Alternant(e) Data Engineer (H/F)
Le poste est rattaché à l’équipe Data décomposée en 4 équipes :
- Doc & fraude : développer des microservices pour le traitement de documents et l’identification de comportement frauduleux
- AI platform : mettre en place des environnements pour l’entraînement et le déploiement de services intégrant de l’IA
- Data Run : dédié à la gestion du run sur la data plateforme : reporting financier et BI avec la stack actuelle
- Data Platform : une équipe dédiée à la refonte de la data plateforme pour assurer le suivi de performance de notre plateforme ainsi que la livraison des informations de facturation à l’équipe Finance.
Deux profils senior/staff sont également présents pour appuyer les équipes sur les sujets Data et IA ainsi que deux Product Owner IA et Data.
La mission est au sein de l’équipe Data Run. L’équipe a pour mission de faire vivre les stacks existantes, et d’intégrer les évolutions nécessaires afin d’assurer la qualité des livrables.
L’infrastructure actuelle permet d’ingérer les données de la plateforme pour les mettre à disposition de nos métiers (customer success manager, produit, finance, etc) via un outil d’exploration et de dashboarding, et via des exports (facturation des clients de l’entreprise).
Cette infrastructure doit avoir une parfaite disponibilité, assurer la qualité, l’intégrité et la mise à jour des données dans un temps imparti (quotidien).
Tes missions
Sous la direction du Lead technique de l’équipe Data Run, en lien avec le produit, les data analyst et l’équipe finance, tes missions sont :
- Fournir à l’équipe finance les données permettant d’assurer la facturation de nos clients ainsi que le reporting financier de l’entreprise
- Etre garant de la qualité des données livrées
- Développer et fiabiliser les pipelines de transformation de données
- Assurer un monitoring de fonctionnement des services dans l’ensemble des environnements
- Faire évoluer l’ensemble des services avec la montée en charge de nos clients
- Réaliser une veille technologique régulière et documenter les projets
Notre stack
- Base de données : Minio / MongoDB, PostgreSQL
- Orchestration : Airflow
- Ingestion et anonymisation : Kafka, Python, Spark, Polars
- Transformation : Spark, Polars et dbt
- Dashboarding : Metabase
- Infra/monitoring : GitLab, Kubernetes, Kibana, Grafana, OpenTelemetry, Helm, Docker
Nous recherchons un.e candidat.e avec une formation de Data Engineer Python. Compétences nécessaires recherchées : Python 3.10+ - Docker – Git. Bonnes bases en SQL (idéalement Postgres). Et appréciées : Spark – AirFlow PostgreSQL – MongoDB. Versionning d’environnement (ex : poetry) Monitoring (Kibana, Grafana, Prometheus, OpenTelemetry, etc). Soft skills : communication fluide, capacité de vulgarisation et de transmission de savoir, bon esprit d’analyse et sens du détail, esprit d’équipe, sérieux et pragmatisme.
#J-18808-Ljbffr