Data Engineer Databricks Airflow SQL
TopChrono, 40 ans d'expertise dans la livraison express B2B premium en Île-de-France. +4 000 clients parmi les plus exigeants, des millions de colis traités chaque année, et une infrastructure data qui doit être aussi rapide et fiable que nos livreurs. On cherche quelqu’un qui comprend, améliore et anticipe — pas juste quelqu’un qui fait tourner les pipelines. Tu rejoins une équipe bienveillante, innovante et sympa, avec de vraies responsabilités dès le premier jour.
PIPELINES DATABRICKS
Tu fais tourner nos jobs PySpark sur Databricks — du batch quotidien au near-realtime. Ce sont les flux logistiques qui font tourner la boîte : pas de droit à l’à-peu-près.
ORCHESTRATION AIRFLOW
Tes DAGs Airflow vivent en prod : monitoring, retry logic, alerting proactif. Quand ça casse, tu sais pourquoi — et tu le résous avant qu’on te le signale.
SQL AVANCÉ & MODÉLISATION
CTEs, fenêtres analytiques, modélisation en étoile, optimisation de requêtes : tu écris du SQL qui quitte la charge et tu modélises proprement les flux complexes — c’est la base sur laquelle tout le reste s’appuie.
REPORTING & STREAMLIT
Rendu majoritairement via MCP Claude et apps Streamlit internes : la qualité des requêtes est ta responsabilité, c’est ce qui fait la fiabilité du rendu.
QUALITÉ & ARCHITECTURE DATA
Gouvernance, contrôles qualité, monitoring, évolution du Lakehouse, ingestion de nouveaux flux : tu fais grandir l’archi data au rythme du métier — sans casser ce qui marche.
COLLABORATION TRANSVERSE
Analysts, Produit, Ops : tu traduis leurs besoins en solutions techniques solides. Tu sais dire non, proposer mieux, et expliquer pourquoi.
03. STACK TECHNIQUE
- Databricks
- Apache Airflow
- SQL avancé
- PySpark
- Streamlit
- Power BI
- Python
04 PROFIL RECHERCHÉ
- 3–4 ans en Data Engineering, en production.
- Databricks — PySpark, Jobs / Workflows au quotidien.
- Airflow en prod : DAGs, debug, monitoring.
- SQL avancé : tu optimises, pas juste tu requêtes.
- Problem solver: tu arrives avec des solutions.
- Esprit proactif et autonomie terrain.
- Sensibilité métier: logistique, contrôle de gestion, ressources humaines, opérations.
- Power BI — pour les besoins ponctuels métiers.
- Great Expectations — qualité de données.
- Excel avancé (pivot, formules complexes).
- Bases en machine learning : savoir appliquer les bons algos sur nos cas d'usage
05 CE QUI FERA LA DIFFÉRENCE
Tu es proactif–ve. Un pipeline qui part en timeout à 3h du matin, tu ne t’attends pas qu’on te le signale. Tu investigues, tu alertes, tu proposes un fix. Tu traites les données des autres comme si c’étaient les tiennes — parce que chez TopChrono, la data c’est notre cœur de métier.
06 CONDITIONS, AVANTAGES & PROCESS
INFOS CLÉS
CONTRAT CDI
LIEU Saint-Ouen (93)
Hybride – 3j présentiel min/sem
Télétravail flexible 3 jours présentiel min/sem
Équipe bienveillante, innovante & sympa
Certification Databricks financée
Tickets restaurant – Mutuelle premium
RTT + 50 % transport
Expérience 3–4 ans
#J-18808-Ljbffr