Chargement en cours

Data Engineer Databricks Airflow SQL

SAINT OUEN SUR SEINE
il y a 1 jour

TopChrono, 40 ans d'expertise dans la livraison express B2B premium en Île-de-France. +4 000 clients parmi les plus exigeants, des millions de colis traités chaque année, et une infrastructure data qui doit être aussi rapide et fiable que nos livreurs. On cherche quelqu’un qui comprend, améliore et anticipe — pas juste quelqu’un qui fait tourner les pipelines. Tu rejoins une équipe bienveillante, innovante et sympa, avec de vraies responsabilités dès le premier jour.

PIPELINES DATABRICKS

Tu fais tourner nos jobs PySpark sur Databricks — du batch quotidien au near-realtime. Ce sont les flux logistiques qui font tourner la boîte : pas de droit à l’à-peu-près.

ORCHESTRATION AIRFLOW

Tes DAGs Airflow vivent en prod : monitoring, retry logic, alerting proactif. Quand ça casse, tu sais pourquoi — et tu le résous avant qu’on te le signale.

SQL AVANCÉ & MODÉLISATION

CTEs, fenêtres analytiques, modélisation en étoile, optimisation de requêtes : tu écris du SQL qui quitte la charge et tu modélises proprement les flux complexes — c’est la base sur laquelle tout le reste s’appuie.

REPORTING & STREAMLIT

Rendu majoritairement via MCP Claude et apps Streamlit internes : la qualité des requêtes est ta responsabilité, c’est ce qui fait la fiabilité du rendu.

QUALITÉ & ARCHITECTURE DATA

Gouvernance, contrôles qualité, monitoring, évolution du Lakehouse, ingestion de nouveaux flux : tu fais grandir l’archi data au rythme du métier — sans casser ce qui marche.

COLLABORATION TRANSVERSE

Analysts, Produit, Ops : tu traduis leurs besoins en solutions techniques solides. Tu sais dire non, proposer mieux, et expliquer pourquoi.

03. STACK TECHNIQUE

  • Databricks
  • Apache Airflow
  • SQL avancé
  • PySpark
  • Streamlit
  • Power BI
  • Python

04 PROFIL RECHERCHÉ

  • 3–4 ans en Data Engineering, en production.
  • Databricks — PySpark, Jobs / Workflows au quotidien.
  • Airflow en prod : DAGs, debug, monitoring.
  • SQL avancé : tu optimises, pas juste tu requêtes.
  • Problem solver: tu arrives avec des solutions.
  • Esprit proactif et autonomie terrain.
  • Sensibilité métier: logistique, contrôle de gestion, ressources humaines, opérations.
  • Power BI — pour les besoins ponctuels métiers.
  • Great Expectations — qualité de données.
  • Excel avancé (pivot, formules complexes).
  • Bases en machine learning : savoir appliquer les bons algos sur nos cas d'usage

05 CE QUI FERA LA DIFFÉRENCE

Tu es proactif–ve. Un pipeline qui part en timeout à 3h du matin, tu ne t’attends pas qu’on te le signale. Tu investigues, tu alertes, tu proposes un fix. Tu traites les données des autres comme si c’étaient les tiennes — parce que chez TopChrono, la data c’est notre cœur de métier.

06 CONDITIONS, AVANTAGES & PROCESS

INFOS CLÉS

CONTRAT CDI

LIEU Saint-Ouen (93)

Hybride – 3j présentiel min/sem

Télétravail flexible 3 jours présentiel min/sem

Équipe bienveillante, innovante & sympa

Certification Databricks financée

Tickets restaurant – Mutuelle premium

RTT + 50 % transport

Expérience 3–4 ans

#J-18808-Ljbffr
Entreprise
Topchrono
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès