Chargement en cours

Alternant.e Data Engineer H/F

PARIS, 75
il y a 1 jour

MGEN Technologies, DSI du Groupe MGEN compte un peu plus de 500 collaborateurs répartis sur 3 sites (Paris, Tours, Nancy).

Au sein de la DSI, les plateformes Data & Référentiels sont les fondements sur lesquels les offres MGEN sont construites dans les chaînes de valeurs métiers, en application de la méthodologie (agilité à l’échelle).

Le Département SI Data porte la réalisation de la stratégie « data centric » de l’entreprise. Au cœur de la transformation engagée du SI, sa mission transverse garantit l’adéquation des plateformes Data & Référentiels pour valoriser l’usage de la data dans une approche « Data as a product ».

Au sein de la Data Platform, vous interviendrez sur les outils :

  • Semarchy xDI (intégration de données)
  • Greenplum (base de données analytique)
  • OpenMetadata (catalogue de données)

Dans un contexte de structuration de la gouvernance data, l’objectif est d’améliorer :

  • la documentation des données et des flux
  • la qualité et la fiabilité des pipelines
  • les performances des traitements

Missions confiées

1. Mise en place d’une documentation automatique des données

  • Extraire les métadonnées depuis Greenplum (tables, colonnes, volumétrie)
  • Concevoir un générateur de documentation (Markdown / HTML)
  • Produire un dictionnaire de données lisible et maintenable
  • Mettre à jour automatiquement la documentation

2. Documentation des pipelines data (XDI)

  • Analyser les flux développés dans Semarchy xDI
  • Extraire les informations clés des pipelines (sources, cibles, transformations)
  • Reconstituer un lineage simplifié des données : source > staging > datamart
  • Générer une documentation standardisée des flux

3. Enrichissement automatisé (IA encadrée)

  • Générer des descriptions automatiques de tables et pipelines
  • Résumer des transformations SQL en langage compréhensible
  • Améliorer la lisibilité de la documentation (validation humaine requise)

4. Mise en place de contrôles qualité (option selon avancement)

  • Définir des règles de qualité des données : complétude, cohérence, unicité
  • Implémenter des tests automatisés sur les pipelines
  • Produire un reporting des anomalies

5. Optimisation des performances

  • Analyser les requêtes SQL dans Greenplum
  • Optimiser : indexation, partitionnement, distribution des données
  • Mesurer les gains de performance et formaliser les bonnes pratiques

6. Contribution au Data Catalog

  • Alimenter OpenMetadata : descriptions de tables documentation des flux, liens entre données et pipelines
  • Participer à la structuration de la gouvernance data

Livrables attendus

  • Scripts d’extraction des métadonnées (BDD & pipelines)
  • Générateur de documentation automatique
  • Documentation des données et des flux
  • Optimisations SQL documentées
  • Guide d’utilisation et bonnes pratiques

Profil recherché

Vous préparez une formation de niveau Bac+3 à Bac+5 en Informatique, Data, Statistiques ou dans un domaine équivalent.

Vous êtes reconnu(e) pour :

  • Votre rigueur et votre sens du détail,
  • Votre esprit d’analyse et votre capacité à résoudre des problématiques complexes,
  • Votre capacité à structurer, documenter et fiabiliser vos travaux,
  • Votre curiosité pour les sujets liés à la data et à l'intelligence artificielle,
  • Votre capacité à travailler en équipe et à collaborer avec différents interlocuteurs.
  • Vous disposez de bonnes bases en SQL et possédez idéalement des connaissances en data engineering (ETL, pipelines de données).

Des notions en Python ou dans un langage de scripting constitueraient un atout supplémentaire.

Si vous souhaitez développer vos compétences dans les domaines de la data, de l’automatisation et de l’exploitation des données, alors cette alternance est faite pour vous !

Le groupe MGEN s’engage pour la Diversité et le Handicap et garantit l’égalité des chances. Nos postes sont ouverts à toutes et tous.

#J-18808-Ljbffr
Entreprise
Mutuelle Generale de l'Education Nationale
Plateforme de publication
WHATJOBS
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès