Alternance - Data Engineer H/F/X
SAINT-DENIS
il y a 16 jours
Pionnier des ventes événementielles en ligne depuis 2001 et acteur incontournable du e-commerce en Europe, Veepee collabore avec plus de 7 000 marques pour proposer des produits à forte décote, disponibles sur une durée limitée. Présent dans de nombreux univers parmi lesquels la mode, la maison, le vin, le voyage, ou encore la beauté ... Veepee a réalisé en 2024 un chiffre d’affaires de 3,3 milliards d’euros TTC et compte 5 000 collaborateurs répartis dans 10 pays.
DESCRIPTION DU POSTE
- L’équipe Data Factory est responsable de la plateforme d’ingestion de données (Agate) permettant d’alimenter le Data Lake et le Data Warehouse de Veepee.
- Dans un contexte de transformation stratégique (migration vers une architecture basée sur Trino / Iceberg / S3 on-prem), l’équipe renforce la fiabilité, la qualité et l’industrialisation des pipelines d’ingestion.
- L’alternant(e) interviendra dans un environnement :
- Kubernetes / VPCloud
- Python / Java / Beam / Dataflow
- BigQuery & nouvelle stack Trino / Iceberg
- CI/CD (GitLab, tests automatisés)
- Observabilité & monitoring
MISSIONS
- L'alternant contribuera à la fiabilisation et à l’industrialisation de la plateforme d’ingestion de données, afin de garantir une base solide pour l’ensemble des usages Data chez Veepee.
- Activité 1 : Stabilisation de la stack d’ingestion
- Ajout de tests unitaires sur les pipelines existants
- Amélioration de la couverture de tests
- Détection des zones de fragilité
- Activité 2 : Amélioration continue de la plateforme Agate
- Refactoring de composants techniques
- Participation à l’optimisation des performances
- Contribution à la gestion des erreurs et retry
- Activité 3 : Qualité & fiabilité des données
- Mise en place de contrôles automatiques
- Contribution aux métriques de qualité
- Participation au monitoring technique
- Activité 4 : Documentation & industrialisation
- Rédaction de README techniques
- Formalisation des bonnes pratiques
- Aide à la standardisation des nouveaux pipelines
- Activité 5 : Participation aux projets stratégiques
- Contribution au double run (BigQuery ↔ nouvelle stack)
- Support aux équipes Data Governance / Science / Analytics
PRÉ REQUIS
- Formation
Bac +3 à Bac +5 en informatique / data / école d’ingénieur
- Compétences techniques
Bases solides en Python & Java
Compréhension des APIs et pipelines de données
Notions SQL
Intérêt pour les architectures data modernes
- Langues
Anglais technique
Entreprise
Veepee
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
SAINT-DENIS
il y a 16 jours
FRANCE
il y a 23 jours
PARIS, 75
il y a 7 jours
PARIS, 75
il y a 8 jours