Alternance - Data Engineer H/F/X
Présentation
Pionnier des ventes événementielles en ligne depuis 2001 et acteur incontournable du e-commerce en Europe, Veepee collabore avec plus de 7 000 marques pour proposer des produits à forte décote, disponibles sur une durée limitée. Présent dans de nombreux univers parmi lesquels la mode, la maison, le vin, le voyage, ou encore la beauté ... Veepee a réalisé en 2024 un chiffre d’affaires de 3,3 milliards d’euros TTC et compte 5 000 collaborateurs répartis dans 10 pays.
Description du poste
L’équipe Data Factory est responsable de la plateforme d’ingestion de données (Agate) permettant d’alimenter le Data Lake et le Data Warehouse de Veepee. Dans un contexte de transformation stratégique (migration vers une architecture basée sur Trino / Iceberg / S3 on-prem), l’équipe renforce la fiabilité, la qualité et l’industrialisation des pipelines d’ingestion. L’alternant(e) interviendra dans un environnement Kubernetes / VPCloud, Python / Java / Beam / Dataflow, BigQuery & nouvelle stack Trino / Iceberg, CI/CD (GitLab, tests automatisés), Observabilité & monitoring.
Responsabilités
- L'alternant contribuera à la fiabilisation et à l’industrialisation de la plateforme d’ingestion de données, afin de garantir une base solide pour l’ensemble des usages Data chez Veepee.
- Activité 1 : Stabilisation de la stack d’ingestion
- Ajout de tests unitaires sur les pipelines existants
- Amélioration de la couverture de tests
- Détection des zones de fragilité
- Activité 2 : Amélioration continue de la plateforme Agate
- Refactoring de composants techniques
- Participation à l’optimisation des performances
- Contribution à la gestion des erreurs et retry
- Activité 3 : Qualité & fiabilité des données
- Mise en place de contrôles automatiques
- Contribution aux métriques de qualité
- Participation au monitoring technique
- Activité 4 : Documentation & industrialisation
- Rédaction de README techniques
- Formalisation des bonnes pratiques
- Aide à la standardisation des nouveaux pipelines
- Activité 5 : Participation aux projets stratégiques
- Contribution au double run (BigQuery ↔ nouvelle stack)
- Support aux équipes Data Governance / Science / Analytics
Prérequis
- Bac +3 à Bac +5 en informatique / data / école d’ingénieur
- Bases solides en Python & Java
- Compréhension des APIs et pipelines de données
- Notions SQL
- Intérêt pour les architectures data modernes
- Anglais technique
- Rigueur
- Curiosité technique
- Envie d’apprendre
- Esprit collaboratif
Le petit plus
- Connaissance de Kubernetes
- Notions de CI/CD
- Expérience avec Airflow / Beam / Spark
- Sensibilité à la qualité logicielle
Avantages
- Prime variable
- Participation & intéressement
- Télétravail possible jusqu'à 2 jours/semaine
- Plate-forme d'apprentissage des langues en ligne
- CSE et ses avantages
- Chèques CESU et chèques vacances
- Accès à une restauration d'entreprise et des frigos connectés
- Accès à la Salle de sport