Développeur CONFIRME Big Data Hadoop/PySpark/Python - 3 à 6 ans
Secteurs stratégiques :
Banque d’investissement
Démarrage :
ASAP
Contexte/Objectifs :
Le département a lancé un programme stratégique, qui comporte plusieurs projets d'harmonisation des processus et outils. L'un de ces streams a pour vocation de constituer un datalake sur une stack Hadoop, afin de servir les besoins en data et reporting. Ce datalake a également pour vocation de devenir la brique centrale de l'architecture du SI.
Nous recherchons un profil Hadoop / PySpark qui sera en charge, en lien avec l'équipe de production applicative / devops, de mettre en œuvre techniquement les évolutions du datalake. Passionné par les données, capable de s’adapter à un environnement dynamique et en constante évolution, le prestataire doit faire preuve d'autonomie, d'initiative et d'une forte capacité d'analyse pour résoudre des problèmes complexes.
Principales missions :
- Mettre en œuvre de nouvelles ingestions de données, data prep/transformation
- Maintenir et faire évoluer nos outils de gestion des pipeline de données (Pyspark + shell scripting)
- Adresser à l'équipe devops les demandes relatives aux évolutions de la plateforme
- Eventuellement mettre en œuvre une couche d'APIs afin d'exposer nos données