Stagiaire Data Science
Stage - Stage en data science & AI et développement logiciel appliqué aux énergies renouvelables (H/F)
Poste basé à La Garenne Colombes
Description du poste / contexte :
L’équipe AI and Advanced Analytics développe des solutions logicielles à contenu algorithmique pour les entités opérationnelles de la Global Business Unit “Renewable and Flex”, en particulier sur les métiers du renouvelable (éolien, solaire) et des batteries (BESS).
Elle s’appuie sur les données opérationnelles collectées depuis l’ensemble des centrales de production d’énergies du Groupe ENGIE à travers le monde, en vue d’améliorer leurs performances grâce à des algorithmes IA et data science et des produits logiciels.
Mission(s)/Activités principal(s):
Le/La stagiaire s’intègrera à l’équipe AI and Advanced Analytics, qui analyse les données des actifs de production, conçoit des algorithmes, et développe des solutions logicielles pour déployer ces algorithmes en production.
Activités / Missions détaillées :
Au périmètre de chaque centrale, des données d’alarmes sont collectées; elles sont particulièrement utiles pour détecter de façon précoce des événements critiques, mais nécessitent au préalable d’être assignées à des catégories afin de les exploiter plus facilement.
Le/La stagiaire s’intègrera à ces travaux, et aura pour mission de :
- analyser les données d’alarmes et leurs assignations : qualité, représentation visuelle, analyses statistiques;
- mettre en œuvre une méthodologie pour assigner automatiquement les d’alarmes;
- mettre en rapport les alarmes avec des événements d’anomalies détectés dans le passé ; certains types d’événements spécialement intéressants seront précisés au cours du stage.
Résultats attendus :
- un rapport incluant méthodologies, analyses et résultats, et / ou une présentation complète faisant office de rapport ;
- le code développé, livré sur GitHub, pour répondre à la problématique.
Données :
ENGIE dispose de données très détaillées telles que :
- des données d’événements : les alarmes remontées automatiquement depuis les centrales;
- des données structurées de type séries temporelles au pas de temps 10 minutes enregistrées au niveau des centrales ;
- des données statiques décrivant un ensemble de caractéristiques des centrales ;
- des données météorologiques supplémentaires, de différentes natures.
Compétences techniques requises :
- Développement logiciel
- Analyses statistiques et visualisations
- Analyse de données/ Modélisation statistique / Data science / Séries temporelles
- IA et IA générative
- Calcul distribué (Spark / Databricks / PySpark)
- Développement logiciel
Compétences comportementales demandées :
- Fort intérêt pour les énergies renouvelables
- Créativité / force de proposition
- Bonnes capacités rédactionnelles en français et en anglais
Entité légale : ENGIE
Expérience professionnelle : Junior (expérience < 3 ans)
Niveaux de qualification : Bac+4 / Bac + 5 (Master, MBA)
Nom de l'entreprise : ENGIE
#J-18808-Ljbffr