STAGE - Data science : Exploitation de données industrielles pour l'optimisation de fluides solubles
LA CELLE-SOUS-GOUZON, 23
il y a 22 jours
Context & Environment Au sein de la brancheOneTech de TotalEnergies, vous rejoindrez le Centre de Recherche de Solaize , situé à 15 minutes au sud de Lyon. Le site regroupe plus de 300 chercheurs dans un environnement verdoyant . Il constitue l'un des principaux centres de R&D de TotalEnergies, dédié notamment :
- Au développement de solutions ainsi que de moyens de mesure et de contrôle des émissions de gaz à effet de serre
- À la formulation de produits à faible empreinte environnementale et décarbonés pour les mobilités thermique, électrique et pour l'industrie (carburants non fossiles d'origine renouvelable, lubrifiants, fluides caloporteurs, bitumes, etc.)
- Structuration et nettoyage de données techniques complexes
- Exploration de méthodes avancées : clustering, réduction de dimension, modèles prédictifs, LLM
- Détection de patterns dans les formulations et leurs performances
- Modélisation prédictive pour optimiser les formulations • Développement d'outils (dashboard interactif ou application)
- Capitalisation de la connaissance métier : transformation des données en insights exploitables, création de visualisations interactives, et formalisation de recommandations pour les équipes formulation et technique.
- Matériel : poste de travail dédié, accès sécurisé aux données internes
- Langages et bibliothèques : Python (Pandas, Scikit-leam, NumPy, SciPy, Matplotlib, Plotly), SQL
- Environnements de développement : VS Code, Jupyter, GitHub, Databricks
- Connaissances solides en Machine Learning supervisé et non supervisé
- Maîtrise de Python (Pandas, Scikit-learn, NumPy, SciPy, Matplotlib)
- SQL : interrogation avancée, structuration et normalisation de bases relationnelles complexes
- Développement d'interfaces et visualisation : création de dashboards interactifs (Databricks, Power BI , Spotfire) ou d'applications (Dash, Streamlit)
- Outils de développement : VS Code, Jupyter, GitHub, Databricks pour un travail collaboratif et reproductible
- GenAI & NLP : utilisation de LLM pour l'analyse sémantique de données semi-structurées
- X
Entreprise
Total Energies
Plateforme de publication
JOOBLE
Offres pouvant vous intéresser
LA CELLE-SOUS-GOUZON, 23
il y a 22 jours
LA CELLE-SOUS-GOUZON, 23
il y a 17 jours
LA CELLE-SOUS-GOUZON, 23
il y a 26 jours
LA CELLE-SOUS-GOUZON, 23
il y a 22 jours