Chargement en cours

Utilité des traces de mobilité synthétiques

LANNION, 22
il y a 2 jours
about the role
Orange est en train d'établir un observatoire de la mobilité (des personnes et des marchandises), reposant sur l'analyse anonymisée des données de signalisation des réseaux mobiles.
Les données individuelles relatives à la mobilité humaine sont riches en information mais, à l'état brut, elles peuvent révéler des éléments sensibles sur les personnes sous-jacentes. Leur exploitation exige donc des mécanismes de protection limitant le risque de réidentification. Dans ce contexte, les traces de mobilité synthétiques, générées artificiellement à partir de données réelles, représentent une alternative prometteuse : elles visent à préserver la confidentialité des individus tout en conservant les caractéristiques statistiques nécessaires à l'analyse. Le stage évaluera précisément si, et dans quelle mesure, ces données synthétiques peuvent remplacer les données réelles sans dégrader la valeur analytique.
L'objectif principal du stage est d'évaluer dans quelle mesure l'utilisation de traces de mobilité synthétiques issues de modèles génératifs profonds peut alimenter des modèles de prédiction de la qualité de l'air, en comparaison avec l'utilisation de données réelles.
Le stage s'inscrit dans un projet collaboratif de recherche visant à construire une chaine de modélisation de la qualité de l'air à partir des traces de mobilité dérivées des données de signalisation des réseaux mobiles. Le ou la stagiaire interagira avec les différentes parties prenantes du projet (data scientists, experts mobilité/air, ingénieurs), afin d'aligner les hypothèses, partager les résultats et consolider les recommandations.
Dans ce cadre, le ou la stagiaire commencera par réaliser un état de l'art sur l'intégration des données de mobilité dans la prédiction de la qualité de l'air et les métriques associées, afin de bien comprendre les approches existantes et les enjeux associés.
Il ou elle analysera ensuite différentes versions de traces de mobilité synthétiques, à partir d'une base de données de trace de mobilité réelles en étudiant leurs caractéristiques statistiques (distributions des trajets, dynamiques temporelles, matrices origine-destination, corrélations spatio-temporelles). Ces traces synthétiques seront intégrées dans un ou plusieurs modèles de prédiction de la qualité de l'air, afin d'évaluer leur impact sur la performance prédictive par rapport à des modèles entrainés avec des traces de mobilités réelles, en mobilisant des métriques appropriées. Enfin, une analyse approfondie des résultats permettra d'identifier les limites de des données synthétiques du point de vue de l'utilité et de proposer des pistes d'amélioration ou des perspectives pour de futurs travaux.
Le travail aboutira à un protocole d'évaluation reproductible, un corpus de code documenté (Python) pour l'intégration et l'évaluation des données synthétiques. Selon l'avancement, des contributions scientifiques (papier de recherche) pourront être envisagées.
about you
Ce sujet demandera au stagiaire de faire preuve de curiosité et d'esprit d'analyse afin d'évaluer les traces de mobilité synthétiques, en particulier pour nourrir des modèles de prédiction de la qualité de l'air. Largement collaboratif, l'étudiant devra rapidement entrer en interaction avec les différentes parties-prenantes du projet, et savoir faire preuve de synthèse. Enfin, le travail d'analyse statistique sollicitera ses compétences en développement et en traitement de données. Le candidat recherché aura donc un profil de niveau M2 ou supérieur, data scientist, développeur ou ingénieur généraliste, avec des connaissances de base en Python et certaines librairies d'analyse de données (Pandas).
Profil Bac +4 ou +5 en école d'ingénieur ou master en informatique, data science et intelligence artificielle, ou mathématiques appliquées, Connaissance des méthodes de machine learning.
  • Connaissances en mathématiques appliquées : statistiques et algorithmes
  • Connaissances et expériences en Datascience : apprentissage automatique, deep learning
  • Expérience de développement en Python, ainsi que des librairies de datascience (pandas, dask, numpy) et machine learning (sklearn, keras, pytorch)
  • Capacité à lire des articles scientifiques en anglais
  • Esprit de synthèse et communication aisée
department
Au sein d'Orange Innovation, la direction FCW (Future Communication & Workplace) a pour mission de définir les orientations, de concevoir et de construire les services de communication, collaboration et environnement de travail.
Vous intégrez le département BDW (Business Digital Workplace) qui vise à améliorer l'efficacité au travail et à fluidifier la collaboration en apportant des solutions d'orchestration, d'intégration et de simplification pour les services digitaux et d'analyse des données. Au sein de ce département, vous piloterez l'équipe WIDE (Workplace, Interactions and Data for Enterprise) dont le large panel d'activités va de la recherche, à l'exploration et au développement de services pour les entreprises.
Entreprise
Orange Business
Plateforme de publication
JOBRAPIDO
Offres pouvant vous intéresser
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès