Chargement en cours

Stage data science H/F - Poisoning attack against generative models

BELFORT, 90
il y a 4 jours
Stage

votre rôle

Le stage s’inscrit dans le cadre du projet Flux Vision d’Orange, qui vise à analyser la mobilité et la présence des personnes sur le territoire à partir de données de localisation issues du réseau mobile, tout en protégeant la vie privée. Pour cela, Orange a développé un générateur de données de trajectoires synthétiques permettant de produire des données anonymisées et représentatives. L’objectif principal du stage est de conceptualiser, développer et tester une méthodologie d’attaque par empoisonnement contre ces générateurs. Il s’agit d’étudier comment altérer le processus d’apprentissage du modèle pour influencer la qualité ou la confidentialité des données synthétiques, tout en restant difficile à détecter.

Les activités principales incluent une étude approfondie de la littérature sur les attaques par empoisonnement, notamment dans le contexte des modèles génératifs et des réseaux de neurones. Le stagiaire devra se familiariser avec les modèles existants de génération de trajectoires, comprendre leur architecture et leur fonctionnement, puis réaliser des expérimentations pour évaluer leur vulnérabilité face à différentes perturbations. Il sera également chargé de définir des scénarios d’attaque illustrant l’impact potentiel sur la vie privée et la représentativité statistique des données, en montrant comment ces attaques peuvent manipuler ou dégrader la qualité des données synthétiques.

Ensuite, le stagiaire devra concevoir et implémenter des stratégies d’empoisonnement adaptées, en entraînant les modèles victimes d’attaques simulées, et en évaluant leur efficacité à manipuler la sortie tout en restant discrètes. La validation de ces méthodes se fera à l’aide d’une méthodologie d’évaluation des performances, en utilisant des métriques pertinentes pour mesurer l’impact sur la distribution des données, la détection des attaques, et la protection de la vie privée. Enfin, des recommandations seront proposées pour renforcer la robustesse des générateurs face à ces menaces.

Les résultats attendus sont une meilleure compréhension des techniques d’attaque par empoisonnement dans ce contexte, des scénarios concrets illustrant leur faisabilité, une méthodologie d’attaque opérationnelle avec des prototypes exploitables, ainsi que des pistes pour améliorer la sécurité et la confidentialité des générateurs de données synthétiques. Le stagiaire sera intégré à une équipe pluridisciplinaire, travaillant en mode agile, avec un encadrement par un référent expérimenté, dans un environnement innovant alliant recherche, développement et enjeux de sécurité liés à la protection des données.

votre profil

Votre profil :

-          De formation supérieure Bac +5 (Ecole d'ingénieur ou Université) en mathématiques ou informatique.

-          Bonne connaissance des problématiques et méthodes de machine learning/ deep neural networks.

-          Très bonne maîtrise du language de programmation Python.

-          Des connaissances de Tensorflow sont un plus.

-          Facultés d'adaptation et d'excellentes qualités relationnelles et rédactionnelles (français et anglais).

-          Sensibilité aux enjeux éthiques et de confidentialité des données.

entité

Vous rejoindrez les équipes d'Orange Innovation Networks, un pôle stratégique au cœur de la recherche et du développement chez Orange. C'est ici que nous imaginons et construisons les réseaux de demain, en explorant des technologies de pointe pour transformer la manière dont les données sont utilisées.

Plus spécifiquement, vous intégrerez l'équipe Flux Vision, spécialisée dans le traitement et la valorisation des données d'opérateur. Vous serez pleinement immergé(e) au sein d'une équipe dynamique de data scientists et d'ingénieurs passionnés. Vous bénéficierez d'un accompagnement technique et métier rapproché, et aurez l'opportunité d'interagir avec une diversité d'experts internes (ingénieurs radio, experts juridiques, chefs de produit). C'est un environnement où l'innovation est le moteur et où chaque projet contribue à façonner l'avenir de la connectivité et des services numériques, notamment à travers la valorisation éthique et responsable des données.

Entreprise
Orange SA
Plateforme de publication
JOOBLE
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
1
Créez un compte (compte Google requis)
2
Dans votre espace, cliquez sur "Mes alertes", puis sur "Créer une alerte"
3
Créez votre alerte avec vos préférences et activez les notifications par email
4
Recevez régulièrement des mails avec les nouvelles offres correspondant à vos attentes