Stage Innovation : Ingénieur Data / IA
SÈVRES, 92
il y a 13 heures
A la Direction de l’Innovation , nous menons des projets de recherche sur des champs d’expérimentation très larges et multi-sectoriels, coordonnés par nos experts au sein des ALTEN Labs (IDF, Toulouse, Grenoble, Rennes et Sophia Antipolis). Dans notre Lab de Sèvres , vous serez accompagné(e) par un Pilote Innovation (Chef de projet) pour développer vos compétences sur le projet décrit ci‑dessous.
Projet : Exploration de la dynamique évolutive d’un corpus documentaire fragmenté via des approches NoSQL
Vous intégrerez un projet de recherche visant à structurer, formaliser et analyser un corpus documentaire complexe, fragmenté et très riche en métadonnées, en constante évolution.
- Structurelle : documents fortement interconnectés, nombreuses références croisées formant un écosystème dense.
- Linguistique : textes mobilisent des vocabulaires spécialisés propres à différents domaines d’activité.
- Temporelle : documents ont des périodes de validité limitées, régulièrement mis à jour ou remplacés, nécessitant une gestion fine des versions et de l’obsolescence.
Missions principales
- Définir une stratégie de structuration, de stockage et d’analyse dynamique du corpus, fondée sur l’exploitation intelligente des métadonnées.
- Modéliser les documents et leurs relations au sein d’un graphe de connaissances.
- Analyser l’évolution des textes dans le temps, en identifiant et en caractérisant les relations entre versions successives de documents.
- Proposer des métriques qualitatives et/ou quantitatives permettant de décrire et de comparer les évolutions thématiques, sémantiques et structurelles du corpus.
Qualifications requises
- Étudiant(e) en école d’ingénieur ou Master 2 (informatique, data, sciences du langage, Intelligence Artificielle ou domaine connexe) avec un intérêt marqué pour les problématiques de structuration des connaissances et d’analyse de données textuelles.
- Bonne maîtrise de la programmation en Python.
- Connaissances en bases de données, graphes de connaissances et ontologies (OWL souhaité).
- Bases en traitement automatique du langage naturel (NLP) pour l’analyse des textes et l’inférence de relations lorsque les métadonnées sont insuffisantes.
- Rigueur, autonomie et goût pour les problématiques de recherche appliquée.
Compétences techniques supplémentaires
- Maîtrise de Python et SPARQL.
- Maîtrise intermédiaire en SQL et Cypher.
- Expérience avec des environnements NoSQL et bases de connaissances.
- Compétences au moins intermédiaires en NLP et dans les approches utilisant Transformers et/ou GNN.
- Bonne appétence pour les statistiques et la manipulation de données complexes.
Compétences transverses
- Excellente capacité de vulgarisation pour partager et expliquer ses travaux au sein d’un environnement multidisciplinaire.
- Autonomie et curiosité.
- Fort esprit d’équipe.
- Bonnes capacités rédactionnelles.
Détails du stage
- Durée : 6 mois (une embauche pourrait être envisagée à l’issue du stage).
- Lieu : Lab de Sèvres.
- Gratification en fonction du niveau Bac+4 ou Bac+5 :
- Bac+4 : 690 euros brut/mois + Tickets restaurants + prise en charge titre de transport.
- Bac+5 : 1300 euros brut/mois + Tickets restaurants + prise en charge titre de transport.
Entreprise
ALTEN
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
GIF-SUR-YVETTE, 91
il y a 3 jours
FRANCE
il y a 4 jours
LA CIOTAT, 13
il y a 4 jours
VILLENEUVE D'ASCQ
il y a 4 jours