Chargement en cours

Stage Innovation : Ingénieur Data / IA

SÈVRES, 92
il y a 13 heures

A la Direction de l’Innovation , nous menons des projets de recherche sur des champs d’expérimentation très larges et multi-sectoriels, coordonnés par nos experts au sein des ALTEN Labs (IDF, Toulouse, Grenoble, Rennes et Sophia Antipolis). Dans notre Lab de Sèvres , vous serez accompagné(e) par un Pilote Innovation (Chef de projet) pour développer vos compétences sur le projet décrit ci‑dessous.

Projet : Exploration de la dynamique évolutive d’un corpus documentaire fragmenté via des approches NoSQL

Vous intégrerez un projet de recherche visant à structurer, formaliser et analyser un corpus documentaire complexe, fragmenté et très riche en métadonnées, en constante évolution.

  • Structurelle : documents fortement interconnectés, nombreuses références croisées formant un écosystème dense.
  • Linguistique : textes mobilisent des vocabulaires spécialisés propres à différents domaines d’activité.
  • Temporelle : documents ont des périodes de validité limitées, régulièrement mis à jour ou remplacés, nécessitant une gestion fine des versions et de l’obsolescence.

Missions principales

  • Définir une stratégie de structuration, de stockage et d’analyse dynamique du corpus, fondée sur l’exploitation intelligente des métadonnées.
  • Modéliser les documents et leurs relations au sein d’un graphe de connaissances.
  • Analyser l’évolution des textes dans le temps, en identifiant et en caractérisant les relations entre versions successives de documents.
  • Proposer des métriques qualitatives et/ou quantitatives permettant de décrire et de comparer les évolutions thématiques, sémantiques et structurelles du corpus.

Qualifications requises

  • Étudiant(e) en école d’ingénieur ou Master 2 (informatique, data, sciences du langage, Intelligence Artificielle ou domaine connexe) avec un intérêt marqué pour les problématiques de structuration des connaissances et d’analyse de données textuelles.
  • Bonne maîtrise de la programmation en Python.
  • Connaissances en bases de données, graphes de connaissances et ontologies (OWL souhaité).
  • Bases en traitement automatique du langage naturel (NLP) pour l’analyse des textes et l’inférence de relations lorsque les métadonnées sont insuffisantes.
  • Rigueur, autonomie et goût pour les problématiques de recherche appliquée.

Compétences techniques supplémentaires

  • Maîtrise de Python et SPARQL.
  • Maîtrise intermédiaire en SQL et Cypher.
  • Expérience avec des environnements NoSQL et bases de connaissances.
  • Compétences au moins intermédiaires en NLP et dans les approches utilisant Transformers et/ou GNN.
  • Bonne appétence pour les statistiques et la manipulation de données complexes.

Compétences transverses

  • Excellente capacité de vulgarisation pour partager et expliquer ses travaux au sein d’un environnement multidisciplinaire.
  • Autonomie et curiosité.
  • Fort esprit d’équipe.
  • Bonnes capacités rédactionnelles.

Détails du stage

  • Durée : 6 mois (une embauche pourrait être envisagée à l’issue du stage).
  • Lieu : Lab de Sèvres.
  • Gratification en fonction du niveau Bac+4 ou Bac+5 :
    • Bac+4 : 690 euros brut/mois + Tickets restaurants + prise en charge titre de transport.
    • Bac+5 : 1300 euros brut/mois + Tickets restaurants + prise en charge titre de transport.
#J-18808-Ljbffr
Entreprise
ALTEN
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès