Ingénieur en IA (H/F)
Missions
Dans le cadre de cette mission, vous participerez à des travaux de recherche qui correspondent à deux axes complémentaires : la représentation de textes et l'intelligence artificielle frugale. Vos activités comprendront l'analyse de l'état de l'art et le prototypage de nouvelles représentations textuelles hiérarchiques. L'approche du traitement automatique des langues (TAL) par apprentissage profond suppose la représentation de la langue sous forme de vecteurs. Bien que les modèles transformeurs actuels ne prennent en compte les textes que de manière séquentielle et souvent auto-régressive, ce traitement se révèle d'autant plus coûteux en calcul que la taille des textes augmente. Vous étudierez les limites de ce paradigme et proposerez des solutions plus efficaces.
D'une part, vous serez chargé d'étudier la littérature consacrée à la construction de représentations d'unités de textes au-delà des mots. Vous hiérarchiserez les représentations en distinguant différents niveaux de découpe du texte. Vous analyserez les apports et les limites des représentations d'ordre supérieur (HiBERT, Sentence-BERT, NextLevelBERT) afin d'en dégager les motivations, les performances et les limitations. À partir de ce travail, vous élaborerez un état de l'art des représentations hiérarchiques et de l'intelligence artificielle frugale.
D'autre part, vous proposerez et prototyperez des systèmes de représentation opérant à l'échelle de la phrase, du texte et du corpus, conçus pour s'inscrire dans une démarche d'intelligence artificielle frugale dans le but de maîtriser les coûts de calcul. Vous serez associé aux publications et valorisations scientifiques des travaux conduits.
Activités
- Étudier la construction de représentations non plates de la donnée textuelle dans la littérature.
- Comprendre les limites des représentations d'ordre supérieur (HiBERT, Sentence‑BERT, NextLevelBERT).
- Proposer et prototyper des systèmes de représentation de la phrase, du texte et du corpus dans un cadre frugal.
- Élaborer un état de l'art efficace des représentations non plates et de l'IA frugale.
- Participer activement aux travaux de recherche en collaboration avec les équipes de l'unité d'accueil.
Contexte de travail : Le travail se déroulera au Laboratoire Interdisciplinaire des Sciences du Numé.
Profil recherché
- titulaire d'un M2 en mathématiques ou informatique
- expérience en TAL
- maîtrise des frameworks de programmation et manipulation de LLM (Python, Hugging Face, etc.)
Contraintes et risques
- Risques liés au travail sur écran.