Chargement en cours

Ingénieur de recherche Intelligence artificielle et sémantique

CASTANET-TOLOSAN, 31
il y a 10 jours

Vos missions en quelques mots

Le poste est rattaché à Direction pour la Science Ouverte (DipSO), une direction placée sous la responsabilité du Directeur général délégué Science et Innovation. La DipSO développe une offre de services, produit des études et des prototypes, conseille/forme les acteurs de la science et de la stratégie en matière de science ouverte et de numérique pour la science. Elle rassemble, pour ce faire, des compétences diverses, complémentaires (documentation, informatique, scientifique, data science) pour assurer ses services et gérer des projets sur l'ensemble de son périmètre. Elle est organisée en quatre pôles.


Son pôle Numérique pour la Science (Num4Sci) contribue à consolider la politique de l'établissement en matière de numérique scientifique, en assurant la mise à disposition d'outils et de services pour la science ouverte. Ces outils et services communs visent notamment à favoriser une pratique plus ouverte et collaborative de la science, et à permettre aux communautés scientifiques de profiter davantage des opportunités du numérique.

Vous serez accueilli(e) au sein de l'équipe Données et Sémantique (D&S) du pôle Num4Sci de la DipSO. Vous contribuez à l'évolution des services en matière de gestion et d'analyse des données textuelles, qu'elles soient structurées ou non. Vous contribuerez à des projets dans ce domaine en étant force de proposition sur les technologies, outils et méthodes à utiliser. Vous assurerez une veille technologique, et contribuerez à la montée en compétences de vos collègues. Vous évoluerez dans un environnement stimulant, à l'interface entre la recherche académique et les applications concrètes en sciences des données.

Votre mission consistera à conduire et mettre en œuvre des projets de développement de solutions applicatives (Python) basées sur des algorithmes de machine learning ou de deep learning visant à extraire des informations sur des productions scientifiques (publications, jeux de données) à partir de différents supports (fichiers PDF, jeux de métadonnées), et à les aligner avec des référentiels (structures, individus, thématiques, mots clés...) afin, par exemple, d'automatiser l'enrichissement du thésaurus par des définitions. Ces développements seront intégrés dans des pipelines afin d'automatiser le workflow de traitement.

  Vous serez plus particulièrement en charge de :

Ø  Mettre en œuvre des modèles d'extraction d'informations à partir de documents (NLP, LLM, etc.).

Ø  Intégrer et consommer des API pour l'échange de données.

Ø  Concevoir et déployer des pipelines ETL pour automatiser les flux de données.

Ø  Conteneuriser les modèles/algorithmes dans des environnements Docker/Kubernetes.

Ø  Mettre en place des mécanismes de suivi de performance et de détection de dérive des modèles.


Profil recherché

 Formation recommandée : Master/Ingénieur (Bac+5) École d'ingénieur ou Master avec spécialisation en informatique et/ou data science.

 Compétences indispensables :

Maîtrise de Python, et librairies associées
Bases de données (SQL, No SQL), Graph, Vectorielles …
Une première expérience avec Docker, Gitlab.
 

Connaissances souhaitées :

Traitement des données textuelles et modèles de langue
Sémantique, vocabulaires contrôlés et ontologies (RDF, SKOS, OWL)
Méthodes et outils de gestion de projets
IA : machine learning, deep learning, LLMs, embeddings
Langages documentaires (ex : thésaurus)
Initiation à Kubernetes.
 


Expérience appréciée :

Participation à un projet de traitement de données non structurées (ex : documents PDF, images, textes bruts...).
Mise en œuvre de modèles, NLP, ou LLM pour l'extraction d'information.
Intégration de modèles ML/DL dans des pipelines de traitement (ETL, data pipelines).
Déploiement de modèles sous forme d'API, idéalement dans des environnements conteneurisés (Docker, Kubernetes).
Sensibilité aux problématiques de monitoring, versioning et dérive des modèles.
 

Aptitudes recherchées :

Travail en équipe.
Rigueur.
Adaptabilité


Niveau d'études minimum requis
  • Niveau
    Niveau 7 Master/diplômes équivalents


Éléments de candidature


Personnes à contacter
  • Richard MORENO
  • Eric CAHUZAC

Entreprise
Inrae
Plateforme de publication
JOBRAPIDO
Offres pouvant vous intéresser
MEYLAN, 38
il y a 1 mois
MEYLAN, 38
il y a 1 mois
PARIS, 75
il y a 1 mois
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès