Chargement en cours

IA/LLM Engineer

PARIS, 75
il y a 1 jour

L’équipe R&I chez codoc développe des algorithmes de similarité phénotypique, des pipelines NLP médicaux et des outils d’indexation sémantique déployés en production dans plusieurs CHU partenaires. Nous travaillons au cœur de projets structurants : Meditwin, RHU SickMast, et des cohortes maladies rares.

Intégré(e) à la Squad R&I et managé(e) par le Lead Data Science, tu occupes la position de référent·e IA/LLMOps. Ton rôle central : concevoir, industrialiser et maintenir les composants IA qui alimentent le produit Codoc, en particulier tout ce qui touche aux embeddings, aux LLM et à l’indexation sémantique des bases de données médicales.

Tes missions

  • Concevoir et intégrer les composants IA du produit Codoc : indexation vectorielle, embeddings et architectures LLM (RAG, extraction, génération)
  • Mettre en production et maintenir les pipelines IA dans les environnements hospitaliers partenaires, en garantissant qualité, performance et conformité RGPD/HDS
  • Contribuer aux projets de recherche sur l’errance diagnostique des maladies rares aux côtés de l’équipe R&I
  • Assurer une veille technologique active et contribuer à la valorisation scientifique des travaux R&I

Compétences techniques requises

  • Maîtrise de Python et de l’écosystème ML (PyTorch, HuggingFace Transformers, LangChain ou LlamaIndex)
  • Solide expérience MLOps : CI/CD pour modèles, versioning (MLflow, DVC, W&B)
  • Expérience d’indexation vectorielle et de bases de données embeddings (FAISS, OpenSearch, Qdrant, pgvector…), y compris le choix de la granularité selon les cas d’usage
  • Maîtrise des architectures RAG et des patterns de déploiement LLM : orchestration, prompt engineering, quantization, gestion du contexte et des limites de tokens
  • Bonnes pratiques d’évaluation : benchmarks d’embeddings, systèmes de feedback utilisateur, métriques de qualité et d’exhaustivité des extractions

Compétences appréciées

  • Intérêt ou expérience dans le domaine de la santé, des données cliniques ou des terminologies médicales (UMLS, SNOMED, CIM-10)
  • Expérience en NLP médical : modèles spécialisés (CamemBERT-bio, DrBERT, BioLinkBERT…), extraction d’entités, NER
  • Pratique de la rédaction scientifique : publications, rapports d’étude, présentations en congrès
  • Connaissance des contraintes réglementaires HDS / RGPD / IA act applicables à l’IA en santé

Formation & expérience

  • Diplôme d’ingénieur·e ou Master 2 en data science, machine learning ou domaine connexe
  • +5 ans d’expérience en déploiement de modèles IA / ML (hors stage)
  • Expérience démontrée en conception et mise en production de systèmes impliquant LLM et/ou modèles d’embeddings à l’échelle
#J-18808-Ljbffr
Entreprise
Codoc
Plateforme de publication
WHATJOBS
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès