Signaler

IA/LLM Engineer

PARIS, 75

il y a 1 jour

L’équipe R&I chez codoc développe des algorithmes de similarité phénotypique, des pipelines NLP médicaux et des outils d’indexation sémantique déployés en production dans plusieurs CHU partenaires. Nous travaillons au cœur de projets structurants : Meditwin, RHU SickMast, et des cohortes maladies rares.

Intégré(e) à la Squad R&I et managé(e) par le Lead Data Science, tu occupes la position de référent·e IA/LLMOps. Ton rôle central : concevoir, industrialiser et maintenir les composants IA qui alimentent le produit Codoc, en particulier tout ce qui touche aux embeddings, aux LLM et à l’indexation sémantique des bases de données médicales.

Tes missions

Concevoir et intégrer les composants IA du produit Codoc : indexation vectorielle, embeddings et architectures LLM (RAG, extraction, génération)
Mettre en production et maintenir les pipelines IA dans les environnements hospitaliers partenaires, en garantissant qualité, performance et conformité RGPD/HDS
Contribuer aux projets de recherche sur l’errance diagnostique des maladies rares aux côtés de l’équipe R&I
Assurer une veille technologique active et contribuer à la valorisation scientifique des travaux R&I

Compétences techniques requises

Maîtrise de Python et de l’écosystème ML (PyTorch, HuggingFace Transformers, LangChain ou LlamaIndex)
Solide expérience MLOps : CI/CD pour modèles, versioning (MLflow, DVC, W&B)
Expérience d’indexation vectorielle et de bases de données embeddings (FAISS, OpenSearch, Qdrant, pgvector…), y compris le choix de la granularité selon les cas d’usage
Maîtrise des architectures RAG et des patterns de déploiement LLM : orchestration, prompt engineering, quantization, gestion du contexte et des limites de tokens
Bonnes pratiques d’évaluation : benchmarks d’embeddings, systèmes de feedback utilisateur, métriques de qualité et d’exhaustivité des extractions

Compétences appréciées

Intérêt ou expérience dans le domaine de la santé, des données cliniques ou des terminologies médicales (UMLS, SNOMED, CIM-10)
Expérience en NLP médical : modèles spécialisés (CamemBERT-bio, DrBERT, BioLinkBERT…), extraction d’entités, NER
Pratique de la rédaction scientifique : publications, rapports d’étude, présentations en congrès
Connaissance des contraintes réglementaires HDS / RGPD / IA act applicables à l’IA en santé

Formation & expérience

Diplôme d’ingénieur·e ou Master 2 en data science, machine learning ou domaine connexe
+5 ans d’expérience en déploiement de modèles IA / ML (hors stage)
Expérience démontrée en conception et mise en production de systèmes impliquant LLM et/ou modèles d’embeddings à l’échelle

#J-18808-Ljbffr

Entreprise

Codoc

Plateforme de publication

WHATJOBS

Offres pouvant vous intéresser

Ingénieur Vidéo – Maintenance des Systèmes Broadcast (H/F)

FRANCE

il y a 10 jours

Alternance data scientist deep learning et innovation géospatiale - h/f

RAMONVILLE SAINT AGNE

il y a 8 jours

ALTERNANCE - Data Scientist - Deep Learning et innovation géospatiale - H/F

RAMONVILLE SAINT AGNE

il y a 1 jour

ALTERNANCE - DATA SCIENTIST - DEEP LEARNING ET INNOVATION GÉOSPATIALE - H/F

RAMONVILLE-SAINT-AGNE, 31

il y a 13 jours