Architecte Systemes IA / Lead MLOps
# Architecte Systemes IA / Lead MLOps### Informations
Département
Engineering & Product
Lieu
Marseille
Contrat
CDIRemote
Non## Le contexte
Mentivis conçoit et opere des systemes d'intelligence artificielle appliques a l'education, la formation professionnelle et la transformation des competences. Nous ne sommes ni un cabinet de conseil, ni un integrateur generique : nous construisons des infrastructures IA souveraines, en production, pour des institutions publiques, des grands comptes et des operateurs de formation a forte volumetrie.
Dans le cadre du deploiement de Mentivis
OS, notre plateforme d'IA appliquee a l'education, nous recrutons un(e) Architecte Systemes IA charge(e) de concevoir, industrialiser et operer nos pipelines multi-LLM en environnement souverain.
Ce poste n'est pas un role de prototypage. Il s'agit de faire tourner des systemes en production, avec des engagements de fiabilite, de traçabilite et de conformite reglementaire aupres de clients institutionnels.## La mission### **Orchestration multi-LLM et industrialisation**Concevoir et maintenir une architecture d'orchestration multi-modeles capable de router, chainer et fallback entre plusieurs LLM selon le contexte, le cout, la latence et les contraintes de souverainete. La stack repose sur Lang
Chain / Lang
Graph pour le chainage agentique, avec une couche d'abstraction permettant le swap de modeles sans refactoring applicatif.
Mettre en place et operer les pipelines MLOps de bout en bout : versioning de modeles (MLflow, Weights & Biases), orchestration d'entrainement et de fine-tuning (Ray, Deep
Speed, Lo
RA/QLo
RA pour l'adaptation parametrique), registre de modeles avec lineage, deploiement canary et blue-green sur infrastructure GPU (NVIDIA A100/H100, ou equivalent cloud souverain OVHcloud, Scaleway, Outscale).### **Guardrails, fiabilite et gouvernance**Implementer une couche systematique de guardrails sur l'ensemble des sorties LLM : detection de hallucinations via NLI (Natural Language Inference), filtrage de contenu (Guardrails AI, Ne
Mo Guardrails de NVIDIA), validation structurelle des outputs (Pydantic, JSON Schema enforcement), et monitoring de derive semantique en production (Lang
Smith, Langfuse, Arize Phoenix).
Mettre en place une infrastructure de tests automatises pour les systemes IA : evaluations de regression sur benchmarks proprietaires, red-teaming automatise, scoring de coherence et de fidelite factuelle, avec alerting et circuit-breaker en cas de degradation.
Assurer la conformite reglementaire (AI Act europeen, RGPD, referentiels ANSSI) et produire la documentation technique necessaire aux audits clients et aux certifications.### **Integration entreprise : Learning
OS et Talent
OS API**Concevoir et maintenir les connecteurs API vers les ecosystemes Learning
OS (LMS/LXP : 360Learning, Cornerstone, Moodle, Open
Ed
X) et Talent
OS (SIRH/Talent Management : Workday, SAP Success
Factors, Talentsoft/Cegid) pour les deploiements grands comptes.
Cela couvre : l'ingestion bidirectionnelle de donnees apprenant (parcours, completions, evaluations, certifications), la synchronisation des referentiels de competences (ROME, ESCO, referentiels clients), l'alimentation en temps reel des moteurs de recommandation IA depuis les donnees RH, et la generation automatisee de contenus pedagogiques contextualises (adaptive learning paths, assessments generes, remediation automatique).
Developper les SDK et la documentation technique permettant aux DSI clients d'integrer nos services IA dans leurs architectures existantes (REST, Graph
QL, webhooks, SSO/SAML).### **Infrastructure et observabilite**Operer l'infrastructure de serving des modeles (v
LLM, Tensor
RT-LLM, Triton Inference Server) avec autoscaling, gestion de la concurrence et optimisation du throughput (batching dynamique, quantification INT8/FP8, speculative decoding).
Mettre en place l'observabilite complete : tracing distribue (Open
Telemetry), metriques de performance des inferences (latence P50/P95/P99, tokens/seconde, cout par requete), dashboards operationnels (Grafana, Datadog), et alerting proactif.## Le profil
Formation d'ingenieur ou equivalent, avec au minimum 5 ans d'experience en production sur des systemes ML/IA, dont une partie significative sur des architectures LLM.### **Maitrise attendue :**Python avance (asyncio, typing strict, packaging), Type
Script pour les couches API. Ecosysteme Lang
Chain/Lang
Graph, ou equivalent (Semantic Kernel, Haystack). Techniques de fine-tuning et d'adaptation de modeles (Lo
RA, QLo
RA, RLHF, DPO). Infrastructure de serving GPU et optimisation d'inference. Kubernetes, Docker, CI/CD sur des pipelines ML. Au moins un cloud souverain europeen (OVHcloud, Scaleway, Outscale, 3DS Outscale).### **Forte valeur ajoutee :**Experience sur des projets conformes AI Act ou certifies (ISO 27001, Sec
Num
Cloud). Connaissance du secteur education/formation et des standards associes (x
API, LTI, SCORM, CMI5). Experience d'integration avec des SIRH ou LMS d'entreprise. Contribution a des projets open source dans l'ecosysteme IA.## Ce que nous offrons
Un poste a impact reel dans un operateur qui deploie des systemes IA en production pour des clients institutionnels et grands comptes, pas dans un lab de recherche deconnecte du terrain. Une equipe resserree ou les decisions techniques sont prises par ceux qui construisent. Un ancrage a Marseille, au coeur de l'ecosysteme Campus Cyber.
AI Euromed, avec une exposition directe aux enjeux de souverainete numerique europeenne.
Remuneration : selon profil et experience, avec une composante variable indexee sur les resultats des projets deployes.
#J-18808-Ljbffr