Postuler

Signaler

Architecte Systemes IA / Lead MLOps

MARSEILLE, 13

il y a 2 jours

# Architecte Systemes IA / Lead MLOps### Informations

Département

Engineering & Product

Lieu

Marseille

Contrat

CDIRemote

Non## Le contexte

Mentivis conçoit et opere des systemes d'intelligence artificielle appliques a l'education, la formation professionnelle et la transformation des competences. Nous ne sommes ni un cabinet de conseil, ni un integrateur generique : nous construisons des infrastructures IA souveraines, en production, pour des institutions publiques, des grands comptes et des operateurs de formation a forte volumetrie.

Dans le cadre du deploiement de Mentivis

OS, notre plateforme d'IA appliquee a l'education, nous recrutons un(e) Architecte Systemes IA charge(e) de concevoir, industrialiser et operer nos pipelines multi-LLM en environnement souverain.

Ce poste n'est pas un role de prototypage. Il s'agit de faire tourner des systemes en production, avec des engagements de fiabilite, de traçabilite et de conformite reglementaire aupres de clients institutionnels.## La mission### **Orchestration multi-LLM et industrialisation**Concevoir et maintenir une architecture d'orchestration multi-modeles capable de router, chainer et fallback entre plusieurs LLM selon le contexte, le cout, la latence et les contraintes de souverainete. La stack repose sur Lang

Chain / Lang

Graph pour le chainage agentique, avec une couche d'abstraction permettant le swap de modeles sans refactoring applicatif.

Mettre en place et operer les pipelines MLOps de bout en bout : versioning de modeles (MLflow, Weights & Biases), orchestration d'entrainement et de fine-tuning (Ray, Deep

Speed, Lo

RA/QLo

RA pour l'adaptation parametrique), registre de modeles avec lineage, deploiement canary et blue-green sur infrastructure GPU (NVIDIA A100/H100, ou equivalent cloud souverain OVHcloud, Scaleway, Outscale).### **Guardrails, fiabilite et gouvernance**Implementer une couche systematique de guardrails sur l'ensemble des sorties LLM : detection de hallucinations via NLI (Natural Language Inference), filtrage de contenu (Guardrails AI, Ne

Mo Guardrails de NVIDIA), validation structurelle des outputs (Pydantic, JSON Schema enforcement), et monitoring de derive semantique en production (Lang

Smith, Langfuse, Arize Phoenix).

Mettre en place une infrastructure de tests automatises pour les systemes IA : evaluations de regression sur benchmarks proprietaires, red-teaming automatise, scoring de coherence et de fidelite factuelle, avec alerting et circuit-breaker en cas de degradation.

Assurer la conformite reglementaire (AI Act europeen, RGPD, referentiels ANSSI) et produire la documentation technique necessaire aux audits clients et aux certifications.### **Integration entreprise : Learning

OS et Talent

OS API**Concevoir et maintenir les connecteurs API vers les ecosystemes Learning

OS (LMS/LXP : 360Learning, Cornerstone, Moodle, Open

X) et Talent

OS (SIRH/Talent Management : Workday, SAP Success

Factors, Talentsoft/Cegid) pour les deploiements grands comptes.

Cela couvre : l'ingestion bidirectionnelle de donnees apprenant (parcours, completions, evaluations, certifications), la synchronisation des referentiels de competences (ROME, ESCO, referentiels clients), l'alimentation en temps reel des moteurs de recommandation IA depuis les donnees RH, et la generation automatisee de contenus pedagogiques contextualises (adaptive learning paths, assessments generes, remediation automatique).

Developper les SDK et la documentation technique permettant aux DSI clients d'integrer nos services IA dans leurs architectures existantes (REST, Graph

QL, webhooks, SSO/SAML).### **Infrastructure et observabilite**Operer l'infrastructure de serving des modeles (v

LLM, Tensor

RT-LLM, Triton Inference Server) avec autoscaling, gestion de la concurrence et optimisation du throughput (batching dynamique, quantification INT8/FP8, speculative decoding).

Mettre en place l'observabilite complete : tracing distribue (Open

Telemetry), metriques de performance des inferences (latence P50/P95/P99, tokens/seconde, cout par requete), dashboards operationnels (Grafana, Datadog), et alerting proactif.## Le profil

Formation d'ingenieur ou equivalent, avec au minimum 5 ans d'experience en production sur des systemes ML/IA, dont une partie significative sur des architectures LLM.### **Maitrise attendue :**Python avance (asyncio, typing strict, packaging), Type

Script pour les couches API. Ecosysteme Lang

Chain/Lang

Graph, ou equivalent (Semantic Kernel, Haystack). Techniques de fine-tuning et d'adaptation de modeles (Lo

RA, QLo

RA, RLHF, DPO). Infrastructure de serving GPU et optimisation d'inference. Kubernetes, Docker, CI/CD sur des pipelines ML. Au moins un cloud souverain europeen (OVHcloud, Scaleway, Outscale, 3DS Outscale).### **Forte valeur ajoutee :**Experience sur des projets conformes AI Act ou certifies (ISO 27001, Sec

Num

Cloud). Connaissance du secteur education/formation et des standards associes (x

API, LTI, SCORM, CMI5). Experience d'integration avec des SIRH ou LMS d'entreprise. Contribution a des projets open source dans l'ecosysteme IA.## Ce que nous offrons

Un poste a impact reel dans un operateur qui deploie des systemes IA en production pour des clients institutionnels et grands comptes, pas dans un lab de recherche deconnecte du terrain. Une equipe resserree ou les decisions techniques sont prises par ceux qui construisent. Un ancrage a Marseille, au coeur de l'ecosysteme Campus Cyber.

AI Euromed, avec une exposition directe aux enjeux de souverainete numerique europeenne.

Remuneration : selon profil et experience, avec une composante variable indexee sur les resultats des projets deployes.

#J-18808-Ljbffr

Entreprise

Mentivis

Plateforme de publication

WHATJOBS

Offres pouvant vous intéresser

Manager Application - Cybersécurité H/F

TOULOUSE, 31

il y a 22 jours

Manager Application - Cybersécurité H/F

TOULOUSE, 31

il y a 2 heures