AI Engineer (LLM / RAG) F/H
PARIS, 75
il y a 5 jours
Overview
Vous rejoignez l’équipe Data / IA / Engineering , rattachée au Chief AI Officer , pour concevoir, implémenter et industrialiser des fonctionnalités d’IA générative (LLM / RAG) au cœur des produits Harvest (CRM patrimonial, outils de conseil, etc.).
Votre mission : transformer l’IA en valeur produit concrète (automatisation, recherche pertinente, meilleure UX) en garantissant qualité, sécurité et conformité en production.
Responsibilities
- Concevoir et délivrer des systèmes LLM “production‑grade” : pipelines RAG complets (ingestion, nettoyage, chunking, embeddings, stockage, retrieval, génération).
- Mettre en place des stratégies de retrieval robustes : hybrid search (lexical + vectoriel), filtrage par métadonnées, reranking, approches multi‑stage pour optimiser recall / precision.
- Réduire les hallucinations et fiabiliser les réponses (grounding, citations internes, guardrails, politiques d’abstention).
- Construire un framework d’évaluation (tests, métriques de factualité et de couverture, benchmarks continus) et un monitoring LLMOps (latence, coûts, qualité, dérive, feedback utilisateur, traçage des prompts).
- Industrialiser les pratiques : versioning des prompts/chaînes, A/B testing, rollouts / rollbacks, définition de SLOs.
- Intégrer sécurité et compliance by design : contrôle d’accès, multi‑tenancy, gestion du PII, auditabilité, OIDC/OAuth2 (ex. Keycloak).
- Travailler en étroite collaboration avec Product, Engineering, experts métier pour transformer des besoins en fonctionnalités mesurables et documenter les bonnes pratiques (RAG, prompting, LLMOps).
Qualifications
- ≥ 5 ans d’expérience en ML / ML Engineering / IA appliquée, avec des réalisations LLM / RAG en production.
- Excellentes bases de software engineering : APIs, tests, performance, design modulaire, revue de code.
- Maîtrise des architectures RAG production‑grade et des agents LLM (orchestration, routing, mémoire, modes dégradés).
- Solide culture LLMOps : évaluation continue, monitoring, A/B testing, rollouts/rollbacks.
- Stack : Python, SQL, JavaScript, FastAPI, PostgreSQL, Airflow, Qdrant (ou équivalent), Docker, Kubernetes, GitLab CI, ArgoCD, Grafana, OpenTelemetry.
- À l’aise dans des environnements complexes et réglementés, autonome, structuré·e.
- Bonus : expérience multi‑agents (router + tools + evaluator), finance / conformité.
Soft skills
- Curieuse, qui voit un monde d’opportunités dans l’IA.
- Battante, capable de pousser les sujets dans un cadre en construction.
- Avec un vrai sens de l’ownership, de la décision et de la pédagogie auprès des métiers.
Entreprise
Harvest Groupe
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
LEVALLOIS-PERRET, 92
il y a 11 jours
LYON, 69
il y a 7 jours
BOULOGNE-BILLANCOURT, 92
il y a 19 heures
PARIS, 75
il y a 7 jours