Signaler

Ingénieur IA Générative & Vertex AI

PARIS, 75

il y a 5 jours

Pyl.Tech est un pure player Google qui accompagne les entreprises dans leur transformation numérique grâce à des solutions innovantes personnalisées. De la modernisation des infrastructures Cloud à l’adoption de l’IA Générative (Gemini), en passant par le Digital Workplace et la Data, nous intervenons de la conception stratégique à la mise en œuvre technique auprès de clients grands comptes et d’ETI ambitieuses. Notre conviction : conjuguer performance et simplicité au service de votre transformation.

Responsabilités

Développer et industrialiser des solutions GenAI (RAG, agents conversationnels, grounding) sur Vertex AI pour les clients.
Construire des pipelines RAG complets : chunking adaptatif, génération d’embeddings text‑embedding‑004, indexation vectorielle via Vertex AI Vector Search.
Orchestrer des chaînes multi‑modèles (LangChain, LlamaIndex) : routing, fallback, chaînes conditionnelles, mémoire conversationnelle.
Concevoir et optimiser les stratégies de retrieval : hybrid search (dense + sparse), re‑ranking, filtrage par métadonnées, scoring de pertinence.
Designer des prompts efficaces (Few‑shot, Chain‑of‑Thought, ReAct) et réduire les hallucinations par le grounding.
Développer des agents conversationnels autonomes capables d’appeler des outils externes (Function Calling, Extensions Vertex AI).
Containeriser et déployer des applications IA scalables sur Cloud Run avec auto‑scaling et gestion des cold starts.
Créer des APIs REST sécurisées (FastAPI/Flask) avec authentification OAuth2, rate limiting et documentation OpenAPI.
Provisionner l’infrastructure via Terraform : Vertex AI Endpoints, Cloud Run services, VPC peering, service accounts.
Mettre en place des pipelines CI/CD dédiés aux modèles IA : tests automatisés, déploiement blue/green, rollback.
Monitorer la qualité des réponses en production : métriques de grounding, latence (P50/P95/P99), coûts tokens, taux d’hallucination.
Implémenter des systèmes d’évaluation automatisés (RAGAS, DeepEval) pour mesurer pertinence et fidélité des réponses.
Optimiser les coûts d’inférence : batching, caching des embeddings, choix du modèle adapté (Gemini Pro vs Flash vs Nano).
Mettre en place logging structuré et dashboards Cloud Monitoring.
Tester les nouveaux modèles Vertex AI (Gemini Ultra, Imagen, Codey) et évaluer leur applicabilité aux cas d’usage clients.
Prototyper des architectures innovantes : multi‑agents, GraphRAG, fine‑tuning supervisé, RLHF.

Compétences techniques

Expertise Python et frameworks IA (LangChain, LlamaIndex).
Connaissance approfondie RAG, embeddings, vector databases et LLMs.
Expérience avec Vertex AI, Gemini API, services Google Cloud.
Maîtrise Docker et déploiement Cloud Run.

Compétences comportementales

Pragmatisme : capacité à passer rapidement d’un POC à la production.
Pédagogie pour vulgariser les concepts IA auprès des équipes métiers.
Curiosité et veille permanente sur les avancées GenAI.

Qualifications

Diplôme Bac+5 en Informatique, Data Science ou IA/ML.
2 à 3 ans d’expérience en développement IA/ML, idéalement avec des projets GenAI ou NLP.

Avantages

Perspectives d’évolution claires : plan de carrière, formations ciblées, certifications professionnelles (Google Cloud, Gemini, etc.).
Cadre de travail flexible et stimulant : télétravail, culture d’entreprise basée sur la confiance, l’entraide et l’innovation.
Projets à fort impact mobilisant les technologies les plus innovantes (IA Générative Gemini, Cloud souverain, Data, Digital Workplace).
Écosystème Google unique : accès privilégié aux dernières technologies, formations partenaires et communauté d’experts passionnés.

#J-18808-Ljbffr

Entreprise

Pyl.Tech

Plateforme de publication

WHATJOBS

Offres pouvant vous intéresser

Generative AI Engineer

PARIS, 75

il y a 8 jours

Artificial Intelligence Engineer (H/F)

PARIS, 75

il y a 13 jours

Architect AI generative H/F

LEVALLOIS PERRET

il y a 13 jours

AI Engineer Databricks

PARIS, 75

il y a 13 jours