Chargement en cours

Ingénieur IA Générative & Vertex AI

PARIS, 75
il y a 5 jours

Pyl.Tech est un pure player Google qui accompagne les entreprises dans leur transformation numérique grâce à des solutions innovantes personnalisées. De la modernisation des infrastructures Cloud à l’adoption de l’IA Générative (Gemini), en passant par le Digital Workplace et la Data, nous intervenons de la conception stratégique à la mise en œuvre technique auprès de clients grands comptes et d’ETI ambitieuses. Notre conviction : conjuguer performance et simplicité au service de votre transformation.

Responsabilités

  • Développer et industrialiser des solutions GenAI (RAG, agents conversationnels, grounding) sur Vertex AI pour les clients.
  • Construire des pipelines RAG complets : chunking adaptatif, génération d’embeddings text‑embedding‑004, indexation vectorielle via Vertex AI Vector Search.
  • Orchestrer des chaînes multi‑modèles (LangChain, LlamaIndex) : routing, fallback, chaînes conditionnelles, mémoire conversationnelle.
  • Concevoir et optimiser les stratégies de retrieval : hybrid search (dense + sparse), re‑ranking, filtrage par métadonnées, scoring de pertinence.
  • Designer des prompts efficaces (Few‑shot, Chain‑of‑Thought, ReAct) et réduire les hallucinations par le grounding.
  • Développer des agents conversationnels autonomes capables d’appeler des outils externes (Function Calling, Extensions Vertex AI).
  • Containeriser et déployer des applications IA scalables sur Cloud Run avec auto‑scaling et gestion des cold starts.
  • Créer des APIs REST sécurisées (FastAPI/Flask) avec authentification OAuth2, rate limiting et documentation OpenAPI.
  • Provisionner l’infrastructure via Terraform : Vertex AI Endpoints, Cloud Run services, VPC peering, service accounts.
  • Mettre en place des pipelines CI/CD dédiés aux modèles IA : tests automatisés, déploiement blue/green, rollback.
  • Monitorer la qualité des réponses en production : métriques de grounding, latence (P50/P95/P99), coûts tokens, taux d’hallucination.
  • Implémenter des systèmes d’évaluation automatisés (RAGAS, DeepEval) pour mesurer pertinence et fidélité des réponses.
  • Optimiser les coûts d’inférence : batching, caching des embeddings, choix du modèle adapté (Gemini Pro vs Flash vs Nano).
  • Mettre en place logging structuré et dashboards Cloud Monitoring.
  • Tester les nouveaux modèles Vertex AI (Gemini Ultra, Imagen, Codey) et évaluer leur applicabilité aux cas d’usage clients.
  • Prototyper des architectures innovantes : multi‑agents, GraphRAG, fine‑tuning supervisé, RLHF.

Compétences techniques

  • Expertise Python et frameworks IA (LangChain, LlamaIndex).
  • Connaissance approfondie RAG, embeddings, vector databases et LLMs.
  • Expérience avec Vertex AI, Gemini API, services Google Cloud.
  • Maîtrise Docker et déploiement Cloud Run.

Compétences comportementales

  • Pragmatisme : capacité à passer rapidement d’un POC à la production.
  • Pédagogie pour vulgariser les concepts IA auprès des équipes métiers.
  • Curiosité et veille permanente sur les avancées GenAI.

Qualifications

  • Diplôme Bac+5 en Informatique, Data Science ou IA/ML.
  • 2 à 3 ans d’expérience en développement IA/ML, idéalement avec des projets GenAI ou NLP.

Avantages

  • Perspectives d’évolution claires : plan de carrière, formations ciblées, certifications professionnelles (Google Cloud, Gemini, etc.).
  • Cadre de travail flexible et stimulant : télétravail, culture d’entreprise basée sur la confiance, l’entraide et l’innovation.
  • Projets à fort impact mobilisant les technologies les plus innovantes (IA Générative Gemini, Cloud souverain, Data, Digital Workplace).
  • Écosystème Google unique : accès privilégié aux dernières technologies, formations partenaires et communauté d’experts passionnés.
#J-18808-Ljbffr
Entreprise
Pyl.Tech
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
PARIS, 75
il y a 8 jours
LEVALLOIS PERRET
il y a 13 jours
PARIS, 75
il y a 13 jours
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès