Ingénieur IA Générative & Vertex AI
PARIS, 75
il y a 5 jours
Pyl.Tech est un pure player Google qui accompagne les entreprises dans leur transformation numérique grâce à des solutions innovantes personnalisées. De la modernisation des infrastructures Cloud à l’adoption de l’IA Générative (Gemini), en passant par le Digital Workplace et la Data, nous intervenons de la conception stratégique à la mise en œuvre technique auprès de clients grands comptes et d’ETI ambitieuses. Notre conviction : conjuguer performance et simplicité au service de votre transformation.
Responsabilités
- Développer et industrialiser des solutions GenAI (RAG, agents conversationnels, grounding) sur Vertex AI pour les clients.
- Construire des pipelines RAG complets : chunking adaptatif, génération d’embeddings text‑embedding‑004, indexation vectorielle via Vertex AI Vector Search.
- Orchestrer des chaînes multi‑modèles (LangChain, LlamaIndex) : routing, fallback, chaînes conditionnelles, mémoire conversationnelle.
- Concevoir et optimiser les stratégies de retrieval : hybrid search (dense + sparse), re‑ranking, filtrage par métadonnées, scoring de pertinence.
- Designer des prompts efficaces (Few‑shot, Chain‑of‑Thought, ReAct) et réduire les hallucinations par le grounding.
- Développer des agents conversationnels autonomes capables d’appeler des outils externes (Function Calling, Extensions Vertex AI).
- Containeriser et déployer des applications IA scalables sur Cloud Run avec auto‑scaling et gestion des cold starts.
- Créer des APIs REST sécurisées (FastAPI/Flask) avec authentification OAuth2, rate limiting et documentation OpenAPI.
- Provisionner l’infrastructure via Terraform : Vertex AI Endpoints, Cloud Run services, VPC peering, service accounts.
- Mettre en place des pipelines CI/CD dédiés aux modèles IA : tests automatisés, déploiement blue/green, rollback.
- Monitorer la qualité des réponses en production : métriques de grounding, latence (P50/P95/P99), coûts tokens, taux d’hallucination.
- Implémenter des systèmes d’évaluation automatisés (RAGAS, DeepEval) pour mesurer pertinence et fidélité des réponses.
- Optimiser les coûts d’inférence : batching, caching des embeddings, choix du modèle adapté (Gemini Pro vs Flash vs Nano).
- Mettre en place logging structuré et dashboards Cloud Monitoring.
- Tester les nouveaux modèles Vertex AI (Gemini Ultra, Imagen, Codey) et évaluer leur applicabilité aux cas d’usage clients.
- Prototyper des architectures innovantes : multi‑agents, GraphRAG, fine‑tuning supervisé, RLHF.
Compétences techniques
- Expertise Python et frameworks IA (LangChain, LlamaIndex).
- Connaissance approfondie RAG, embeddings, vector databases et LLMs.
- Expérience avec Vertex AI, Gemini API, services Google Cloud.
- Maîtrise Docker et déploiement Cloud Run.
Compétences comportementales
- Pragmatisme : capacité à passer rapidement d’un POC à la production.
- Pédagogie pour vulgariser les concepts IA auprès des équipes métiers.
- Curiosité et veille permanente sur les avancées GenAI.
Qualifications
- Diplôme Bac+5 en Informatique, Data Science ou IA/ML.
- 2 à 3 ans d’expérience en développement IA/ML, idéalement avec des projets GenAI ou NLP.
Avantages
- Perspectives d’évolution claires : plan de carrière, formations ciblées, certifications professionnelles (Google Cloud, Gemini, etc.).
- Cadre de travail flexible et stimulant : télétravail, culture d’entreprise basée sur la confiance, l’entraide et l’innovation.
- Projets à fort impact mobilisant les technologies les plus innovantes (IA Générative Gemini, Cloud souverain, Data, Digital Workplace).
- Écosystème Google unique : accès privilégié aux dernières technologies, formations partenaires et communauté d’experts passionnés.
Entreprise
Pyl.Tech
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
PARIS, 75
il y a 8 jours
PARIS, 75
il y a 13 jours
LEVALLOIS PERRET
il y a 13 jours
PARIS, 75
il y a 13 jours