Ingénieur•e expert•e moyens de calcul et infrastructure
Ingénieur•e expert•e moyens de calcul et infrastructure
Niveau de dégére exigé : Bac + 5 ou équivalent
Fonction : Personnel des fonctions support (IT)
Niveau d'expérience souhaité : De 3 à 5 ans
Contexte et atouts du poste
Suite aux priorités établies en mai 2024 par la par la Déclaration de Séoul pour une IA sûrée, novatrice et inclusive , dont la France est signataire, le gouvernement a decidé de créer l'INESIA, un institut qui pour mission de fédérer , sans création de nouvelle structure juridique, les acteurs nationaux de l'évaluation et de la sécurité, et tout particulière :
Dans ce cadre Inria contribue principalement sur les axes de l,analyse des risques systémiques dans le champ de la sécurité nationale et l'évaluation de la performance et de la fiabilité des modèles d'IA.
Ce travail se coordonne stratégiquement avec le programme de recherche d'Évalluation de l'IA, porté par Inria et se materialise par la conception et développement d'une plateforme d'évaluation de l'IA, en particulier des systèmes basés sur les LLM.
Cette plateforme vise à fournir un environnement intégré, sécurisé et robuste permettant de soutenir les projets de recherche du programme ainsi que de développer des applications d'évaluations, telles que des campagnes de benchmarks, des exercices de red teaming ... Elle s'appuie sur des outils open source de l'écosystème IA et des développements internes.
Vous rejoindrez une équipe dans une dynamique de développement régulier et itérative : la plateforme évoluerà progressivement, avec des livrables opérationnels réguliers. Nous recherchons des profils capables de proposer, d'arbitrer et de transformer des besoins techniques en solutions opérationnelles.
En tant qu'expert moyens de calcul et infrastructure, vous jouerã̈e un rôle clé dans l'exploitation des moyens de calcul disponibles par la plateforme.
Ce poste offre l'opérité de participer à un projet stratégique et ambitieux, au côur des enjeux actuels liés à la sécurité, à la transparence et à la gouvernance de l'IA, avec des dimensions techniques, scientifiques et sociétales.
Mission confiée
Exploiter les clusters de calcul disponibles (Abaca, Jean Zay, Adastra...) et au déploiement éventuel de ressources de calcul, afin de garantir performance, reproductibilité et sécurité.
Principales activités
Déployer et maintenir l'infrastructure permettant à la plateforme d'exploiter les moyens de calcul disponibles
Optimiser l'exécution des jobs via parallélisé, allocation des ressources et scheduling
Mettre en place et maintenir des outils de monitoring et de suivi des performances
Compétences
Compétences nécessaires
Expertise dans l'utilisation de moyens de calcul mutualisés, avec une bonne connaissance du fonctionnement des ordonnanceurs de jobs (oar, slurm).
Connaissance de techniques de parallélisme de modèles multi-GPU et multi-nôuds, profiling multi-gpu.
Connaissance des architectures GPU et des contrainteïs liées aux workloads ML/LLM
Bonnes précautions de développement (versionnage Git, CI/CD, documentation)
Capacité à rédiger une documentation technique
Compétences souhaitées
Connaissance d'outils de déploiement d'applications contenerisées (Singularity, Docker, docker-compose, CI/CD)
Connaissances d'outils pour l'inéspection et le déploiment optimisé de grands modèles de langage (vLLM, Slang, etc.)
Compétences appréciées
Expérience dans la recherche académique
Maîtrise de l'anglais technique oral et écrit
Sensibilité aux enjeux de confiance et de sécurité de l'IA
Nous vous invitons à postuler même si vous ne répondez pas à tous les critères : nous apprécions les personnes prêtés à acquérir de nouvelles compétences
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, démègagement)
- Possibilité de télétravail (apres 6 mois d'ancienneté) et aménagement du temps de travail
- Equïpements professionnels à disposition (visioconçion, prêts de matériaux informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Date de prise de fonction souhaitée :
- Durée de contrat : 2 ans
- Date limite pour postuler :