Administrateur(trice) Système HPC
MONTPELLIER, 34
il y a 5 jours
Administrateur Systèmes Linux – Environnement HPC
CDI | Confirmé / Senior | Centre de calcul – Environnement scientifique
Démarrage : À définir
Contexte du poste
Alliance Services Plus (AS+) recherche un(e) Administrateur(trice) Systèmes Linux HPC pour le compte d’un centre de calcul national de référence, opérant des infrastructures de calcul intensif dédiées à la recherche scientifique et à l’enseignement supérieur.
Intégré(e) au sein des équipes d’exploitation, vous contribuerez au maintien en condition opérationnelle d’une plateforme HPC critique, utilisée par une communauté importante d’utilisateurs pour des travaux de simulation, de modélisation et de calcul scientifique à grande échelle.
Missions principales
- L’administration, le maintien en condition opérationnelle et l’optimisation d’environnements Linux à grande échelle
- La gestion et l’exploitation d’infrastructures de calcul intensif (clusters HPC)
- Le support technique de niveau 2/3 auprès des utilisateurs scientifiques
- L’administration des ordonnanceurs de jobs et des systèmes de fichiers parallèles
- Le déploiement, la mise à jour et l’optimisation des environnements logiciels scientifiques
- L’automatisation des tâches d’administration et d’exploitation
- La gestion des incidents, le diagnostic et la résolution de problèmes complexes
- La participation aux opérations de maintenance et aux évolutions d’architecture
- La rédaction et la mise à jour de la documentation technique et des procédures
- La participation à la veille technologique et à l’amélioration continue des plateformes
Environnement technique
Les projets s’appuient principalement sur les technologies suivantes :
- Systèmes d’exploitation : Linux (RHEL, CentOS, Rocky Linux, Ubuntu)
- Ordonnanceurs : Slurm (principal), PBS Pro (selon environnements)
- Stockage : systèmes de fichiers distribués (Lustre, GPFS)
- Réseaux haute performance : InfiniBand
- Gestion d’environnements logiciels : modules (Lmod / module-tcl), Spack
- Supervision & exploitation : outils de monitoring HPC et systèmes
- Architectures matérielles : CPU x86_64 / ARM, GPU (NVIDIA – selon périmètre)
Profil recherché
- Formation Bac+5 (École d’ingénieur, Master) ou expérience équivalente
- Expérience confirmée en administration systèmes Linux dans un environnement complexe
- Connaissance des environnements HPC et des contraintes associées (performance, scalabilité, disponibilité)
- Maîtrise des outils d’exploitation Linux et des mécanismes d’automatisation
- Capacité à intervenir sur des infrastructures critiques en production
Qualités attendues
- Rigueur et sens de l’analyse
- Autonomie et capacité à prioriser
- Bon relationnel et aptitude à travailler avec des utilisateurs experts
- Capacité à documenter et à formaliser les procédures
- Esprit d’équipe et sens du service
Atouts appréciés
- Expérience en centre de calcul ou environnement de recherche
- Connaissance des architectures HPC avancées (réseau, stockage, GPU)
- Pratique des outils de déploiement et d’orchestration HPC
Entreprise
Alliance Services Plus
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
PARIS, 75
il y a 4 jours
PARIS, 75
il y a 5 jours
PARIS, 75
il y a 5 jours
LABÈGE, 31
il y a 2 jours