Ingénieur(e) Admin. Système HPC - N2
PARIS, 75
il y a 8 jours
Dans le cadre d'un projet stratégique de modernisation et d'exploitation d'une infrastructure de calcul intensif au sein d'un grand organisme public réglementaire, nous recherchons un(e) Administrateur(trice) Systèmes HPC confirmé(e).
L'environnement s'inscrit dans un contexte de haute disponibilité et d'exigences de sécurité strictes, en lien avec des missions critiques de simulation et d'analyse scientifique.
Responsabilités principales
- Administration et maintien en condition opérationnelle des clusters de calcul (Linux RHEL/Rocky, 500–2000+ nœuds)
- Gestion des ordonnanceurs de jobs (Slurm) : configuration des partitions, QoS, accounting et optimisation du scheduling
- Administration des systèmes de fichiers parallèles (Lustre, GPFS/Spectrum Scale) : tuning I/O, gestion des quotas, surveillance des performances
- Déploiement et gestion des environnements logiciels scientifiques via Environment Modules et Spack
- Supervision des réseaux haute performance (InfiniBand HDR/HDR100, Ethernet RoCE)
- Support utilisateur de niveau 2 : diagnostic de problèmes de performance, aide à l'optimisation d'applications scientifiques
- Contribution à l'automatisation des opérations (Ansible, scripts Bash/Python)
- Participation aux astreintes et gestion des incidents critiques en lien avec l'équipe senior
- Rédaction de documentation technique et de procédures d'exploitation
Compétences techniques requises
- Linux avancé (RHEL/Rocky Linux/CentOS) – administration à grande échelle
- Virtualisation et conteneurisation : KVM, Singularity/Apptainer
- Outils d'automatisation : Ansible (maîtrise opérationnelle), Puppet (connaissance appréciée)
- Scripting : Bash (avancé), Python (maîtrise fonctionnelle)
- Ordonnanceur Slurm : configuration, partitions, accounting, QoS
- Systèmes de fichiers parallèles : Lustre et/ou GPFS (exploitation et tuning)
- Réseaux HPC : InfiniBand, Ethernet haut débit
- Gestion des stacks logicielles scientifiques : Spack, Environment Modules
Monitoring & sécurité
- Outils de supervision : Prometheus/Grafana, Nagios/Zabbix
- Sécurité Linux : hardening, gestion des accès, audit (conformité SI sensible)
- Gestion des identités : LDAP/Active Directory
Profil et expérience attendus
- Formation supérieure en informatique, systèmes ou domaine connexe (Bac+3 à Bac+5)
- 3 à 6 ans d'expérience en administration systèmes, dont au moins 2 ans en environnement HPC ou datacenter critique
- Expérience en environnement réglementé ou sécurisé appréciée
- Capacité à travailler en équipe et à communiquer avec des utilisateurs scientifiques exigeants
- Rigueur, autonomie dans le cadre défini, sens du service
- Maîtrise du français (langue de travail) ; anglais technique lu/écrit
Modalités pratiques
- Rythme de présence : 2 jours sur site / 3 jours en télétravail par semaine
- Participation aux astreintes de niveau 2 (planning partagé)
- Déplacements : Ponctuels sur site client (Île-de-France)
Entreprise
Alliance Services Plus
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
PARIS, 75
il y a 25 jours
PARIS, 75
il y a 25 jours
PARIS, 75
il y a 25 jours
PARIS, 75
il y a 25 jours