CLOUD - LEAD SRE - COMPUTE AND ORCHESTRATION
LE KREMLIN BICÊTRE
il y a 1 jour
Vos missions en quelques mots
En tant que Lead SRE Compute & Orchestration, vous concevez, déployez et opérez l’ensemble de la stack compute. Vos missions incluent :
- Provisionnement & inventaire : mettre en œuvre l’automatisation complète (e.g., Tinkerbell, MAAS, Ironic, Netbox ou équivalents) ;
- Firmware & BMC : maîtriser, durcir et automatiser la couche firmware ;
- OS & Images : produire et déployer les images OS durcies ;
- Virtualisation : implémenter et exploiter la couche de virtualisation (OpenStack, Incus, KubeVirt ou équivalent) en garantissant isolation et résilience ;
- Kubernetes : opérer les clusters (control plane, workers, etcd) et assurer leur reconstruction rapide ainsi que la résilience multi-sites ;
- Reproductibilité : garantir des builds et déploiements déterministes, versionnés, auditables ;
- Sécurité : implémenter le durcissement à toutes les couches (firmware, OS, runtime) et contribuer à la chaîne de confiance boot-to-workload ;
- Documentation : rédiger les procédures d’exploitation et la documentation technique ;
- Pilotage : conduire l’exploitation par les SLO, error budgets et RETEX ;
- Équipe : encadrer techniquement les ingénieurs ; contribuer au recrutement et à la montée en compétences.
Profil recherché
Nous cherchons un expert infrastructure compute confirmé (10+ ans d’expérience en production), capable de concevoir et opérer les couches basses d’une plateforme critique, avec une approche SRE et une sensibilité sécurité.
Vous possédez de l’expérience professionnelle :
- Exploitation en production, en mode SRE, de plateforme d’hébergement à grande échelle : gestion d’incidents, astreintes, pilotage par SLO/SLI ;
- Maîtrise opérationnelle d’au moins une solution d’orchestration de compute en production :
- Soit virtualisation : OpenStack, Incus ou équivalent avec gestion multi-cluster, isolation et résilience ;
- Soit Kubernetes : déploiement et exploitation de clusters multi-sites avec leur gestion centralisée (Rancher ou équivalent) ;
- Provisionnement bare metal à grande échelle ;
- Culture SRE : automatisation, observabilité, RETEX et amélioration continue.
Compétences techniques
- Expertise pointue attendue sur l’un des deux domaines (VM ou Kubernetes), le second étant couvert par un recrutement complémentaire ;
- Maîtrise fonctionnement Linux et expérience des OS immutables ou durcis ;
- Expertise d’un OS déclaratif ou et d’un langage d’infrastructure as code (Terraform, Ansible, Helm) ;
- Maîtrise d’au moins un langage de programmation (Go ou Python) : être capable d’implémenter des routines d’orchestration (contrôleurs) ;
- Très bonne connaissance des questions de sécurité et de durcissement (firmware, OS, runtime), capacité à dialoguer avec une chaîne SSI.
Vous êtes
- Rigoureux : Capacité à concevoir et maintenir des infrastructures critiques avec une attention méticuleuse aux détails, particulièrement dans les aspects de sécurité et de reproductibilité.
- Innovant : Capacité à proposer des solutions techniques avancées et à implémenter des bonnes pratiques.
- Ancré dans une culture d’analyse factuelle et d’amélioration continue.
Atouts appréciés
- Expérience d’environnements multi-sites / multi-régions ;
- Expérience avec des environnements air-gapped ;
- Connaissance de SecNumCloud et IGI 1300 ;
- Contributions open source.
Entreprise
Civils de la Défense - Ministère des Armées
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
ISSY LES MOULINEAUX
il y a 3 jours
MASSY
il y a 3 jours
NANTERRE, 92
il y a 13 heures
HOLTZHEIM, 67
il y a 23 jours