Chargement en cours

CLOUD - LEAD SRE - COMPUTE AND ORCHESTRATION

LE KREMLIN BICÊTRE
il y a 1 jour

Vos missions en quelques mots

En tant que Lead SRE Compute & Orchestration, vous concevez, déployez et opérez l’ensemble de la stack compute. Vos missions incluent :

  • Provisionnement & inventaire : mettre en œuvre l’automatisation complète (e.g., Tinkerbell, MAAS, Ironic, Netbox ou équivalents) ;
  • Firmware & BMC : maîtriser, durcir et automatiser la couche firmware ;
  • OS & Images : produire et déployer les images OS durcies ;
  • Virtualisation : implémenter et exploiter la couche de virtualisation (OpenStack, Incus, KubeVirt ou équivalent) en garantissant isolation et résilience ;
  • Kubernetes : opérer les clusters (control plane, workers, etcd) et assurer leur reconstruction rapide ainsi que la résilience multi-sites ;
  • Reproductibilité : garantir des builds et déploiements déterministes, versionnés, auditables ;
  • Sécurité : implémenter le durcissement à toutes les couches (firmware, OS, runtime) et contribuer à la chaîne de confiance boot-to-workload ;
  • Documentation : rédiger les procédures d’exploitation et la documentation technique ;
  • Pilotage : conduire l’exploitation par les SLO, error budgets et RETEX ;
  • Équipe : encadrer techniquement les ingénieurs ; contribuer au recrutement et à la montée en compétences.

Profil recherché

Nous cherchons un expert infrastructure compute confirmé (10+ ans d’expérience en production), capable de concevoir et opérer les couches basses d’une plateforme critique, avec une approche SRE et une sensibilité sécurité.

Vous possédez de l’expérience professionnelle :

  • Exploitation en production, en mode SRE, de plateforme d’hébergement à grande échelle : gestion d’incidents, astreintes, pilotage par SLO/SLI ;
  • Maîtrise opérationnelle d’au moins une solution d’orchestration de compute en production :
    • Soit virtualisation : OpenStack, Incus ou équivalent avec gestion multi-cluster, isolation et résilience ;
    • Soit Kubernetes : déploiement et exploitation de clusters multi-sites avec leur gestion centralisée (Rancher ou équivalent) ;
    • Provisionnement bare metal à grande échelle ;
    • Culture SRE : automatisation, observabilité, RETEX et amélioration continue.

Compétences techniques

  • Expertise pointue attendue sur l’un des deux domaines (VM ou Kubernetes), le second étant couvert par un recrutement complémentaire ;
  • Maîtrise fonctionnement Linux et expérience des OS immutables ou durcis ;
  • Expertise d’un OS déclaratif ou et d’un langage d’infrastructure as code (Terraform, Ansible, Helm) ;
  • Maîtrise d’au moins un langage de programmation (Go ou Python) : être capable d’implémenter des routines d’orchestration (contrôleurs) ;
  • Très bonne connaissance des questions de sécurité et de durcissement (firmware, OS, runtime), capacité à dialoguer avec une chaîne SSI.

Vous êtes

  • Rigoureux : Capacité à concevoir et maintenir des infrastructures critiques avec une attention méticuleuse aux détails, particulièrement dans les aspects de sécurité et de reproductibilité.
  • Innovant : Capacité à proposer des solutions techniques avancées et à implémenter des bonnes pratiques.
  • Ancré dans une culture d’analyse factuelle et d’amélioration continue.

Atouts appréciés

  • Expérience d’environnements multi-sites / multi-régions ;
  • Expérience avec des environnements air-gapped ;
  • Connaissance de SecNumCloud et IGI 1300 ;
  • Contributions open source.
#J-18808-Ljbffr
Entreprise
Civils de la Défense - Ministère des Armées
Plateforme de publication
WHATJOBS
Offres pouvant vous intéresser
ISSY LES MOULINEAUX
il y a 3 jours
NANTERRE, 92
il y a 13 heures
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès