Cloud – SRE plateforme cloud
Placé sous l’autorité du ministre des Armées, le Commissariat au Numérique de Défense (CND) a pour mission d’apporter un appui numérique performant et résilient aux opérations et de faciliter la construction du système de combat de demain autour du numérique et de la donnée. Il apporte un appui numérique permettant au ministère des Armées de fonctionner au quotidien, et gère les crédits qui lui ont attribués et rend compte des résultats obtenus à la Représentation nationale.
Ainsi, le CND assure la direction, l'exploitation et le soutien des réseaux d'infrastructure, du socle numérique ministériel mutualisé et des systèmes d'information (SI) et de communication qui lui sont confiés.
Lead SRE Plateforme
Vous concevez, déployez et opérez l'offre de services qui rend la plateforme utilisable. Vos missions incluent :
- Isolation & performances : garantir l'isolation multi-tenant, la résilience et les performances de la plateforme en production ;
- Catalogue de services managés : bases de données, caches, queues, secrets — déploiement régional puis extension multi-régions en collaboration avec les équipes Storage et Compute ;
- Landing zone multi-tenant : namespaces, quotas, RBAC, templates, CI/CD — régional puis multi-régions ;
- Automatisation : industrialiser la plateforme pour garantir la reproductibilité des déploiements et réduire la charge d'exploitation ;
- Services transverses : mettre en œuvre observabilité as a service (métriques, logs, traces) et secrets as a service ;
- Gestion d'incidents : participation niveau N3/N4 et astreintes ;
- Pilotage : conduire l'exploitation par les SLO, error budgets et RETEX ;
- Équipe : encadrer techniquement les ingénieurs plateforme ; contribuer au recrutement et à la montée en compétences ;
- Documentation & formation : rédiger la documentation et accompagner les équipes utilisatrices.
Profil recherché
Nous cherchons SRE plateforme (10+ ans d'expérience), capable de construire et opérer des services managés robustes et d’offrir une expérience développeur de qualité.
Expérience professionnelle
- Exploitation SRE de plateforme cloud à l'échelle : gestion d'incidents, astreintes, pilotage par SLO/SLI, RETEX ;
- Ingénierie plateforme : conception et exploitation de services managés sur Kubernetes (operators, Helm, Kustomize), CI/CD (GitLab CI, ArgoCD ou équivalent), landing zones multi-tenant ;
- Déploiements multi-sites avec approche automatisée et reproductible.
Compétences techniques
- Expertise d’au moins un langage d’infrastructure-as-code (e.g., Terraform) ;
- Expertise d’une stack d’observabilité (Prometheus, Grafana, Loki ou équivalent), et des outils/méthodes de métrologies ;
- Maîtrise d'au moins un langage de programmation (Go, Python ou équivalent), capacité à contribuer aux operators et à l'outillage plateforme ;
- Très bonne compréhension des enjeux de systèmes distribués multi-regions (cohérence, consensus, réplication, CAP) et capacité à dialoguer avec une équipe experte ;
- Très bonne connaissance des questions de sécurité, capacité à dialoguer avec une chaîne SSI.
Qualités personnelles
- Rigoureux : Capacité à concevoir et maintenir des infrastructures critiques avec une attention méticuleuse aux détails, particulièrement dans les aspects de sécurité et de reproductibilité ;
- Innovant : Capacité à proposer des solutions techniques avancées et à implémenter des bonnes pratiques ;
- Ancré dans une culture d'analyse factuelle et d'amélioration continue ;
Atouts appréciés
- Expérience d'environnements multi-sites / multi-régions ;
- Expérience avec des environnements air-gapped ;
- Connaissance de SecNumCloud et IGI 1300 ;