Ingénieur SRE (H/F)
Contexte de la mission
Dans un environnement complexe et exigeant, vous intervenez au sein d’une équipe SRE (Site Reliability Engineering) afin d’assurer la fiabilité, la performance et la disponibilité de plateformes critiques en production.
Le projet s’inscrit dans un contexte de transformation et d’industrialisation des systèmes, avec une forte orientation vers l’automatisation, la qualité de service et l’amélioration continue.
Vos missions principales
Rattaché(e) au responsable SRE, vous intervenez sur les activités suivantes :
Assurer la gestion opérationnelle des applications critiques en haute disponibilité
Participer à la maintenance et à l’évolution des plateformes techniques (environnements Linux, Docker, Kubernetes)
Gérer des environnements hybrides (Cloud & Data Center privé)
Contribuer à la sécurisation des plateformes (design, configuration, implémentation)
Développer et améliorer des outils liés à la production
Optimiser le monitoring technique et fonctionnel des plateformes
Garantir le maintien en condition opérationnelle (MCO) et la performance des systèmes
Gérer les incidents, évolutions et reporting dans le respect des SLA
Participer à la mise en production via des tests automatisés (unitaires, fonctionnels, smoke tests)
Apporter un support technique aux équipes internes et utilisateurs
Participer aux astreintes (support 24/7)
Compétences requises
Techniques
Développement (niveau confirmé)
SRE / Production Engineering (confirmé)
Environnements Linux / UNIX
Conteneurisation : Docker, Kubernetes
Outils : Git, Jenkins, Ansible / Saltstack
Cloud : AWS / Azure
Monitoring : Grafana, Zabbix, Nagios
Scripting : Bash
Notions en réseaux distribués
Atouts
Kubernetes (certification CKA appréciée)
Java / SQL
Architecture API
Normes ITIL / Sécurité SI (ISO 27001)
Connaissances en cryptographie / PKI