Site Reliability Engineer (SRE) GCP H/F
? Missions
En tant que Site Reliability Engineer (SRE) GCP, vous êtes garant de la fiabilité, de la scalabilité et de la performance des plateformes cloud opérées sur Google Cloud.
Au cœur des environnements de production, vous contribuez à l'automatisation et à l'amélioration continue de la fiabilité des systèmes.
Vos responsabilités :Définir et mettre en œuvre les pratiques SRE : SLI, SLO, SLA Garantir la haute disponibilité et la résilience des plateformes cloud
Automatiser l'infrastructure et les opérations pour réduire le travail manuel
Développer des outils et scripts pour améliorer l'exploitation des systèmes
Mettre en place des stratégies de monitoring, alerting et observabilité
Participer à la gestion des incidents critiques (incident response, post-mortem, RCA)
Optimiser la scalabilité et la performance des infrastructures cloud
Contribuer à l'amélioration des pipelines CI/CD et des pratiques Dev
Ops
Travailler en étroite collaboration avec les équipes Software Engineering, Cloud et Platform
Participer aux revues d'architecture et aux décisions techniques