Site Reliability Engineer (SRE) (H/F)
Nous recherchons un(e) Site Reliability Engineer (SRE) expérimenté(e) pour renforcer nos équipes et garantir la fiabilité, la performance et la scalabilité de notre plateforme. Vos missions Vous serez responsable de la disponibilité et de la qualité de service de nos systèmes en production. À ce titre, vous interviendrez sur la gestion des incidents de bout en bout (analyse des causes racines, mise en place de correctifs et actions de prévention), ainsi que sur l'amélioration continue de l'observabilité. Vous contribuerez activement à l'automatisation des opérations et du support, notamment via des approches software et l'usage d'outils innovants (dont l'IA appliquée aux Ops). Vous travaillerez en étroite collaboration avec les équipes de développement, Dev
Ops et sécurité, en apportant votre expertise pour améliorer la fiabilité, la performance et la sécurité des systèmes, tout en influençant les bonnes pratiques techniques. ️ Environnement technique Vous évoluerez dans un environnement moderne basé sur GCP, Kubernetes et des infrastructures automatisées. Vous utiliserez notamment Linux, Python, Terraform et Datadog pour le monitoring et l'observabilité. L'écosystème de développement repose sur Git
Hub et Git
Hub Actions. Des connaissances solides en réseau et en sécurité (WAF, protection DDo
S) sont attendues. Pourquoi nous rejoindre Vous interviendrez sur des sujets à fort impact, au cœur de la fiabilité de la plateforme, avec une réelle autonomie et la possibilité de mettre en place des améliorations structurantes.