Site Reliability Engineer Expérimenté
Nous recherchons un Site Reliability Engineer expérimenté , avec une approche d’ingénierie forte, capable de faire évoluer la plateforme vers plus de fiabilité, de performance et de maîtrise opérationnelle.
Poste basé à Grenoble – télétravail hybride (2–3 jours / semaine).
Vous intervenez sur deux produits, avec une approche orientée valeur et impact business.
Pleenk – Plateforme de paiement crypto & identité
Pleenk est une plateforme moderne permettant l’intégration de paiements en cryptomonnaie avec des mécanismes avancés de gestion d’identité et de conformité (KYC, onboarding, traçabilité).
Son ambition est claire : fournir une infrastructure fiable, sécurisée et observable, capable de supporter des flux financiers critiques.
L’infrastructure est pensée comme un produit à part entière : automatisée, mesurable et conçue pour accompagner la croissance rapide du système.
Infra & SRE
- Kubernetes
- CI/CD industrialisée
- Observabilité (logs, métriques, alerting)
- Infrastructure as Code
Les enjeux principaux : fiabilité des flux financiers, sécurité, traçabilité, résilience et scalabilité .
Plateforme marketplace
Plateforme en production depuis plus de 15 ans, avec :
- Trafic élevé
- Volumes de données importants
- Contraintes de disponibilité fortes
- Évolutions fonctionnelles continues
L’enjeu est de faire évoluer l’infrastructure pour accompagner un passage à l’échelle international, tout en garantissant stabilité et performance.
Infra & SRE
- Kubernetes (bare metal)
- CI/CD (Jenkins / GitLab CI)
- PostgreSQL, Elasticsearch
- Systèmes distribués
Les enjeux principaux : scalabilité, performance, disponibilité et maîtrise des coûts d’exploitation .
Votre mission
Fiabilité & Résilience
- Garantir la disponibilité et la stabilité des systèmes en production.
- Définir et suivre les indicateurs de fiabilité (SLA, SLO, SLI).
- Améliorer en continu la résilience des systèmes (gestion des pannes, fallback, retry, circuit breakers).
Observabilité & Run
- Mettre en place et faire évoluer l’observabilité (logs, métriques, traces).
- Améliorer la détection et la résolution des incidents.
- Mener des post-mortems orientés amélioration continue.
- Réduire le bruit d’alerting et améliorer la pertinence des signaux.
Automatisation & Plateforme
- Automatiser l’exploitation et réduire le toil.
- Améliorer les pipelines CI/CD et les processus de déploiement.
- Faire évoluer les environnements (dev, staging, prod) pour plus de fiabilité et de reproductibilité.
- Concevoir des outils internes pour améliorer la productivité des équipes.
Infrastructure & Performance
- Faire évoluer Kubernetes et l’infrastructure associée.
- Optimiser les performances (latence, ressources, coût).
- Opérer et sécuriser les composants critiques (bases de données, services techniques).
- Anticiper les problématiques de passage à l’échelle.
Collaboration Produit & Engineering
- Travailler en proximité avec les développeurs pour concilier vitesse et fiabilité.
- Accompagner les équipes sur les bonnes pratiques (déploiement, monitoring, gestion d’erreurs).
- Participer aux choix techniques structurants.
- Faire de la plateforme un levier d’accélération produit, pas un frein.
Qualifications
- Expérience >5 ans en SRE, infrastructure ou production engineering.
- Expérience sur des systèmes en production à fort enjeu.
- Compétences techniques :
- Excellente maîtrise de Kubernetes et des environnements conteneurisés.
- Bonne maîtrise des problématiques de fiabilité, performance et sécurité.
- Expérience en observabilité (logs, métriques, alerting).
- À l’aise avec l’Infrastructure as Code (Terraform ou équivalent).
- Compréhension des systèmes distribués et des architectures backend.
Approche
- Approche engineering de la production (automation-first).
- Forte culture fiabilité et amélioration continue.
- Pragmatique, orienté impact business.
- Capable de prioriser selon la valeur.
- Autonome et force de proposition.
- À l’aise pour collaborer étroitement avec les équipes produit.
Avantages
- Salaire : 50–60K€ + variable non plafonné
- Télétravail hybride flexible (2–3 jours / semaine)
- Carte Swile
- Mutuelle famille 100%
- Séminaires trimestriels