Site Reliability Engineer Expérimenté

GRENOBLE, 38

il y a 14 heures

Nous recherchons un Site Reliability Engineer expérimenté , avec une approche d’ingénierie forte, capable de faire évoluer la plateforme vers plus de fiabilité, de performance et de maîtrise opérationnelle.

Poste basé à Grenoble – télétravail hybride (2–3 jours / semaine).

Vous intervenez sur deux produits, avec une approche orientée valeur et impact business.

Pleenk – Plateforme de paiement crypto & identité

Pleenk est une plateforme moderne permettant l’intégration de paiements en cryptomonnaie avec des mécanismes avancés de gestion d’identité et de conformité (KYC, onboarding, traçabilité).

Son ambition est claire : fournir une infrastructure fiable, sécurisée et observable, capable de supporter des flux financiers critiques.

L’infrastructure est pensée comme un produit à part entière : automatisée, mesurable et conçue pour accompagner la croissance rapide du système.

Infra & SRE

Kubernetes
CI/CD industrialisée
Observabilité (logs, métriques, alerting)
Infrastructure as Code

Les enjeux principaux : fiabilité des flux financiers, sécurité, traçabilité, résilience et scalabilité .

Plateforme marketplace

Plateforme en production depuis plus de 15 ans, avec :

Trafic élevé
Volumes de données importants
Contraintes de disponibilité fortes
Évolutions fonctionnelles continues

L’enjeu est de faire évoluer l’infrastructure pour accompagner un passage à l’échelle international, tout en garantissant stabilité et performance.

Infra & SRE

Kubernetes (bare metal)
CI/CD (Jenkins / GitLab CI)
PostgreSQL, Elasticsearch
Systèmes distribués

Les enjeux principaux : scalabilité, performance, disponibilité et maîtrise des coûts d’exploitation .

Votre mission

Fiabilité & Résilience

Garantir la disponibilité et la stabilité des systèmes en production.
Définir et suivre les indicateurs de fiabilité (SLA, SLO, SLI).
Améliorer en continu la résilience des systèmes (gestion des pannes, fallback, retry, circuit breakers).

Observabilité & Run

Mettre en place et faire évoluer l’observabilité (logs, métriques, traces).
Améliorer la détection et la résolution des incidents.
Mener des post-mortems orientés amélioration continue.
Réduire le bruit d’alerting et améliorer la pertinence des signaux.

Automatisation & Plateforme

Automatiser l’exploitation et réduire le toil.
Améliorer les pipelines CI/CD et les processus de déploiement.
Faire évoluer les environnements (dev, staging, prod) pour plus de fiabilité et de reproductibilité.
Concevoir des outils internes pour améliorer la productivité des équipes.

Infrastructure & Performance

Faire évoluer Kubernetes et l’infrastructure associée.
Optimiser les performances (latence, ressources, coût).
Opérer et sécuriser les composants critiques (bases de données, services techniques).
Anticiper les problématiques de passage à l’échelle.

Collaboration Produit & Engineering

Travailler en proximité avec les développeurs pour concilier vitesse et fiabilité.
Accompagner les équipes sur les bonnes pratiques (déploiement, monitoring, gestion d’erreurs).
Participer aux choix techniques structurants.
Faire de la plateforme un levier d’accélération produit, pas un frein.

Qualifications

Expérience >5 ans en SRE, infrastructure ou production engineering.
Expérience sur des systèmes en production à fort enjeu.
Compétences techniques :
- Excellente maîtrise de Kubernetes et des environnements conteneurisés.
- Bonne maîtrise des problématiques de fiabilité, performance et sécurité.
- Expérience en observabilité (logs, métriques, alerting).
- À l’aise avec l’Infrastructure as Code (Terraform ou équivalent).
- Compréhension des systèmes distribués et des architectures backend.

Approche

Approche engineering de la production (automation-first).
Forte culture fiabilité et amélioration continue.
Pragmatique, orienté impact business.
Capable de prioriser selon la valeur.
Autonome et force de proposition.
À l’aise pour collaborer étroitement avec les équipes produit.

Avantages

Salaire : 50–60K€ + variable non plafonné
Télétravail hybride flexible (2–3 jours / semaine)
Carte Swile
Mutuelle famille 100%
Séminaires trimestriels

#J-18808-Ljbffr

Entreprise

Hyperweb

Plateforme de publication

WHATJOBS

Offres pouvant vous intéresser

Engineering Lead – Platform & Infrastructure

TOULOUSE, 31

il y a 2 jours

DevOps / SRE

LYON, 69

il y a 2 jours

Site Reliability Engineer (SRE) GCP H/F

TOULOUSE, 31

il y a 1 mois

Software Engineer

PARIS, 75

il y a 2 jours