DATA ENGINEER GCP/Big data
Objectifs du poste
Garantir la disponibilité, la performance et la résilience de l'écosystème technique supportant l'application mobile
Réduire l'impact des incidents sur les utilisateurs
Mettre en place une observabilité orientée expérience utilisateur
Industrialiser la fiabilité par l'automatisation
Missions principales
1. Fiabilité, disponibilité & performance
Définir et suivre les SLI / SLO des parcours critiques mobiles :
- Chargement des données
- Paiement
- Notifications push
Veiller à la haute disponibilité des APIs backend consommées par l'app, en coordination avec les équipes backend. Améliorer les temps de réponse et la stabilité globale.
Exemples concrets
- Détection d'une latence API impactant uniquement les utilisateurs Android en 4G
- Mise en place de caches edge pour réduire le temps de chargement mobile
- Définition d'un SLO "taux de crash < 0,5 %", "cold start < 5 secondes"
2. Observabilité orientée utilisateur mobile
Mettre en place une observabilité full stack (Backend + Mobile), corréler données techniques et ressenti utilisateur, exploiter les retours App Store / Google Play comme signaux de fiabilité.
Exemples concrets
- Corrélation entre hausse des avis négatifs et crashs sur une version iOS
- Analyse des cold starts après une nouvelle release
- Identification d'un problème régional via les avis stores
3. Gestion des incidents & on-call
Participation aux rotations d'astreinte (on-call), Détection rapide des incidents impactant les utilisateurs mobiles, Coordination des actions de remédiation, Rédaction de post-mortems sans blâme.
Exemples concrets
- Incident de login après une release backend
- Push massif déclenchant une surcharge API
- Rollback automatique après détection d'erreurs mobile
4. Déploiements sûrs & automatisation
Mise en place de déploiements progressifs : Blue/Green (bascule instantanée mais réversible), Automatisation des rollbacks. Utilisation de feature flags pour réduire les risques côté mobile.
Exemples concrets
- Activation progressive d'une nouvelle API consommée par l'app (Canary)
- Désactivation immédiate d'une feature mobile via feature flag (Blue/Green)
- Déploiement backend synchronisé avec une release mobile
5. Scalabilité & gestion des pics de charge
Anticiper et absorber les pics de trafic :
- Notifications push massives
- Événements business
- Optimiser les coûts cloud liés au trafic mobile.
Exemples concrets
- Simulation de montée en charge avant une promo
- Autoscaling dynamique des APIs
- Optimisation du trafic réseau mobile
6. Sécurité & conformité
- Sécurisation des échanges mobile/backend
- Gestion des secrets et clés API
- Protection contre les abus et attaques
Exemples concrets
- Rotation des tokens JWT
- Rate limiting par client mobile
- Blocage de trafic anormal
7. Collaboration & culture fiabilité
- Travailler étroitement avec : Développeurs iOS / Android
- Intégrer la fiabilité dès la conception (reliability by design).
- Transformer les retours utilisateurs en actions techniques.
Exemples concrets
- Analyse hebdomadaire des avis stores avec le support
- Contribution aux choix d'architecture mobile
- Participation aux rituels produit
8. Livrables attendus
- Analyses post-mortems
- Plans d'amélioration
- Roadmap fiabilité