MLOps / DevOps / Data Engineer (H/F)
MARSEILLE 06,
13
il y a 1 jour
Notre société industrialise des flux voix temps réel à gros volume (STT/TTS, LLM, AMD) sur une infra scalable (Kubernetes + GPU) pour des campagnes téléphoniques massives. Nous cherchons un profil hybride MLOps/DevOps/Data Engineer pour fiabiliser, accélérer et réduire les coûts de bout en bout.
Votre mission sera de concevoir, déployer et opérer une plateforme MLOps/Data temps réel (sub-300 ms) : ingestion audio → STT → NLP/LLM → orchestration → TTS, avec observabilité, CI/CD, sécurité et contrôle des coûts.
Responsabilités clés
1/ Infra & Ops
Concevoir l'infra Kubernetes (prod/staging), autoscaling CPU/GPU, réseau, stockage.
Mettre en place CI/CD (build, tests, canary/blue-green, rollback).
Observabilité end-to-end : logs, métriques, traces, alerting (SLO/SLI).
Sécurité : IAM, secrets, durcissement, sauvegardes, PRA.
2/ MLOps
Registry/traçabilité des modèles (MLflow/DVC/W&B), packaging (ONNX/TensorRT), serving (vLLM/Triton/TorchServe/FastAPI).
Déploiements progressifs (shadow/canary), AB-tests, surveillance de dérive.
Optimisation latence/coût : quantization, distillation, KV-cache, batch, pinning GPU.
3/ Data Engineering
Pipelines batch & streaming (Airflow, dbt, Kafka/Redpanda) pour logs audio/intent/succès d'appels.
Qualité des données, schémas, GDPR (pseudonymisation, rétention).
Exposition de datasets/metrics pour les Data Scientists et les équipes métier.
4/ Téléphonie/Voix (plus)
Intégration Asterisk/FreeSWITCH/Jambonz/Drachtio, routage SIP, AMD.
Intégration STT (Whisper/Vosk/ASR cloud) et TTS (Coqui/ElevenLabs/Azure), budgets de latence.
5/ FinOps
Suivi coût/minute & coût/inférence, dashboards, right-sizing GPU, réservations/spot.
Votre mission sera de concevoir, déployer et opérer une plateforme MLOps/Data temps réel (sub-300 ms) : ingestion audio → STT → NLP/LLM → orchestration → TTS, avec observabilité, CI/CD, sécurité et contrôle des coûts.
Responsabilités clés
1/ Infra & Ops
Concevoir l'infra Kubernetes (prod/staging), autoscaling CPU/GPU, réseau, stockage.
Mettre en place CI/CD (build, tests, canary/blue-green, rollback).
Observabilité end-to-end : logs, métriques, traces, alerting (SLO/SLI).
Sécurité : IAM, secrets, durcissement, sauvegardes, PRA.
2/ MLOps
Registry/traçabilité des modèles (MLflow/DVC/W&B), packaging (ONNX/TensorRT), serving (vLLM/Triton/TorchServe/FastAPI).
Déploiements progressifs (shadow/canary), AB-tests, surveillance de dérive.
Optimisation latence/coût : quantization, distillation, KV-cache, batch, pinning GPU.
3/ Data Engineering
Pipelines batch & streaming (Airflow, dbt, Kafka/Redpanda) pour logs audio/intent/succès d'appels.
Qualité des données, schémas, GDPR (pseudonymisation, rétention).
Exposition de datasets/metrics pour les Data Scientists et les équipes métier.
4/ Téléphonie/Voix (plus)
Intégration Asterisk/FreeSWITCH/Jambonz/Drachtio, routage SIP, AMD.
Intégration STT (Whisper/Vosk/ASR cloud) et TTS (Coqui/ElevenLabs/Azure), budgets de latence.
5/ FinOps
Suivi coût/minute & coût/inférence, dashboards, right-sizing GPU, réservations/spot.
Plateforme de publication

Offres pouvant vous intéresser
LYON 05,
69
il y a 1 mois
NANTES,
44
il y a 9 jours
PARIS,
75
il y a 1 mois
NANTES,
44
il y a 2 mois