Machine Learning Engineer (H/F) - CDI
Descriptif de l’équipe
Le poste est rattaché à l’équipe Data décomposée en 4 équipes :
- Doc & fraude : développer des microservices pour le traitement de documents et l’identification de comportement frauduleux
- AI platform : mettre en place des environnements pour l’entraînement et le déploiement de services intégrant de l’IA
- Data Run : dédié à la gestion de la data plateforme actuelle (maintien en condition, évolution, scaling, etc) : reporting financier et BI
- Data Platform : une équipe dédiée à la refonte de la data plateforme pour assurer le suivi de performance de notre plateforme ainsi que la livraison des informations de facturation à l’équipe Finance
Nous ouvrons le poste de Machine Learning Engineer dans l’équipe Doc&fraud .
Deux profils senior/staff sont également présents pour appuyer les équipes sur les sujets Data et IA ainsi que deux Product Owner IA et Data.
L’équipe Doc & Fraude a pour mission de développer des algorithmes pour :
- classifier, découper, OCRiser, structurer les champs pertinents de documents d’identité, justificatif de domicile, bulletins de salaire
- détecter des comportements frauduleux sur notre plateforme via du scoring et des algorithmes de graphes
Les enjeux de l’équipe sont d’assurer une architecture moderne à base de LLM et scalable en production ainsi que de continuer à développer nos produits avec les nouveautés du marché, augmentant nos systèmes de lecture avec des supports variés (fichiers à plat, vidéo, etc) ainsi que développer nos capacités de détection de fraude.
L’équipe est composée de : une lead d’équipe, un machine learning engineer, un data scientist et un développeur python.
Le poste
Le poste a donc les responsabilités suivantes en fonction des équipes :
- Développer des algorithmes de traitements de documents (machine learning, pré et post traitements, etc) pour la création ou l’enrichissement des services de l’équipe
- Mettre en place de pratiques MLOps (DevOps pour Machine Learning), garantir le fonctionnement et l’évolution de l’accès, de la transformation et de l’exposition des données, mais aussi de l’annotation
- Utiliser les outils pour optimiser les performances de calcul des modèles développés et faciliter leur mise en production
- S’assurer que ses développements soient validés, déployés et fonctionnels en prod
- Améliorer la couverture fonctionnelle de nos services en lien avec les demandes produit (nouveaux documents, nouveaux champs, etc)
- Appuyer le Data Scientist sur les projets de R&D en rapport avec les problématiques Data, assurer un état de l’art sur l’ensemble des sujets R&D développés
- Appuyer l’équipe d’exploitation, infrastructure et développement dans la mise en production des services de l’équipe
- Assurer un monitoring de fonctionnement des services dans l’ensemble des environnements
- Faire évoluer l’ensemble des services avec la montée en charge de nos clients
- Réaliser une veille technologique régulière et documenter les projets
Ce poste couvre, d’une part, des études R&D sur des thématiques de data science au sens large, afin de maintenir les produits proposés chez QuickSign à l’état de l’art. Il faut donc être force de proposition sur l’adaptation d’algorithmes récents à nos problématiques.
D’autre part, le passage des études R&D en production nécessite de garantir des taux de performances élevés (compromis ressources, temps, qualité). Il faut donc avoir de l’appétence pour développer du code suivant les guidelines de bon développement, en portant une attention particulière aux tests et au monitoring, afin de garantir le bon fonctionnement des modules Data en production.
Compétences nécessaires recherchées
Nous recherchons un.e candidat.e avec une première expérience de Machine Learning Engineer (3-5 ans d’expérience) Compétences nécessaires recherchées :
- Python 3.10+ – Docker – Git
- Connaissances de librairies de machine learning et deep learning. Par exemple : Tensorflow 2 / PyTorch, ONNX
- Gestion d’API (Flask, FastAPI)
- Expérience avec des services déployés en production
- Versionning d’environnement (ex : poetry, uv)
- Monitoring (Kibana, Grafana, Prometheus, OpenTelemetry, etc)
- Streaming/cache (Kafka, Redis, Valkey)
- Base données (PostgreSQL)
- Infra (Helm, Harbor, Kubernetes, CI/CD)
- Soft skills : communication fluide, capacité de vulgarisation et de transmission de savoir curieux et à l’écoute des nouvelles avancées sur les sujets IA esprit d’équipe, sérieux et pragmatisme