Ingénieur statisticien (H/F)
Vous collaborerez étroitement avec les experts en fouille de données mais aussi en intéraction avec d'autres équipes avec des projets appliqués similaires en bio-informatique et modélisation probabiliste, ainsi qu'avec les partenaires externes des consortiums impliqués dans l'analyse de données biomédicales (neuroimagerie, RNA-seq).
Concevoir, adapter, implémenter, tester et documenter une version Python d'un algorithme de Bayésien variationnel développé initialement sous MATLAB, afin de permettre la modélisation efficace, interprétable et reproductible de données de neuroimagerie et de séquençage ARN dans un cadre de recherche translationnelle.
- Analyser l'implémentation MATLAB existante de l'algorithme de Bayésien variationnel fondé sur le principe d'Énergie Libre.
- Concevoir et développer une implémentation fidèle et optimisée en Python (bibliothèques scientifiques usuelles : Num
Py, Sci
Py, Py
Torch/JAX ou équivalent).
- Adapter l'algorithme aux spécificités des données de neuroimagerie et de séquençage ARN (prétraitement, formats, pipelines d'analyse).
- Mettre en place des protocoles de tests, de validation et de comparaison avec la version MATLAB (précision, stabilité, performance).
- Optimiser le code (vectorisation, parallélisation, utilisation de GPU si pertinent) pour le traitement de données de grande dimension.
- Participer à la revue de la littérature sur les méthodes de Bayes variationnel (MATLAB/Python) et contribuer à la veille méthodologique.
- Documenter le code, rédiger des rapports techniques et des notes méthodologiques en vue de publications scientifiques.
- Contribuer à l'analyse de jeux de données de neuroimagerie et de séquençage ARN en collaboration avec les chercheurs de l'équipe.
- Participer, si besoin, à la formation et à l'accompagnement des utilisateurs de l'outil (chercheurs, doctorants, ingénieurs).