Chargement en cours

Stage M2 : Algorithme de Monte-Carlo pour la modélisation géostatistique non stationnaire sur données binaires

CASTANET-TOLOSAN, 31
il y a 9 jours
Stage

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales , implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Le stage se déroulera au sein de l'unité de Mathématiques et Informatiques du centre Occitanie-Toulouse qui développe des méthodes et des programmes en statistique, machine learning, et informatique. 

Le/la stagiaire sera encadré.e par Sébastien Coube (MIAT, INRAE, Toulouse) pour l’algorithmique et Élise Maigné (MIAT, INRAE, Toulouse) pour l’implémentation. 

Environnement de travail, missions et activités

Contexte

Le dérèglement climatique accentue les risques pesant sur les forêts, notamment en favorisant la prolifération du Bostryche Typographe, un insecte qui s’attaque aux épicéas affaiblis par la chaleur et la sécheresse. L’implantation massive d’épicéas en dehors de leur habitat naturel en altitude aggrave la situation, entraînant des ravages dans plusieurs régions d’Europe. Ces attaques ont des conséquences économiques et environnementales importantes. Pour mieux gérer ce risque, des données satellitaires permettent de cartographier les zones touchées en France.

Ces données croisées avec des variables locales (climat, topographie) permettent de modéliser les facteurs de risque, en tenant compte de l’auto-corrélation spatiale grâce aux modèles géostatistiques à processus Gaussien.

Un modèle de processus Gaussien non-stationnaire a été développé [1] pour tenir compte du fait que les données ne se comportent pas partout de la même façon, en fonction de l’altitude ou de la région par exemple. Il permet d’améliorer les performances de prédiction par rapport à un modèle stationnaire mais il ne s’applique qu’aux données continues. Le but du stage est d’étendre la méthode à des données binaires. Dans le cas des Bostryches Typographes, cela permettrait par exemple de pouvoir prédire le fait qu’un pixel de l’image satellite correspond ou non à de la forêt détruite par l’infestation (variable binaire).

Objectif du stage

L’objectif du stage est d’étendre le modèle existant [1] aux données binaires, avec un algorithme efficace et d’évaluer les améliorations de prédiction du modèle non-stationnaire par rapport à un modèle stationnaire sur des données simulées.

Déroulement du stage

Les principales étapes seront :

  1. Utiliser la littérature sur les champs Gaussiens et les méthodes de Monte-Carlo, en particulier [2] pour adapter l’algorithme existant de [1] à des observations d’une variable réponse binaire et produire un pseudo-code.
  2. Implémenter le pseudo-code en partant du code existant dans le package R GeoNonStat. Des méthodes tels que l’algèbre linéaire sparse  ou l’implémentation bas-niveau en C++ seront utilisées pour accélérer les calculs.
  3. Simuler des données adaptées au problème puis :
    • Tester le bon comportement des chaînes de Markov générées par l’algorithme MCMC, au moyen de diagnostics basés sur des chaînes parallèles, ou l’ effective sample size .
    • Évaluer l’amélioration des performances d’interpolation du modèle spatial, c’est-à-dire sa capacité à prédire des endroits de l’espace géographique qui ne sont pas observés.
    • Évaluer l’amélioration des performances d’estimation des coefficients de régression associés aux variables explicatives.

Bibliographie

• [1] Nonstationary Spatial Process Models with Spatially Varying Covariance Kernels , Sébastien Coube, Sudipto Banerjee, Benoît Liquet, 2025, Journal of Computational and Graphical Statistics

• [2] MCMC using Hamiltonian dynamics, NEAL, Radford M., et al., 2011, Handbook of markov chain monte carlo

Formations et compétences recherchées

Licence/Master (Bac+3/5)

  • De solides bases en mathématiques et particulièrement en algèbre linéaire sont requises.
  • Une bonne connaissance de R.
  • Un intérêt pour les simulations stochastiques et les méthodes de Monte-Carlo.
  • Une connaissance de C++, voire Rcpp, serait un plus. 

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

-  jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation , conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.

Modalités pour postuler

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

Entreprise
INRAE
Plateforme de publication
JOOBLE
Soyez le premier à postuler aux nouvelles offres
Soyez le premier à postuler aux nouvelles offres
Créez gratuitement et simplement une alerte pour être averti de l’ajout de nouvelles offres correspondant à vos attentes.
* Champs obligatoires
Ex: boulanger, comptable ou infirmière
Alerte crée avec succès