Postuler

'Scientific machine learning' multi-fidélité avec entrées hétérogènes // Multi-Fidelity Scienti[...]

PALAISEAU, 91

il y a 15 heures

'Scientific machine learning' multi-fidélité avec entrées hétérogènes // Multi-Fidelity Scientific Machine Learning with Heterogeneous Inputs

Réf ABG- ADUM-73002 Sujet de Thèse

Institut Polytechnique de Paris École polytechnique

Lieu de travail Palaiseau Cedex - Ile-de-France - France

Intitulé du sujet 'Scientific machine learning' multi-fidélité avec entrées hétérogènes // Multi-Fidelity Scientific Machine Learning with Heterogeneous Inputs

Mots clés multi-fidélité, Entrées hétérogènes, Scientific Machine Learning / Multi-Fidelity, Heterogeneous Inputs, Scientific Machine Learning

Description du sujet

De nombreux problèmes d'ingénierie et de sciences reposent sur des phénomènes physiques complexes, difficiles à reproduire expérimentalement, et pour lesquels les campagnes de mesure sont coûteuses. La simulation numérique est donc essentielle pour la prédiction, la conception et l'aide à la décision. Dans des applications multi-physiques, fortement couplées et paramétrées, une simulation haute fidélité du système complet est souvent trop coûteuse pour être répétée (optimisation, quantification d'incertitudes, calibration, contrôle). Un exemple illustratif est l'hémodynamique computationnelle : les simulations 3D instationnaires sur géométries artérielles patient-spécifiques nécessitent la résolution des équations de Navier–Stokes, couplées à l'élasticité des parois et à des conditions aux limites issues de données cliniques ; elles sont précises mais trop coûteuses pour des études paramétriques systématiques, d'où l'usage de modèles simplifiés (1D), réduits ou surrogats. L'enjeu scientifique central est de combiner, de façon rigoureuse, l'information issue de modèles de fidélité différente pour obtenir la précision du modèle haute fidélité à coût réduit : c'est l'objectif des méthodes multi-fidélité. Toutefois, une limite importante reste insuffisamment traitée : la présence d'entrées et/ou de sorties hétérogènes entre modèles (paramétrisations différentes, discretisations distinctes, variables d'état non partagées), qui empêche l'application directe des cadres multi-fidélité standards supposant un espace d'entrée commun et une correspondance point à point des sorties. Cette thèse, financée par le projet MediTwin (jumeaux numériques patient-spécifiques en santé), vise à développer des méthodes multi-fidélité scalables capables de fusionner des modèles aux paramétrisations non concordantes et des structures de données hétérogènes. Le travail abordera : (i) la définition de représentations latentes communes reliant des espaces d'entrée hétérogènes ; (ii) la construction de surrogats multi-fidélité cohérents malgré ces hétérogénéités ; (iii) la quantification et la propagation des incertitudes dues au faible volume de données haute fidélité et aux erreurs d'alignement/embedding ; (iv) la conception de stratégies d'échantillonnage adaptatif (active learning) pour sélectionner efficacement les simulations haute fidélité. La méthodologie s'appuiera sur l'apprentissage de représentations (autoencodeurs/VAEs, Deep CCA), l'apprentissage d'opérateurs (DeepONet, Fourier Neural Operator), des approches probabilistes (co-krigeage en espace latent, modèles hybrides deep-probabilistes) et des techniques d'optimisation bayésienne pour le plan d'expériences.

Description en anglais

Many engineering and scientific problems involve complex physical phenomena that are difficult—and sometimes impossible—to reproduce experimentally, while experimental campaigns are costly in time and resources. Numerical simulation is therefore essential for prediction, design, and decision support. In modern multi-physics applications with strong couplings across scales and high-dimensional parameterizations, a single high-fidelity simulation is often too expensive to be run repeatedly for optimization, uncertainty quantification (UQ), calibration, or control. A representative example is computational hemodynamics: fully resolved simulations of blood flow in patient-specific arterial geometries require solving the three-dimensional, time-dependent Navier–Stokes equations, often coupled with vessel wall elasticity and boundary conditions inferred from clinical data. Although highly informative, such simulations are computationally intensive, which limits their use in large parametric studies; hence the need for simplified or surrogate models (e.g., 1D network models, reduced-order models, or data-driven surrogates). The key scientific challenge is to combine information from models of different fidelity levels in a principled way to approach high-fidelity accuracy at reduced computational cost—this is the goal of multi-fidelity modeling. However, a major limitation remains insufficiently addressed: heterogeneous inputs and outputs across fidelities. In many applications, low- and high-fidelity models do not share the same parameterization, discretization, or state variables, which prevents the direct use of standard multi-fidelity frameworks that assume a common input space and pointwise correspondence of outputs. This PhD, funded through the MediTwin project (patient-specific digital twins for medical applications), aims to develop scalable multi-fidelity methods capable of merging information from models with mismatched parameterizations and heterogeneous data structures. The research will investigate (i) how to define common latent representations linking heterogeneous input spaces across fidelities; (ii) how to build multi-fidelity surrogates that remain consistent under such heterogeneities; (iii) how to quantify and propagate uncertainty induced by limited high-fidelity data and representation mismatch; and (iv) how to design adaptive sampling strategies (active learning) to select expensive high-fidelity evaluations so as to maximize information gain. Methodologically, the work will draw on representation learning (autoencoders/VAEs, CCA/Deep CCA), operator learning (DeepONet, Fourier Neural Operator), probabilistic multi-fidelity modeling (latent-space co‑kriging, deep probabilistic surrogates), and Bayesian optimization for adaptive experimental design.

Début de la thèse : 01/10/2026

Précisions sur le financement

Financement d'autres établissements publics à caractère industriel et commercial (ADEME, ADIT, ANDRA, Bpifrance, BRGM, CIRAD, CNES, Universcience, CSTB, IFPEN, IFREMER, INERIS, IRSN).

Présentation établissement et labo d'accueil

Institut Polytechnique de Paris École polytechnique

Etablissement délivrant le doctorat

Institut Polytechnique de Paris École polytechnique

Ecole doctorale

574 Mathématiques Hadamard

#J-18808-Ljbffr

Entreprise

Association Bernard Gregory

Plateforme de publication

WHATJOBS

Offres pouvant vous intéresser

PhD: Multi-Fidelity Scientific ML for Heterogeneous Inputs

PALAISEAU, 91

il y a 12 heures

Thèse Projet GRAIL – NLP & Grpah

PALAISEAU, 91

il y a 2 jours

Data Scientist - Drug Discovery & AI

SACLAY, 91

il y a 2 jours

Battery Pack Simulation Engineer M/F

GRENOBLE, 38

il y a 2 jours