Doctorat - Reconstruction de l’évolution des répertoires d’exons chez les eucaryotes
Doctorat - Reconstruction de l’évolution des répertoires d’exons chez les eucaryotes
Date de prise de poste : 1 octobre 2026
génomique évolution exons introns
Résumé du projet
Les gènes eucaryotes sont composés de deux catégories d’éléments : les exons, inclus dans les ARN matures, et les introns qui sont les régions séparant ces exons. Introns et exons sont initialement transcrits ensemble, et les introns sont excisés durant le phénomène d’épissage.
L’épissage est soumis à des mécanismes de régulations qui rendent possible la maturation d’ARN différents à partir d’un même gène, de plusieurs transcrits différents, dans un processus d’épissage alternatif. Malgré le rôle des structures intron‑exon dans la régulation des processus moléculaires eucaryotes, les mécanismes régissant l’évolution de ces structures sont encore peu connus.
Les études portant sur la composition en exon‑intron à l’échelle du génome favorisent l’hypothèse d’un génome eucaryote ancestral riche en introns et une tendance globale à la réduction de leur nombre au cours de l’évolution, ponctuée par des événements d’expansion rapide. Il existe cependant peu de données sur les mécanismes évolutifs sous‑tendant la réduction du nombre d’introns à l’échelle des gènes, ni comment cela affecte la composition en domaines des protéines correspondantes. L’accroissement du nombre de génomes de bonne qualité rend aujourd’hui possible l’étude de l’évolution des exons à une résolution plus fine que précédemment.
L’objectif de ce projet est de concevoir une méthode à large échelle d’inférence d’homologie entre exons. Cette méthode sera utilisée pour caractériser à l’échelle des répertoires de gènes entiers des eucaryotes, l’évolution des structures de gènes et les mécanismes mis en cause dans l’évolution des structures exoniques. Ces reconstructions évolutives serviront de source de données de référence pour améliorer l’annotation des structures de gènes chez les eucaryotes.
Le 1er axe du projet concerne le développement d’une méthode bioinformatique de comparaison d’exons entre gènes homologues. Elle s’appuiera sur les données OrthoInspector, une base de données d’orthologie entre gènes développée dans l’équipe d’accueil. La méthode exploitera des comparaisons de séquences entre gènes homologues pour définir les relations d’homologie entre leurs exons et la nature de ces relations. L’approche développée s’inspirera des méthodes de l’état de l’art, avec pour objectif de les étendre aux groupes hiérarchiques d’orthologues. La reconstruction évolutive ainsi obtenue sera mise à disposition dans une base de données publique et servira à décrire avec précision les mécanismes mis en jeu dans la réorganisation des structures intron‑exon.
Le 2nd axe vise à exploiter les résultats des reconstructions évolutives pour affiner la qualité des annotations structurales de gènes des génomes eucaryotes. L’étudiant(e) développera une méthode d’évaluation de la qualité des annotations des structures de gènes, étendant et complétant les méthodes d’évaluation de qualité des répertoires de gènes existantes comme OMArk. Les groupes d’exons conservés pour un groupe taxonomique donné seront utilisés comme références. Pour chacun de ces groupes, le programme détectera automatiquement la présence d’exons inattendus ou l’absence d’exons particulièrement conservés. Cette méthode sera intégrée à un programme d’évaluation et de correction de modèle de gènes et permettra d’améliorer la qualité des données disponibles dans les bases de données.
Les deux axes développés durant la thèse permettront de mettre au point une approche itérative, où des relations évolutives initiales seront utilisées pour améliorer les annotations de gènes, qui seront utilisées à leur tour pour affiner l’inférence des relations évolutives entre exons.
Profil et compétences recherchés
Le ou la candidat(e) doit être titulaire d’un Master dans le domaine de la bioinformatique et/ou génomique. Il ou elle devra être capable de démontrer de solides compétences en bioinformatique et en informatique, une bonne maîtrise de la programmation (Python) et des outils de bases de la bioinformatique. Des bases théoriques solides en biologie moléculaire et en biologie évolutionnaire sont également requises.
Un intérêt pour la génomique comparative, l’évolution et la biodiversité serait apprécié.
Financement
Cette thèse est financée et commencera le 1/10/2026. L’étudiant bénéficiera d’un contrat doctoral de droit public pour les 3 ans de réalisation de la thèse (2300 € brut/mois).
Supervision et équipe
Cette thèse sera supervisée par Odile Lecompte et Yannis Nevers, au sein de l’équipe CSTB du laboratoire ICube. L’étudiant en thèse sera suivi par le biais de réunions régulières pour discuter des avancées des projets et formuler des recommandations. Les candidats ou candidates présélectionnées seront invités dans les locaux de l’équipe pour des rencontres avec les superviseurs et autres membres de l’équipe.
#J-18808-Ljbffr