Offre de Stage PFE
Notre laboratoire intervient dans le domaine judiciaire et contribue à la recherche et l'analyse de preuves numériques dans des enquêtes portant sur des crimes et délits.
Dans ce cadre, nous développons des outils d'intelligence artificielle appliqués à l'analyse de conversations et de documents judiciaires, afin d'en extraire les éléments pertinents et d'assister les analystes humains dans leur travail d'interprétation.
Le stagiaire participera activement à l'amélioration et à la mise en œuvre de ces outils sur des données textuelles complexes (conversations, rapports, documents de procédure, etc.).
Vos missionsMissions principales
1. Analyse automatisée de conversations
- Développer et tester des modèles d'IA capables d'identifier, dans des conversations extraites de téléphones, les éléments pertinents en lien avec une infraction donnée.
- Concevoir des prompts ou modules de questionnement permettant d'interroger l'IA sur la présence d'indices ou de comportements spécifiques.
- Évaluer la pertinence et la précision des résultats produits par l'IA.
2. Rédaction assistée
- Participer à la génération et à la reformulation de résumés ou d'extraits significatifs à intégrer dans les rapports d'expertise.
- Adapter le vocabulaire et le ton aux standards du domaine expertal.
- Aider à la mise au point d'un lexique ou modèle de rédaction conforme aux exigences légales et métiers.
3. Détection et analyse de documents de procédure
- Mettre au point une méthode d'analyse et de tri de plusieurs dizaines à centaines de documents judiciaires.
- Identifier leur type (procès-verbal, audition, perquisition, etc.), leurs éléments clés et les relations entre eux.
- Construire une chronologie ou une représentation structurée des événements et des acteurs, permettant de répondre à des questions précises sur le déroulement de l'affaire.
Compétences attendues
Compétences techniques :
- Bonne compréhension des principes du traitement automatique du langage naturel (NLP) et de leur mise en œuvre à l'aide de modèles de langage de grande taille (LLM).
- Maîtrise de Python et des principales bibliothèques associées à l'IA et au NLP (exemples : Hugging Face, LangChain, spaCy, Transformers, etc.).
- Capacité à préparer, nettoyer et structurer des données textuelles issues de sources variées (fichiers JSON, CSV, PDF, OCR, etc.).
- Connaissance des concepts liés à l'ingénierie de prompts, à l'analyse sémantique et à la recherche d'information dans de grands corpus textuels.
- Intérêt pour l'intégration de LLM dans des outils métiers (via API ou frameworks spécialisés) et pour les questions de performance et d'explicabilité des modèles.
Compétences analytiques et métiers :
- Rigueur, sens de la confidentialité et respect des données sensibles. Un casier judiciaire sera demandé.
- Esprit d'analyse et capacité à synthétiser des informations complexes pour les rendre exploitables par l'IA ou par les enquêteurs.
- Aisance rédactionnelle et curiosité pour le vocabulaire et la logique du droit et de la procédure pénale.
Profil recherché :
- Étudiant(e) en école d'ingénieur ou master 2 avec spécialisation en intelligence artificielle, data science ou informatique.
- Première expérience (projet ou stage) en LLM, NLP ou en traitement de données textuelles fortement appréciée.
Ce que nous offrons
- Une immersion dans un secteur à fort impact sociétal, au croisement de la technologie et du droit.
- L'opportunité de contribuer à des projets concrets utilisant les dernières avancées en IA générative.
- Un encadrement technique et métier de proximité, dans une équipe passionnée.
Début du stage souhaité Janvier / Février 2026