Stage - Développement d'un RAG “Matériaux” F-H
Votre futur environnement de travail :
Au sein de la Division Systèmes & Équipements de Safran Landing Systems, la Direction Technique conçoit et développe une large gamme d'équipements destinés à être intégrés dans les systèmes de trains d'atterrissage : extension/rétraction, orientation, freinage, surveillance. Ces systèmes complexes nécessitent une maîtrise de domaines physiques variés et un fort niveau d'innovation.
Dans ce cadre, la Direction Technique développe actuellement un projet innovant visant à exploiter les données matériaux (rapports, normes, spécifications, propriétés, essais, procédures) au travers d'une plateforme RAG (Retrieval Augmented Generation), permettant d'interroger et de valoriser la base documentaire en langage naturel grâce aux modèles LLM.
________________________________________
Votre mission :
Rattaché(e) au département Actionnement, vous intégrerez l'équipe projet et contribuerez directement au développement de cette plateforme innovante.
Plus précisément, votre mission consistera à :
• Collecter, nettoyer et normaliser des données multi-formats (Excel, Word, PDF)
• Mettre en place un dataset structuré et exploitable regroupant les données matériaux
• Concevoir un pipeline d'ingestion et d'indexation dans une base documentaire
• Développer un RAG permettant d'interroger la base à l'aide d'un LLM
• Expérimenter et comparer différentes stratégies (embeddings, vector stores, chunking)
• Proposer un prototype fonctionnel d'interface (CLI ou mini application web)
• Documenter vos travaux et participer à la capitalisation technique
Votre futur environnement de travail :
Au sein de la Division Systèmes & Équipements de Safran Landing Systems, la Direction Technique conçoit et développe une large gamme d'équipements destinés à être intégrés dans les systèmes de trains d'atterrissage : extension/rétraction, orientation, freinage, surveillance. Ces systèmes complexes nécessitent une maîtrise de domaines physiques variés et un fort niveau d'innovation.
Dans ce cadre, la Direction Technique développe actuellement un projet innovant visant à exploiter les données matériaux (rapports, normes, spécifications, propriétés, essais, procédures) au travers d'une plateforme RAG (Retrieval Augmented Generation), permettant d'interroger et de valoriser la base documentaire en langage naturel grâce aux modèles LLM.
________________________________________
Votre mission :
Rattaché(e) au département Actionnement, vous intégrerez l'équipe projet et contribuerez directement au développement de cette plateforme innovante.
Plus précisément, votre mission consistera à :
• Collecter, nettoyer et normaliser des données multi-formats (Excel, Word, PDF)
• Mettre en place un dataset structuré et exploitable regroupant les données matériaux
• Concevoir un pipeline d'ingestion et d'indexation dans une base documentaire
• Développer un RAG permettant d'interroger la base à l'aide d'un LLM
• Expérimenter et comparer différentes stratégies (embeddings, vector stores, chunking)
• Proposer un prototype fonctionnel d'interface (CLI ou mini application web)
• Documenter vos travaux et participer à la capitalisation technique
Job Requirements
Profil recherché
• Étudiant(e) Bac+4/5 en informatique, data science ou domaine similaire
• Bonne compréhension des modèles de langage et des principes du RAG
• Solides compétences en Python et manipulation de données multi-formats
• Rigueur, autonomie et goût pour l'innovation
• Intérêt pour les applications de l'IA dans un environnement industriel exigeant
Job Requirements
Profil recherché
• Étudiant(e) Bac+4/5 en informatique, data science ou domaine similaire
• Bonne compréhension des modèles de langage et des principes du RAG
• Solides compétences en Python et manipulation de données multi-formats
• Rigueur, autonomie et goût pour l'innovation
• Intérêt pour les applications de l'IA dans un environnement industriel exigeant
But what else? (advantages, specific features, etc.)
Travail dans une petite équipe composée d'ingénieurs calcul, dans le cadre du développement de l'IA au sein du métier calcul.
But what else? (advantages, specific features, etc.)
Travail dans une petite équipe composée d'ingénieurs calcul, dans le cadre du développement de l'IA au sein du métier calcul.
Company Information
Safran is an international high-technology group, operating in the aviation (propulsion, equipment and interiors), defense and space markets. Its core purpose is to contribute to a safer, more sustainable world, where air transport is more environmentally friendly, comfortable and accessible. Safran has a global presence, with 100,000 employees and sales of 27.3 billion euros in 2024, and holds, alone or in partnership, world or regional leadership positions in its core markets.
Safran is in the 2nd place in the aerospace and defense industry in TIME magazine's "World's best companies 2024" ranking.
Company Information
Safran is an international high-technology group, operating in the aviation (propulsion, equipment and interiors), defense and space markets. Its core purpose is to contribute to a safer, more sustainable world, where air transport is more environmentally friendly, comfortable and accessible. Safran has a global presence, with 100,000 employees and sales of 27.3 billion euros in 2024, and holds, alone or in partnership, world or regional leadership positions in its core markets.
Safran is in the 2nd place in the aerospace and defense industry in TIME magazine's "World's best companies 2024" ranking.