Assistant-e ingénieur-e en production, traitement de données et enquêtes H/F
Informations générales
Organisme de rattachement
CNRS
Référence
UMR7107-MOBINT-P54009
Date de début de diffusion
/11/2025
Date de parution
/12/2025
Date de fin de diffusion
/01/2026
Versant
Fonction Publique de l'Etat
Catégorie
Catégorie A (cadre)
Nature de l'emploi
Emploi ouvert aux titulaires et aux contractuels
Domaine / Métier
Recherche - Experte / Expert en production, traitement et analyse de données
Statut du poste
Vacant
Intitulé du poste
Assistant-e ingénieur-e en production, traitement de données et enquêtes H/F
Descriptif de l'employeur
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l'Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d'éthique, de déontologie et d'intégrité scientifique.
Description du poste
Mission :
Contribuer à la conception et la mise en œuvre de protocoles de collecte, de publication électronique et de traitement de corpus de langues rares. Participer à la préparation des corpus audio/vidéo annotés pour publication électronique (archivage), en étroite collaboration avec les chercheurs (Sciences du langage et Anthropologie linguistique) et les ingénieur-es et technicien-nes du laboratoire.
Activité :
- Participer à la conception et à l'organisation de corpus multimédia de langues rares dans une archive ouverte, la collection « Pangloss » ).
- Contribuer à la valorisation et à la diffusion des résultats, en particulier via le site - Assurer les opérations de codage et de recodage de métadonnées et d'annotations.
- Contribuer à la qualité et à la cohérence des corpus par un suivi des projets, de la collecte à la publication électronique des données.
- Former et conseiller les chercheurs en matière d'outils d'annotation et de traitement.
- Aider à paramétrer les outils selon les particularités des projets et situations d'enquête.
- Exercer une veille sur les méthodes d'enquêtes et les outils de traitement de données.
Conditions particulières d'exercice
Le Centre national de la recherche scientifique est l'une des plus importantes institutions publiques au monde : femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l'Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l'international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l'innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
Descriptif du profil recherché
Contexte :
La mission du LACITO (Langues et Civilisations à Tradition Orale, UMR 7107 CNRS / Sorbonne Nouvelle / INALCO) est de décrire et étudier la diversité des langues et des civilisations à tradition orale. Cette mission comporte un caractère d'urgence, du fait de l'érosion de cette diversité, parallèle à l'érosion des écosystèmes et la chute de la biodiversité. La collection Pangloss, archive ouverte principalement dédiée aux langues à tradition orale, regroupe des corpus dans près de 200 langues. Cette collection, en libre accès pour tous les publics ), est au cœur d'un environnement de Science ouverte, l'enjeu étant de parvenir à un progrès cumulatif des connaissances, grâce à un appui mutuel entre données, outils et publications.
Le LACITO est un laboratoire « à taille humaine », à la gouvernance collégiale : un laboratoire à l'écoute des langues, à l'écoute des gens. Au sein du laboratoire, la personne recrutée travaillera en équipe avec une ingénieure (qui assure dépôt des données en archive pérenne, maintenance d'éléments d'applications informatiques, et nouvelles innovations) et un technicien. Le travail autour des corpus oraux bénéficie de relations de confiance et d'étroite collaboration avec des partenaires d'autres institutions dont la Très Grande Infrastructure de Recherche Huma-Num, la Bibliothèque nationale de France et le Laboratoire Ligérien de Linguistique (voir à titre d'exemple : ).
Contraintes :
Du fait du rôle central des interactions avec les collègues, la présence sur site revêt une importance évidente. Le poste est néanmoins compatible sans difficulté particulière avec le télétravail partiel selon les règlements et préconisations du CNRS.
Competence :
Savoirs :
- Méthodes et outils en traitement et analyse des données, en particulier celles des enquêtes linguistiques de terrain (Maîtrise).
- Méthodes et outils en production de données (connaissance générale)
- Principes de gestion des métadonnées : préconisations du réseau OLAC (Open Language Archives Community) d'archives ouvertes, outils spécialisés
- Systèmes de gestion de base de données (connaissance générale)
- Familiarité avec les technologies web : connaissance générale HTML, XML
- Archivage pérenne des données de recherche (notions)
- Connaissances générales en linguistique souhaitables. Un rudiment en ethnologie/anthropologie serait un plus.
- Cadre légal et déontologique (connaissance générale)
- Techniques de présentation écrite et orale
- Langue anglaise : B1 (cadre européen commun de référence pour les langues)
- Une familiarité préalable avec les outils logiciels d'annotations les plus couramment employés en linguistique de terrain serait un plus (Elan, Toolbox, FLEx..)
Savoirs faire:
- Savoir assurer la traçabilité des procédures de traitement des informations.
- Savoir transférer les données d¿un logiciel à un autre (en traitement manuel ou en paramétrant des scripts Python existant).
- Savoir participer à la rédaction des textes de présentation des divers corpus sur , en français et en anglais
Savoirs-être :
- Travailler en équipe avec des chercheurs, des spécialistes d'informatique, d'audiovisuel, d'Information Scientifique et Technique
- Savoir s'adapter d'une façon qui encourage la créativité
Temps plein
Oui
Informations complémentairesInformations complémentaires
Campgane hiver 2026
Localisation du poste
Europe, France, Île-de-France, Val de Marne (94)
Géolocalisation du poste
VILLEJUIF
Lieu d'affectation (sans géolocalisation)
94800 VILLEJUIF (France)
Critères candidatNiveau d'études / Diplôme
Niveau 5 Diplômes de niveau bac +2
Spécialisation
Sciences humaines & droit- Sciences (y compris dmographie, anthropologie
Langues
Français (Seuil)