Alternance : Data Scientist H/F
La Direction du Numérique et de la Stratégie d’Innovation (DNSI) conçoit, développe, maintient et héberge les sites Internet et les applications mobiles des 7 chaînes de Radio France (France Info, France Inter, ICI, France Culture, France Musique, Mouv’, FIP). La DNSI accompagne les chaînes dans la mise en oeuvre de leur offre numérique sur tous les supports : Internet fixe et mobile, applications, réseaux sociaux, plateformes vidéo, podcasts, assistants vocaux, etc. Elle assure une veille permanente sur les nouveaux usages des médias numériques : assistants vocaux, son 3D, voitures connectées. Ses équipes travaillent selon des méthodes agiles, plaçant les usages des auditeurs au cœur des priorités de chaque projet.
Pôles de la DNSI
- Direction du Numérique Grand Public (DNGP)
- Direction des Technologies Numériques et Outils de Contribution (DTNOC)
- Direction de la Documentation et des Métadonnées
- Délégation aux Méthodes et Opérations
- Direction de l’Accélération et du Partage de l’Innovation (DAPI)
Au sein de la DNSI, la Direction Technique du Numérique et des Outils de Contribution conçoit et opère les plateformes numériques sur lesquelles sont distribuées ces stations de radio, ainsi que les podcasts qu’elles produisent. L’équipe R&D recherche un·e alternant·e data scientist pour 12 mois.
Notre environnement technique : La plateforme numérique de Radio France et les outils collaboratifs pour l'enrichir sont développés en interne. Voici un ensemble non‑exhaustif des technologies (avec lesquelles tu interagiras peut‑être) qui les supportent :
- Python et les librairies open source de Machine Learning (PyTorch, scikit‑learn, etc.)
- Streamlit
- PostgreSQL, Elastic
- Docker, Kubernetes
Activités, responsabilités du titulaire
Les data scientists de l’équipe cherchent à fournir de nouvelles manières d’interagir avec les contenus audio produits par Radio France, tant à destination des contributeurs internes qu’à celle des utilisateurs finaux de la plateforme Radio France.
Rôle dans l’équipe & missions :
- Consulter la littérature scientifique pour alimenter sa réflexion
- Recueillir les besoins auprès des utilisateurs internes
- Concevoir et/ou implémenter un algorithme pour y répondre
- Présenter les résultats au sein de l’équipe ainsi qu’aux porteurs de besoin pour récolter leurs retours
Quelques exemples de projets à traiter :
- Classification de contenus audio
- Conception d'un algorithme de chapitrage automatique de podcast basé sur le transcript
- Détection de deep fake audios
- Optimisation d'un moteur de recherche sémantique fait maison
- Détection de moments clés dans un contenu audio pour aider à la découpe d'extraits
Compétences techniques demandées
Science des données :
- Intérêt avancé pour le Traitement Automatique de la Langue (NLP) ainsi que pour les techniques d’apprentissage automatique (machine learning, deep learning)
- Une appétence pour la veille technologique et scientifique est nécessaire
- Excellente connaissance des bibliothèques open source clés telles que Numpy, Pandas, PyTorch, scikit‑learn
- Une expérience en traitement automatique du signal audio sera appréciée
Développement logiciel :
- Excellente maîtrise de Python
- Être à l’aise dans un environnement *nix
- Savoir versionner son code et collaborer à l’aide d’un VCS (comme git)
- Respecter les principes Clean Code et garantir un niveau de qualité en paramétrant sa CI/CD
- Connaissance de la conteneurisation appréciée
Informations complémentaires
Rythme d’alternance souhaité : 3 semaines / 1 semaine ou 4/1 J (flexible). Merci de préciser votre rythme sur votre CV.
Télétravail possible, si les bonnes conditions de travail sont réunies au domicile et que l'autonomie de l'alternant(e) est évaluée positivement par le manager.
Début de contrat : septembre 2026. Poste basé au 116, Avenue du Président Kennedy, 75016 Paris.
Localisation du poste
France, Île-de-France, Paris (75)
Critères candidat
Compétences générales requises :
- Être curieux·se et inventif·ve
- Capacité d'analyse de sa pratique et de celle des autres
- Capacité à imaginer puis tester des solutions aux limitations déterminées
- Communiquer tant les résultats intermédiaires que les difficultés rencontrées
- Capacité à travailler efficacement en équipe, avec parfois des échanges interdisciplinaire (journalistes, documentalistes, etc.)
- Communiquer des concepts techniques à des non-experts est un plus
Profil requis :
- Formation Bac+4/5 en Mathématiques appliquées, Data Science, Informatique, Science des données ou mention similaire
- Rigueur, adaptabilité, implication et fiabilité
- Intérêt pour l'activité (secteur nouveaux médias)
- Première expérience professionnelle et/ou académique vivement souhaitée
- Lien vers GitHub, portfolio ou site présentant des projets académiques ou personnels réalisés vivement apprécié
Licence et Master 1
À propos de Radio France
Radio France est le premier groupe radiophonique français. Sa politique ressources humaines vise à valoriser l’expérience et les compétences de chacun de ses collaborateurs au service des enjeux de l’entreprise. Radio France est engagée dans une politique d’égalité professionnelle, d’inclusion et de lutte contre toute forme de discrimination. Son engagement en faveur de la diversité est porté dans son programme Egalité 360. Radio France détient le label Alliance Diversité / Égalité décerné par l’Afnor et fait partie du réseau #activateurdeprogrès des entreprises qui s’engagent en faveur de l’emploi des personnes en situation de handicap.
Référence
26DIR
Entité de rattachement
Direction du Numérique et de la Stratégie d’Innovation
#J-18808-Ljbffr