Alternance : Data Scientist H/F

Alternance(12 mois)
Paris
Télétravail fréquent
Salaire : Non spécifié
Expérience : < 6 mois
Postuler

Radio France
Radio France

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

La Direction du Numérique et de la Stratégie d’Innovation (DNSI) conçoit, développe, maintient et héberge les sites Internet et les applications mobiles des 7 chaînes de Radio France (France Info, France Inter, ICI, France Culture, France Musique, Mouv’, FIP). 
 
La DNSI accompagne les chaînes dans la mise en oeuvre de leur offre numérique sur tous les supports : Internet fixe et mobile, applications, réseaux sociaux, plateformes vidéo, podcasts, assistants vocaux, etc. 
Elle assure une veille permanente sur les nouveaux usages des médias numériques : assistants vocaux, son 3D, voitures connectées. Ses équipes travaillent selon des méthodes agiles, plaçant les usages des auditeurs au coeur des priorités de chaque projet.
 
 La direction est structurée autour de 5 pôles complémentaires, en charge des orientations stratégiques et de la mise en oeuvre du développement numérique de Radio France : 

  • Direction du Numérique Grand Public (DNGP)

  • Direction des Technologies Numériques et Outils de Contribution (DTNOC)

  • Direction de la Documentation et des Métadonnées

  • Délégation aux Méthodes et Opérations

  • Direction de l’Accélération et du Partage de l’Innovation (DAPI)

Au sein de la DNSI, la Direction Technique du Numérique et des Outils de Contribution conçoit et opère les plateformes numériques sur lesquelles sont distribuées ces stations de radio, ainsi que les podcasts qu’elles produisent. L’équipe R&D recherche un·e alternant·e data scientist pour 12 mois. 

Notre environnement technique :

La plateforme numérique de Radio France et les outils collaboratifs pour l’enrichir sont développés en interne. Voici un ensemble non-exhaustif des technologies (avec lesquelles tu interagiras peut-être) qui les supportent : 
. Python et les librairies open source de Machine Learning (PyTorch, scikit-learn, etc.) 
. Streamlit 
. PostgreSQL, Elastic 
. Docker, Kubernetes

Missions

Les data scientists de l’équipe cherchent à fournir de nouvelles manières d’interagir avec les contenus audio produits par Radio France, cela aussi bien à destination des contributeurs internes qu’à celle des utilisateurs finaux de la plateforme Radio France.  

Dans cet objectif, ils proposent des outils de suggestion de métadonnées, d’aide à la rédaction, de structuration de la bibliothèque de podcasts, de recherche avancée comme la recherche sémantique ou la détection de temps forts, etc. 
  
Rôle dans l’équipe & missions :

  • Consulter la littérature scientifique pour alimenter sa réflexion

  • Recueillir les besoins auprès des utilisateurs internes

  • Concevoir et/ou implémenter un algorithme pour y répondre

  • Présenter les résultats au sein de l’équipe ainsi qu’aux porteurs de besoin pour récolter leurs retours

Quelques exemples de projets à traiter :

  • Classification de contenus audio,

  • Conception d’un algorithme chapitrage automatique de podcast basé sur le transcript,

  • Détection de deep fake audios

  • Optimisation d’un moteur de recherche sémantique fait maison,

  • Détection de moments clés dans un contenu audio pour aider à la découpe d’extraits

Compétences techniques demandées
Science des données
- Intérêt avancé pour le Traitement Automatique de la Langue (NLP) ainsi que pour les techniques d’apprentissage automatique (machine learning, deep learning), 
- Une appétence pour la veille technologique et scientifique est nécessaire, 
- Excellente connaissance des bibliothèques open source clés telles que Numpy, Pandas, PyTorch et scikit-learn, 
- Une expérience en traitement automatique du signal audio sera appréciée. 

Développement logiciel
- Excellente maîtrise de Python, 
- Être à l’aise dans un environnement *nix, 
- Savoir versionner son code et collaborer à l’aide d’un VCS (comme git), 
- Respecter les principes Clean Code et à garantir un niveau de qualité en paramétrant sa CI/CD, 
- Connaissance de la conteneurisation appréciée.


Profil recherché

Compétences générales requises :
- Être curieux·se et inventif·ve,
- Capacité d’analyse de sa pratique et de celle des autres,
- Capacité à imaginer puis tester des solutions aux limitations déterminées,
- Communiquer tant les résultats intermédiaires que les difficultés rencontrées,
- Capacité à travailler efficacement en équipe, avec parfois des échanges interdisciplinaire (journalistes, documentalistes, etc.),
- Communiquer des concepts techniques à des non-experts est un plus

Profil requis :
- Formation Bac+4/5 en Mathématiques appliquées, Data Science, Informatique, Science des données ou mention similaire
- Rigueur, adaptabilité, implication et fiabilité
- Intérêt pour l’activité (secteur nouveaux médias)
- Première expérience professionnelle et/ou académique vivement souhaité
- Lien vers GitHub, portfolio ou site présentant des projets académiques ou personnels réalisés vivement apprécié

Informations complémentaires

Rythme d’alternance souhaité : 3 semaines / 1 semaine ou 4/1J (flexible), merci de préciser votre rythme sur votre CV

Télétravail possible, si les bonnes conditions de travail sont réunies au domicile et que l’autonomie de l’alternant(e) est évaluée positivement par le manager.
Début de contrat : septembre 2026 
Poste basé au 116, Avenue du Président Kennedy 75016 Paris.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Postuler