Stage Data Scientist NLP (H/F)

Stage(6 mois)
Paris
Salaire : Non spécifié
Début : 31 août 2025
Télétravail occasionnel
Éducation : Bac +5 / Master

codoc
codoc

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

codoc recherche d’un stagiaire Data Scientist dans l’équipe R&D. Tu participeras à l’optimisation des algorithmes de recherche développés en partenariat avec l’Institut Imagine et à leur intégration dans des projets nationaux, tels que Meditwin.

Dans le cadre du projet Meditwin, codoc contribue au développement d’outils d’analyse sémantique avancés pour l’identification automatique de patients à risque de maladies rares.

Tes missions :

  • Test et comparaison de méthodes NLP : Tu seras chargé d’appliquer et de comparer différentes méthodes d’extraction d’informations pertinentes à partir de comptes rendus hospitaliers multilingues (NER, embeddings, dictionnaires et RegEx), en évaluant leur performance à chaque étape via un gold standard en français.

  • Standardisation sémantique : Tu assureras l’alignement des entités extraites avec des terminologies médicales standardisées (notamment UMLS), afin de faciliter la comparaison sémantique entre patients. Cet alignement multilingue sera utilisé pour exécuter l’algorithme de similarité développé par codoc, afin d’identifier les patients les plus proches au sens clinique.

  • Optimisation des algorithmes de R&D : Tu proposeras et testeras de nouvelles méthodes visant à améliorer les performances des algorithmes, notamment celui utilisé pour identifier les patients atteints de maladies rares.

Rejoindre codoc c’est :

  • Donner du sens à ton travail en participant à la croissance d’une entreprise qui a du sens dans la santé

  • Contribuer à apporter une solution avec un fort impact pour la communauté scientifique et médicale

  • Un environnement de travail bienveillant qui encourage la créativité

Avantages :

  • Des moments conviviaux en équipe réguliers

  • Des tickets-restaurants

  • Mac

  • Transport (50%)


Profil recherché

Si tu te reconnais dans au moins cinq de ces points, n’hésite pas à nous contacter pour ce poste.

Si ton profil ne correspond pas mais que codoc t’intéresse, tu peux aussi nous contacter car nous agrandissons notre équipe produit.

  • Master 2 en école d’ingénieur ou en cursus Data Science

  • Une appétence pour les enjeux des industries de santé et la recherche clinique

  • Excellente capacité de communication orale et écrite

  • Connaissance du traitement de langage naturel (NLP)

  • Connaissance en recherche bibliographique et veille technologique

  • Maitrise des langages de programmation en particulier Python et ses bibliothèques NLP

  • Connaissance des ontologies médicales (UMLS, HPO)

  • Esprit analytique, rigueur et autonomie


Déroulement des entretiens

Nous essayons d’éviter les processus lourds qui s’étendent sur plusieurs mois, mais pour nous il est important qu’il y ait un vrai fit avec l’équipe, ce qui induit de prendre un peu de temps :

  • Validation de ta candidature et échange par visio (45 minutes)

  • Rencontre avec l’équipe produit et cas d’usage (physique - 1h30)

  • Débrief détaillé

  • Proposition de stage

Conditions du stage :

Durée du stage: 6 mois

Lieu: Paris Liberté Living Lab, rue Alexandrie.

Date de début: Entre le 1er septembre et le 30 septembre en fonction de tes disponibilités

Télétravail: autorisé à partir de deux mois de stage

Contact : Mathilde Fruchart, Data Scientist R&D Engineer - mathilde@codoc.co

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres