Stagiaire LLM - Entrepôt de données de santé

Stage(5 à 6 mois)
Paris
Salaire : Non spécifié
Début : 31 août 2025
Télétravail occasionnel
Expérience : < 6 mois
Éducation : Bac +5 / Master

codoc
codoc

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Codoc recherche un·e stagiaire Data Scientist pour rejoindre son équipe R&D et explorer le potentiel des modèles de langage (LLMs) appliqués aux données cliniques, dans le contexte des entrepôts de données de santé (EDS).

Tu travailleras à l’intégration de ces modèles dans nos outils internes et auprès de nos partenaires hospitaliers, afin de faciliter la structuration, l’accès et l’exploitation des données de santé, au service du soin et de la recherche.

Tes missions :

  • Faciliter l’usage des outils via les LLMs

    Tu mettras en œuvre des LLMs pour assister les utilisateurs (cliniciens, data scientists, chefs de projet…) dans la formulation de requêtes complexes, la transformation de texte libre en formats structurés, ou l’explication des résultats.

  • Restructurer les données à l’aide des LLMs

    Tu testeras l’usage des LLMs pour résumer des dossiers patients, extraire automatiquement des éléments clés (diagnostics, antécédents, traitements…) ou pré-annoter les données en vue de leur intégration dans des formats standardisés.

  • Évaluer et comparer les approches

    Tu conduiras des benchmarks entre différentes approches (LLMs vs méthodes classiques) sur des cas d’usage concrets, en définissant des jeux de test et des métriques adaptés à la donnée clinique.

  • Proposer des améliorations concrètes

    Tu seras force de proposition pour intégrer ces modèles dans des parcours utilisateurs réels, que ce soit via des prototypes ou des modules intégrés aux outils existants de Codoc.


Profil recherché

Si tu te reconnais dans au moins cinq de ces points, n’hésite pas à nous contacter pour ce poste.

Si ton profil ne correspond pas mais que codoc t’intéresse, tu peux aussi nous contacter car nous agrandissons notre équipe produit.

  • Master 2 en école d’ingénieur ou en cursus Data Science / Intelligence Artificielle

  • Une appétence pour les enjeux des industries de santé et la recherche clinique

  • Expérience avec des modèles NLP, notamment LLMs ou embeddings cliniques

  • Maitrise des langages de programmation en particulier Python

  • Connaissance des ontologies médicales (UMLS, HPO)

  • Esprit analytique, rigueur et autonomie

  • Connaissance en recherche bibliographique et veille technologique


Déroulement des entretiens

Processus de recrutement :

Nous essayons d’éviter les processus lourds qui s’étendent sur plusieurs mois, mais pour nous il est important qu’il y ait un vrai fit avec l’équipe, ce qui induit de prendre un peu de temps :

  • Validation de ta candidature et échange par visio (30 minutes)

  • Rencontre avec l’équipe et test technique (physique - 1h30)

  • Débrief détaillé

  • Proposition de stage

Conditions du stage :

  • Durée du stage: 6 mois

  • Lieu: Paris Liberté Living Lab, rue Alexandrie.

  • Date de début: Entre le 1er septembre et le 30 septembre en fonction de tes disponibilités

  • Télétravail: autorisé à partir de deux mois de stage

  • Des tickets-restaurants

  • Mac

  • Transport (50%

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres