Codoc recherche un·e stagiaire Data Scientist pour rejoindre son équipe R&D et explorer le potentiel des modèles de langage (LLMs) appliqués aux données cliniques, dans le contexte des entrepôts de données de santé (EDS).
Tu travailleras à l’intégration de ces modèles dans nos outils internes et auprès de nos partenaires hospitaliers, afin de faciliter la structuration, l’accès et l’exploitation des données de santé, au service du soin et de la recherche.
Tes missions :
Faciliter l’usage des outils via les LLMs
Tu mettras en œuvre des LLMs pour assister les utilisateurs (cliniciens, data scientists, chefs de projet…) dans la formulation de requêtes complexes, la transformation de texte libre en formats structurés, ou l’explication des résultats.
Restructurer les données à l’aide des LLMs
Tu testeras l’usage des LLMs pour résumer des dossiers patients, extraire automatiquement des éléments clés (diagnostics, antécédents, traitements…) ou pré-annoter les données en vue de leur intégration dans des formats standardisés.
Évaluer et comparer les approches
Tu conduiras des benchmarks entre différentes approches (LLMs vs méthodes classiques) sur des cas d’usage concrets, en définissant des jeux de test et des métriques adaptés à la donnée clinique.
Proposer des améliorations concrètes
Tu seras force de proposition pour intégrer ces modèles dans des parcours utilisateurs réels, que ce soit via des prototypes ou des modules intégrés aux outils existants de Codoc.
Si tu te reconnais dans au moins cinq de ces points, n’hésite pas à nous contacter pour ce poste.
Si ton profil ne correspond pas mais que codoc t’intéresse, tu peux aussi nous contacter car nous agrandissons notre équipe produit.
Master 2 en école d’ingénieur ou en cursus Data Science / Intelligence Artificielle
Une appétence pour les enjeux des industries de santé et la recherche clinique
Expérience avec des modèles NLP, notamment LLMs ou embeddings cliniques
Maitrise des langages de programmation en particulier Python
Connaissance des ontologies médicales (UMLS, HPO)
Esprit analytique, rigueur et autonomie
Connaissance en recherche bibliographique et veille technologique
Processus de recrutement :
Nous essayons d’éviter les processus lourds qui s’étendent sur plusieurs mois, mais pour nous il est important qu’il y ait un vrai fit avec l’équipe, ce qui induit de prendre un peu de temps :
Validation de ta candidature et échange par visio (30 minutes)
Rencontre avec l’équipe et test technique (physique - 1h30)
Débrief détaillé
Proposition de stage
Conditions du stage :
Durée du stage: 6 mois
Lieu: Paris Liberté Living Lab, rue Alexandrie.
Date de début: Entre le 1er septembre et le 30 septembre en fonction de tes disponibilités
Télétravail: autorisé à partir de deux mois de stage
Des tickets-restaurants
Mac
Transport (50%
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.