codoc recherche d’un stagiaire Data Scientist dans l’équipe R&D. Tu participeras à l’optimisation des algorithmes de recherche développés en partenariat avec l’Institut Imagine et à leur intégration dans des projets nationaux, tels que Meditwin.
Dans le cadre du projet Meditwin, codoc contribue au développement d’outils d’analyse sémantique avancés pour l’identification automatique de patients à risque de maladies rares.
Tes missions :
Test et comparaison de méthodes NLP : Tu seras chargé d’appliquer et de comparer différentes méthodes d’extraction d’informations pertinentes à partir de comptes rendus hospitaliers multilingues (NER, embeddings, dictionnaires et RegEx), en évaluant leur performance à chaque étape via un gold standard en français.
Standardisation sémantique : Tu assureras l’alignement des entités extraites avec des terminologies médicales standardisées (notamment UMLS), afin de faciliter la comparaison sémantique entre patients. Cet alignement multilingue sera utilisé pour exécuter l’algorithme de similarité développé par codoc, afin d’identifier les patients les plus proches au sens clinique.
Optimisation des algorithmes de R&D : Tu proposeras et testeras de nouvelles méthodes visant à améliorer les performances des algorithmes, notamment celui utilisé pour identifier les patients atteints de maladies rares.
Rejoindre codoc c’est :
Donner du sens à ton travail en participant à la croissance d’une entreprise qui a du sens dans la santé
Contribuer à apporter une solution avec un fort impact pour la communauté scientifique et médicale
Un environnement de travail bienveillant qui encourage la créativité
Avantages :
Des moments conviviaux en équipe réguliers
Des tickets-restaurants
Mac
Transport (50%)
Si tu te reconnais dans au moins cinq de ces points, n’hésite pas à nous contacter pour ce poste.
Si ton profil ne correspond pas mais que codoc t’intéresse, tu peux aussi nous contacter car nous agrandissons notre équipe produit.
Master 2 en école d’ingénieur ou en cursus Data Science
Une appétence pour les enjeux des industries de santé et la recherche clinique
Excellente capacité de communication orale et écrite
Connaissance du traitement de langage naturel (NLP)
Connaissance en recherche bibliographique et veille technologique
Maitrise des langages de programmation en particulier Python et ses bibliothèques NLP
Connaissance des ontologies médicales (UMLS, HPO)
Esprit analytique, rigueur et autonomie
Nous essayons d’éviter les processus lourds qui s’étendent sur plusieurs mois, mais pour nous il est important qu’il y ait un vrai fit avec l’équipe, ce qui induit de prendre un peu de temps :
Validation de ta candidature et échange par visio (45 minutes)
Rencontre avec l’équipe produit et cas d’usage (physique - 1h30)
Débrief détaillé
Proposition de stage
Conditions du stage :
Durée du stage: 6 mois
Lieu: Paris Liberté Living Lab, rue Alexandrie.
Date de début: Entre le 1er septembre et le 30 septembre en fonction de tes disponibilités
Télétravail: autorisé à partir de deux mois de stage
Contact : Mathilde Fruchart, Data Scientist R&D Engineer - mathilde@codoc.co
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres