Data scientist - NLP psychiatrie

Résumé du poste
CDD / Temporaire(12 à 36 mois)
Salaire : Non spécifié
Télétravail occasionnel
Expérience : > 2 ans
Éducation : Bac +5 / Master
Compétences & expertises
Connaissances en cybersécurité
Analyse des systèmes
Analyse statistique
Créativité et innovation
Connaissance des troubles de santé mentale
+4

APHP DSN
APHP DSN

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Mieux comprendre la santé mentale des jeunes franciliens : le projet CASSANDRE

L’épidémie de COVID-19 a fortement impacté la santé mentale de la population, en particulier des plus jeunes. La compréhension de ce phénomène reste néanmoins à parfaire : quelles populations sont-elles les plus touchées ? Quelle a été la réponse du système de santé ? Quels sont les principaux facteurs de risques liés à ces troubles psychiatriques ? La Région Ile de France finance le projet CASSANDRE, porté par la Pr. Marion Leboyer, pour étudier ces différents aspects et ainsi mieux organiser les réponses apportées par les pouvoirs publics.

Les algorithmes de data science à l’Entrepôt des Données de Santé

Les données massives de l’Entrepôt de Données de Santé (EDS) contiennent de très nombreuses informations d’intérêt pour améliorer les connaissances médicales et optimiser le système de santé, mais celles-ci sont souvent présentes de manière diffuse (l’information est déduite à partir de nombreuses données) et non-structurée (sous la forme de textes, d’images, de signaux). Il apparaît nécessaire de pré-traiter les données à large échelle et à l’aide d’algorithmes de data science dédiés avant de pouvoir répondre aux questions posées par les utilisateurs de l’EDS. De nombreux algorithmes de Natural Language Processing (NLP) sont en particulier développés, validés et mis en production pour rendre possible l’exploitation des dizaines de millions de comptes rendus cliniques présents dans l’EDS (par exemple la détection automatique du layout des PDF, la pseudonymisation des textes, l’extraction de variables structurées à partir des textes, l’entraînement de modèles de machine learning à large échelle, etc.).

Les équipes

Le poste est à mi-temps entre l’Unité de Recherche Clinique (URC) de l’Hôpital Henri Mondor (Créteil) et l’équipe Data Science du Pôle Innovation et Données de la Direction des Services Numériques (Paris XIIème arrondissement). L’URC accompagne les projets de recherche menés sur l’EDS, en fournissant un accompagnement technico-réglementaire et une expertise méthodologique et biostatistique. L’équipe Data Science développe et valide des algorithmes de pré-traitement des données massives.

Votre mission

Vous travaillerez étroitement avec l’équipe de recherche composée de psychiatres, biostatisticiens, épidémiologistes. Vous développerez des algorithmes NLP pour détecter, dans les millions de comptes rendus cliniques de l’EDS, les variables d’intérêt du projet CASSANDRE : prescription de psychotropes, effets indésirables de ces traitements (néphrologiques, cardiovasculaires, gynécologiques, etc.). Vous explorerez la base de données pour générer ou vérifier des hypothèses, pour mieux décrire les parcours patients, etc. Les développements réalisés seront publiés en open source permettant ainsi de co-construire des communs numériques dédiés à la recherche en santé mentale. Le poste peut éventuellement prendre la forme d’une thèse de science, suivant le profil et le projet du candidat.


Profil recherché

Idéalement, vous…

  • Avez un diplôme d’ingénieur, M2 en mathématique appliqué ou équivalent avec spécialisation sur les enjeux de traitement de données massives (Big Data) / ML / NLP / AI / Data Science ;

  • Avez 2 ans d’expérience ;

  • Etes fortement intéressé par les problématiques liées au système de santé ;

  • Souhaitez prendre part à un projet de recherche ambitieux ;

…et vous avez un savoir faire dans plusieurs de ces domaines

  • Expertise en développement Python ;

  • Expertise en statistiques ;

  • Expertise en analyse de bases de données, familiarité avec le framework Spark ;

  • Modèles de machine learning, en particulier pour l’analyse automatique de textes (NLP) ;

Connaissances appréciées :

  • Problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé (dont la recherche sur données et la recherche clinique) ;

  • Modélisation de systèmes complexes

  • Capacité à lire la littérature scientifique et à contribuer à des articles scientifiques

  • Standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, SnomedCT, LOINC…)

  • Connaissance de la recherche clinique

  • Expérience en recherche appréciée

Et humainement ?

  • Des qualités d’autonomie, de flexibilité et de responsabilité

  • Curieux, dynamique et créatif, avec une réelle envie de faire preuve d’innovation

  • Esprit d’équipe et la volonté de prendre part à une aventure collective

  • Sens de l’écoute, du résultat et de la qualité


Déroulement des entretiens

Entretien de motivation (distanciel)

Epreuve technique (présentiel)

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.