Mieux comprendre la santé mentale des jeunes franciliens : le projet CASSANDRE
L’épidémie de COVID-19 a fortement impacté la santé mentale de la population, en particulier des plus jeunes. La compréhension de ce phénomène reste néanmoins à parfaire : quelles populations sont-elles les plus touchées ? Quelle a été la réponse du système de santé ? Quels sont les principaux facteurs de risques liés à ces troubles psychiatriques ? La Région Ile de France finance le projet CASSANDRE, porté par la Pr. Marion Leboyer, pour étudier ces différents aspects et ainsi mieux organiser les réponses apportées par les pouvoirs publics.
Les algorithmes de data science à l’Entrepôt des Données de Santé
Les données massives de l’Entrepôt de Données de Santé (EDS) contiennent de très nombreuses informations d’intérêt pour améliorer les connaissances médicales et optimiser le système de santé, mais celles-ci sont souvent présentes de manière diffuse (l’information est déduite à partir de nombreuses données) et non-structurée (sous la forme de textes, d’images, de signaux). Il apparaît nécessaire de pré-traiter les données à large échelle et à l’aide d’algorithmes de data science dédiés avant de pouvoir répondre aux questions posées par les utilisateurs de l’EDS. De nombreux algorithmes de Natural Language Processing (NLP) sont en particulier développés, validés et mis en production pour rendre possible l’exploitation des dizaines de millions de comptes rendus cliniques présents dans l’EDS (par exemple la détection automatique du layout des PDF, la pseudonymisation des textes, l’extraction de variables structurées à partir des textes, l’entraînement de modèles de machine learning à large échelle, etc.).
Les équipes
Le poste est à mi-temps entre l’Unité de Recherche Clinique (URC) de l’Hôpital Henri Mondor (Créteil) et l’équipe Data Science du Pôle Innovation et Données de la Direction des Services Numériques (Paris XIIème arrondissement). L’URC accompagne les projets de recherche menés sur l’EDS, en fournissant un accompagnement technico-réglementaire et une expertise méthodologique et biostatistique. L’équipe Data Science développe et valide des algorithmes de pré-traitement des données massives.
Votre mission
Vous travaillerez étroitement avec l’équipe de recherche composée de psychiatres, biostatisticiens, épidémiologistes. Vous développerez des algorithmes NLP pour détecter, dans les millions de comptes rendus cliniques de l’EDS, les variables d’intérêt du projet CASSANDRE : prescription de psychotropes, effets indésirables de ces traitements (néphrologiques, cardiovasculaires, gynécologiques, etc.). Vous explorerez la base de données pour générer ou vérifier des hypothèses, pour mieux décrire les parcours patients, etc. Les développements réalisés seront publiés en open source permettant ainsi de co-construire des communs numériques dédiés à la recherche en santé mentale. Le poste peut éventuellement prendre la forme d’une thèse de science, suivant le profil et le projet du candidat.
Idéalement, vous…
Avez un diplôme d’ingénieur, M2 en mathématique appliqué ou équivalent avec spécialisation sur les enjeux de traitement de données massives (Big Data) / ML / NLP / AI / Data Science ;
Avez 2 ans d’expérience ;
Etes fortement intéressé par les problématiques liées au système de santé ;
Souhaitez prendre part à un projet de recherche ambitieux ;
…et vous avez un savoir faire dans plusieurs de ces domaines
Expertise en développement Python ;
Expertise en statistiques ;
Expertise en analyse de bases de données, familiarité avec le framework Spark ;
Modèles de machine learning, en particulier pour l’analyse automatique de textes (NLP) ;
Connaissances appréciées :
Problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé (dont la recherche sur données et la recherche clinique) ;
Modélisation de systèmes complexes
Capacité à lire la littérature scientifique et à contribuer à des articles scientifiques
Standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, SnomedCT, LOINC…)
Connaissance de la recherche clinique
Expérience en recherche appréciée
Et humainement ?
Des qualités d’autonomie, de flexibilité et de responsabilité
Curieux, dynamique et créatif, avec une réelle envie de faire preuve d’innovation
Esprit d’équipe et la volonté de prendre part à une aventure collective
Sens de l’écoute, du résultat et de la qualité
Entretien de motivation (distanciel)
Epreuve technique (présentiel)
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.