Cette offre n’est plus disponible.

Data scientist H/F

Résumé du poste
CDD / Temporaire(12 à 36 mois)
Créteil, Paris
Télétravail occasionnel
Salaire : Non spécifié
Expérience : > 1 an
Éducation : Bac +5 / Master
Compétences & expertises
Analyse des systèmes
Travail d'équipe
Analyse statistique
Communication
Créativité et innovation
+3

AP-HP - Direction des Services Numériques (DSN)
AP-HP - Direction des Services Numériques (DSN)

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Identifier les facteurs prédictifs et mécanismes impliqués dans l’accès aux soins palliatifs hospitaliers des patients âgés avec cancer : le projet DASPPAC

Dans une population mondiale de plus en plus nombreuse et vieillissante, l’incidence des cancers ne cesse d’augmenter. Plus de la moitié de tous les cas de cancer et des décès surviennent chez des personnes âgées de 65 ans et plus, et cette tendance devrait s’accentuer dans les années à venir. Ce contexte interroge les déterminants du parcours de soins des patients âgés avec cancer en termes de pronostic et d’accès aux soins. Plusieurs études ont rapporté des disparités en termes de dépistage, de diagnostic, d’accès aux soins et de survie entre les patients cancéreux âgés et leurs homologues plus jeunes, l’âge étant le principal facteur limitant. Dans ce cadre, les objectifs du projet DASPPAC sont d’identifier les déterminants cliniques, notamment de la souffrance sévère liée à la santé, associés au déclin fonctionnel, à l’accès aux traitement anti-cancéreux, aux prises en charge palliatives et à la survie des patients âgés avec cancer, en tenant compte des caractéristiques sociodémographiques, tumorales, et de comorbidités du patient ainsi que de la période de prise en charge.

Les algorithmes de data science à l’Entrepôt des Données de Santé

Les données massives de l’Entrepôt de Données de Santé (EDS) contiennent de très nombreuses informations d’intérêt pour améliorer les connaissances médicales et optimiser le système de santé, mais celles-ci sont souvent présentes de manière diffuse (l’information est déduite à partir de nombreuses données) et non-structurée (sous la forme de textes, d’images, de signaux). Il apparaît nécessaire de pré-traiter les données à large échelle et à l’aide d’algorithmes de data science dédiés avant de pouvoir répondre aux questions posées par les utilisateurs de l’EDS. De nombreux algorithmes de Natural Language Processing (NLP) sont en particulier développés, validés et mis en production pour rendre possible l’exploitation des dizaines de millions de comptes rendus cliniques présents dans l’EDS (par exemple la détection automatique du layout des PDF, la pseudonymisation des textes, l’extraction de variables structurées à partir des textes, l’entraînement de modèles de machine learning à large échelle, etc.).

L’équipe

Le poste est à temps plein au sein de l’équipe de recherche en épidémiologie clinique du vieillissement CEpiA et de l’Unité de Recherche Clinique (URC) de l’Hôpital Henri Mondor (Créteil). L’équipe CEpiA porte de nombreux projets de recherche sur des cohortes cliniques, des bases de données médico-administratives (type SNDS) ou encore sur des entrepôts de données de santé (notamment l’EDS de l’AP-HP), en fournissant un accompagnement technico-réglementaire et une expertise méthodologique, biostatistique, technique et épidémiologique.

Certains déplacements au sein de l’équipe data science du Pôle Innovation et Données de l’AP-HP (campus Picpus, Paris XII), sont à prévoir pour échanger des méthodologies de code et de travail avec les autres data scientists de l’AP-HP.

Votre mission

Vous travaillerez étroitement avec l’équipe de recherche composée d’épidémiologistes, biostatisticiens, ingénieurs, médecins cliniciens gériatres et oncologues. Vous serez en charge de la mise à jour du chaînage entre la cohorte clinique ELCAPA et l’EDS de l’AP-HP. Vous développerez également des algorithmes NLP pour détecter dans les comptes rendus cliniques de l’EDS, les variables d’intérêt du projet DASPPAC, incluant données d’accès aux soins de support et soins palliatifs, données de traitement, sévérité du cancer et autres antécédents. Vous explorerez la base de données pour générer ou vérifier des hypothèses, pour mieux décrire les parcours patients, etc. Les développements réalisés seront publiés en open source permettant ainsi de co-construire des communs numériques dédiés à la recherche en gériatrie et oncologie.


Profil recherché

Prérequis

Diplôme d’Ingénieur, Doctorat ou M2 en Mathématiques appliquées ou équivalent avec spécialisation sur les enjeux de traitement de données massives (Big Data) / ML / NLP / AI / Data Science

Compétences requises

  • Expertise en développement Python ;

  • Expertise en statistiques ;

  • Expertise en analyse de bases de données, familiarité avec le framework Spark ;

  • Modèles de machine learning, en particulier pour l’analyse automatique de textes (NLP) ;

  • Esprit d’équipe, communication, ouverture d’esprit, créativité, curiosité, transdisciplinarité

  • Être autonome, avoir un bon sens de l’organisation du travail et des priorités

Compétences appréciées

  • Problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé (dont la recherche sur données et la recherche clinique) ;

  • Modélisation de systèmes complexes

  • Capacité à lire la littérature scientifique et à contribuer à des articles scientifiques

  • Standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, SnomedCT, LOINC…)

  • Connaissance de la recherche clinique

  • Expérience en recherche appréciée

Qualités requises

  • Des qualités d’autonomie, de flexibilité et de responsabilité

  • Curieux, dynamique et créatif, avec une réelle envie de faire preuve d’innovation

  • Esprit d’équipe et la volonté de prendre part à une aventure collective

  • Sens de l’écoute, du résultat et de la qualité


Déroulement des entretiens

  • Entretien visio (~1h)

  • Test technique (~1h)

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.