Assistance Publique - Hôpitaux de Paris - DSI

Assistance Publique - Hôpitaux de Paris - DSI

Data Scientist - covid19

  • CDD / Temporaire (12 mois)
  • Début :  
  • Paris
  • Télétravail partiel possible
  • Bac +5 / Master
  • > 1 an

La tribu

Assistance Publique - Hôpitaux de Paris - DSI

Assistance Publique - Hôpitaux de Paris - DSI

  • Big Data, Intelligence artificielle / Machine Learning, Santé
  • De 50 à 250 salariés

Le poste

Data Scientist - covid19

  • CDD / Temporaire (12 mois)
  • Paris

Cette offre a été pourvue !

À propos

L’ Assistance Publique - Hôpitaux de Paris (AP - HP) est un établissement public de santé et le centre hospitalier universitaire - CHU - de la région Ile-de-France, reconnu mondialement pour sa recherche. Le département Web Innovation Données (WIND) s’inscrit au sein de la Direction des Systèmes d’Information.

Sa mission ? 🎯Réaliser les projets digitaux innovants au sein de l’hôpital.

Ses projets phares ?

🚀 Construire le plus large entrepôt public de données de santé en Europe! Le projet vise à valoriser les données produites à l’AP-HP pour la recherche, l’innovation et le pilotage des soins, tout en protégeant les données patient. L’Entrepôt de Données de Santé, c’est déjà +8 millions de patients dont les données sont structurées et référencées sur une plateforme Big Data dédiée.

🙋‍♀️🙋‍♂Faciliter le quotidien des patients! Le domaine gère notamment toutes les applications mobiles et tous les téléservices de l’AP-HP.

🔬Monter une plateforme Bio-Informatique centrale pour assister les pôles de biologie de l’ AP-HP dans leurs besoins informatiques (gestion du séquençage, déploiement de ressources de calcul).

🌼Développer et déployer au niveau national les outils de collecte et d’analyse épidémiologique des données relatives aux maladies rares.

Descriptif du poste

La mission de votre équipe

Une équipe de data scientists et de data engineers se constitue pour aider au pilotage de la crise sanitaire covid19 à l’échelle de l’AP-HP. Cette équipe, qui sera composée d’un noyau de 5 personnes d’ici quelques semaines, réalise les analyses et tableaux de bord demandés par la cellule de crise de l’AP-HP. Elle travaille en particulier sur l’Entrepôt des Données de Santé (EDS) de l’AP-HP qui centralise les données collectées à l’AP-HP dans le cadre de soin, et les met à disposition de la recherche et du pilotage.

L’EDS contient aujourd’hui les données médicales de plus de 12 millions de patients (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoire etc.). Les données structurées et non-structurées qui sont collectées à l’APHP sont intégrées et mises à jour quotidiennement. Un travail important de standardisation des données a été engagé afin de s’aligner sur les standards internationaux et assurer une interopérabilité maximale (OMOP, FHIR et les terminologies médicales de référence LOINC, CIM etc.). Une plateforme technique d’analyse est actuellement mise à disposition de plus de 40 projets de recherche, avec un cluster Hadoop (distribution Hortonworks avec les briques Hive, Spark2, Solr, Phoenix, Hbase, HDFS, Zookeper, Ambari etc.), une base de données PostgreSQL et des outils d’exploitation de données (Jupyter Lab, i2b2, Cognos, Cohort360).

Les missions du plateau technique ‘data’ mis en place pour la gestion de crise sont:

  • La réalisation d’études ponctuelles demandées par la cellule de crise AP-HP
  • Le maintien et l’enrichissement du tableau de bord de gestion de crise

Pour cela, le plateau technique pourra s’appuyer sur:

  • La plateforme technique du pôle Innovation et Données de l’AP-HP
  • L’expertise des services “data science” et “Pilotage - BI” du pôle Innovation et Données de l’AP-HP
  • Le cadrage médical et opérationnel de la Direction de la Stratégie et de la Transformation
  • L’expertise de nombreux médecins et chercheurs partenaires, à l’AP-HP et en dehors

Vos missions

Au sein du plateau technique de gestion de crise covid19, vous aurez pour mission de proposer et de développer des modèles statistiques et indicateurs répondant aux attentes de la cellule de crise covid19 de l’AP-HP.

Après vous être familiarisé.e avec les différentes bases de données pouvant être mises à contribution, dont celle de l’EDS, vous contribuerez à l’effort transversal afin d’améliorer la qualité des données intégrées, leur documentation et leur exploitation. Vous serez amené.e à développer des scripts de data management ou des librairies python de pre-processing. Pour enrichir la base de données par des données structurées, vous contribuerez au développement et à la mise en production de modèles de NLP qui extrairont des comptes rendus médicaux des variables d’intérêt.

Votre travail se fera en interaction avec de nombreux acteurs gravitant autour de l’EDS : l’équipe technique en charge de la Plateforme Méga Données pour la mise en production des modèles et librairies développés, les différentes équipes de recherche de l’AP-HP, les datascientists de l’AP-HP et partenaires externes (INRIA, Sorbonne Université etc.). Vous interviendrez dans le cadre de groupes de travail pluridisciplinaires.

Vos missions principales seront:

  • La réalisation d’études ponctuelles sur les données utiles à la gestion de crise covid19 ;
  • Le développement de librairies de pre-processing adaptées au contexte de l’AP-HP ;
  • Le développement de modèles de machine learning (ML) ;

Profil recherché

Idéalement, vous..

  • Avez un diplôme d’ingénieur ou équivalent (bac+5, master2) en data science ;
  • Avez au moins un an d’expérience professionnelle dans le domaine de la data science, ou un doctorat portant sur des thématiques proches ;
  • Adhérez aux valeurs du service public et vous êtes passionné.e par le domaine de la santé ;
  • Avez un niveau d’anglais courant ;

Vous avez un savoir faire dans plusieurs de ces domaines :

  • Expertise en statistiques ;
  • Expertise en analyse de bases de données (SQL) ;
  • Expertise en développement de modèles de machine learning (Tensorflow, Pytorch etc.) ;
  • Expertise en calcul distribué et en data management (Spark, Scala, etc.) ;
  • Expertise en traitement automatiques des langues (NLP) ;
  • Expertise en développement Python ;
  • Expertise en déploiement de modèles statistiques/de machine learning ;
  • Connaissance des problématiques hospitalières (structures, processus) et des métiers de la santé ;

Et humainement ?

  • Des qualités d’autonomie, de flexibilité et de responsabilité
  • Curieux, dynamique et créatif, avec une réelle envie de faire preuve d’innovation
  • Esprit d’équipe et la volonté de prendre part à une aventure collective
  • Sens de l’écoute, du résultat et de la qualité

Découvrez l'équipe de Assistance Publique - Hôpitaux de Paris - DSI

Questions et réponses sur l'offre
  • Ajouter aux favoris
  • Partager sur Twitter
  • Partager sur Facebook
  • Partager sur Linkedin

Notre sélection d'articles pour vous

Inspirez-vous avec une sélection d'articles