Health Data Hub

Health Data Hub

Data Engineer

  • CDI 
  • Paris

La tribu

Health Data Hub

Health Data Hub

  • Intelligence artificielle / Machine Learning, Santé

Le poste

Data Engineer

  • CDI 
  • Paris

À propos

Rejoignez-les pour participer à l’accélération des usages des données de santé poursuivant une finalité d’intérêt public.

Pour permettre un système de santé efficace, personnalisé et humaniste, les données de santé ont un rôle à jouer. C’est par le traitement et le croisement d’un grand volume de données de qualité, que les recherches les plus impactantes pourront être menées : pour améliorer le dépistage et diagnostic d’une maladie, analyser les effets à long terme de traitements, élargir les méthodes d’évaluation des prises en charge au-delà des essais cliniques actuels pour garantir à chaque patient le traitement le plus adapté, etc.

Au Health Data Hub, leur ambition est d’accompagner les acteurs qui œuvrent à trouver les solutions de demain pour améliorer la santé des citoyens.

Descriptif du poste

En lien avec les producteurs de données, l’équipe data à la charge de la collecte, de la mise en qualité et de la gestion du catalogue de données. Elle prépare les jeux de données requis pour la réalisation des projets par leurs porteurs, requérant une expertise fine des données pour la création d’extractions pertinentes sur le plan médical. Elle réalise les chaînages lorsque plusieurs sources de données sont mobilisées et doit être capable d’en documenter la qualité.
Pour industrialiser ces procédures, elle met en place une gouvernance de la donnée. Elle apporte son soutien aux producteurs dans le processus de préparation des données et notamment la déidentification et la création d’échantillons synthétiques. Elle élabore des services pour faciliter la compréhension des données disponibles au catalogue par les utilisateurs en mettant en place des outils de catalogue de métadonnées en ligne et de requêtage simple. Elle est force de proposition dans l’offre de formation et de développement d’outils à visée pédagogique sur le périmètre qui est le sien.

Au sein d’une équipe data d’une dizaine de personnes, le data engineer aura pour mission :
● d’opérer la plateforme technologique du HDH, tant pour la réception de bases au catalogue que pour la réalisation des extractions et appariements à destination des projets ayant accès à la plateforme. Cela inclut une forte composante opérationnelle, et notamment:
○ implémentation, mise en production et exécution de programmes de contrôle de la qualité, de l’intégrité et de la sensibilité des données réceptionnées
○ réalisation des extractions et des appariements entre différentes sources de données
○ appui, suivi et documentation des projets accédants ou contribuant au catalogue de bases
● de contribuer aux divers chantiers internes de l’équipe, entre autres :
○ implémentation d’un catalogue de métadonnées, à destination des producteurs et consommateurs des données du catalogue
○ implémentation d’un pipeline de transformation des bases vers un format international (OMOP)
○ implémentation et travail de fond sur des problématiques de déidentification, d’anonymisation et de génération synthétique de données
○ définition de l’offre de service en terme d’outils à déployer sur la plateforme technologique
● de supporter et d’appuyer les autres équipes sur des problématiques transverses: cadrage technique des projets accédant à plateforme, participation et restitution des travaux du HDH lors de meetup, soutien à l’organisation de data challenge, etc.

Profil recherché

Expérience et Compétences requises
● Confortable dans un ou plusieurs langages de programmation et de scripting
● Bonne connaissance opérationnelle en SQL ou librairie de traitement de données
● Capacité à concilier des compétences en analyse fonctionnelle des données avec une
expertise et flexibilité technique
● Capacités rédactionnelles
● Capacité à travailler en équipe multidisciplinaire
● Bon relationnel - apte à gérer une relation avec des partenaires du HDH
● Bonne capacité d’autonomie et force de proposition - apte à évoluer dans un
environnement en forte évolution et croissance
● Expérience dans un framework de traitement distribué (e.g. spark) est un plus
● Expérience en informatique ou recherche médicale est un plus

Découvrez l'équipe de Health Data Hub

Ce contenu est bloqué
Le cookie Youtube est obligatoire pour voir ce contenu
Questions et réponses sur l'offre
  • Ajouter aux favoris
  • Partager sur Twitter
  • Partager sur Facebook
  • Partager sur Linkedin

Notre sélection d'articles pour vous

Inspirez-vous avec une sélection d'articles