Health Data Hub

Health Data Hub

Stagiaire data management / biostatistique

  • Stage (6 mois)
  • Début :  
  • Paris
  • Bac +3

La tribu

Health Data Hub

Health Data Hub

  • Intelligence artificielle / Machine Learning, Santé

Le poste

Stagiaire data management / biostatistique

  • Stage (6 mois)
  • Début :  
  • Paris
  • Bac +3

À propos

Rejoignez-les pour participer à l’accélération des usages des données de santé poursuivant une finalité d’intérêt public.

Pour permettre un système de santé efficace, personnalisé et humaniste, les données de santé ont un rôle à jouer. C’est par le traitement et le croisement d’un grand volume de données de qualité, que les recherches les plus impactantes pourront être menées : pour améliorer le dépistage et diagnostic d’une maladie, analyser les effets à long terme de traitements, élargir les méthodes d’évaluation des prises en charge au-delà des essais cliniques actuels pour garantir à chaque patient le traitement le plus adapté, etc.

Au Health Data Hub, leur ambition est d’accompagner les acteurs qui œuvrent à trouver les solutions de demain pour améliorer la santé des citoyens.

Descriptif du poste

Au sein de l’équipe Data et en lien étroit avec la Fabrique, vous interviendrez principalement sur l’établissement du catalogue de métadonnées pour les bases qui seront disponibles via le Health Data Hub. Ce catalogue sera accessible à tous et s’inscrit dans la démarche science ouverte du Health Data Hub.

L’accès aux données de santé est réglementé en France et l’instruction d’une demande dure au minimum 6 mois. Comprendre le contenu d’une base de données est donc primordial afin de s’assurer qu’elle contient bien les informations nécessaires à la réalisation du projet de recherche.

Dans le cadre de sa démarche science ouverte et open source, le HDH propose en accès libre des informations, de la documentation, et des formations afin d’utiliser et comprendre les données plus facilement. En particulier, le HDH et ses partenaires (DREES, Santé publique France, CNAM, ANSM, ARS, ATIH, etc.) mettent à disposition une documentation ouverte collaborative comprenant des notebooks pour se former au fonctionnement du Système National des Données de Santé (SNDS), un générateur de données de synthèse, de nombreuses fiches thématiques regroupant les spécificités du SNDS, une section open data listant toutes les ressources accessibles sur le thème des données de santé, un dictionnaire interactif, ainsi que des programmes utilisés par des data scientist et statisticiens. Cette initiative de partage des connaissances est une première en France dans le domaine de la santé et est un succès puisque certaines ressources ont été reprises et adaptées pour d’autres objectifs par des institutions en santé françaises.

En plus de la documentation collaborative et du dictionnaire interactif, le HDH est en train de travailler sur la description du contenu d’une base de données : les métadonnées. La structuration des métadonnées pour des bases de données en Santé est un enjeu majeur dans la réutilisation des bases de données.

Le catalogue de métadonnées du HDH contient trois niveaux de métadonnées :

  • le niveau base qui apporte des informations générales sur la base : description, le responsable de la collecte des données, le nombre de tables, le nombre de variables, la profondeur des données, les protocoles de qualité effectués sur les données etc.

  • le niveau table qui apporte des informations pour chaque table de la base : le nom de la table, le nombre de lignes, la description de la table, les clés permettant de joindre deux tables entre elles, etc.

  • le niveau variable qui apporte des informations pour chaque variable de chaque table : description, format, statistiques, indicateurs de qualités, etc.

Le stage aura pour objectif d’accompagner les responsables de données dans la mise en place du catalogue de métadonnées.
Plus particulièrement :

  • compréhension de la structure des données
  • alimentation du catalogue de métadonnées
  • représentations graphiques d’indicateurs (distribution de l’âge, distribution homme-femme, etc.)
  • calcul d’indicateurs de qualité (moyenne, écart-type, médiane, bornes, complétudes, plausibilité, etc.)

Vous contribuerez également sur les autres chantiers science ouverte de l’équipe Data :

  • alimentation de la documentation collaborative sur le SNDS
  • alimentation du dictionnaire interactif sur le SNDS
  • développement de la démarche opensource du Health Data Hub

Profil recherché

Compétences techniques

  • Maîtrise en Data management;
  • Maîtrise du calcul de statistiques;
  • Connaissance en Python ou R souhaitée;
  • Capacité à naviguer et appréhender une base de données particulièrement complexe;
  • Appétence pour le secteur médical;
  • (optionnel) Maîtrise de Git.

Qualités humaines et relationnelles

  • Motivation;
  • Qualités d’organisation, de planification et de rigueur;
  • Sens du service et du travail en équipe;
  • Bon relationnel;
  • Curiosité et capacité d’adaptation.

Découvrez l'équipe de Health Data Hub

Ce contenu est bloqué
Le cookie Youtube est obligatoire pour voir ce contenu
Questions et réponses sur l'offre
  • Ajouter aux favoris
  • Partager sur Twitter
  • Partager sur Facebook
  • Partager sur Linkedin

Notre sélection d'articles pour vous

Inspirez-vous avec une sélection d'articles