This position is no longer available.

Data Engineer

Permanent contract
Paris
Salary: Not specified
No remote work

Health Data Hub
Health Data Hub

Interested in this job?

jobs.faq.title

The position

Job description

En lien avec les producteurs de données, l’équipe data à la charge de la collecte, de la mise en qualité et de la gestion du catalogue de données. Elle prépare les jeux de données requis pour la réalisation des projets par leurs porteurs, requérant une expertise fine des données pour la création d’extractions pertinentes sur le plan médical. Elle réalise les chaînages lorsque plusieurs sources de données sont mobilisées et doit être capable d’en documenter la qualité.
Pour industrialiser ces procédures, elle met en place une gouvernance de la donnée. Elle apporte son soutien aux producteurs dans le processus de préparation des données et notamment la déidentification et la création d’échantillons synthétiques. Elle élabore des services pour faciliter la compréhension des données disponibles au catalogue par les utilisateurs en mettant en place des outils de catalogue de métadonnées en ligne et de requêtage simple. Elle est force de proposition dans l’offre de formation et de développement d’outils à visée pédagogique sur le périmètre qui est le sien.

Au sein d’une équipe data d’une dizaine de personnes, le data engineer aura pour mission :
● d’opérer la plateforme technologique du HDH, tant pour la réception de bases au catalogue que pour la réalisation des extractions et appariements à destination des projets ayant accès à la plateforme. Cela inclut une forte composante opérationnelle, et notamment:
○ implémentation, mise en production et exécution de programmes de contrôle de la qualité, de l’intégrité et de la sensibilité des données réceptionnées
○ réalisation des extractions et des appariements entre différentes sources de données
○ appui, suivi et documentation des projets accédants ou contribuant au catalogue de bases
● de contribuer aux divers chantiers internes de l’équipe, entre autres :
○ implémentation d’un catalogue de métadonnées, à destination des producteurs et consommateurs des données du catalogue
○ implémentation d’un pipeline de transformation des bases vers un format international (OMOP)
○ implémentation et travail de fond sur des problématiques de déidentification, d’anonymisation et de génération synthétique de données
○ définition de l’offre de service en terme d’outils à déployer sur la plateforme technologique
● de supporter et d’appuyer les autres équipes sur des problématiques transverses: cadrage technique des projets accédant à plateforme, participation et restitution des travaux du HDH lors de meetup, soutien à l’organisation de data challenge, etc.


Preferred experience

Expérience et Compétences requises
● Confortable dans un ou plusieurs langages de programmation et de scripting
● Bonne connaissance opérationnelle en SQL ou librairie de traitement de données
● Capacité à concilier des compétences en analyse fonctionnelle des données avec une
expertise et flexibilité technique
● Capacités rédactionnelles
● Capacité à travailler en équipe multidisciplinaire
● Bon relationnel - apte à gérer une relation avec des partenaires du HDH
● Bonne capacité d’autonomie et force de proposition - apte à évoluer dans un
environnement en forte évolution et croissance
● Expérience dans un framework de traitement distribué (e.g. spark) est un plus
● Expérience en informatique ou recherche médicale est un plus

Want to know more?

These job openings might interest you!

These companies are also recruiting for the position of “Données/Business Intelligence”.

See all job openings