Cette offre n’est plus disponible.

Data Engineer

CDI
Paris
Télétravail non autorisé
Salaire : Non spécifié

Health Data Hub
Health Data Hub

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

En lien avec les producteurs de données, l’équipe data à la charge de la collecte, de la mise en qualité et de la gestion du catalogue de données. Elle prépare les jeux de données requis pour la réalisation des projets par leurs porteurs, requérant une expertise fine des données pour la création d’extractions pertinentes sur le plan médical. Elle réalise les chaînages lorsque plusieurs sources de données sont mobilisées et doit être capable d’en documenter la qualité.
Pour industrialiser ces procédures, elle met en place une gouvernance de la donnée. Elle apporte son soutien aux producteurs dans le processus de préparation des données et notamment la déidentification et la création d’échantillons synthétiques. Elle élabore des services pour faciliter la compréhension des données disponibles au catalogue par les utilisateurs en mettant en place des outils de catalogue de métadonnées en ligne et de requêtage simple. Elle est force de proposition dans l’offre de formation et de développement d’outils à visée pédagogique sur le périmètre qui est le sien.

Au sein d’une équipe data d’une dizaine de personnes, le data engineer aura pour mission :
● d’opérer la plateforme technologique du HDH, tant pour la réception de bases au catalogue que pour la réalisation des extractions et appariements à destination des projets ayant accès à la plateforme. Cela inclut une forte composante opérationnelle, et notamment:
○ implémentation, mise en production et exécution de programmes de contrôle de la qualité, de l’intégrité et de la sensibilité des données réceptionnées
○ réalisation des extractions et des appariements entre différentes sources de données
○ appui, suivi et documentation des projets accédants ou contribuant au catalogue de bases
● de contribuer aux divers chantiers internes de l’équipe, entre autres :
○ implémentation d’un catalogue de métadonnées, à destination des producteurs et consommateurs des données du catalogue
○ implémentation d’un pipeline de transformation des bases vers un format international (OMOP)
○ implémentation et travail de fond sur des problématiques de déidentification, d’anonymisation et de génération synthétique de données
○ définition de l’offre de service en terme d’outils à déployer sur la plateforme technologique
● de supporter et d’appuyer les autres équipes sur des problématiques transverses: cadrage technique des projets accédant à plateforme, participation et restitution des travaux du HDH lors de meetup, soutien à l’organisation de data challenge, etc.


Profil recherché

Expérience et Compétences requises
● Confortable dans un ou plusieurs langages de programmation et de scripting
● Bonne connaissance opérationnelle en SQL ou librairie de traitement de données
● Capacité à concilier des compétences en analyse fonctionnelle des données avec une
expertise et flexibilité technique
● Capacités rédactionnelles
● Capacité à travailler en équipe multidisciplinaire
● Bon relationnel - apte à gérer une relation avec des partenaires du HDH
● Bonne capacité d’autonomie et force de proposition - apte à évoluer dans un
environnement en forte évolution et croissance
● Expérience dans un framework de traitement distribué (e.g. spark) est un plus
● Expérience en informatique ou recherche médicale est un plus

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

  • Artefact

    Senior Data Analyst

    Artefact
    Artefact
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, Digital Marketing / Data Marketing
    1 500 collaborateurs

  • Elevate

    Manager Data (F/H)

    Elevate
    Elevate
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, Digital Marketing / Data Marketing
    120 collaborateurs

  • Lenstra

    Senior Analytics Engineer

    Lenstra
    Lenstra
    CDI
    Paris
    Télétravail total
    Logiciels, Intelligence artificielle / Machine Learning
    30 collaborateurs

  • SkillCorner

    ML Engineer

    SkillCorner
    SkillCorner
    CDI
    Paris
    Télétravail total
    Logiciels, Intelligence artificielle / Machine Learning
    60 collaborateurs

  • Veesion

    Data Scientist (F/M)

    Veesion
    Veesion
    CDI
    Paris
    Télétravail total
    Salaire : 70K à 85K €
    Logiciels, Intelligence artificielle / Machine Learning
    212 collaborateurs

  • Mistral Ai

    Research Engineer, Machine Learning

    Mistral Ai
    Mistral Ai
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, IT / Digital
    280 collaborateurs

Voir toutes les offres