Cette offre n’est plus disponible.

Data Engineer

CDI
Paris
Salaire : Non spécifié
Télétravail non autorisé

Health Data Hub
Health Data Hub

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

En lien avec les producteurs de données, l’équipe data à la charge de la collecte, de la mise en qualité et de la gestion du catalogue de données. Elle prépare les jeux de données requis pour la réalisation des projets par leurs porteurs, requérant une expertise fine des données pour la création d’extractions pertinentes sur le plan médical. Elle réalise les chaînages lorsque plusieurs sources de données sont mobilisées et doit être capable d’en documenter la qualité.
Pour industrialiser ces procédures, elle met en place une gouvernance de la donnée. Elle apporte son soutien aux producteurs dans le processus de préparation des données et notamment la déidentification et la création d’échantillons synthétiques. Elle élabore des services pour faciliter la compréhension des données disponibles au catalogue par les utilisateurs en mettant en place des outils de catalogue de métadonnées en ligne et de requêtage simple. Elle est force de proposition dans l’offre de formation et de développement d’outils à visée pédagogique sur le périmètre qui est le sien.

Au sein d’une équipe data d’une dizaine de personnes, le data engineer aura pour mission :
● d’opérer la plateforme technologique du HDH, tant pour la réception de bases au catalogue que pour la réalisation des extractions et appariements à destination des projets ayant accès à la plateforme. Cela inclut une forte composante opérationnelle, et notamment:
○ implémentation, mise en production et exécution de programmes de contrôle de la qualité, de l’intégrité et de la sensibilité des données réceptionnées
○ réalisation des extractions et des appariements entre différentes sources de données
○ appui, suivi et documentation des projets accédants ou contribuant au catalogue de bases
● de contribuer aux divers chantiers internes de l’équipe, entre autres :
○ implémentation d’un catalogue de métadonnées, à destination des producteurs et consommateurs des données du catalogue
○ implémentation d’un pipeline de transformation des bases vers un format international (OMOP)
○ implémentation et travail de fond sur des problématiques de déidentification, d’anonymisation et de génération synthétique de données
○ définition de l’offre de service en terme d’outils à déployer sur la plateforme technologique
● de supporter et d’appuyer les autres équipes sur des problématiques transverses: cadrage technique des projets accédant à plateforme, participation et restitution des travaux du HDH lors de meetup, soutien à l’organisation de data challenge, etc.


Profil recherché

Expérience et Compétences requises
● Confortable dans un ou plusieurs langages de programmation et de scripting
● Bonne connaissance opérationnelle en SQL ou librairie de traitement de données
● Capacité à concilier des compétences en analyse fonctionnelle des données avec une
expertise et flexibilité technique
● Capacités rédactionnelles
● Capacité à travailler en équipe multidisciplinaire
● Bon relationnel - apte à gérer une relation avec des partenaires du HDH
● Bonne capacité d’autonomie et force de proposition - apte à évoluer dans un
environnement en forte évolution et croissance
● Expérience dans un framework de traitement distribué (e.g. spark) est un plus
● Expérience en informatique ou recherche médicale est un plus

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

  • Allphins

    Data Engineer (H/F)

    Allphins
    Allphins
    CDI
    Paris
    Télétravail fréquent
    60K à 80K €
    Intelligence artificielle / Machine Learning, FinTech / InsurTech
    17 collaborateurs

  • Descartes Underwriting

    Data Scientist - CDI

    Descartes Underwriting
    Descartes Underwriting
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, Assurance
    230 collaborateurs

  • Craft AI

    Senior ML / LLM Engineer

    Craft AI
    Craft AI
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, SaaS / Cloud Services
    34 collaborateurs

  • QuantCube Technology

    Lead Data Scientist - NLP

    QuantCube Technology
    QuantCube Technology
    CDI
    Paris
    Télétravail fréquent
    55K à 65K €
    Intelligence artificielle / Machine Learning, FinTech / InsurTech
    75 collaborateurs

  • Polynom

    R&D Scientist en IA Générative - CDI

    Polynom
    Polynom
    CDI
    Rueil-Malmaison
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, Stratégie
    40 collaborateurs

  • Safran.AI (ex-Preligens)

    Senior Deep Learning Scientist (H/F)

    Safran.AI (ex-Preligens)
    Safran.AI (ex-Preligens)
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, Big Data
    250 collaborateurs

Voir toutes les offres