Cette offre n’est plus disponible.

Data Engineer - Imagerie Médicale

Résumé du poste
CDD / Temporaire(12 à 24 mois)
Paris
Salaire : 38K à 55K €
Télétravail fréquent
Expérience : > 2 ans
Éducation : Bac +5 / Master
Compétences & expertises
Contenu généré
Créativité et innovation
Collaboration et travail d'équipe
Connaissances en cybersécurité
Hadoop
Java
+8

AP-HP - Direction des Services Numériques (DSN)
AP-HP - Direction des Services Numériques (DSN)

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

La mission de votre équipe

Afin de permettre le développement de projets de recherche innovants, en particulier dans le domaine de l’intelligence artificielle, l’AP–HP a mis en place une plateforme Big Data, infrastructure informatique propre, intégrant des capacités de stockage et de calcul pour l’exploitation sécurisée et performante des données de santé dont elle est dépositaire. Cette plateforme héberge notamment l’entrepôt de données de santé (EDS) de l’AP-HP.

L’Entrepôt de Données de Santé (EDS) de l’AP-HP intègre des données administratives et médicales de plus de 10 millions de patients hospitalisés ou venus en consultation au sein des 39 établissements de l’AP-HP (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Cet entrepôt permet d’améliorer le pilotage de l’activité hospitalière et de faire avancer la recherche scientifique dans le domaine de la santé en favorisant la réalisation d’études sur données, la mise en place d’essais cliniques et le développement d’algorithmes d’aide à la décision.

L’infrastructure on-premise au sein des data-centres de l’AP-HP compte actuellement +150 machines physiques cumulant un total de 5Po de stockage, 1900 cœurs de calcul, 20To de RAM, une centaine de GPUs (P40, T4, V100, A100, H100) et des To d’échanges réseau quotidiens.

Votre équipe, le domaine « Plateforme Données Massive », a pour mission l’intégration des données de santé massives et complexes (données structurés, textes, imagerie, voix, signaux physiologiques, etc.) et leur utilisation à grande échelle, de manière performante, ergonomique et sécurisée dans le respect des principes et règles de gouvernance des données définis par l’AP-HP. Dans le domaine de l’imagerie médicale, les images sont majoritairement produites dans les plus de 20 services de radiologie de l’APHP et stockés dans un PACS Centrale APHP, géré par le pôle imagerie de la DSI.

Vos missions

Au sein de l’équipe en charge de la Plateforme Données de l’APHP, vous participerez au développement des outils ou composants répondant aux attentes des médecins et chercheurs pour l’exploitation des données d’imagerie médicale collectées dans le cadre de leurs projets de recherche.

La plateforme Données Massive a engagé le développement d’une solution spécifique de serveur PACS ainsi que les mécanismes de collecte des données depuis le serveur PACS de l’APHP et d’autres sources d’images. Vous serez amené à analyser, à proposer et à mettre en oeuvre des solutions adaptées aux différents besoins des projets de recherche et vous participerez également à la mise en place d’un certain nombre d’outils de base (visualisation, annotation, etc.) pour faciliter l’exploitation et l’enrichissement des données d’imagerie par les utilisateurs de la plateforme.

En tant que data engineer spécialisé en imagerie médicale, vous :

  • Accompagnerez les chefs de projet à la définition des besoins des médecins pour la réalisation des projets de recherche

  • Développerez, industrialiserez et maintiendrez les flux d’intégration de données d’images pour permettre la collecte et l’utilisation de nouvelles typologies de données (extraction, sélection, collecte et intégration) via des connecteurs spécifiques développés principalement en python

  • Déploierez les pipelines d’intégration de données et en assurerez la performance globale

  • Aiderez à l’implémentation de standards et normes de mise à disposition des données

  • Mettrez en place des outils permettant l’enrichissement des données (analyse, annotation, etc)

  • Travaillerez en collaboration avec les partenaires (industriel, start-up, académique) à l’exploitation de leurs outils au sein de la Plateforme BigData


Profil recherché

Vous avez un savoir faire dans un de ces domaines :

  • Vous maitrisez Python et au moins un autre langage de programmation (Scala / Java apprécié)

  • Vous avez de bonnes connaissances sur les base de données relationnelles et distribuées (PostgreSQL, HIVE)

  • Vous avez de bonnes connaissances du traitement des données massives et des technologies Big Data (Spark, Kafka, CEPH, HDFS, Hadoop)

  • Vous avez des bonnes connaissances sur les formats de stockage suivants (Avro, Parquet, ORC)

  • Vous avez de bonnes connaissances des méthodologies DevOps et des outils associés (Docker, Kubernetes, GitLab …)

  • Vous avez de l’experience en intégration et en déploiement continu (GitLabCI, ArgoCD)

  • Vous maitrisez les systèmes d’exploitation UNIX

Idéalement, vous..

  • Avez un diplôme d’ingénieur ou équivalent (bac+4/5, master2) en informatique ou sciences avec formation complémentaire en informatique

  • Connaissez les standards en imagerie médicale (DICOM, HL7-FHIR, OMOP, …)

  • Avez des connaissances en méthodes de développement logiciel (Méthodologie agile, qualification, recette, mise en production, maintenance opérationnelle, pilotage, …)

  • Avez des connaissances des bonnes pratiques de sécurité informatique et de la réglementation informatique et libertés

  • Adhérez aux valeurs du service public et vous avez un intérêt prononcé pour le domaine de la santé

  • Avez un niveau d’anglais courant

Et humainement ?

  • Capacité à appréhender des enjeux liés à la recherche, à l’analyse de données et aux technologies de machine learning/deep learning, notamment dans le domaine de la santé (santé publique, imagerie médicale, épidémiologie, …)

  • Esprit d’équipe et la volonté de prendre part à une aventure collective

  • Sens de l’écoute, du résultat et de la qualité

  • Des qualités d’autonomie, de flexibilité et de responsabilité

  • Curieux, rigoureux, dynamique et créatif, avec un réel envie de faire preuve d’innovation

  • Être ouvert aux nouvelles technologies dans votre domaine


Déroulement des entretiens

Au travers de 2 à 3 entretiens vous échangerez avec différents chefs de projets et le directeur de la plateforme

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

  • Mistral Ai

    AI Scientist - Paris (Internship Phd)

    Mistral Ai
    Mistral Ai
    CDD / Temporaire
    Paris
    Intelligence artificielle / Machine Learning, IT / Digital
    280 collaborateurs

  • AP-HP - Direction des Services Numériques (DSN)

    Data scientist F/H

    AP-HP - Direction des Services Numériques (DSN)
    AP-HP - Direction des Services Numériques (DSN)
    CDD / Temporaire
    Paris
    Télétravail fréquent
    40K à 70K €
    Intelligence artificielle / Machine Learning, Big Data
    570 collaborateurs