Afin de permettre le développement de projets de recherche innovants, en particulier dans le domaine de l’intelligence artificielle, l’AP–HP a mis en place une plateforme Big Data, infrastructure informatique propre, intégrant des capacités de stockage et de calcul pour l’exploitation sécurisée et performante des données de santé dont elle est dépositaire. Cette plateforme héberge notamment l’entrepôt de données de santé (EDS) de l’AP-HP.
L’Entrepôt de Données de Santé (EDS) de l’AP-HP intègre des données administratives et médicales de plus de 8 millions de patients hospitalisés ou venus en consultation au sein des 39 établissements de l’AP-HP (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Cet entrepôt permet d’améliorer le pilotage de l’activité hospitalière et de faire avancer la recherche scientifique dans le domaine de la santé en favorisant la réalisation d’études sur données, la mise en place d’essais cliniques et le développement d’algorithmes d’aide à la décision.
La Plateforme Big Data de l’AP-HP compte actuellement +20 machines pour le cluster Hadoop (5To RAM, +850 Cores, 1.8Po d’espace disque), de machines GPU (24 Nvidia P40), de 10 machines dédiées aux environnements Jupyter pour l’analyse de données, et de nombreuses autres machines applicatives.
Votre équipe, le domaine « Plateforme Big Data », a pour mission l’intégration des données de santé massives et complexes (données structurés, textes, imagerie, voix, signaux physiologiques, etc.) et leur utilisation à grande échelle, de manière performante, ergonomique et sécurisée dans le respect des principes et règles de gouvernance des données définis par l’AP-HP. Dans le domaine de l’imagerie médicale, les images sont majoritairement produites dans les plus de 20 services de radiologie de l’APHP et stockés dans un PACS Centrale APHP, géré par le pôle imagerie de la DSI.
Au sein de l’équipe en charge de la Plateforme Big Data de l’APHP, vous participerez au développement des outils ou composants répondant aux attentes des médecins et chercheurs pour l’exploitation des données d’imagerie médicale (majoritairement au format DICOM) collectées dans le cadre de leurs projets de recherche.
La plateforme big data a engagé le développement d’une solution spécifique de serveur PACS ainsi que les mécanismes de collecte des données depuis le serveur PACS de l’APHP et d’autres sources d’images. Vous serez amené à analyser, à proposer et à mettre en oeuvre des solutions adaptées aux différents besoins des projets de recherche et vous participerez également à la mise en place d’un certain nombre d’outils de base (visualisation, annotation, etc.) pour faciliter l’exploitation et l’enrichissement des données d’imagerie par les utilisateurs de la plateforme.
En tant que data engineer spécialisé en imagerie médicale, vous :
Vous maitrisez des langages de programmation suivants :
Vous avez de bonne connaissance sur les base de données :
Vous avez de bonne connaissance du traitement des données massives et des technologies Big Data dont :
Vous avez des connaissances sur les différents formats de stockage suivants :
Au travers de 2 à 3 entretiens vous échangerez avec différents chefs de projets et le directeur de la plateforme
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.