Cette offre n’est plus disponible.

CTO- Plateforme Big Data

CDI
Paris
Salaire : 50 à 70 €
Télétravail fréquent
Expérience : > 5 ans
Éducation : Bac +5 / Master

APHP DSN
APHP DSN

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

La mission de votre équipe

Afin de permettre le développement de projets de recherche innovants, en particulier dans le domaine de l’intelligence artificielle, l’AP–HP a mis en place une plateforme Big Data, infrastructure informatique propre, intégrant des capacités de stockage et de calcul pour l’exploitation sécurisée et performante des données de santé dont elle est dépositaire. Cette plateforme héberge notamment l’entrepôt de données de santé (EDS) de l’AP-HP.

L’Entrepôt de Données de Santé (EDS) de l’AP-HP intègre des données administratives et médicales de plus de 8 millions de patients hospitalisés ou venus en consultation au sein des 39 établissements de l’AP-HP (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Cet entrepôt permet d’améliorer le pilotage de l’activité hospitalière et de faire avancer la recherche scientifique dans le domaine de la santé en favorisant la réalisation d’études sur données, la mise en place d’essais cliniques et le développement d’algorithmes d’aide à la décision.

La Plateforme Big Data de l’AP-HP compte actuellement +20 machines pour le cluster Hadoop (5To RAM, +850 Cores, 1.8Po d’espace disque), de machines GPU (56 Nvidia P40 et V100), de 20 machines dédiées aux environnements Jupyter pour l’analyse de données, et de nombreuses autres machines applicatives.

Votre équipe, le domaine « Plateforme Big Data », a pour mission l’intégration des données de santé massives et complexes (données structurés, textes, imagerie, voix, signaux physiologiques, etc.) et leur utilisation à grande échelle, de manière performante, ergonomique et sécurisée dans le respect des principes et règles de gouvernance des données définis par l’AP-HP.

Vos missions

Le/la responsable de l’équipe développement ou CTO et adjoint(e) au directeur de la Plateforme Big Data aura pour mission principale de coordonner et d’accompagner l’ensemble des projets de développement d’outils adaptés à l’intégration et à l’exploitation des données de santé au sein de l’entrepôt de données et du cluster mégadonnées. L’enjeu principal est d’étendre et d’industrialiser le « Data Lake » construit sur une architecture Big Data et d’adapter cette architecture constamment aux nouvelles sources de données à intégrer tout en proposant des ressources et services fiables et performantes aux projets de recherche clinique, au domaine pilotage du département, voire dans le cadre d’autres utilisations émergentes (Portail patient, API Rest standardisés, etc).

Sous la responsabilité du directeur de la plateforme, vous piloterez les activités transversales d’exploitation, les projets d’infrastructure et les différentes activités de développements/DevOps qui constitue le socle de nos projets de recherche sur données médicales. Vos missions comportent typiquement des facettes suivantes :

  • Manager les développeurs et développeuses front et back des équipes de développements Applicatifs, API, Moteur de recherche et transformations big-data ;
  • Manager les fonctions exploitation et support aux différents utilisateurs des ressources de la plateforme ;
  • Coordonner les activités opérationnelles (Tests, qualification, mise en production) liées à l’évolution du stack technique de la plateforme ;
  • Contribuer à l’élaboration du schéma directeur de la plateforme mégadonnées de l’APHP (infrastructure, flux de données, couches applicatives, sécurisation/certification, etc.) ;
  • Participer à la conception et au développement des outils techniques (sélection de cohortes de patients, modélisation, algorithmes d’analyse, moteur de recherche, méthodes statistiques, visualisation, etc.) adaptés au contexte du cluster big data ;
  • Participer à la sécurisation des applications et outils développés ;
  • Réaliser une veille technologique et contribuer au transfert de compétences au sein des équipes.

Profil recherché

Idéalement, vous..

  • Avez un diplôme d’ingénieur ou équivalent (bac+5, master2) en informatique ou sciences (mathématique, physique, sciences de la vie) avec formation complémentaire en informatique ;
  • Avez une expérience de développement de +6 ans et avez déjà été lead tech sur un projet big data ;
  • Avez une expérience de gestion d’environnements de production dans le domaine de la data ;
  • Adhérez aux valeurs du service public et vous êtes passionné par le domaine de la santé ;
  • Avez une expérience dans la manipulation de données avec le langage SQL ;
  • Bonne connaissance du traitement des données massives et des technologies Big Data (Hadoop, Kafka, Spark, Elastic Search, NoSQL, etc.) ;
  • Connaissez les standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, Snomed, LOINC…) ;
  • Avez des connaissances approfondies en méthodes de développement logiciel (cycle en V, méthodes agiles, etc.) ;
  • Avez un niveau d’anglais courant ;

Vous avez un savoir faire dans un de ces domaines :

  • Expertise en SQL (Oracle, PostgreSQL, Hive) ;
  • Expertise en développement Spark (Scala) ;
  • Connaissance approfondie du moteur de recherche Apache Lucene et de sa mise en oeuvre ;
  • Connaissance approfondie en codage (Java, Python, Javascript) et en API Rest/GraphQL ;
  • Connaissance en programmation informatique (Windows/Linux, Full-Stack web, BDD SQL) ;
  • Connaissance approfondie en méthodes de développement logiciel (dont cycle en V, méthodes agile), méthodes d’analyse et de modélisation (Merise, UML …)
  • Connaissance des méthodologies DevOps/DataOps et des outils associés (Docker, Kubernetes, Gitlab CI/CD, Jenkins…)
  • Connaissances approfondies de la gestion d’environnements de production informatique (exploitation, supervision, reporting, sécurisation, etc.)
  • Connaissances en méthode de conduite de projet (planification, reporting, analyse de risques, etc.)
  • Connaissances en droit des données informatiques

Et humainement ?

  • Capacité à appréhender des enjeux liés à la recherche, à l’analyse de données et aux technologies de machine learning/deep learning, notamment dans le domaine de la santé (santé publique, génétique, épidémiologie, etc.)
  • Des qualités d’autonomie, de flexibilité et de responsabilité
  • Curieux/se, dynamique et créatif, avec une réelle envie de faire preuve d’innovation
  • Esprit d’équipe et la volonté de prendre part à une aventure collective
  • Sens de l’écoute, du résultat et de la qualité

Déroulement des entretiens

2-3 Entretiens Visio + Présentiel

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres