jobs.faq.remoteWork_question

jobs.faq.remoteWork_answer_partial

jobs.faq.contractType_question

jobs.faq.contractType_answer_defined

jobs.faq.coverLetter_question

jobs.faq.coverLetter_answer_mandatory

Data Engineer - Plateforme Big Data de l’AP-HP - APHP DSN - Smlouva na dobu určitou ve městě Paris

Tato pozice již není k dispozici.

APHP DSN

Data Engineer - Plateforme Big Data de l’AP-HP

Smlouva na dobu určitou(24 měsíc/měsíce/měsíců)

Paris

Plat: Neuvedeno

Několik dní doma

zkušenosti: > 2 roky

Vzdělání: Magisterský stupeň vzdělání

před 2 lety

APHP DSN

Máte zájem o tuto nabídku?

jobs.faq.title

Pozice

Popis pozice

La mission de votre équipe

Afin de permettre le développement de projets de recherche innovants, en particulier dans le domaine de l’intelligence artificielle, l’AP–HP a mis en place une plateforme Big Data, infrastructure informatique propre, intégrant des capacités de stockage et de calcul pour l’exploitation sécurisée et performante des données de santé dont elle est dépositaire. Cette plateforme héberge notamment l’entrepôt de données de santé (EDS) de l’AP-HP.

L’Entrepôt de Données de Santé (EDS) de l’AP-HP intègre des données administratives et médicales de plus de 8 millions de patients hospitalisés ou venus en consultation au sein des 39 établissements de l’AP-HP (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Cet entrepôt permet d’améliorer le pilotage de l’activité hospitalière et de faire avancer la recherche scientifique dans le domaine de la santé en favorisant la réalisation d’études sur données, la mise en place d’essais cliniques et le développement d’algorithmes d’aide à la décision.

La Plateforme Big Data de l’AP-HP compte actuellement +20 machines pour le cluster Hadoop (5To RAM, +850 Cores, 1.8Po d’espace disque), de machines GPU (24 Nvidia P40), de 10 machines dédiées aux environnements Jupyter pour l’analyse de données, et de nombreuses autres machines applicatives.

Votre équipe, le domaine « Plateforme Big Data », a pour mission l’intégration des données de santé massives et complexes (données structurés, textes, imagerie, voix, signaux physiologiques, etc.) et leur utilisation à grande échelle, de manière performante, ergonomique et sécurisée dans le respect des principes et règles de gouvernance des données définis par l’AP-HP.

Vos missions

Vous participerez activement à des projets de recherche visant à améliorer de manière décisive la prise en charge des patients atteints de Covid 19 hospitalisés en réanimation.
Vous aurez pour mission générale d’assurer le développement de la plateforme informatique du projet de recherche RECORDS. Cette plateforme permettra la gestion des données d’études observationnelles et d’un essai clinique multicentrique multi-bras adaptatif. La solution devra permettre la collecte, l’exploitation et la sauvegarde des données de la recherche (données cliniques, biologiques et omiques (génomiques, métabolomiques) pendant la durée du projet.

En tant que data engineer, vous allez :

Développer, en lien avec l’équipe de recherche RECORDS en charge des analyses omiques et avec la plateforme données massives de l’APHP, une solution d’intégration des données génomiques (fichiers FastQ, BAM, …) dans un espace de stockage dédié.
Assurer l’intégration des données analysées (fichier VCF) dans l’outil eCRF Cleanweb.
Exploiter les API des applications eCRF (REDCap et Cleanweb) pour l’intégration des données dans des bases de données de recherche.
Exploiter les API des applications eCRF (REDCap et Cleanweb) pour la mise à disposition des données via l’espace Jupyter de la Plateforme Données Massives de l’AP-HP.
Contribuer en mode agile au développement d’une plateforme d’intégration des outils de Recherche Clinique (PIORC).
Assurer la mise à disposition des données aux différents partenaires de projet RECORDS.
Garantir le caractère générique de la solution développée qui tout en répondant aux exigences du projet RECORDS, permettra la réalisation de nouvelles études au sein du consortium et pourra être déployée dans le cadre d’autres projets de recherche
Contribuer, en collaboration avec l’équipe d’infrastructure de la plateforme, au déploiement, MCO et à l’évolution de la plateforme PIORC.
Veiller à respecter la cohérence technique de la plateforme PIORC par rapport aux méthodes et solutions définis au sein de la Plateforme Données Massives de l’AP-HP.
Apporter un support utilisateurs de niveau N2/N3 et traiter les demandes de correction ou d’évolution par rapport aux outils et données mis à disposition ;

Požadavky na pozici

Idéalement, vous..

Avez un diplôme d’ingénieur ou équivalent (bac+5, master2) en informatique ou sciences (mathématique, physique, sciences de la vie) avec formation complémentaire en informatique
Maitrise en méthode de conduite de projet (planification, reporting, analyse de risques, …)
Maitrise l’un des langages Python, Java, Scala (Spark)
Connaissance en méthodes de développement logiciel (dont cycle en V, méthodes agile), méthodes d’analyse et de modélisation (Merise, UML …)
Avez une expérience dans la manipulation de données avec le langage SQL
Connaissez les standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, Snomed, LOINC…)
Connaissance des outils ETL (Talend, …) et des méthodes de data warehouse (OLTP, RDBMS…)
Connaissance du traitement des données massives et des technologies Big Data (Hadoop, Hive, Kafka, Spark, Elastic Search, NoSQL, etc.)
Avez des connaissances en administration d’environnements Linux
Avez des connaissances en statistiques et en droit des données informatiques
Avez des connaissances des bonnes pratiques de sécurité informatique et de la réglementation informatique et libertés
Avez un niveau d’anglais courant

Vous avez un savoir faire dans un de ces domaines :

Expertise en Programmation Informatique (Windows & UNIX)
Expertise en codage (Java et/ou Scala, Python)
Bonne maitrise des langages Python/R et de bash
Bonnes connaissance des bases de données Oracle, Postgresql ou MySQL et langages associés (sql)
Maîtrise des outils ETL (Talend, …), d’informatique décisionnelle et des méthodes de data warehouse (OLTP, RDBMS…)
Connaissance des standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, Snomed, LOINC…)
Bonne connaissance du traitement des données massives et des technologies Big Data (Hadoop, Kafka, Spark, Elastic Search, NoSQL, etc.)
Connaissance le moteur de recherche Apache Lucene et de sa mise en oeuvre
Connaissance approfondie en méthodes de développement logiciel (dont cycle en V, méthodes agile), méthodes d’analyse et de modélisation (Merise, UML …)
Connaissance des méthodologies devops et des outils associés (Docker, Kubernetes, Jenkins…)
Connaissances en méthode de conduite de projet (planification, reporting, analyse de risquesrisques, …)

Et humainement ?

Capacité à appréhender des enjeux liés à la recherche, à l’analyse de données et aux technologies de machine learning/deep learning, notamment dans le domaine de la santé (santé publique, génétique, épidémiologie…)
Des qualités d’autonomie, de flexibilité et de responsabilité
Curieux, dynamique et créatif, avec un réel envie de faire preuve d’innovation
Esprit d’équipe et la volonté de prendre part à une aventure collective
Sens de l’écoute, du résultat et de la qualité

Proces náboru

2-3 Entretiens

Chcete se dozvědět více?

Rencontrez Roman, Alternance en Cyber Sécurité

Objevte společnost

Prozkoumejte profil společnosti nebo ji sledujte a zjistěte, zda se k vám hodí!

Prozkoumejte společnost

Sledovat!

Jste spokojeni s formátem našich pracovních nabídek?

Vaše zpětná vazba nám pomáhá zlepšovat služby Welcome to the Jungle.

Společnost

APHP DSN

Artificial Intelligence / Machine Learning, Big Data, Zdraví

540 zaměstnanců

Založeno v 2020

Průměrný věk: 46 let

Fluktuace zaměstnanců: 14%

30%

70%

Poznáte je?

Premier centre hospitalier et universitaire européen, l’AP-HP accueille chaque année plus de 8 millions de patients et couvre 84 spécialités médicales et chirurgicales. Elle est reconnue pour la qualité et la compétence de ses professionnels qui exercent au sein de 38 sites hospitaliers dans toute l’Ile-de-France et en région.
Travailler à l’AP-HP, c’est servir l’intérêt général au sein d’un grand service public et venir en appui des professionnels de santé pour la meilleure prise en charge possible des patients.

Les équipes de la Direction des services numériques (DSN) de l’AP-HP participent directement à l’effort de consolidation d’un haut niveau d’excellence médicale et scientifique.
C’est la raison pour laquelle chaque collaboratrice et collaborateur de la DSN de l’AP-HP s’engage à :

s’investir quotidiennement, dans le respect de l’intégrité, de la sécurité et de la protection des données sensibles,
travailler dans un esprit collaboratif avec toutes les équipes pour atteindre les objectifs fixés,
fournir le meilleur service aux utilisateurs finaux des systèmes d’information,
faire preuve de bienveillance et de politesse en toute circonstance,
respecter sans condition les règles de confidentialité inhérentes à nos activités.

La Direction des services numériques :

Intègre des logiciels/progiciels,
Développe des applications,
Teste et qualifie des produits,
Développe des méthodes et outils de traitement de données massives,
Construit des architectures et assure une urbanisation optimale des applications informatiques,
Pilote des infrastructures complexes : serveurs, stockage, réseaux de haute performance,
Conduit et met en œuvre des projets innovants et de recherche sur données.

Ce que vous ferez dans notre équipe contribuera directement au bon fonctionnement de l’AP-HP pour assurer notre Priorité N°1 : fournir le meilleur service à nos patients et nos professionnels !

Data Engineer - Plateforme Big Data de l’AP-HP

Máte zájem o tuto nabídku?

Pozice

Popis pozice

La mission de votre équipe

Vos missions

Požadavky na pozici

Idéalement, vous..

Vous avez un savoir faire dans un de ces domaines :

Et humainement ?

Proces náboru

Chcete se dozvědět více?

Rencontrez Julien, Architecte réseaux

Rencontrez Roman, Alternance en Cyber Sécurité