Cette offre n’est plus disponible.

Senior Data Scientist - Responsable LabIA

CDI
Paris
Salaire : Non spécifié
Début : 30 juin 2020
Télétravail occasionnel
Expérience : > 5 ans
Éducation : > Bac +5 / Doctorat

APHP DSN
APHP DSN

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

L’EQUIPE

Le pôle Innovation et Données comporte plusieurs équipes travaillant directement à la constitution de bases de données et au traitement de données massives :
📊 L’Entrepôt de Données de Santé (EDS), principale base de données de santé hébergée au sein de la plateforme Données Massives de l’AP-HP, contient aujourd’hui les données médicales de plus de 11 millions de patients (40 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires).
🌼La Banque Nationale de Données Maladies Rares constitue la base de données la plus importante sur les maladies rares en France.
🔬La plateforme BioInformatique de l’AP-HP consolidant les données de génétique des patients de l’AP-HP.

Avec l’accélération de ces différents projets 🚀, les besoins en terme de sciences des données au sein même de l’équipe Innovation et Données sont de plus en plus nombreux (enrichissement des données, mise en place de pipelines de traitements - NLP, anonymisation, génération de données synthétiques, constitution de librairies datascience pour appuyer l’exploitation des données…).

Nous souhaitons ainsi créer un pôle IA composé de datascientists capables de suivre l’état de l’art et d’adresser les enjeux de traitement des données pour ces différents projets.

MISSION GENERALE

Vous aurez pour mission principale de construire et de structurer le Lab IA (recrutements, missions, partenariats…)

MISSIONS SPECIFIQUES

Vour aurez pour missions de :

• Constituer et manager une équipe de data scientists appliquant/développant les techniques à l’état de l’art dans le domaine de la Data science.
• Développer la R&D dans le champ du traitement de données massives en santé en lien avec les instituts thématiques d’IA, les universités et les chaires IA et santé dont l’AP-HP est partenaire.
• Industrialiser une chaine de Traitement Automatique des Langues (TAL) au sein de la plateforme permettant d’ extraire de l’information des documents cliniques.
• Porter des projets de data science de bout en bout (conception, prototypage, mise en production) permettant d’anticiper l’évolution de l’état de santé des patients, d’identifier des tendances concernant la prise en charge des patients ou les résultats des soins.
• Industrialiser des procédés d’analyse des données les plus utiles et modéliser les résultats pour les rendre lisibles et exploitables par les professionnels de santé, les chercheurs ou les directions fonctionnelles (phénotypage, patients similaires, indicateurs de tendances)
• Animer la communauté de Data Science de l’AP-HP (6 data scientists au sein des unités de recherche clinique) et de l’écosystème en lien avec les partenaires académiques et industriels de l’institution.
• Coordonner l’appui analytique aux recherches réalisées sur les données de la plateforme : études observationnelles complexes (études épidémiologiques, études d’incidence, analyse de comorbidités, études de corrélation entre facteurs de risque et survenue de maladies ou de complications, études de pratiques, études médico-économiques) ou développement/évaluation d’algorithmes (ML/DL)


Profil recherché

-Doctorat en informatique ou statistique, spécialisé dans la Data Science ou Intelligence Artificielle ou en sciences (mathématique, physique, sciences de la vie) avec formation complémentaire en informatique.
-Expérience professionnelle de 5 ans dans l’analyse de données dans un environnement Big Data avec une expérience significative de Machine Learning en production (aides décisionnelles, détection de tendances, TAL, etc)

• Vous êtes expert.e en algorithmie, mathématiques appliquées et statistiques et avez une passion pour l’IA et le Machine Learning avec un vrai enthousiasme pour explorer et apprendre (cours en ligne, papiers de recherche, compétitions Kaggle, portfolio Git, etc.)

• Vous avez de solides compétences en programmation informatique (Python, Java, C/C++, Javascript, Scala, …), avez une forte expérience en machine learning/Deep Learning.

• Vous maitrisez les bases de données (SQL, NoSQL, Cassandra…), les outils ETL, les systèmes décisionnels (BI), les technologies du Big Data permettant le traitement et la manipulation de données, l’interface de développement JupyterLab

• Vous avez une bonne connaissance des frameworks commerciaux ou open-source de data science (pandas, ML Flow, TensorFlow, PyTorch, scikit-learn, Keras ,…) et êtes en capacité de réaliser des analyses comparatives de ces solutions dans le contexte de l’AP-HP

• Vous avez la capacité de comprendre rapidement les enjeux d’une organisation afin de créer et développer de nouvelles solutions adaptées aux cas d’usage

• Vous maitrisez les méthodes de développements agiles, savez adopter une approche pragmatique des problèmes, pour créer des outils utilisables en production rapidement, notamment en s’appuyant sur l’existant,

• Vous avez une capacité à tester et expérimenter, comprendre et modifier le code de programmes existants

• Vous savez piloter, animer / communiquer, motiver une équipe et avez de la pédagogie pour expliquer des concepts complexes à des audiences non techniques.

• Vous avez une très bonne connaissance du secteur de la recherche dans les domaines de Machine Learning ou Deep Learning

• Vous êtes capable de rédiger ou de coordonner la rédaction d’articles scientifiques dans le domaine du Machine Learning/Deep Learning

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres