Mission générale
Le data scientist / pharmaco_épidémiologiste collabore avec les investigateurs et les autres data scientist / biostatisticiens du GHU à tous les stades de l’exploitation de l’Entrepôt de Données de Santé de l’AP-HP et de la base de l’Assurance Maladie (SNDS): explicitation de la demande, mise au point du protocole de requêtage, réalisation de la requête, contrôle de la qualité des données, réalisation d’analyses, présentation des données, rédaction du rapport, diffusion des résultats. Il interagit avec l’équipe de développement de l’EDS pour garantir la fiabilité des processus d’extraction et d’alimentation de l’entrepôt.
Missions détaillées
Identification et construction de variables d’intérêt à partir de données massives issues de l’EDS et du SNDS, en concertation avec les médecins cliniciens, épidémiologistes et DIM. Participation au choix des nomenclatures, des sources de données externes et à la production du référentiel de données. Veille scientifique sur les méthodes informatiques et statistiques d’analyse des données massives ou non structurées
Réalisation d’analyses statistiques sur données massives dont analyse de données longitudinales, de données censurées, datamining (sélection de variables, régularisation de modèle), analyse de trajectoires, modèles causaux, …
Analyse méthodologique des études : analyse critique de la littérature, définition du plan expérimental, choix des critères de sélection et critères de jugement, modalités de recueil des données médicales et de suivi des patients, planification des analyses et calcul du nombre de sujets nécessaire
Rédaction du rapport, aide à la valorisation et à l’écriture des articles : présentation des résultats et rédaction des parties méthodes et résultats des articles scientifiques, rédaction des rapports d’analyse.
Mise en place de procédures de contrôle et d’assurance-qualité des données. Mise en place de bonnes pratiques d’usage de l’EDS
Veille réglementaire
Participation à la vie de l’URC et prise en charge des missions collectives ou transversales
Participation aux évènement scientifiques de l’équipe de recherche
Participation aux groupes de travail mis en place par la DRCI ou l’URC relevant de sa compétence
Formation de ses collègues, animation de séminaires
Savoir-faire requis
Formation en statistique, analyse de données et méthodologie de la recherche
Méthodes et pratique en recherche clinique, épidémiologique, et en bases de données décisionnelles
Maîtrise des principaux logiciels statistiques et de la programmation (R et/ou SAS, Python est également bienvenu)
Connaître la législation relative à la recherche (Code Santé Publique), le traitement automatisé des données et la confidentialité (Informatique et Libertés, CNIL) ainsi que la réglementation (Bonnes Pratiques Cliniques)
Savoir valider, interpréter et présenter les données
Savoir juger de la qualité méthodologique des articles scientifiques
Connaissances associées
Connaissance du milieu de la santé, du système d’information médico-administratif de l’AP-HP et national (SNDS)
Connaissance de l’anglais
Ethique et déontologie médicale de la recherche clinique
Savoir être requis
Disponibilité
Rigueur
Curiosité intellectuelle
Facilité de contact
Aptitude à travailler en équipe
Rencontrez Reda, Data Manager
Rencontrez Léo, Ingénieur prim 3D
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.