CONTEXTE STRATEGIQUE
Depuis plus de dix ans, la Fondation FondaMental structure et exploite des cohortes cliniques multicentriques en psychiatrie. Ces bases constituent aujourd’hui un patrimoine de données multimodales unique comprenant :
• Données cliniques longitudinales
• Questionnaires standardisés
• Données biologiques
• Données omiques
• Imagerie
• Données numériques et signaux comportementaux
Nous entrons dans une nouvelle phase stratégique — passer de la structuration des données à leur exploitation avancée par IA générative. Ce recrutement s’inscrit dans la continuité de nos efforts de :
• Structuration harmonisée des données multimodales
• Construction d’un Entrepôt de Données de Santé (EDS)
• Standardisation cross-pathologies
• Interopérabilité et valorisation scientifique
Notre ambition est désormais d’utiliser ces données historiques et les futures collectes pour :
• Améliorer la stratification des patients
• Développer des approches de phénotypage digital
• Construire des modèles multimodaux intégrés
• Générer des données synthétiques réalistes
• Développer des LLM spécialisés en psychiatrie.
IMPACT ATTENDU
Ce poste vise à :
• Transformer nos bases en moteur algorithmique de nouvelle génération
• Accélérer la recherche translationnelle
• Améliorer la robustesse statistique des analyses
• Permettre des simulations cliniques sécurisées
• Développer une IA propriétaire en psychiatrie de précision
Nous cherchons un profil capable de transformer ce socle de données en moteur d’innovation algorithmique, en combinant rigueur scientifique, vision système et capacité d’implémentation.
MISSIONS PRINCIPALES
1. GENERATION DE DONNEES SYNTHETIQUES MULTIMODALES
Développer des modèles génératifs adaptés aux données cliniques structurées (fondation models tabulaires)
Concevoir des modèles de diffusion multimodaux intégrant :
Données cliniques longitudinales
Biomarqueurs biologiques
Scores psychométriques
Signaux numériques (wearables, données comportementales)
Préserver les corrélations inter-modales et dynamiques temporelles
Implémenter des métriques de fidélité statistique, clinique et causale
Évaluer les risques de fuite d’information et de ré-identification
Développer des approches conditionnelles (génération par sous-groupe clinique)
L’objectif est de permettre la simulation de cohortes, l’augmentation de données et l’expérimentation méthodologique sécurisée.
2. STRATIFICATION PATIENT & PHENOTYPAGE DIGITAL
Développer des modèles multimodaux pour identifier des sous-types cliniques latents
Intégrer données historiques FACE et nouvelles collectes
Concevoir des représentations patients (embeddings multimodaux)
Explorer des approches causales et longitudinales
Participer à la définition d’un pipeline de médecine de précision en psychiatrie
3. LLM SPECIALISES PSYCHIATRIE& PHENOTYPAGE DIGITAL
Fine-tuning de modèles de langage sur corpus clinique structuré
Développement de pipelines RAG sécurisés sur EDS
Agents d’analyse de dossiers et synthèse clinique
Structuration automatique de comptes rendus
Benchmark clinique des performances
4. RECHERCHE & INNOVATION
Veille scientifique continue
Prototypage rapide
Interaction étroite avec cliniciens et data scientists
Contribution à publications et projets nationaux/internationaux
COMPETENCES TECHNIQUES INDISPENSABLES
• Maîtrise avancée de Python, PyTorch
• Expérience en modèles discriminatifs et génératifs (Diffusion, VAE, GAN ou LLM)
• Bonne compréhension des modèles probabilistes
• Expérience sur données tabulaires complexes
• Gestion de données longitudinales
• Capacité à travailler avec données hétérogènes, bruitées, manquantes• xxx
COMPETENCES APPRECIEES
• Expérience en données médicales
• Multimodal learning
• Causal inference
• RLHF ou alignement de LLM
• MLOps / GPU training / Kubernetes
FORMATION : PhD ou Master 2 en IA, Machine Learning, Mathématiques appliquées, Bio-informatique ou équivalent.
Pour postuler, veuillez envoyer votre CV ainsi qu’une lettre de motivation.
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.