Ingénieur·e I.A. Générative

CDI
Créteil
Télétravail occasionnel
Salaire : Non spécifié
Début : 30 avril 2026
Expérience : > 2 ans
Éducation : > Bac +5 / Doctorat

Fondation FondaMental
Fondation FondaMental

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

CONTEXTE STRATEGIQUE

Depuis plus de dix ans, la Fondation FondaMental structure et exploite des cohortes cliniques multicentriques en psychiatrie. Ces bases constituent aujourd’hui un patrimoine de données multimodales unique comprenant :

• Données cliniques longitudinales

• Questionnaires standardisés

• Données biologiques

• Données omiques

• Imagerie

• Données numériques et signaux comportementaux

Nous entrons dans une nouvelle phase stratégique — passer de la structuration des données à leur exploitation avancée par IA générative. Ce recrutement s’inscrit dans la continuité de nos efforts de :

• Structuration harmonisée des données multimodales

• Construction d’un Entrepôt de Données de Santé (EDS)

• Standardisation cross-pathologies

• Interopérabilité et valorisation scientifique

Notre ambition est désormais d’utiliser ces données historiques et les futures collectes pour :

• Améliorer la stratification des patients

• Développer des approches de phénotypage digital

• Construire des modèles multimodaux intégrés

• Générer des données synthétiques réalistes

• Développer des LLM spécialisés en psychiatrie.

IMPACT ATTENDU

Ce poste vise à :

• Transformer nos bases en moteur algorithmique de nouvelle génération

• Accélérer la recherche translationnelle

• Améliorer la robustesse statistique des analyses

• Permettre des simulations cliniques sécurisées

• Développer une IA propriétaire en psychiatrie de précision

Nous cherchons un profil capable de transformer ce socle de données en moteur d’innovation algorithmique, en combinant rigueur scientifique, vision système et capacité d’implémentation.

MISSIONS PRINCIPALES

1. GENERATION DE DONNEES SYNTHETIQUES MULTIMODALES

  • Développer des modèles génératifs adaptés aux données cliniques structurées (fondation models tabulaires)

  • Concevoir des modèles de diffusion multimodaux intégrant :

    • Données cliniques longitudinales

    • Biomarqueurs biologiques

    • Scores psychométriques

    • Signaux numériques (wearables, données comportementales)

  • Préserver les corrélations inter-modales et dynamiques temporelles

  • Implémenter des métriques de fidélité statistique, clinique et causale

  • Évaluer les risques de fuite d’information et de ré-identification

  • Développer des approches conditionnelles (génération par sous-groupe clinique)

L’objectif est de permettre la simulation de cohortes, l’augmentation de données et l’expérimentation méthodologique sécurisée.

2. STRATIFICATION PATIENT & PHENOTYPAGE DIGITAL

  • Développer des modèles multimodaux pour identifier des sous-types cliniques latents

  • Intégrer données historiques FACE et nouvelles collectes

  • Concevoir des représentations patients (embeddings multimodaux)

  • Explorer des approches causales et longitudinales

  • Participer à la définition d’un pipeline de médecine de précision en psychiatrie

3. LLM SPECIALISES PSYCHIATRIE& PHENOTYPAGE DIGITAL

  • Fine-tuning de modèles de langage sur corpus clinique structuré

  • Développement de pipelines RAG sécurisés sur EDS

  • Agents d’analyse de dossiers et synthèse clinique

  • Structuration automatique de comptes rendus

  • Benchmark clinique des performances

4. RECHERCHE & INNOVATION

  • Veille scientifique continue

  • Prototypage rapide

  • Interaction étroite avec cliniciens et data scientists

  • Contribution à publications et projets nationaux/internationaux


Profil recherché

COMPETENCES TECHNIQUES INDISPENSABLES

• Maîtrise avancée de Python, PyTorch

• Expérience en modèles discriminatifs et génératifs (Diffusion, VAE, GAN ou LLM)

• Bonne compréhension des modèles probabilistes

• Expérience sur données tabulaires complexes

• Gestion de données longitudinales

• Capacité à travailler avec données hétérogènes, bruitées, manquantes• xxx

COMPETENCES APPRECIEES

• Expérience en données médicales

• Multimodal learning

• Causal inference

• RLHF ou alignement de LLM

• MLOps / GPU training / Kubernetes

FORMATION : PhD ou Master 2 en IA, Machine Learning, Mathématiques appliquées, Bio-informatique ou équivalent.


Déroulement des entretiens

Pour postuler, veuillez envoyer votre CV ainsi qu’une lettre de motivation.

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.