Ingénieur·e I.A. Générative

Permanent contract
Créteil
Occasional remote
Salary: Not specified
Starting date: April 30, 2026
Experience: > 2 years
Education: PhD or more

Fondation FondaMental
Fondation FondaMental

Interested in this job?

Questions and answers about the job

The position

Job description

CONTEXTE STRATEGIQUE

Depuis plus de dix ans, la Fondation FondaMental structure et exploite des cohortes cliniques multicentriques en psychiatrie. Ces bases constituent aujourd’hui un patrimoine de données multimodales unique comprenant :

• Données cliniques longitudinales

• Questionnaires standardisés

• Données biologiques

• Données omiques

• Imagerie

• Données numériques et signaux comportementaux

Nous entrons dans une nouvelle phase stratégique — passer de la structuration des données à leur exploitation avancée par IA générative. Ce recrutement s’inscrit dans la continuité de nos efforts de :

• Structuration harmonisée des données multimodales

• Construction d’un Entrepôt de Données de Santé (EDS)

• Standardisation cross-pathologies

• Interopérabilité et valorisation scientifique

Notre ambition est désormais d’utiliser ces données historiques et les futures collectes pour :

• Améliorer la stratification des patients

• Développer des approches de phénotypage digital

• Construire des modèles multimodaux intégrés

• Générer des données synthétiques réalistes

• Développer des LLM spécialisés en psychiatrie.

IMPACT ATTENDU

Ce poste vise à :

• Transformer nos bases en moteur algorithmique de nouvelle génération

• Accélérer la recherche translationnelle

• Améliorer la robustesse statistique des analyses

• Permettre des simulations cliniques sécurisées

• Développer une IA propriétaire en psychiatrie de précision

Nous cherchons un profil capable de transformer ce socle de données en moteur d’innovation algorithmique, en combinant rigueur scientifique, vision système et capacité d’implémentation.

MISSIONS PRINCIPALES

1. GENERATION DE DONNEES SYNTHETIQUES MULTIMODALES

  • Développer des modèles génératifs adaptés aux données cliniques structurées (fondation models tabulaires)

  • Concevoir des modèles de diffusion multimodaux intégrant :

    • Données cliniques longitudinales

    • Biomarqueurs biologiques

    • Scores psychométriques

    • Signaux numériques (wearables, données comportementales)

  • Préserver les corrélations inter-modales et dynamiques temporelles

  • Implémenter des métriques de fidélité statistique, clinique et causale

  • Évaluer les risques de fuite d’information et de ré-identification

  • Développer des approches conditionnelles (génération par sous-groupe clinique)

L’objectif est de permettre la simulation de cohortes, l’augmentation de données et l’expérimentation méthodologique sécurisée.

2. STRATIFICATION PATIENT & PHENOTYPAGE DIGITAL

  • Développer des modèles multimodaux pour identifier des sous-types cliniques latents

  • Intégrer données historiques FACE et nouvelles collectes

  • Concevoir des représentations patients (embeddings multimodaux)

  • Explorer des approches causales et longitudinales

  • Participer à la définition d’un pipeline de médecine de précision en psychiatrie

3. LLM SPECIALISES PSYCHIATRIE& PHENOTYPAGE DIGITAL

  • Fine-tuning de modèles de langage sur corpus clinique structuré

  • Développement de pipelines RAG sécurisés sur EDS

  • Agents d’analyse de dossiers et synthèse clinique

  • Structuration automatique de comptes rendus

  • Benchmark clinique des performances

4. RECHERCHE & INNOVATION

  • Veille scientifique continue

  • Prototypage rapide

  • Interaction étroite avec cliniciens et data scientists

  • Contribution à publications et projets nationaux/internationaux


Preferred experience

COMPETENCES TECHNIQUES INDISPENSABLES

• Maîtrise avancée de Python, PyTorch

• Expérience en modèles discriminatifs et génératifs (Diffusion, VAE, GAN ou LLM)

• Bonne compréhension des modèles probabilistes

• Expérience sur données tabulaires complexes

• Gestion de données longitudinales

• Capacité à travailler avec données hétérogènes, bruitées, manquantes• xxx

COMPETENCES APPRECIEES

• Expérience en données médicales

• Multimodal learning

• Causal inference

• RLHF ou alignement de LLM

• MLOps / GPU training / Kubernetes

FORMATION : PhD ou Master 2 en IA, Machine Learning, Mathématiques appliquées, Bio-informatique ou équivalent.


Recruitment process

Pour postuler, veuillez envoyer votre CV ainsi qu’une lettre de motivation.

These job openings might interest you!

These companies are also recruiting for the position of “Données/Business Intelligence”.

  • Orakl Oncology

    Senior AI Engineer

    Orakl Oncology
    Orakl Oncology
    Permanent contract
    Le Kremlin-Bicêtre
    Occasional remote
    Artificial Intelligence / Machine Learning, Pharmaceutical / Biotech
    21 employees

  • AQEMIA

    Senior Data Scientist

    AQEMIA
    AQEMIA
    Permanent contract
    Paris
    A few days at home
    Artificial Intelligence / Machine Learning, Pharmaceutical / Biotech
    60 employees