Contexte
Les modèles de substitution basés sur le deep learning, tels que les GNN, les transformers sur maillages et les modèles à ordre réduit, sont de plus en plus utilisés pour accélérer les simulations physiques, mais nécessitent un entraînement et une ingénierie spécifiques à chaque tâche. Récemment, des modèles fondation pour données tabulaires (par exemple TabPFN) ont été proposés comme modèles sans entraînement, capables de s'adapter à de nouvelles tâches uniquement via le conditionnement. Leur pertinence pour les données issues de simulations physiques reste largement inexplorée.
SafranTech a déjà benchmarké plusieurs approches de modélisation de substitution dans le cadre du framework PLAID (https://huggingface.co/PLAIDcompetitions), fournissant une base de référence solide pour la comparaison.
Ce stage s'inscrit dans la continuité d'un premier stage débutant en avril 2026.
Objectifs
Le stage vise à :
- Évaluer si les modèles fondation pour données tabulaires peuvent servir de substituts viables pour les simulations physiques en utilisant uniquement le conditionnement.
- Comparer leur précision et leur robustesse avec les méthodes de deep learning existantes benchmarkées dans PLAID.
- Évaluer leur débit de calcul et leur passage à l'échelle pour un usage industriel à grande échelle.
Plan de travail
- Bibliographie et mise en place des benchmarks
Étudier les modèles fondation pour données tabulaires et la modélisation de substitution en physique. Se familiariser avec les datasets, les métriques et les baselines de PLAID.
- Expériences sur grilles régulières
Appliquer les modèles fondation directement aux sorties de simulations physiques définies sur des grilles régulières. Comparer la précision et le coût d'inférence avec les baselines PLAID existantes.
- Analyse du débit et de la scalabilité
Évaluer le temps d'inférence, l'utilisation mémoire et la scalabilité en batch, et comparer l'inférence par conditionnement seul avec celle des modèles entièrement entraînés.
- Maillages non structurés via représentations latentes
Étendre l'approche aux maillages non structurés à l'aide d'embeddings latents (par exemple POD ou autoencodeurs), et comparer avec des modèles prenant en compte la structure du maillage.
- Analyse et limites
Identifier les modes d'échec, les limites de passage à l'échelle et les domaines d'applicabilité des modèles fondation en simulations physiques.
Résultats attendus
- Une comparaison quantitative entre les modèles fondation et les modèles de substitution de pointe en physique.
- Des conclusions claires sur les compromis précision–vitesse.
- Des recommandations pratiques pour les workflows de simulation industrielle.
Profil recherché
- Formation en simulations numériques / mathématiques appliquées.
- Expérience de base en réseaux de neurones et programmation différentiable avec PyTorch.
- Maîtrise de la programmation en Python.
- Capacité à travailler de manière autonome et en collaboration dans un environnement de recherche.
Rencontrez Audrey, Responsable de Département
Rencontrez Mélanie, Monteur câbleur