Stage - Ingénieur R&D Machine Learning for Optimal Control F/H

Stage
Courbevoie
Télétravail non autorisé
Salaire : 900 à 1 450 € par mois
Expérience : < 6 mois
Éducation : Bac +5 / Master
Postuler

Framatome
Framatome

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

Contexte
Au sein du département DTIPC-F (études neutroniques), vous rejoindrez une équipe de R&D spécialisée en automatique et en intelligence artificielle appliquées au pilotage de systèmes complexes.
Le stage s'inscrit dans le cadre du développement d'une méthode d'apprentissage en temps réel (online learning) visant à améliorer la précision des méthodes de commande prédictive d'un réacteur nucléaire.
Ce travail, à l'interface entre machine learning et ingénierie nucléaire, a un impact direct sur la sûreté et la performance des installations.

Lors de la mise en oeuvre d'un algorithme de commande prédictive en temps réel, un écart persistant apparaît entre :
le modèle de simulation théorique,
et le comportement physique réel du réacteur.
Cet écart, variable dans le temps et spécifique à chaque installation, peut être estimé grâce aux données d'exploitation.
L'objectif est donc de concevoir un modèle statistique adaptatif capable de corriger cet écart en ligne.

Objectifs du stage
Réaliser un état de l'art des méthodes d'apprentissage statistique en ligne.
Concevoir un modèle adaptatif capable de corriger en temps réel l'erreur de prédiction/simulation.
Évaluer différentes familles de modèles de séries temporelles (réseaux de neurones, méthodes ensemblistes, régressions avancées…), selon : performance quantitative, complexité et explicabilité.
Implémenter et entraîner les modèles, constituer un jeu de données représentatif, comparer les approches retenues.
Analyser la Sample Complexity : obtenir des garanties théoriques sur le nombre minimal de données nécessaires pour apprendre la fonction cible.
(Optionnel) Intégrer des stratégies d'active learning pour recaler le modèle en fonction des variations physiques réelles.
(Optionnel) Définir une stratégie de contrôle optimal basée sur le modèle corrigé (physique + ML).
(Si l'avancée le permet) Explorer des approches de contrôle autonome en temps réel (Active Reinforcement Learning).

Mots-clés
Statistical Learning
Active Learning
Time Series Forecasting
Physics-Informed Neural Networks (PINN)
Optimal Control


Profil recherché

Vous êtes en dernière année d'école d'ingénieur ou équivalent universitaire, avec une spécialisation en mathématiques appliquées, automatique ou intelligence artificielle, et vous recherchez un stage de fin d'études.
Vous savez faire preuve d'initiative et d'autonomie dans vos travaux, tout en ayant le goût de la recherche appliquée.
Vous disposez d'une aptitude à travailler en équipe et d'une capacité de dialogue, en particulier pour expliquer clairement vos choix et résultats.
La maîtrise de l'anglais (oral et écrit) est requise.
Vous avez un intérêt (apprécié) pour l'automatique et le contrôle, des notions en Matlab/SIMULINK, ainsi qu'une curiosité pour le secteur nucléaire et énergétique.

La/le stagiaire sera directement intégré(e) à une équipe de R&D en automatique et sera encadré(e) par un ingénieur ainsi qu'un doctorant du Pôle DTIPC.

Envie d’en savoir plus ?

Postuler