Le télétravail est-il possible pour ce poste ?

Il n'est pas précisé si cet emploi est possible en télétravail.

Quel est le type de contrat pour ce poste ?

Le contrat pour ce poste est de type {contract_type}.

Une expérience est-elle requise pour cette offre?

Aucune expérience n'est nécessaire pour postuler à cette offre.

Apprentissage par renforcement pour une IA agentique fiable - Stage H/F - Assystem

Assystem

Apprentissage par renforcement pour une IA agentique fiable - Stage H/F

Stage

Courbevoie

Salaire : Non spécifié

Expérience : < 6 mois

Postuler

hier

Assystem

Cette offre vous tente ?

Postuler

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Nous recherchons un(e) stagiaire pour participer à la mise en place d’IA agentique sure et efficace pour des workflows d’ingénierie en contexte réglementé nucléaire. Vous appliquerez l’apprentissage par renforcement (RL) – associé à des garde fous solides à une évaluation rigoureuse – pour permettre à un agent LLM de planifier, d’utiliser les outils et de vérifier les résultats sur une infrastructure cloud et sur site.

Vous travaillerez main dans la main avec notre référent technique LLM pour appliquer des méthodes de RL de pointe (optimisation des préférences (DPO/IPO), bandits, RL hors ligne) à des cas d’usages concrets à destination des équipes d’ingénierie - tout en répondant aux attentes du secteur en matière de sécurité et de conformité.

Missions principales:

Construire une boucle d’agents (planning → appels outils → vérification) avec garde-fous.
Récompenses multi objectifs multi-objective rewards prenant en compte également latence, coût..
Construire un pipeline preference/feedback RLHF/RLAIF.
Explorer différentes méthodes RL : preference optimization (DPO/IPO), bandits;
Sécuriser le pipeline: règles, provenance tracking, confidence, human-in-the-loop approvals.
Appliquer à la réalisation d’un assistant pilote agentique démontrant un gain de temps sur des cas d’usage réels.

Pourquoi réaliser votre stage chez Assystem ? On a 3 bonnes raisons pour vous convaincre !

🥐 Travailler au sein d’une équipe engagée qui ramène expertise et croissants le matin !

😎 Découvrir pourquoi 92% de nos stagiaires apprécient l’ambiance et leur environnement de travail

🏆 Gagner en compétences et développer votre expertise métier en échangeant au quotidien avec les collaborateurs Assystem, ainsi que le client en direct pour plus de proximité !

Profil recherché

Niveau de formation :
Étudiant en BAC+5 (Master, école d’ingénieur ou équivalent).
Un niveau BAC+4 pourra être envisagé pour un(e) candidat(e) particulièrement motivé(e).

Domaine de spécialisation :
Informatique, Intelligence Artificielle, ou Mathématiques appliquées.

Compétences techniques :

Solide maîtrise de Python, avec une expérience sur PyTorch (ou TensorFlow).
Intérêt marqué pour l’apprentissage par renforcement (reward design, bandits, policy/preference optimization).
Intérêt pour les LLMs et les agents intelligents ; une expérience avec LangChain, LangGraph ou outils similaires est un plus.
Bonne compréhension des bonnes pratiques de développement : tests, reproductibilité, suivi des expériences (experiment tracking).
Familiarité avec Git et Docker.

Compétences transverses :
Curiosité, rigueur, autonomie, esprit d’initiative, sens de la collaboration, et anglais opérationnel.

Informations supplémentaires

Nous nous engageons au respect de l’égalité de traitement entre les candidats, et célébrons toutes les formes de diversité. Chez Assystem, seules les compétences comptent ! Si vous souhaitez porter à la connaissance d’Assystem une quelconque situation ou des besoins spécifiques, n’hésitez pas vous serez accompagné(e) !

Envie d’en savoir plus ?

Rencontrez Adrien, Responsable du bureau d'études

Rencontrez Olivier, Responsable d'équipe

Découvrez l'entreprise

Explorez la vitrine de l’entreprise ou suivez-la pour savoir si elle vous correspond vraiment !

Explorer l’entreprise

Ils sont sociables

L'entreprise

Assystem

Bureau d'études et d'ingénierie, Ingénieries Spécialisées, Energie

8000 collaborateurs

Créée en 1966

Chiffre d'affaires : 611M€

30%

70%

Qui sont-ils ?

⚡Trouver des solutions au dérèglement climatique est la priorité du 21ème siècle, et implique de switcher à l’énergie bas-carbone. Chez Assystem, on s’est donc donné pour mission d’accélérer la transition énergétique partout dans le monde. Et pour y parvenir, nos 8000 Switchers couplent leur expertise historique en ingénierie et en management de projet aux technologies digitales.

Implantés dans 13 pays (Europe, Moyen-Orient, Asie, Amérique du nord), nous travaillons sur la production et la distribution d’électricité bas-carbone, à travers le développement des énergies nucléaires et renouvelables. Nous participons également à la modernisation des réseaux électriques et l’électrification des usages, à travers l’hydrogène pour décarboner les secteurs des transports et de l’industrie.

Le lieu de travail

Allée de l'Arche, 92400 Courbevoie, France

Les +

Psst... On a plein de choses à vous dire sur les avantages que nous offrons à nos employés.

Découvrir

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Centralisation et exploration des données de projets IA - Stage H/F
Assystem
Stage
Courbevoie
Bureau d'études et d'ingénierie, Ingénieries Spécialisées
8 000 collaborateurs
il y a 13 jours
Stagiaire - Data Analyst
SKEZI
Stage
Paris
Télétravail fréquent
Bureau d'études et d'ingénierie, IT / Digital
30 collaborateurs
il y a 15 jours
Stage système de génération automatique de scénarios automobile par IA (H/F)
SOGECLAIR
Stage
Boulogne-Billancourt
Télétravail non autorisé
Bureau d'études et d'ingénierie, Mobilité
1 100 collaborateurs
il y a 21 jours