Le télétravail est-il possible pour ce poste ?

Il n'est pas précisé si cet emploi est possible en télétravail.

Quel est le type de contrat pour ce poste ?

Le contrat pour ce poste est de type {contract_type}.

STAGE - IA - Évaluation et alignement d’agents LLM F/H - Thales

Thales

STAGE - IA - Évaluation et alignement d’agents LLM F/H

Stage

Vélizy-Villacoublay

Salaire : Non spécifié

Postuler

il y a 23 jours

Thales

Cette offre vous tente ?

Postuler

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Lieu : Vélizy-Villacoublay, France

Construisons ensemble un avenir de confiance

Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et plus inclusif. Le Groupe investit près de 4 milliards d’euros par an en Recherche & Développement, notamment dans des domaines clés de l’innovation tels que l’IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.

Nos engagements, vos avantages

Notre savoir-faire technologique
Notre attention portée à l’équilibre des collaborateurs
Un environnement inclusif et bienveillant
Un engagement sociétal et environnemental reconnu (Thales Solidarity, indice CAC 40 ESG…)

Votre quotidien

Rejoignez-nous sur le campus Vélizy qui héberge une grande diversité d’activités Thales, aéro, défense, civile,… A l'ouest de Paris, ce site offre un environnement de travail équipé des dernières innovations technologiques et propose des services permettant de concilier vie professionnelle et personnelle.

Au sein du département Systèmes de Protection Défense (PRS), notre équipe développe un système agentique basé sur des LLM capable de convertir automatiquement des protocoles militaires structurés (ex. NVG vers ADatP-3, etc.).

Ce système repose sur :

un agent convertisseur (LangGraph + LLM + outils MCP),
une infrastructure d’observabilité (Langfuse).

Le stage vise à concevoir un protocole d’évaluation réaliste pour un agent LLM outillé, puis à exploiter les trajectoires collectées pour améliorer l’agent convertisseur via des techniques d’alignement modernes (SFT, DPO, GRPO).

Le sujet se déroulera en 2 étapes :

Une phase d’évaluation afin de déterminer la performance de l’agent convertisseur à l’aide d’un nouvel agent opérateur
et une seconde phase d’amélioration de l’agent convertisseur à l’aide des trajectoires générées durant la phase d’évaluation (Self-Imitation Learning).

Tes missions consisteront à :

Développer un agent simulé : implémenter un agent LangGraph jouant le rôle d’un opérateur humain et piloter des conversations simulées selon des scénarios définis.
Collecter et traiter les données : utiliser Langfuse pour enregistrer les interactions et consolider les trajectoires au format JSONL.
Analyser le raisonnement : identifier informations manquantes et hypothèses implicites, reconstituer les actions et analyser les stratégies efficaces.
Définir les métriques et rewards : mesurer le succès end-to-end, le nombre de tours/actions et types d’échecs, et créer des fonctions de reward pour GRPO.
Améliorer l’agent convertisseur : créer des datasets pour SFT, DPO et GRPO, évaluer les performances et analyser les gains.

Votre profil

En dernière année d'école ingénieur ou diplôme équivalent (BAC+5), avec une spécialisation en IA, vous recherchez un stage de 6 mois ?
Tu maîtrises Python et as déjà travaillé avec des LLM APIs (vLLM on-prem ou équivalent) ainsi que la gestion d’agents (MCP) ?
Tu possèdes de solides connaissances des frameworks LangGraph et/ou LangChain, et idéalement des outils de tracing et d’observabilité comme Langfuse ?
Des connaissances en reinforcement learning (TorchRL, TRL) seraient un plus.
Tu es curieux.se et as envie d’explorer, comprendre et tester de nouvelles approches ?
Tu disposes d'un bon esprit d'analyse te permettant de structurer un problèmen d'analyser des résultats et d'en tirer des conclusions.
Tu savais avancer de manière autonome mais aussi travailler en équipe, partager tes idées et écouter les autres ?

Le mot de l'équipe

Si tu veux apprendre, innover et contribuer à des projets qui ont du sens, on a hâte de te rencontrer. Postule et viens construire l’IA de demain avec nous !

Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d’études.Thales, entreprise Handi-Engagée, reconnait tous les talents. La diversité est notre meilleur atout. Postulez et rejoignez nous !

Envie d’en savoir plus ?

Rencontrez François, Responsable d'un laboratoire de Data Science

Rencontrez Imane, Développeuse Logiciel

Découvrez l'entreprise

Explorez la vitrine de l’entreprise ou suivez-la pour savoir si elle vous correspond vraiment !

Explorer l’entreprise

Ils sont sociables

L'entreprise

Thales

Logiciels, Cybersécurité, Aéronautique / Spatiale

80000 collaborateurs

Créée en 2000

Chiffre d'affaires : 19Mds€

Qui sont-ils ?

Chez Thales, nous sommes fiers de travailler ensemble pour imaginer des solutions innovantes qui contribuent à construire un avenir plus sûr, plus vert et plus inclusif. Un avenir de confiance. Mais ces technologies ne viennent pas de nulle part.

L’intelligence humaine est le moteur derrière la technologie qui fait la renommée de Thales.
Chez Thales, tout commence par l’Intelligence Humaine. C’est pourquoi notre ambition est de vous offrir la meilleure « expérience » possible. Nous nous efforçons de mettre en place les conditions de votre développement, de faciliter votre quotidien, votre équilibre vie personnelle - vie professionnelle, et d’étendre vos perspectives.

Un savoir-faire technologique au service de la société.
Les projets que nous conduisons sont complexes et nos clients exigeants. Pour répondre aux besoins actuels et futurs de nos clients, nous maîtrisons plus d’une centaine de disciplines, de l’optique à la physique quantique, du traitement du signal à la connectivité et à l’intelligence artificielle. Rejoindre Thales, c’est repousser les limites de la technologie et la mettre au service du progrès et du développement durable de nos sociétés. C’est donc être au cœur d’une formidable aventure technique.

Une attention portée à l’équilibre des collaborateurs au service de leur réussite.
C’est pourquoi, notamment, nous nous efforçons de créer un environnement de travail accueillant et d’accorder la flexibilité nécessaire à l’équilibre entre vie professionnelle et vie personnelle. Nous savons que cet équilibre est essentiel à votre épanouissement et à la réussite des projets que nous vous confierons.

Des parcours professionnels riches.
Chez Thales, nous jouons collectif. Ce qui signifie travailler en équipe, côtoyer des experts et donc apprendre et développer ses compétences en permanence tout en faisant bénéficier le Groupe de son savoir-faire. C’est aussi la possibilité d’évoluer, de changer de fonction ou d’activité, voire de pays.

Les avantages salariés

Horaires de travail flexibles
Subventions CSE (Sport, Culture,...)
Congés pour enfant malade

Voir tous les avantages

Le lieu de travail

Vélizy-Villacoublay, Ile-de-France, France

Besoin de plus d’infos ?

Vie d’entreprise, ambiance, réalisations... On a encore plein de choses à vous dire !

Découvrir

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

STAGE – Ingénieur en IA générative – Vision – Language Models pour l’analyse de scène par fusion multimodale (H/F) – 6 mois
Thales
Stage
Palaiseau
Logiciels, Cybersécurité
80 000 collaborateurs
hier
AI Engineer Intern H/F
Skaleet
Stage
Boulogne-Billancourt
Télétravail non autorisé
Logiciels, IT / Digital
120 collaborateurs
avant-hier
Stage - Business Data Analyst (x/f/m) - Juillet 2026
Doctolib
Stage
Paris
Télétravail fréquent
Application mobile, Logiciels
3 000 collaborateurs
avant-hier
Data Scientist - Physical Data / Predictions - Internship
SkillCorner
Stage
Paris
Télétravail occasionnel
Logiciels, Intelligence artificielle / Machine Learning
100 collaborateurs
il y a 3 jours
Healthcare Data Analyst - F/H
SYSNAV
Stage
Paris
Télétravail occasionnel
Salaire : 1,4K à 1,5K € par mois
Ingénieries Spécialisées, Logiciels
100 collaborateurs
il y a 5 jours
Stage Ingénieur(e) Automatisation Data (F/H)
Groupe SII
Stage
Vélizy-Villacoublay
Télétravail non autorisé
Logiciels, Intelligence artificielle / Machine Learning
16 000 collaborateurs
il y a 5 jours