Le télétravail est-il possible pour ce poste ?

Il n'est pas précisé si cet emploi est possible en télétravail.

Quel est le type de contrat pour ce poste ?

Le contrat pour ce poste est de type {contract_type}.

STAGE 2026 - IA / NLP - Gestion d'incertitude et hallucination dans les réponses d'agents IA - F/H - Berger-Levrault

Berger-Levrault

STAGE 2026 - IA / NLP - Gestion d'incertitude et hallucination dans les réponses d'agents IA - F/H

Résumé du poste

Stage

Labège

Salaire : 5,4K à 6K €

Éducation : Bac +5 / Master

Compétences & expertises

FastAPI

LangChain

Streamlit

Athena

Mistral AI

Postuler

hier

Berger-Levrault

Cette offre vous tente ?

Postuler

Questions et réponses sur l'offre

Le poste

Descriptif du poste

🔍 Sujet : Détection et gestion d’incertitude dans les réponses d’agents IA

🧩 Contexte :

Au sein de la Direction de la Recherche et de l’Innovation Technologique (DRIT), le Lab IA explore les nouveaux paradigmes d’intelligence artificielle, et en particulier l’intégration des modèles de langage de grande taille (LLM) dans des systèmes multi-agents intelligents.

L’un des défis majeurs de ces systèmes concerne la fiabilité et la transparence des réponses générées : les modèles peuvent produire des affirmations incorrectes tout en affichant une confiance élevée. Cette « illusion de certitude » nuit à la confiance des utilisateurs et à la robustesse globale du système.

Le stage s’inscrit dans une démarche de R&D exploratoire, visant à concevoir et expérimenter des mécanismes d’auto-évaluation et de calibration de confiance pour des agents conversationnels intégrant des LLM. Ce travail contribuera à l’amélioration de la fiabilité, de la traçabilité et de l’ergonomie cognitive de l’assistant IA développé dans le cadre du projet Athena de Berger-Levrault.

🛠️ Missions :

Étudier les approches existantes de détection d’incertitude et de calibration de confiance dans les modèles de langage : estimation probabiliste, self-consistency, chain-of-thought scoring, contradiction detection, LLM uncertainty estimation.
Concevoir un module d’évaluation de fiabilité, capable d’estimer la fiabilité d’une réponse générée à partir d’indicateurs sémantiques : évaluation de similarité de la réponse principale avec des réponses candidates, cohérence inter-agent, vérification de sources externes (API sur sites web de référence ou corpus métier de référence, etc.).
Mettre en place un système de scoring sémantique pour évaluer la cohérence interne des réponses et identifier les contradictions ou divergences logiques.
Prototyper un mécanisme de retour d’incertitude dans l’interface agentique : visualisation de la confiance (barres, couleurs, reformulations automatiques), feedback utilisateur.
Évaluer scientifiquement le dispositif, via un protocole expérimental mesurant précision, robustesse, calibrage et perception utilisateur.

Selon l’avancement de la mission d’autres pistes comme la suggestion de correction seraient envisageable.

Approches et technologies envisagées :

LLM : Modèles de Mistral AI
Frameworks : LangChain
Méthodes : self-consistency, contradiction-check, semantic similarity scoring (SBERT, Cosine distance), combinaison de métriques
Stack possible : Python, FastAPI, Streamlit pour les tests, VectorDB (Weaviate).

Livrables attendus :

Une étude comparative des méthodes d’estimation de confiance pour les LLM.
Un prototype fonctionnel d’agent capable de produire un score de confiance accompagné d’une visualisation explicite.
Un protocole d’évaluation et un rapport scientifique présentant les résultats.
Des recommandations pour l’intégration de ce module

Profil recherché

Vous êtes étudiant(e) en Master 2, école d’ingénieurs ou formation universitaire en intelligence artificielle, data science, NLP ou informatique. Et vous recherchez un stage de 6 mois débutant au printemps 2026.
Vous présentez un intérêt marqué pour la recherche appliquée et les modèles de langage (LLM).
Vous maîtrisez Python ainsi que la manipulation de modèles de langage et d’embeddings.
Vous faites preuve de curiosité scientifique, de rigueur méthodologique et d’un réel goût pour l’expérimentation.

Déroulement des entretiens

Postulez via notre espace candidat.

Si votre profil nous fait lever un sourcil, attendez-vous à recevoir un appel pour un premier échange téléphonique

Vous avez réussi à piquer notre curiosité ! Attendez-vous à ce qu'on vous propose un deuxième échange, que ce soit à distance ou dans nos locaux. Et naturellement, on ne vous laissera pas en plan, vous aurez une réponse de notre part, que cela soit positif ou négatif

DIVERSITE ET INCLUSION : CHEZ NOUS, C’EST PLUS QU’UNE POLITIQUE, C’EST UNE FORCE !

Nous nous engageons à :

Accueillir et intégrer les talents uniques des personnes en situation de handicap

Cultiver une culture d'inclusion où la différence est valorisée

Sensibiliser et accompagner nos équipes aux enjeux de diversité

Parce que la singularité de chacun est une richesse, nous mettons tout en place pour que chaque collaboratrice et collaborateur puisse s'exprimer et s'épanouir pleinement.

Envie d’en savoir plus ?

Rencontrez Sandra, Développeuse Full stack

Découvrez l'entreprise

Explorez la vitrine de l’entreprise ou suivez-la pour savoir si elle vous correspond vraiment !

Explorer l’entreprise

Ils sont sociables

L'entreprise

Berger-Levrault

Logiciels, IT / Digital, SaaS / Cloud Services

2200 collaborateurs

Âge moyen : 43 ans

Chiffre d'affaires : 216 M€

39%

61%

Qui sont-ils ?

Berger-Levrault est un éditeur de logiciel international basé en France qui s’adresse aux collectivités et administrations territoriales, aux établissements de santé, au monde de l’éducation et à l’industrie. Le Groupe implanté en Europe, au Maroc et au Canada compte 40 000 clients sur les 5 continents.

Engagés dans une transformation numérique responsable, les 2 200 collaborateurs de Berger-Levrault agissent au quotidien pour être à la hauteur des enjeux sociétaux, économiques et environnementaux de leurs clients par la création de solutions digitales de confiance.

Aujourd’hui, Berger-Levrault, c’est : 🥇 une position de leader dans l’édition de logiciel …

leader des solutions logicielles de Ressources Humaines et de Gestion Financière pour les secteurs public et parapublic en France et en Espagne
leader européen des solutions de gestion de maintenance
3ème du TOP 5 des fournisseurs SaaS et On-premise du secteur public selon Markess by Exaegis
12ème du TOP Truffle 100 des éditeurs de logiciel français
21ème du Top 250 des éditeurs de logiciels français et la 11ème place au classement des éditeurs sectoriels selon EY France et Numeum

…et aussi :
la 1ère ETI en France à être partenaire stratégique de l’INRIA et du CNRS.

Les avantages salariés

Entre 1-2 jours de télétravail

Voir tous les avantages

Engagements

Qualiopi

Le lieu de travail

64 Rue Jean Rostand, 31670 Labège, France

Culture d’entreprise

Vous souhaitez en savoir plus sur l’entreprise et son histoire ? C’est par ici !

Découvrir

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

STAGE 2026 - IA / NLP - Apprentissage des préférences utilisateur (mémoire) - F/H
Berger-Levrault
Stage
Labège
Salaire : 5,4K à 6K €
Logiciels, IT / Digital
2 200 collaborateurs
hier
Deep Learning on accumulated LiDAR PointCloud - Internship Toulouse
EasyMile
Stage
Toulouse
Télétravail non autorisé
Logiciels, Mobilité
150 collaborateurs
hier
STAGE OUVRIER - Capitalisation des données métiers – H/F
Thales
Stage
Toulouse
Logiciels, Cybersécurité
80 000 collaborateurs
il y a 7 jours
Stage POWER BI Analyste/Développeur
Groupe SII
Stage
Toulouse
Télétravail non autorisé
Logiciels, Intelligence artificielle / Machine Learning
16 000 collaborateurs
il y a 26 jours
SAP: Administration plateforme et développement SAC
Tata Consultancy Services - TCS
Stage
Toulouse
Télétravail occasionnel
Logiciels, IT / Digital
600 000 collaborateurs
le mois dernier