STAGE 2026 - IA / NLP - Apprentissage des préférences utilisateur (mémoire) - F/H

Stage
Labège
Salaire : 5,4K à 6K €
Éducation : Bac +5 / Master
Postuler

Berger-Levrault
Berger-Levrault

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

🔍 Sujet : Apprentissage des préférences utilisateur - personnalisation de la stratégie d’agent IA

 

 

🧩 Contexte :

 

Au sein de la Direction de la Recherche et de l’Innovation Technologique (DRIT), le Lab IA explore les nouveaux paradigmes d’intelligence artificielle, et en particulier l’intégration des modèles de langage de grande taille (LLMs) dans des systèmes multi-agents intelligents.

 

L’un des défis de ces systèmes d’agents IA modernes est de pouvoir s’adapter à leurs utilisateurs : niveau de technicité attendu, style de communication, granularité des explications, ou encore préférences dans la façon d’exécuter des tâches.

 

Le stage s’inscrit dans une démarche de R&D exploratoire, visant à concevoir et expérimenter un mécanisme d’apprentissage et de personnalisation adaptative permettant à un agent IA de moduler ses réponses et stratégies en fonction du profil et du comportement de chaque utilisateur.

 

 Ce travail s’intègre dans le cadre du projet Athena, une plateforme d’agents IA développée par Berger-Levrault, visant à créer des assistants capables de raisonner, collaborer et s’adapter de manière autonome

 

 

🛠️ Missions :

  • Étudier les approches existantes de personnalisation d’agents IA : apprentissage implicite/explicite des préférences, reinforcement learning from user feedback (RLHF/RLAIF), retrieval personalization, contextual prompt tuning, profilage dynamique.
  • Concevoir une architecture d’agent capable de :

                 - observer et enregistrer les interactions utilisateur (préférences, styles, contextes d’usage),

                 - apprendre à inférer les préférences implicites (ton, niveau d’explication, format de réponse, etc.),

                 - adapter dynamiquement sa stratégie d’orchestration, son prompting ou son contenu généré.

  • Prototyper un système d’apprentissage continu des préférences, connecté à la plateforme d’agents IA Athena.
  • Définir des métriques de satisfaction et de pertinence personnalisée, et mettre en place un protocole expérimental d’évaluation.

 

Approches et technologies envisagées :

  • Techniques de personnalisation :
    • Profilage utilisateur dynamique (embedding comportemental, clustering sémantique)
    • Contextual Prompt Adaptation
    • Few-shot personalization (mémoire courte + profil long terme)
    • Reinforcement Learning from User Feedback (RLHF / RLAIF simplifié)
  • Stack technique :
    • Python, LangChain
    • Vector store pour stockage de préférences  (Weaviate)
    • Streamlit / React pour le tableau de bord de suivi utilisateur
    • LLMs : Mistral

 

Livrables attendus :

  • État de l’art sur les approches de personnalisation d’agents IA et apprentissage des préférences
  • Prototype d’un agent capable d’adapter son comportement à chaque utilisateur
  • Mécanisme de suivi et de visualisation de la personnalisation
  • Rapport sur la performance du modèle d’adaptation et les gains observés

Profil recherché

  • Vous êtes étudiant(e) en Master 2, en école d’ingénieurs ou en formation universitaire en intelligence artificielle, data science, NLP ou informatique. Et vous recherchez un stage de 6 mois débutant au printemps 2026.

  • Vous démontrez un intérêt marqué pour la recherche appliquée et les LLMs.

  • Vous possédez de bonnes compétences en Python ainsi qu’en manipulation de modèles de langage et d’embeddings.

  • Vous faites preuve de curiosité scientifique, de rigueur méthodologique et d’un réel goût pour l’expérimentation.


Déroulement des entretiens

  • Postulez via notre espace candidat.
  • Si votre profil nous fait lever un sourcil, attendez-vous à recevoir un appel pour un premier échange téléphonique
  • Vous avez réussi à piquer notre curiosité ! Attendez-vous à ce qu'on vous propose un deuxième échange, que ce soit à distance ou dans nos locaux. Et naturellement, on ne vous laissera pas en plan, vous aurez une réponse de notre part, que cela soit positif ou négatif
  • DIVERSITE ET INCLUSION : CHEZ NOUS, C’EST PLUS QU’UNE POLITIQUE, C’EST UNE FORCE !

    Nous nous engageons à :

  • Accueillir et intégrer les talents uniques des personnes en situation de handicap
  • Cultiver une culture d'inclusion où la différence est valorisée
  • Sensibiliser et accompagner nos équipes aux enjeux de diversité
  • Parce que la singularité de chacun est une richesse, nous mettons tout en place pour que chaque collaboratrice et collaborateur puisse s'exprimer et s'épanouir pleinement.

    Envie d’en savoir plus ?

    D’autres offres vous correspondent !

    Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

    Postuler