STAGE 2026 - Assistant IA Hors-Ligne - F/H

Stage
Boulogne-Billancourt
Salaire : 5,4K à 6K €
Éducation : Bac +5 / Master
Postuler

Berger-Levrault
Berger-Levrault

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

🔍 Sujet : Générateur Intelligent de Packs d'Assistance pour la Maintenance Industrielle Hors-Ligne

 

 

🧩 Contexte :

 

Les techniciens de maintenance interviennent régulièrement dans des environnements totalement déconnectés : tunnels, sous-sols industriels, zones isolées ou sites sécurisés. Dans ces situations, notre assistant IA en ligne (basé sur un LLM déployé sur nos serveurs) devient inutilisable.

Pour dépasser cette limite, CARL développe un assistant IA hors-ligne reposant sur des tiny LLM embarqués (Phi, Gemma Nano, TinyLlama…). Ces modèles ne peuvent être réellement efficaces que s’ils disposent d’un pack d’assistance : un ensemble optimisé de documents, extraits pertinents, historiques, procédures et métadonnées de recherche adaptés à leur capacité de contexte réduite.

Ce pack doit être généré en amont, en combinant :

  • les données issues de la GMAO CARL Source,
  • la documentation technique et les historiques d’intervention,
  • et les capacités de notre assistant IA en ligne (via API interne) pour identifier les sections réellement utiles.

Le format de pack, le modèle d’embedding et le moteur hors-ligne existant seront fournis : le stage se concentre sur la génération et l’optimisation des contenus

 

 

🎯 Objectif :

 

Concevoir et prototyper un système capable de créer automatiquement un pack d’assistance compact, pertinent et exploitable par un tiny LLM hors-ligne, à partir :

  • de l’analyse d’un ordre de travail,
  • de la sélection intelligente des contenus pertinents,
  • de la génération des embeddings, index et métadonnées nécessaires au moteur offline.

 

🛠️ Missions :

 

1. Sélection de contenu

  • Analyser l’OT (Ordre de travail) pour identifier les besoins documentaires.
  • Extraire les sections pertinentes (PDF, images, historiques).
  • Utiliser l’assistant IA en ligne pour obtenir résumés et extraits ciblés.
  • Fusionner et filtrer ces contenus pour ne conserver que l’essentiel.

2. Construction du pack hors-ligne

  • Générer embeddings et index locaux (modèles fournis).
  • Structurer le pack dans le format standard du moteur offline.
  • Préparer le chunking adapté aux tiny LLMs.

3. Optimisation

  • Compresser et réduire la taille.
  • Dédupliquer et prioriser les contenus.
  • Mettre en place des indicateurs simples de qualité.

4. Tests

  • Tester le pack dans l’assistant hors-ligne existant.
  • Vérifier pertinence, cohérence et temps de réponse.
  • Valider le comportement sur mobile.

Extensions possibles

  • Packs multi-interventions.
  • Mises à jour incrémentales.
  • Scoring qualité avancé.

 

 

Livrables

  • Prototype fonctionnel du générateur de packs
  • Pipeline d’extraction et de sélection de contenu
  • Spécification du pack (structure, index, métadonnées)
  • Rapport d’optimisation
  • Jeux de tests et résultats de compatibilité
  • Documentation d’intégration

 

Les plus de ce stage :

  • Travail direct sur embeddings, index vectoriels, chunking et pipelines documentaires
  • Possibilité d’accès à une thèse CIFRE / doctorat sur les tiny LLM et l’Edge AI

Profil recherché

  • Vous êtes étudiant en Informatique, Génie Logiciel ou Data Engineering et vous recherchez un stage de 6 mois débutant au printemps 2026.
  • Vous avez une excellente maîtrise de Python.
  • Vous possédez des compétences en traitement documentaire, NLP ou indexation.
  • Vous comprenez les contraintes mobiles (stockage, mémoire).
  • Vous avez des notions en RAG, embeddings et chunking.
  • Vous vous intéressez à l’Edge AI / IA embarquée.
  • Vous connaissez les environnements industriels ou la GMAO.

Déroulement des entretiens

  • Postulez via notre espace candidat.
  • Si votre profil nous fait lever un sourcil, attendez-vous à recevoir un appel pour un premier échange téléphonique
  • Vous avez réussi à piquer notre curiosité ! Attendez-vous à ce qu'on vous propose un deuxième échange, que ce soit à distance ou dans nos locaux. Et naturellement, on ne vous laissera pas en plan, vous aurez une réponse de notre part, que cela soit positif ou négatif
  • DIVERSITE ET INCLUSION : CHEZ NOUS, C’EST PLUS QU’UNE POLITIQUE, C’EST UNE FORCE !

    Nous nous engageons à :

  • Accueillir et intégrer les talents uniques des personnes en situation de handicap
  • Cultiver une culture d'inclusion où la différence est valorisée
  • Sensibiliser et accompagner nos équipes aux enjeux de diversité
  • Parce que la singularité de chacun est une richesse, nous mettons tout en place pour que chaque collaboratrice et collaborateur puisse s'exprimer et s'épanouir pleinement.

    Envie d’en savoir plus ?

    D’autres offres vous correspondent !

    Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

    Voir toutes les offres
    Postuler