Au sein de l’équipe de R&D d’Angers, tu contribueras au projet « AI for Compliance », dédié à l’utilisation de modèles de langage de grande taille (LLM) pour analyser des documents techniques et juridiques.
L’objectif principal du projet est de comprendre et structurer le contenu des documents techniques et juridiques, et de définir des règles permettant de vérifier que le code respecte les exigences techniques et réglementaires. Le stage permettra de mettre en place des méthodes d’analyse et de reporting automatisées, en exploitant les LLM pour la compréhension et le raisonnement sur des documents complexes.
Analyser des documents techniques et juridiques pour extraire exigences, contraintes et règles de conformité.
Définir et formaliser des règles de validation afin de vérifier la conformité du code avec les documents du projet.
Concevoir et implémenter des pipeliness NLP exploitant des LLM, incluant :
RAG avec des LLM de base (GPT-4, LLaMA) pour comprendre les documents et raisonner sur des documents longs ou multiples.
LLM orientés code (StarCoder, Code LLaMA) pour vérifier le code par rapport aux exigences extraites.
Prompt engineering, fine-tuning et chaînes de raisonnement pour optimiser l’extraction, le raisonnement et la vérification de conformité.
Évaluer, valider et optimiser les résultats produits par les modèles pour garantir précision, fiabilité et couverture.
Solides connaissances en Traitement Automatique du Langage Naturel (NLP) et LLM.
Connaissance de l’analyse de documents techniques et juridiques.
Maîtrise de Python et des frameworks NLP tels que Hugging Face Transformers, spaCy ou LangChain.
Compréhension des bonnes pratiques de développement logiciel et des workflows de projet.
Capacité à formaliser des règles et à raisonner sur des exigences complexes.
Curiosité, rigueur et capacité à travailler en équipe.
Tu passeras un entretien avec le responsable R&D d’Angers ainsi que la Responsable IA d’iDAKTO.
Rencontrez Marine, Legal Manager
Rencontrez Hassan, CEO