Développer et optimiser des pipelines de collecte et traitement d’URLs pour analyser des sites web de manière précise.
Identifier et classifier les URLs dupliquées, pertinentes ou peu utiles, y compris dans des applications web modernes (SPA).
Contribuer à des analyses statistiques pour comprendre quelles pages sont réellement visitées et comment améliorer notre mapping des sites web.
Participer à l’amélioration de notre stack IA existante : RAG Chatbot, Graph RAG, et modules de détection de similarité multilingue.
Travailler sur le maintien et le développement de notre infrastructure Python pour assurer performance et scalabilité.
Exploiter et manipuler des graphes de données pour modéliser les relations entre pages, URLs et sites web.
Apporter ton support sur des projets opérationnels et des demandes clients, en mettant à profit tes compétences en data, IA et infrastructure.
Étudiant(e) en dernière année d’école d’ingénieur ou master en data science, data engineering, informatique ou NLP.
Très bonne maîtrise de Python et des bibliothèques data (pandas, numpy, scikit-learn…).
Connaissance ou intérêt pour le scraping web, le traitement de texte et l’analyse de données complexes.
Compétences en NLP : analyse de texte, embeddings, détection de similarité multilingue.
Expérience ou intérêt pour les graphes de données et les modèles relationnels (Graph RAG, knowledge graph, network analysis…).
Bases en CI/CD et gestion de stack technique : compréhension des workflows de déploiement, tests automatisés et intégration continue.
Connaissances générales du web et de son fonctionnement : HTTP, SPA, URL structures, crawling.
Curiosité, autonomie et capacité à proposer des solutions innovantes et concrètes.
Goût pour les environnements dynamiques et tech-driven, où chaque contribution a un impact direct.
Call RH d’environ 15 minutes pour échanger sur ton parcours, tes motivations et répondre à tes questions sur le stage.
Entretien technique avec un membre de l’équipe, incluant un petit test technique pour évaluer tes compétences pratiques en Python, data et NLP.
Rencontrez Lukas, Directeur Marketing
Rencontrez Thomas, Directeur Team Projet 1
These companies are also recruiting for the position of “Données/Business Intelligence”.