Dans le cadre de ce stage, tu participeras à une étude de faisabilité visant à explorer des approches innovantes pour enrichir et améliorer notre moteur de recommandation. L’objectif est de dépasser les techniques classiques en exploitant plus finement la richesse sémantique de notre catalogue pour offrir une expérience utilisateur encore plus pertinente.
Tes principales missions seront :
Étude de l’état de l’art : Analyser et comprendre les dernières avancées en systèmes de recommandation, avec un focus particulier sur les approches hybrides, l’utilisation de représentations sémantiques (embeddings) et les modèles de langage pour la recommandation.
Investigation et application : Étudier comment des modèles sémantiques peuvent être appliqués pour mieux comprendre notre catalogue de 200 millions d’offres. Tu investigueras leur potentiel pour résoudre des défis clés comme les problèmes de démarrage à froid (cold start), l’amélioration de la découverte de nouvelles offres culturelles et sa mise en place concrète en lien avec les enjeux produits de l’application.
Prototypage des solutions : Développer des premières solutions pour tester la faisabilité de ces approches sur nos données. Tu pourras par exemple travailler sur l’enrichissement de la tour “Item” de notre modèle de Retrieval ou travailler sur des Algorithmes de Bandits sur la partie Ranking.
Implémentation dans notre stack : En fonction des résultats, contribuer à l’implémentation d’une solution validée au sein de notre infrastructure existante.
Ce stage a été conçu avant tout comme un parcours de formation et d’accompagnement.
Notre objectif est de t’accompagner dans ton apprentissage tout en te permettant de comprendre les enjeux réels auxquels nous faisons face en entreprise et au sein d’une squad data science. Ce n’est pas seulement un travail technique, c’est une immersion dans un projet d’envergure, avec un accompagnement personnalisé, afin de te donner une vision claire des défis et des solutions dans un contexte professionnel.
Compétences et savoir-faire recherchés
Connaissances de base en Machine Learning, NLP et une curiosité pour les modèles de langage.
Maîtrise de Python et des bibliothèques associées à l’IA (TensorFlow, PyTorch, Hugging Face, etc.)
Un vif intérêt pour les systèmes de recommandation, la personnalisation et l’analyse de données.
Capacité à apprendre rapidement et à s’adapter à de nouvelles technologies.
Bonnes capacités de communication et travail en équipe.
Stack Technique interne
Infra : GCP (BigQuery, VertexAI, Composer, GKE, …) + Terraform
ML : TensorFlow, Scikit-Learn, Transformers, Hugging Face, …
Data Visualisation : Metabase
Langages : Python, SQL
Entretien avec Daniel, Lead data scientist
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.