Artefact est une société internationale de services autour de la data, spécialisée dans le conseil en transformation data, dont la mission est de transformer la donnée en délivrant des résultats tangibles sur l’ensemble de la chaîne de valeur des entreprises. L’approche unique d’Artefact, qui fait le pont entre la donnée et le business, permet à nos clients d’atteindre leurs objectifs business de façon dédiée et efficace. Nos 800 employés allient leurs compétences pluridisciplinaires au profit de l’innovation business des entreprises. Nos technologies de pointe en Intelligence Artificielle, nos méthodes agiles garantissent le succès des projets IA de nos clients, de la conception au déploiement, jusqu’à la formation et l’accompagnement au changement.
Depuis plusieurs années, nous développons des solutions pour la chaîne logistique de grands acteurs du monde de la distribution, tels que Carrefour, Fortenova, L’Oréal ou encore Danone.
Contexte
Un supermarché propose généralement entre 5000 et 20 000 produits, tandis que la centrale d’achat d’un distributeur en référence plus de 150 000. Les distributeurs doivent donc sélectionner quels produits vendre dans chaque magasin. Historiquement, cette sélection est réalisée manuellement, avec des assortiments standards basés sur l’expérience métier au niveau du magasin ou du distributeur.
Malgré les grandes quantités de données disponibles, celles-ci sont encore trop peu utilisées pour ces prises de décision. Par exemple, les paniers de produits achetés par les clients sont riches en informations sur les préférences et la complémentarité entre produits. Cependant, cette donnée est complexe et difficile à exploiter efficacement.
L’objectif du distributeur est de proposer un assortiment optimal, c’est-à-dire un ensemble de produits à mettre en rayon qui maximise un objectif prédéfini : le revenu final attendu, la marge moyenne ou encore le volume de ventes hebdomadaires [1]. Ce choix dépend de la stratégie du groupe ainsi que des catégories de produits. Le problème est généralement traité en deux étapes successives. La première consiste à estimer l’utilité attribuée par les clients à un produit donné dans un assortiment donné. Cette utilité doit tenir compte des phénomènes de substitution et de cannibalisation entre produits, ainsi que des préférences des clients. La seconde étape consiste à proposer un ensemble optimal de produits à partir des utilités calculées. Cette optimisation prend généralement en compte des contraintes additionnelles définies, par exemple, par les category managers ou la chaîne logistique.
Problématique
Les approches historiques utilisent une représentation linéaire de l’utilité client [2]. Des travaux récents [3] montrent que l’introduction de fonctions non linéaires permet de mieux représenter l’hétérogénéité des clients dans la fonction de décision.
Les réseaux de neurones ont démontré un grand succès dans la compréhension des interactions entre mots ou pixels. En particulier, Word2Vec [4] a permis de créer des représentations vectorielles de mots pertinentes avec une architecture très simple. Plus récemment, les Transformers [6][7] ont révolutionné le traitement du langage, avec une capacité extraordinaire à analyser et générer des textes de plus en plus longs.
Dans ce contexte, nous cherchons à exploiter les données issues des tickets de caisse pour mieux comprendre les interactions entre produits. Avec des milliers de clients par jour, un supermarché dispose de jeux de données à très grande échelle reflétant les préférences d’achat. De premières applications d’architectures de modèles de langage au retail ont permis d’observer de premiers résultats prometteurs [5].
L’objectif du stage sera de poursuivre les travaux en s’appuyant sur des modèles récents de réseaux de neurones (Transformers, modèles génératifs, etc) pour construire de meilleures fonctions décision client.
En particulier, l’ambition est de mieux comprendre comment la présence ou l’absence d’un produit influence le client, et ainsi de construire un assortiment optimal. Les modèles développés pourront être testés sur de vraies données privées issues du retail.
[1] Rooderkerk, Robert P., Harald J. Van Heerde, and Tammo HA Bijmolt. "Optimizing retail assortments." Marketing Science 32.5 (2013): 699-715.
[2] McFadden, Daniel. "Conditional logit analysis of qualitative choice behavior." (1973).
[3] Aouad, Ali, and Antoine Désir. "Representing random utility choice models with neural networks." arXiv preprint arXiv:2207.12877 (2022).
[4] Mikolov, Tomas, et al. "Efficient estimation of word representations in vector space." arXiv preprint arXiv:1301.3781 (2013).
[5]Ruiz, Francisco JR, Susan Athey, and David M. Blei. "SHOPPER: a probabilistic model of consumer choice with substitutes and complements." (2020): 1-27.
[6] Vaswani, Ashish, et al. "Attention is all you need." Advances in neural information processing systems 30 (2017).
[7] Hanzhao Wang, Xiaocheng Li, Kalyan Talluri, “Transformer Choice Net: A Transformer Neural Network for Choice Prediction”, arXiv(2023)
IA - Intelligence Artificielle - Génératif - Machine Learning - Retail - Assortiment - Deep Learning - Recherche
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres