Tato pozice již není k dispozici.

Stage -Data Science- Détection de produits doublons produits

Stáž(6 měsíc/měsíce/měsíců)
Paris
Plat: Neuvedeno
Počáteční datum: 31. srpna 2020
Žádná práce na dálku
zkušenosti: < 6 měsíců
Vzdělání: Magisterský stupeň vzdělání

ManoMano
ManoMano

Máte zájem o tuto nabídku?

jobs.faq.title

Pozice

Popis pozice

ManoMano, entreprise fondée en 2013, est une future licorne et la première marketplace d’e-commerce d’amélioration de l’habitat en Europe (1M d’utilisateurs par jour et 420 M€ de chiffre d’affaires en 2018, > 5 millions de produits).

Dès son lancement, le site ManoMano a développé ses propres algorithmes de machine learning, qui représentent aujourd’hui un vrai avantage compétitif. Les chantiers, nombreux et passionnants, touchent à l’ensemble des activités de l’entreprise. En voici une liste non exhaustive :
Optimisation de l’efficacité des campagnes marketing
Moteurs de recommandation
Moteur de recherche
Catégorisation des produits
Extraction des attributs des produits
Prévision des ventes

La diversité des projets et l’autonomie des data scientists font de ManoMano l’un des meilleurs terrains de jeu de Data Science en France (si ce n’est le meilleur !).

Aujourd’hui, une petite dizaine d’algorithmes sont en production. Ils reposent sur une grande diversité d’approches (business rules, régression linéaire et logistique, gradient boosted trees, product2vect, ..)

Le sujet du stage porte sur la détection de doublons de produits. Les produits en vente sur le site ManoMano proviennent de vendeurs différents: ils n’ont pas les mêmes références produits, ni parfois les mêmes noms et descriptions. Mais pour un utilisateur, il est déroutant de voir deux fois le même produit (par exemple une perceuse Makita 18V), leur seule différence étant qu’ils sont vendus par deux marchands différents.
Pouvoir regrouper les produits permettrait entre autres:
de mutualiser la donnée qu’ils ont acquise (le nombre de notes, le nombre de ventes…), ce qui aiderait nos utilisateurs et notre connaissance des produits
de proposer à nos utilisateurs un choix plus élargi de produits (sur la même page aujourd’hui, il peut y avoir deux produits identiques: on pourrait afficher deux produits distincts)

Le nombre de produits identiques en vente à ce jour est aujourd’hui inconnu, mais certaines expériences utilisateurs démontrent qu’ils sont présent et représentent une proportion non négligeable de notre catalogue. Vu la taille de celui ci (>5M de produits), il est exclu de tous les identifier à la main.

L’objectif dans un premier temps sera d’étudier la faisabilité de ce projet. Si le temps le permet et que les résultats sont satisfaisants, la seconde partie du stage sera orientée vers la mise en production de la détection des doublons, et du calcul de l’impact de cette fonctionnalité pour l’expérience utilisateur via un AB test.


Požadavky na pozici

Etudiant en stage de fin d’études niveau M2 (école d’ingénieur généraliste ou université), tu as plusieurs des qualités suivantes :

une appétence forte pour l’informatique et des bonnes pratiques de software engineering
une capacité à comprendre et modifier le code des programmes existants,
une ou plusieurs expérience(s) significative(s) de Machine Learning en production,
une passion pour l’intelligence artificielle et le Machine Learning avec un vrai enthousiasme pour explorer et apprendre : cours en ligne, papiers de recherche, compétitions Kaggle, portfolio Git, etc.
une compréhension des enjeux de l’entreprise afin de créer et développer de nouvelles solutions adaptées,
une approche pragmatique des problèmes, pour créer des outils utilisables en production rapidement, notamment en s’appuyant sur l’existant,
une capacité à tester et expérimenter,
de la pédagogie pour expliquer des concepts complexes à des audiences non techniques.

Tu feras partie de l’équipe Data Science et auras des contacts fréquents avec les équipes IT et Produit. Tes missions seront transverses à l’ensemble de la société.

Chcete se dozvědět více?

Tato volná pracovní místa by vás mohla zajímat!

Tyto společnosti rovněž nabírají pracovníky na pozici "{profese}".