Data Scientist : les clés du métier et les conseils pour réussir

Publié dans Data Scientist

16 févr. 2017

4min

Data Scientist : les clés du métier et les conseils pour réussir
auteur.e

Guidé par sa curiosité, Eric Daoud atterrit en 2016 chez ManoMano, une plateforme de vente en ligne de produits de bricolage et de jardinage, en tant que Data Scientist. Un métier d’avenir qui peut être défini comme : un spécialiste de la donnée, qui la questionne en vue d’optimiser des problématiques Business. Dans le cadre d’un site e-commerce comme ManoMano, le Data Scientist va créer des algorithmes de recommandation intégrés au site, pour guider au mieux les internautes dans leurs achats.

En forte croissance, la startup possède aujourd’hui une valorisation à hauteur de 100M€ et compte une centaine d’employés. Une vraie réussite, au sein de laquelle a évolué Eric ! Comment se déroule son quotidien, quels outils utilise-t-il et quelles bibliothèques (Python) lui sont utiles ? Il nous répond et donne ses meilleurs conseils à tous ceux qui aimeraient, eux aussi, plonger au coeur de la data.

Ecole d’ingénieur, projets extrascolaires, autoformation… Quel parcours t’es-tu bricolé avant d’être recruté chez ManoMano ?

J’ai passé mon bac à Marseille avant de partir faire mes études à l’ECAM, une école d’ingénieurs à Lyon. De quoi avoir de bonnes bases en mathématiques et en logique. J’ai ensuite été pris à Centrale Paris, où j’ai suivi le mastère spécialisé SIO, pour « systèmes informatiques ouverts ». J’ai pu améliorer mes compétences en développement, et découvrir de nouvelles technologies autour du Cloud Computing et du Big Data. Lors de la formation, j’ai mené un projet pour eYeka, le leader mondial du crowdsourcing qui aide des entreprises dans leurs campagnes marketing. Avec mon équipe, nous avons développé une solution algorithmique permettant de grouper des médias par thème en se basant sur la donnée textuelle. C’est grâce à ce projet que j’ai découvert le Machine Learning et le métier de Data Scientist.

A la recherche d'un job de Data Scientist ?

Découvrez les dernières offres et postulez !

Voir les offres

J’ai ensuite entendu parler de ManoMano par le biais d’un chasseur de têtes. Il m’a proposé de postuler. J’ai passé deux entretiens : le premier était une simple discussion autour de mes projets et compétences. le second était plus technique. Il consistait en un test de code et de logique, abordable, complexe juste ce qu’il faut. Une épreuve trop simple m’aurait découragé. J’ai finalement été pris en stage, il y a dix mois déjà ! Depuis, je crée des algorithmes de recommandation pour améliorer l’expérience des utilisateurs et les aider à acheter tout ce dont ils ont besoin pour mener leurs projets à bien.

Une fois engagé chez ManoMano, tu as dû faire tes preuves et affiner tes compétences de Data Scientist. A quels outils as-tu recours pour t’améliorer au quotidien ?

J’ai plusieurs sites de référence, que je consulte régulièrement :

  • Stack Overflow, pour tout ce qui a trait aux problèmes de code
  • Hacker News ou des articles d’experts tels que Xavier Amatriain (passé par Netflix et Quota), pour m’améliorer en algorithmes de recommandation
  • Les publications de recherche, d’employés de Spotify ou Google, sont également assez riches en enseignements

Je me suis aussi inscrit aux groupes Facebook «apprentissage profond» ou «hackathons hackers», qui sont bien utiles pour être se tenir au courant des dernières avancées, et j’essaie, quand j’en ai le temps, d’aller à des meetups. Le NLP Paris Meetup est très intéressant, pour ne citer que lui. La liste est longue finalement !

Pour paramétrer tes algorithmes, tu utilises le langage Python. Quelles bibliothèques te sont le plus utiles pour récupérer des programmes de base ?

J’ai mes préférées. Parmi elles :

  • Scikit-learn comprend beaucoup d’algorithmes standard de Machine Learning, et une API très facile à prendre en main
  • Gensim est plus spécialisé. Il est plutôt orienté Natural Language Processing, à savoir le traitement automatique de texte
  • Pandas est bien utile pour l’analyse de données et permet de créer des dataframes à partir de fichiers csv par exemple et de faire des opérations dessus, ou même de la visualisation.
  • Tensorflow, le framework de Deep Learning par Google, qui devient de plus en plus apprécié et utilisé. Tensorflow est assez polyvalent et grandit très rapidement.

Il y a d’autres frameworks comme Caffe, Torch, Theano, Flask me permet de déployer des API en Python.

A quelles qualités ton métier fait-il appel selon toi ?

Plusieurs qualités me semblent essentielles :

  1. La curiosité et la rigueur, pour concevoir de nouveaux algorithmes, les paramétrer et expérimenter de nouvelles approches sur de nouvelles données, par exemple
  2. Un certain sens de la communication, pour comprendre au mieux les besoins des autres équipes et leur fournir de bonnes solutions algorithmiques; la rigueur, pour ne pas s’éparpiller et coder de façon « propre ».
  3. Enfin, il est incontournable d’avoir une bonne capacité analytique. Pour être efficace, il faut comprendre le fonctionnement d’un algorithme, anticiper son comportement et être à même de savoir s’il pourrait marcher ou non, selon la donnée utilisée en entrée.

Comment qualifierais-tu le contexte de travail ?

Je me plais vraiment bien chez ManoMano, depuis le début, grâce à l’indépendance dont je bénéficie dans mes projets. Je peux les mener de A à Z, ce qui est propre à cette startup mais aussi, tout simplement, à un grand nombre d’autres jeunes pousses en plein développement.

Au début de mon stage, je n’avais pas toutes les compétences techniques. On m’a fait confiance. On m’a guidé et incité à tester. Il a fallu que je trouve les algorithmes et les technologies à utiliser. J’ai été agréablement surpris de voir que l’on ne m’a pas jugé sur mes compétences de départ, qui étaient assez maigres par rapport à ce que je sais faire aujourd’hui. On m’a plutôt jugé sur mes résultats et sur ma capacité à explorer par moi-même. Nous faisons tout pour que cette bienveillance et cette ouverture d’esprit persistent, malgré l’augmentation rapide des effectifs.

Tu es désormais en CDI depuis plusieurs mois. Comment envisages-tu ton avenir ?

Mes prochaines missions consisteront à concevoir des algorithmes de plus en plus performants, qui pourront être utilisés dans de plus en plus de pages du site, mais aussi brasser des données des mails des utilisateurs, qui transitent par le site. A l’avenir, les sites n’auront plus une présentation similaire pour leurs visiteurs, mais varieront en fonction de la personne qui les consulte.

La logique voudrait, qu’à terme, je sois amené à manager d’autres personnes. En espérant que cela permette à ces algorithmes d’avoir de plus en plus d’effets et de gagner encore plus en pertinence.

Suivez Welcome to the Jungle sur Facebook pour recevoir chaque jour nos meilleurs articles dans votre timeline !

Photo WTTJ @ManoMano

Vous êtes à la recherche d’une nouvelle opportunité ?

Plus de 200 000 candidats ont trouvé un emploi sur Welcome to the Jungle.

Explorer les jobs