Mission
Qwant recherche un étudiant pour un stage de fin d’étude, ouvrant potentiellement sur un recrutement.
L’équipe développe plusieurs outils d’extraction d’information automatique afin de modéliser au mieux les documents web, et s’intéresse aussi aux méthodes de synthèse automatique de documents. L’objectif étant de présenter à l’utilisateur final la meilleure description des résultats du moteur de recherche.
Dans ce cadre, il sera demandé au stagiaire NLP de développer un prototype de synthèse de documents adaptée à nos besoins métiers chez Qwant, à savoir aux documents web.
Activités et résultats attendus
Après 2 mois :
Exploration des solutions possibles pour la synthèse de documents web et de leurs évaluationsPrise en main des outils NLP et ML adaptés aux problématiques de mise en production
Après 5 mois :
Analyse et exploration des datasetsEvaluation de plusieurs solutions et mise en place de la solution optimale en mode démo.Synthèse du travail effectué et analyse des résultats
Tools/technologies
Python (PyTorch, sklearn, pandas, Gensim, NLTK, SpaCy, …)Jupyter EnvironmentVespa indexing and retrieval platform (https://vespa.ai/)Git version control
Descriptif de l’équipe
Tu travailles au sein de l’équipe Core Search, chargée de la maintenance et des évolutions du Moteur de Recherche Web propre à Qwant.
L’équipe est essentiellement composée de Data Scientists, Data Engineers et développeurs backend, intervenant sur des problématiques Big Data et Machine Learning, Information Retrieval et NLP (Traitement du Langage Naturel).
Pré-requis
Parcours
Bac+5 : Master à dominante NLP ou domaines associés
Hard skills
PythonBonne connaissance théorique et pratique en data science et plus particulièrement le traitement des données textuelles Maîtrise des fondamentaux du ML Maîtrise des fondamentaux du NLP (word2vec, TF-IDF, modèles de langue contextuels, etc.)Programmation sous linux/mac os
Soft skills
Esprit d’équipe et bonne communicationFort esprit académiqueProactivité et agilitéOwnership
Entretiens avec l’équipe
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres