Cette offre n’est plus disponible.

Stage Recherche: NLP/Analyse Synthèse de Document Web

Stage(3 à 6 mois)
Salaire : Non spécifié
Télétravail fréquent
Éducation : Bac +5 / Master

Qwant
Qwant

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Mission

Qwant recherche un étudiant pour un stage de fin d’étude, ouvrant potentiellement sur un recrutement.

L’équipe développe plusieurs outils d’extraction d’information automatique afin de modéliser au mieux les documents web, et s’intéresse aussi aux méthodes de synthèse automatique de documents. L’objectif étant de présenter à l’utilisateur final la meilleure description des résultats du moteur de recherche.

Dans ce cadre, il sera demandé au stagiaire NLP de développer un prototype de synthèse de documents adaptée à nos besoins métiers chez Qwant, à savoir aux documents web.
Activités et résultats attendus
Après 2 mois :

Exploration des solutions possibles pour la synthèse de documents web et de leurs évaluationsPrise en main des outils NLP et ML adaptés aux problématiques de mise en production

Après 5 mois :

Analyse et exploration des datasetsEvaluation de plusieurs solutions et mise en place de la solution optimale en mode démo.Synthèse du travail effectué et analyse des résultats

Tools/technologies

Python (PyTorch, sklearn, pandas, Gensim, NLTK, SpaCy, …)Jupyter EnvironmentVespa indexing and retrieval platform (https://vespa.ai/)Git version control

Descriptif de l’équipe

Tu travailles au sein de l’équipe Core Search, chargée de la maintenance et des évolutions du Moteur de Recherche Web propre à Qwant.

L’équipe est essentiellement composée de Data Scientists, Data Engineers et développeurs backend, intervenant sur des problématiques Big Data et Machine Learning, Information Retrieval et NLP (Traitement du Langage Naturel).


Profil recherché

Pré-requis
Parcours

Bac+5 : Master à dominante NLP ou domaines associés

Hard skills

PythonBonne connaissance théorique et pratique en data science et plus particulièrement le traitement des données textuelles    Maîtrise des fondamentaux du ML    Maîtrise des fondamentaux du NLP (word2vec, TF-IDF, modèles de langue contextuels, etc.)Programmation sous linux/mac os

Soft skills

Esprit d’équipe et bonne communicationFort esprit académiqueProactivité et agilitéOwnership

Déroulement des entretiens

Entretiens avec l’équipe

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres