L'envoi d'un CV est-il obligatoire pour postuler à cette offre ?

Pour postuler à cette offre, l'envoi de votre CV est obligatoire.

Le télétravail est-il possible pour ce poste ?

Le télétravail est autorisé pour ce poste.

Quel est le type de contrat pour ce poste ?

Le contrat pour ce poste est de type {contract_type}.

Une lettre de motivation est-elle obligatoire pour postuler à cette offre ?

La lettre de motivation est obligatoire pour postuler à cette offre.

Une expérience est-elle requise pour cette offre?

Aucune expérience n'est nécessaire pour postuler à cette offre.

Stage Backend: Backend Internship: Crawler/parser des documents au format PDF - Qwant

Cette offre n’est plus disponible.

Qwant

Stage Backend: Backend Internship: Crawler/parser des documents au format PDF

Stage(3 à 6 mois)

Paris, Nice…

Salaire : Non spécifié

Télétravail fréquent

Expérience : < 6 mois

Éducation : Bac +5 / Master

l’année dernière

Qwant

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Mission :
Qwant recherche un étudiant pour un stage de fin d’étude, ouvrant potentiellement sur un recrutement.
Dans le cadre du développement de notre crawler et de notre index web, nous souhaiterions prendre en compte plus de formats textuels qu’actuellement, en commençant par l’ajout du format PDF.
Le stagiaire devra développer un outil de parsing de PDF et l’extraction des signaux dans un format compréhensible par notre index. Une fois collectés, les documents seront intégrer à notre index.

L’équipe:
Tu travailles au sein de l’équipe Core Search, chargée de la maintenance et des évolutions du Moteur de Recherche Web propre à Qwant.

L’équipe est essentiellement composée de Data Scientists, Data Engineers et développeurs backend, intervenant sur des problématiques Big Data et Machine Learning, Information Retrieval et NLP (Traitement du Langage Naturel).

Activités et résultats attendus
Après 2 mois :

Prise en main des outils utilisés par l'équipeParsing des documents au format PDFEvaluation de la solution

Après 5 mois :

Extraire les signaux depuis les documents parsésIndexation des documents dans notre index webSynthèse du travail effectué et analyse des résultats

Tools/technologies

RustVespa indexing and retrieval platform (https://vespa.ai/)Git version control

Profil recherché

Pré-requis
Parcours

Bac+5 / Master

Hard skills

A l’aise avec un langage type Rust ou C++ Être familier avec la programmation asynchrone Programmation sous linux os

Soft skills

Esprit d’équipe et bonne communicationFort esprit académiqueProactivité et agilitéOwnership

Déroulement des entretiens

Entretiens techniques avec l’équipe CoreSearch

Envie d’en savoir plus ?

Rencontrez Jonathan, Full Stack Developer

Découvrez l'entreprise

Explorez la vitrine de l’entreprise ou suivez-la pour savoir si elle vous correspond vraiment !

Explorer l’entreprise

Ils sont sociables

L'entreprise

Qwant

Big Data

84 collaborateurs

Créée en 2013

Âge moyen : 37 ans

25%

75%

Qui sont-ils ?

Lancé en 2013, conçu et développé avec passion en France, Qwant est le moteur de recherche européen qui respecte la vie privée de ses utilisateurs. Afin de garantir la meilleure expérience utilisateur, Qwant s’appuie sur son propre index du Web, des équipes pleines d’audace et sur des technologies innovantes de Machine Learning, et de Natural Language Processing.

Qwant se base sur trois piliers fondamentaux : offrir un service de recherche internet de qualité, offrir une vision responsable du web et au cœur de tout, respecter la vie privée de ses utilisateurs.
Ainsi, l’entreprise ne collecte pas les données personnelles et ne propose aucune publicité ciblée. Les algorithmes de classement des informations garantissent pour chaque requête utilisateur des résultats pertinents qui ne sont pas influencés par la collecte de données personnelles.

Aujourd’hui le moteur de recherche Qwant compte chaque mois près de 6 millions d’utilisateurs dans le monde et répond à plus de 2 milliards de requêtes.
Nous proposons différents services respectant la vie privée de nos utilisateurs : un moteur de recherche Qwant Search, disponible aussi pour les 6-12 ans avec Qwant Junior, une cartographie Qwant Maps, un bloqueur de traqueurs-cookies avec l’extension Qwant VIPrivacy.

Le lieu de travail

Le Petit-Quevilly
Nice
Paris

Culture d’entreprise

Vous souhaitez en savoir plus sur l’entreprise et son histoire ? C’est par ici !

Découvrir

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Développement de logiciels et de sites Web”.

Rakuten Tech in Europe
hier
DevOps – Intern – M/F
Paris
Stage
Diduenjoy
il y a 3 jours
Développeur Back-End (Stage)
Paris
Stage
Télétravail fréquent
NetDevices
il y a 3 jours
Stage dev front ou fullstack JS pré-embauche
Paris
Stage
Télétravail total
Euris
il y a 4 jours
STAGE CHEF DE PROJET LOGICIELS SAAS F/H
Boulogne-Billancourt
Stage
AdvanThink (ISoft)
il y a 9 jours
Stage DataViz et Développement Frontend
Saint-Aubin
Stage
En 1 clic
il y a 11 jours
Stage - Développeur PowerApps
Paris
Stage
Télétravail fréquent