Cette offre n’est plus disponible.

Data Scientist - Machine learning - Bibliothèque de traitement NLP - Stage

Stage
Bordeaux
Salaire : Non spécifié
Télétravail non autorisé

Thales
Thales

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

QUI SOMMES-NOUS ?

Thales propose des systèmes d’information et de communication sécurisés et interopérables pour les forces armées, les forces de sécurité et les opérateurs d’importance vitale. Ces activités, qui regroupent radiocommunications, réseaux, systèmes de protection, systèmes d’information critiques et cybersécurité, répondent aux besoins de marchés où l’utilisation des nouvelles technologies numériques est déterminante. Thales intervient tout au long de la chaîne de valeur, des équipements aux systèmes en passant par le soutien logistique et les services associés.

La Direction d'Ingénierie Logicielle propose pour son département Augmented Data, la réalisation d'un sujet de stage "Data Scientist - Machine learning - Bibliothèque de traitement NLP ".

Type: Stage

Lieu: Bordeaux-Mérignac (33)

QUI ETES-VOUS?

Vous êtes étudiant(e) en dernière année d'école d'Ingénieurs ou de faculté orienté informatique ?

Vous avez de bonnes connaissances autour des technologies Python, Jupyter Notebook?

Vous avez des connaissances en traitement du langage naturel?

Vous avez des connaissances en traitement de données (pandas, numpy, etc.), en visualisation de données ( matplotlib, seaborn, plotly, etc.) et en machine learning ( scikit-learn, tensorflow, etc) ?

Vous disposez d'un background en mathématiques (statistiques) / scientifique?

Vous faites preuve de curiosité ?

Vous avez la capacité à travailler en équipe ?

Vous parlez anglais?

Alors ce stage est fait pour vous !

CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE:

L’objectif de ce stage est de contribuer à la mise en place d’une bibliothèque de chaines de traitement NLP génériques (prétraitement, extraction d’entités nommées, etc.) en l’enrichissant avec des algorithmes basés sur différentes techniques : modèle probabiliste, modèle séquentiel, mécanisme d’attention. Une part importante du stage sera consacrée au développement de cas d’usage démontrant la valeur ajoutée des nouveaux algorithmes introduits dans ces bibliothèques.

Vous serez intégré(é) au sein d’une équipe de data scientists et encadré par un responsable technique, vous aurez pour mission de développer des algorithmes de machine learning orientés NLP .

En nous rejoignant, vous vous verrez confier les missions suivantes:

- Définir un état de l’art des techniques actuellement utilisées en NLP (représentations des données, classe d’algorithmes, complexité dans la mise en oeuvre)

- Sélectionner les algorithmes les plus pertinents à mettre en œuvre à l’issue de l’état de l’art

- Pour chaque algorithme retenu, définir un cas d’usage pertinent illustrant la plus-value de l’algorithme

- Pour chaque algorithme retenu, implémenter une chaine de traitement NLP complète (preprocessing, entrainement du modèle)

- Définir une méthode d’évaluation des modèles obtenus et analyser les résultats

L'objectif étant d'enrichir une bibliothèque de chaine de traitements NLP génériques avec de nouveaux algorithmes et participer au développement d’une bibliothèque utilisant des méthodes de transfer learning afin de spécialiser les algorithmes NLP sur des thématiques particulières.

Innovation, passion, ambition : rejoignez Thales et créez le monde de demain, dès aujourd’hui.

Envie d’en savoir plus ?