Cette offre n’est plus disponible.

Ingénieur·e Machine Learning / NLP (Stage)

Stage(6 mois)
Bègles
Salaire : < 700 € par mois
Début : 31 mai 2022
Télétravail fréquent

HelloAsso
HelloAsso

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Notre plateforme Explore est un site web sur lequel le Grand Public peut découvrir, parcourir ou rechercher l’ensemble des associations / activités / projets disponibles sur Helloasso.
Cette plateforme en nom propre a pour objectif de se positionner comme acteur de référence auprès du Grand Public dès lors qu’il s’agit d’activités associatives et d’apporter une source d’audience supplémentaire aux associations.

Les utilisateurs pourront rechercher à la fois des activités ou associations par thématiques (exemple : sport, musique, loisirs, …) ou sous-thématiques (football, tennis, bénévolat, chant, etc.).

Nous cherchons donc à étoffer l’équipe avec une personne spécialisée en intelligence artificielle, et plus particulièrement dans le NLP, afin d’avoir un moteur de recherche pertinent, qui pourra répondre à l’attente de nos utilisateurs.

Actuellement, le modèle utilisé pour les thématiques est en production, mais rencontre des problèmes d’interprétation (94%). Le modèle pour les sous-thématiques est, en partie, en production, mais n’est pas terminé.

Les technologies utilisées pour les 2 modèles sont les suivantes :
thématiques : TF-IDF (scikit learn)
Le dataset utilisé pour l’instant est tiré du journal officiel des associations (opendata) ainsi que quelques données de nos associations catégorisées à la main.
Sous thématiques: RASA (nlu)
Actuellement basé sur des mots clés

Dans ce contexte c’est au sein de l’équipe DevOps que vos missions principales seront de développer les services autour du NLP, d’améliorer leur pertinence et d’en effectuer la maintenance.

Vos missions :

Développement de la solution technique

  • Amélioration des performances : reprise et amélioration des méthodes et algorithmes employés ; analyse détaillée du modèle : robustesse, analyse des cas d’erreur, sensibilités
  • Mise en place de méthodes d’interprétation des résultats : mots impactants, analyse du fond VS forme.
  • Générer un dataset le plus pertinent possible
  • Générer un jeu de test pour vérifier la pertinence du model et s’assurer que le résultat est atteint.

Assurance qualité technique

  • Vous devez garantir la stabilité, la performance, la robustesse et l’évolutivité de votre périmètre technique
  • Sécurisation de l’infrastructure
  • Mise en oeuvre du plan de continuité

Profil recherché

Jeune diplômé(e) ou en dernière année de votre cursus Ingénieur, Master, Jeune Docteur, avec une spécialisation dans le domaine de la Data Science et de l’Intelligence Artificielle, vous souhaitez travailler sur des sujets de pointe en NLP.
Vous êtes curieux(se) avec l’envie d’acquérir de nouvelles connaissances et méthodologies. Doté(e) d’une grande rigueur, vous êtes autonome dans votre travail.
Vous avez une bonne compréhension théorique du Machine Learning (principaux algorithmes, compromis, optimisation, métriques, etc.) et vous connaissez les méthodes usuelles en NLP. Vous maitrisez Python, en particulier les librairies de ML & DL (Numpy, Pandas, Scikit-learn, etc…) et de NLP (Spacy ou autres). La connaissance de RASA est un plus.

Envie d’en savoir plus ?