Data Scientist (NLP, LLM) - stage fin études

Résumé du poste
Stage(4 à 12 mois)
Paris
Salaire : Non spécifié
Début : 28 avril 2024
Télétravail total
Expérience : > 6 mois
Éducation : Bac +5 / Master
Compétences & expertises
Compétences en communication
Planification et organisation
Adaptabilité
Intégration continu
Créativité et innovation
+8

May
May

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

May, start up à impact, est le partenaire santé digital des femmes et des familles.

Concrètement, l’app May c’est une équipe médicale dispo 7/7 jusqu’à 22h dans la poche des (futurs) parents, des outils et des informations éclairantes à chaque étape, de la grossesse à l’entrée à l’école de l’enfant.

A travers May, entreprise à mission, nous poursuivons les objectifs suivants :

  • des parents sereins : aider chacun à devenir le parent qu’il veut être, et à bien vivre le quotidien (mouvementé!) avec un enfant

  • des enfants en bonne santé : Accompagner le bien être des enfants, dans la période tellement clé des 1000 premiers jours

  • un système de santé désengorgé : contribuer à désengorger la médecine de ville

4 ans après sa création, l’app May a aujourd’hui 100K utilisateurs mensuels. Nous éditons principalement deux services : l’application mobile grand public et un logiciel médical pour notre équipe de professionnels de santé. 

La plateforme comprend un chat médical, une interface d’administration, une gestion des plannings et des factures, une bibliothèque de contenu et plusieurs briques d’IA. L’objectif est de permettre aux professionnels de santé et administrateurs d’opérer avec une efficience maximale.

En tant que stagiaire Data Scientist spécialisé.e en NLP et LLM, vos missions consisteront à développer des modèles d’IA pour répondre à plusieurs cas d’usage autour de l’amélioration de l’expérience utilisateur pour les futurs et jeunes parents d’une part, et notre équipe médicale d’autre part. Intégré.e au sein de l’équipe Data, vous serez amené.e à travailler sur divers projets liés à l’analyse, la classification, la suggestion de contenu ou encore la génération de texte. Vous participerez activement aux projets de R&D, tout en étant impliqué.e dans toutes les phases du cycle de déploiement, jusqu’à la mise en production et le suivi des modèles. 

Missions 

  • Améliorer les modèles existants et concevoir de nouveaux algorithmes d’apprentissage, en intégrant les avancées les plus récentes et en veillant à maintenir un niveau conforme aux derniers développements du domaine (LLMs, fine-tuning, RAG, prompt engineering, etc.). 

  • Collaborer avec l’équipe pour proposer et concevoir de nouveaux modèles répondant aux besoins de la plateforme May et de ses utilisateurs.

  •  Participer à l’entraînement, à l’évaluation et au déploiement des modèles.

  • Contribuer au développement de pipelines et de cadres de tests automatisés pour garantir la qualité et la fiabilité des modèles déployés.


Profil recherché

Qualités nécessaires pour le poste 

  • Créativité, curiosité et fort intérêt pour les innovations en IA 

  • Capacité à apprendre rapidement et à s’adapter à de nouvelles technologies ou changements de paradigmes

  • Rigueur et organisation 

  • Aptitude et motivation à communiquer et à échanger avec l’équipe technique et les professionnels de santé 

  • Dynamisme et capacité à prendre des initiatives dans le cadre de ses missions 

Profil recherché

  • Master 2 ou école d’ingénieur avec une spécialisation en Data Science/IA/NLP

  • Bonnes connaissances des méthodes d’analyse de données et des algorithmes d’apprentissage supervisés et non-supervisés

  • Expérience pratique dans le traitement du langage naturel (NLP) pour des applications telles que l’analyse syntaxique, la reconnaissance d’entités nommées (NER), la classification de texte ou l’analyse de sentiments.

  • Connaissance approfondie de Python et des bibliothèques de data science telles que scikit-learn, pandas, NLTK, spaCy, PyTorch et Transformers.

  • Expérience avec l’utilisation de modèles de fondation tels que BERT ou GPT pour le calcul d’embeddings et/ou d’autres tâches.

  • Connaissances sur le fine-tuning de modèle, l’ implémentation de RAG (Retrieval-Augmented Generation), le développement de systèmes de recommandation ou la mise en œuvre de systèmes OCR (Optical Character Recognition). 

  • Familiarité avec les bases de données relationnelles et la manipulation de données SQL.

  • Connaissance des bonnes pratiques de développement logiciel, y compris l’utilisation d’IDE, de git et d’autres outils de gestion de versions.

  • Expérience dans le déploiement et la surveillance de modèles d’IA en environnements de production, avec une connaissance des pratiques MLOps.

  • Affinité pour la recherche appliquée, en particulier dans le domaine de l’IA et de la santé, avec une sensibilité et des connaissances sur les enjeux éthiques associés.

  •  Envie de contribuer fortement à la croissance d’une société à impact et Intérêt pour les enjeux liés à la santé de la femme/parentalité

Conditions du stage

  • Stage basé à Paris centre

  • Télétravail partiel ou total possible

  • Durée du stage : plus de 4 mois


Déroulement des entretiens

Le process de recrutement se déroule en 2 ou 3 étapes :

  • Un premier entretien avec le CTO ou avec notre lead Data Scientist pour échanger autour du poste et ses enjeux, l’expérience du candidat et ses attentes.

  • Suite à ce premier entretien et en fonction des profils, un entretien plus “technique” autour d’une PR, d’un exemple de code ou d’une contribution open-source peut avoir lieu pour “simuler” une tâche que nous traitons quotidiennement et valider la fluidité et la qualité des échanges avec l’équipe.

  • Un dernier entretien de “fit” avec des membres de l’équipe

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres