STAGE - Data Scientist (IA générative, NLP, LLM)

Stage(4 à 12 mois)
Paris
Salaire : Non spécifié
Début : 31 janvier 2025
Télétravail fréquent
Expérience : > 6 mois
Éducation : Bac +5 / Master

May
May

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

May, startup à impact, est le partenaire santé digital dédié aux femmes et aux familles.

Concrètement, l’app May offre un accompagnement médical disponible 7 jours sur 7, jusqu’à 22h, directement dans la poche des (futurs) parents. À chaque étape, de la grossesse aux premiers pas de l’enfant à l’école, nous proposons des outils personnalisés et des informations éclairantes.

En tant qu’entreprise à mission, May poursuit trois objectifs :

  • Des parents sereins : Accompagner chacun dans son rôle de parent, pour vivre sereinement le quotidien souvent mouvementé avec un enfant.

  • Des enfants en bonne santé : Favoriser le bien-être des enfants, notamment durant les 1000 premiers jours, période essentielle pour leur développement.

  • Un système de santé optimisé : Contribuer à désengorger la médecine de ville en offrant une solution complémentaire.

Quatre ans après sa création, May réunit aujourd’hui plus de 100 000 utilisateurs actifs mensuels. Nous éditons deux services principaux : une application mobile grand public et un logiciel médical pour notre équipe de professionnels de santé.

La plateforme comprend divers outils : un chat médical, une interface d’administration, la gestion des plannings et des factures, une bibliothèque de contenu, et des modules d’intelligence artificielle (IA). Notre objectif : permettre aux professionnels de santé d’opérer avec une efficacité maximale.

Stage : Data Scientist spécialisé·e en NLP et LLM

Nous recherchons un·e stagiaire Data Scientist passionné·e par le traitement du langage naturel (NLP) et les grands modèles de langage (LLM). Au sein de notre équipe Data, vous développerez des modèles d’IA pour améliorer l’expérience des futurs et jeunes parents, ainsi que celle de notre équipe médicale. Vous travaillerez sur des projets variés comme l’analyse, la classification, la suggestion de contenu, et la génération de texte.

Vos missions :

  • Optimiser les modèles existants et concevoir de nouveaux algorithmes en s’appuyant sur les dernières avancées technologiques (LLMs, fine-tuning, RAG, prompt engineering, etc.).

  • Collaborer avec l’équipe pour imaginer et développer des modèles adaptés aux besoins spécifiques de la plateforme May et de ses utilisateurs.

  • Participer à l’entraînement, l’évaluation et le déploiement des modèles en production.

  • Contribuer à la mise en place de pipelines et de tests automatisés pour garantir la qualité et la fiabilité des solutions déployées.


Profil recherché

Qualités nécessaires pour le poste 

  • Créativité, curiosité et fort intérêt pour les innovations en IA 

  • Capacité à apprendre rapidement et à s’adapter à de nouvelles technologies ou changements de paradigmes

  • Rigueur et organisation 

  • Aptitude et motivation à communiquer et à échanger avec l’équipe technique et les professionnels de santé 

  • Dynamisme et capacité à prendre des initiatives dans le cadre de ses missions 

Profil recherché

  • Master 2 ou école d’ingénieur avec une spécialisation en Data Science/IA/NLP

  • Bonnes connaissances des méthodes d’analyse de données et des algorithmes d’apprentissage supervisés et non-supervisés

  • Expérience pratique dans le traitement du langage naturel (NLP) pour des applications telles que l’analyse syntaxique, la reconnaissance d’entités nommées (NER), la classification de texte ou l’analyse de sentiments.

  • Connaissance approfondie de Python et des bibliothèques de data science telles que scikit-learn, pandas, NLTK, spaCy, PyTorch et Transformers.

  • Expérience avec l’utilisation de modèles de fondation tels que BERT ou GPT pour le calcul d’embeddings et/ou d’autres tâches.

  • Connaissances sur le fine-tuning de modèle, l’ implémentation de RAG (Retrieval-Augmented Generation), le développement de systèmes de recommandation ou la mise en œuvre de systèmes OCR (Optical Character Recognition). 

  • Familiarité avec les bases de données relationnelles et la manipulation de données SQL.

  • Connaissance des bonnes pratiques de développement logiciel, y compris l’utilisation d’IDE, de git et d’autres outils de gestion de versions.

  • Expérience dans le déploiement et la surveillance de modèles d’IA en environnements de production, avec une connaissance des pratiques MLOps.

  • Affinité pour la recherche appliquée, en particulier dans le domaine de l’IA et de la santé, avec une sensibilité et des connaissances sur les enjeux éthiques associés.

  •  Envie de contribuer fortement à la croissance d’une société à impact et Intérêt pour les enjeux liés à la santé de la femme/parentalité

Conditions du stage

  • Stage basé à Paris centre

  • Télétravail partiel ou total possible

  • Durée du stage : plus de 4 mois


Déroulement des entretiens

Le process de recrutement se déroule en 2 ou 3 étapes :

  • Un premier entretien avec notre Lead ML Engineer pour échanger autour du poste et ses enjeux, l’expérience du candidat et ses attentes.

  • Suite à ce premier entretien et en fonction des profils, un entretien plus “technique” afin d’évaluer la maîtrise des concepts de base de machine learning et de programmation, ainsi que la fluidité et la qualité des échanges avec l’équipe.

  • Un dernier entretien de “fit” avec le CTO

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres