May, start up à impact, est le partenaire santé digital des femmes et des familles.
Concrètement, l’app May c’est une équipe médicale dispo 7/7 jusqu’à 22h dans la poche des (futurs) parents, des outils et des informations éclairantes à chaque étape, de la grossesse à l’entrée à l’école de l’enfant.
A travers May, entreprise à mission, nous poursuivons les objectifs suivants :
des parents sereins : aider chacun à devenir le parent qu’il veut être, et à bien vivre le quotidien (mouvementé!) avec un enfant
des enfants en bonne santé : Accompagner le bien être des enfants, dans la période tellement clé des 1000 premiers jours
un système de santé désengorgé : contribuer à désengorger la médecine de ville
4 ans après sa création, l’app May a aujourd’hui 100K utilisateurs mensuels. Nous éditons principalement deux services : l’application mobile grand public et un logiciel médical pour notre équipe de professionnels de santé.
La plateforme comprend un chat médical, une interface d’administration, une gestion des plannings et des factures, une bibliothèque de contenu et plusieurs briques d’IA. L’objectif est de permettre aux professionnels de santé et administrateurs d’opérer avec une efficience maximale.
En tant que stagiaire Data Scientist spécialisé.e en NLP et LLM, vos missions consisteront à développer des modèles d’IA pour répondre à plusieurs cas d’usage autour de l’amélioration de l’expérience utilisateur pour les futurs et jeunes parents d’une part, et notre équipe médicale d’autre part. Intégré.e au sein de l’équipe Data, vous serez amené.e à travailler sur divers projets liés à l’analyse, la classification, la suggestion de contenu ou encore la génération de texte. Vous participerez activement aux projets de R&D, tout en étant impliqué.e dans toutes les phases du cycle de déploiement, jusqu’à la mise en production et le suivi des modèles.
Missions
Améliorer les modèles existants et concevoir de nouveaux algorithmes d’apprentissage, en intégrant les avancées les plus récentes et en veillant à maintenir un niveau conforme aux derniers développements du domaine (LLMs, fine-tuning, RAG, prompt engineering, etc.).
Collaborer avec l’équipe pour proposer et concevoir de nouveaux modèles répondant aux besoins de la plateforme May et de ses utilisateurs.
Participer à l’entraînement, à l’évaluation et au déploiement des modèles.
Contribuer au développement de pipelines et de cadres de tests automatisés pour garantir la qualité et la fiabilité des modèles déployés.
Qualités nécessaires pour le poste
Créativité, curiosité et fort intérêt pour les innovations en IA
Capacité à apprendre rapidement et à s’adapter à de nouvelles technologies ou changements de paradigmes
Rigueur et organisation
Aptitude et motivation à communiquer et à échanger avec l’équipe technique et les professionnels de santé
Dynamisme et capacité à prendre des initiatives dans le cadre de ses missions
Profil recherché
Master 2 ou école d’ingénieur avec une spécialisation en Data Science/IA/NLP
Bonnes connaissances des méthodes d’analyse de données et des algorithmes d’apprentissage supervisés et non-supervisés
Expérience pratique dans le traitement du langage naturel (NLP) pour des applications telles que l’analyse syntaxique, la reconnaissance d’entités nommées (NER), la classification de texte ou l’analyse de sentiments.
Connaissance approfondie de Python et des bibliothèques de data science telles que scikit-learn, pandas, NLTK, spaCy, PyTorch et Transformers.
Expérience avec l’utilisation de modèles de fondation tels que BERT ou GPT pour le calcul d’embeddings et/ou d’autres tâches.
Connaissances sur le fine-tuning de modèle, l’ implémentation de RAG (Retrieval-Augmented Generation), le développement de systèmes de recommandation ou la mise en œuvre de systèmes OCR (Optical Character Recognition).
Familiarité avec les bases de données relationnelles et la manipulation de données SQL.
Connaissance des bonnes pratiques de développement logiciel, y compris l’utilisation d’IDE, de git et d’autres outils de gestion de versions.
Expérience dans le déploiement et la surveillance de modèles d’IA en environnements de production, avec une connaissance des pratiques MLOps.
Affinité pour la recherche appliquée, en particulier dans le domaine de l’IA et de la santé, avec une sensibilité et des connaissances sur les enjeux éthiques associés.
Envie de contribuer fortement à la croissance d’une société à impact et Intérêt pour les enjeux liés à la santé de la femme/parentalité
Conditions du stage
Stage basé à Paris centre
Télétravail partiel ou total possible
Durée du stage : plus de 4 mois
Le process de recrutement se déroule en 2 ou 3 étapes :
Un premier entretien avec le CTO ou avec notre lead Data Scientist pour échanger autour du poste et ses enjeux, l’expérience du candidat et ses attentes.
Suite à ce premier entretien et en fonction des profils, un entretien plus “technique” autour d’une PR, d’un exemple de code ou d’une contribution open-source peut avoir lieu pour “simuler” une tâche que nous traitons quotidiennement et valider la fluidité et la qualité des échanges avec l’équipe.
Un dernier entretien de “fit” avec des membres de l’équipe
Tieto spoločnosti tiež prijímajú pracovníkov na pozíciu "{profesia}".