Senior Data Scientist / ML Engineer

Resumen del puesto
Indefinido
Paris
Salario: 80.000K a 120.000K €
Fecha de inicio: 06 de julio de 2025
Unos días en casa
Experiencia: > 2 años
Formación: Licenciatura / Máster
Competencias y conocimientos
Contenido generado
Capacidad de comunicación
Adaptabilidad
Pytorch
Aws
Python

Bluecoders
Bluecoders

¿Te interesa esta oferta?

Preguntas y respuestas sobre esta oferta

El puesto

Descripción del puesto

À propos de l’équipe :

L’équipe « AI Data » améliore les performances des modèles de langage (LLMs) et des modèles vision-langage (VLMs) à l’aide de techniques de pointe centrées sur les données. Qu’il s’agisse de génération de données synthétiques, de distillation de modèles ou d’alignement sur les préférences humaines et IA, l’équipe développe des jeux de données de haute qualité qui optimisent l'efficacité, le raisonnement et l’adaptabilité des modèles.

L’impact est direct sur l’entraînement et le fine-tuning des systèmes d’IA de pointe. Rejoignez cette équipe pour contribuer à l’optimisation des données dans une IA de nouvelle génération.

Vos missions :

  • Développer et mettre en œuvre des stratégies avancées pour améliorer la performance, l'efficacité et l'applicabilité des LLMs, VLMs et modèles d’action.
  • Générer et enrichir des jeux de données synthétiques multimodaux (texte, images, trajectoires d’action) pour améliorer les capacités des modèles (VQA, comportements d’agents, navigation virtuelle, etc.).
  • Appliquer des techniques de distillation de modèles pour optimiser leur déploiement à grande échelle, notamment en environnement embarqué.
  • Concevoir et affiner des cadres d’évaluation ciblant les cas limites et mesurant les progrès dans divers domaines.
  • Mener des recherches sur l’alignement des données avec les préférences humaines et IA, en mettant en place des boucles de rétroaction pour améliorer la prise de décision des agents.
  • Collaborer étroitement avec des équipes pluridisciplinaires pour intégrer des solutions basées sur les données dans les systèmes LLM, VLM et agents.
  • Se tenir à jour des dernières avancées en matière de stratégie de données IA, de distillation de modèles et d’apprentissage multimodal.

 


Requisitos

Compétences techniques :

  • Solides compétences en programmation Python : calcul parallèle, conception système, déploiements à grande échelle, évaluation de modèles, déploiements sur AWS.
  • Expérience dans le développement et la maintenance de pipelines de données multimodales.
  • Expérience en entraînement et déploiement de LLMs, VLMs ou modèles PyTorch.

Excellentes capacités de communication, aussi bien avec des interlocuteurs techniques que non techniques.

Capacité à s’adapter à un environnement en constante évolution.

Diplôme :

Master ou doctorat en apprentissage automatique, vision par ordinateur, traitement du langage naturel ou domaine connexe.

Bonne compréhension des paradigmes d'entraînement et d’évaluation des modèles multimodaux.

Avantages :

Rejoindre une aventure passionnante au cœur de l’IA de demain, et participer aux débuts d'une startup parmi les plus prometteuses du secteur.

Travailler dans une équipe dynamique, multiculturelle, et entourée de talents de renommée mondiale en intelligence artificielle.

Bénéficier d’une rémunération compétitive.

Accéder à des opportunités de développement professionnel, d’apprentissage continu, et d’évolution de carrière.

¿Quieres saber más?