Nous recherchons un(e) Ingénieur(e) en Implémentation de l’Observabilité (E2E) pour l’IA Générative (GenAI), compétent(e) et proactif(ve), pour concevoir et mettre en œuvre des solutions d’observabilité de bout en bout à travers les plateformes et pipelines d’IA générative. Ce rôle est essentiel pour garantir la transparence, la fiabilité et la performance des systèmes GenAI en intégrant des capacités de surveillance, journalisation, traçage et alertes tout au long du cycle de vie de l’entraînement des modèles à l’inférence et l’interaction utilisateur.
Missions principales :
Architecture & Implémentation de l’Observabilité
Concevoir et mettre en œuvre des cadres d’observabilité pour les systèmes GenAI, y compris les LLMs, les modèles ajustés (fine-tuned) et les pipelines multimodaux, en collaboration avec le Product Owner.
Intégrer la télémétrie à travers les différentes couches : ingestion des données, entraînement des modèles, déploiement et inférence.
Développer des tableaux de bord et des alertes à l’aide d’outils tels que Grafana, Prometheus, OpenTelemetry, Azure Monitor, ou équivalents.
Surveillance & Journalisation
Mettre en œuvre une journalisation structurée et le traçage des composants GenAI (ex : ingénierie des prompts, réponses des modèles, latence, utilisation des tokens).
Assurer la visibilité sur les performances des modèles, les dérives, les taux d’hallucination et les boucles de retour utilisateur.
Intégration & Automatisation
Collaborer avec les équipes MLOps, DevSecOps et les équipes plateformes pour intégrer l’observabilité dans les pipelines CI/CD.
Automatiser les contrôles de santé, la détection d’anomalies et les workflows de réponse aux incidents.
Gouvernance & Conformité
Soutenir la traçabilité des sorties GenAI conformément aux cadres de gouvernance IA de l’entreprise.
Veiller à ce que les solutions d’observabilité respectent les normes de confidentialité des données, de sécurité et d’éthique de l’IA.
Profil recherché :
Bonne compréhension des architectures cloud (Azure, AWS ou GCP – une première expérience est un plus).
Notions de MLOps / IA Générative : familiarité avec les grands modèles de langage (LLM), le fine-tuning, les pipelines d’inférence.
Connaissances de base ou intérêt fort pour des outils d’observabilité : Grafana, Prometheus, OpenTelemetry, Azure Monitor, etc.
Maîtrise de Python et des outils de gestion de configuration (YAML, JSON).
Notions en CI/CD et conteneurisation (Docker, Git, etc.) appréciées.
Bonnes capacités de communication, sens de l’organisation, rigueur
Bon niveau d’anglais professionnel (écrit et oral)
Avantages du stage :
Travail sur des sujets de pointe : immersion dans l’univers de l’IA Générative (GenAI), un domaine en forte croissance et au cœur de l’innovation technologique.
Encadrement de qualité : accompagnement par des experts en MLOps, observabilité et IA pour monter en compétences rapidement.
Vision globale d’un projet IA : participation à toutes les étapes du cycle de vie d’un modèle — de l’entraînement à la mise en production et à la supervision.
Utilisation d’outils et de technologies modernes : OpenTelemetry, Grafana, Azure Monitor, LLMs, pipelines CI/CD, etc.
Environnement stimulant et collaboratif : travail au sein d’équipes pluridisciplinaires (Data, DevOps, SRE, sécurité).
Responsabilisation progressive : missions concrètes, valorisables sur le plan professionnel, avec une vraie contribution aux projets en cours.
Accès aux formations internes / e-learning : pour approfondir les sujets cloud, IA ou DevOps.
Rencontrez Amine, Architecte technique
Rencontrez Denis, Tech Lead
Ces entreprises recrutent aussi au poste de “Engineering Disciplines”.