GenAI E2E Observability Implementation Engineer

Résumé du poste
Stage(6 mois)
Puteaux
Télétravail occasionnel
Salaire : Non spécifié
Début : 31 décembre 2025
Compétences & expertises
Surveillance des opérations
Conteneurisation et orchestration
Communication
Intégration continue
Collaboration et travail d'équipe
+10

Tata Consultancy Services - TCS
Tata Consultancy Services - TCS

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Nous recherchons un(e) Ingénieur(e) en Implémentation de l’Observabilité (E2E) pour l’IA Générative (GenAI), compétent(e) et proactif(ve), pour concevoir et mettre en œuvre des solutions d’observabilité de bout en bout à travers les plateformes et pipelines d’IA générative. Ce rôle est essentiel pour garantir la transparence, la fiabilité et la performance des systèmes GenAI en intégrant des capacités de surveillance, journalisation, traçage et alertes tout au long du cycle de vie de l’entraînement des modèles à l’inférence et l’interaction utilisateur.

Missions principales :

Architecture & Implémentation de l’Observabilité

  • Concevoir et mettre en œuvre des cadres d’observabilité pour les systèmes GenAI, y compris les LLMs, les modèles ajustés (fine-tuned) et les pipelines multimodaux, en collaboration avec le Product Owner.

  • Intégrer la télémétrie à travers les différentes couches : ingestion des données, entraînement des modèles, déploiement et inférence.

  • Développer des tableaux de bord et des alertes à l’aide d’outils tels que Grafana, Prometheus, OpenTelemetry, Azure Monitor, ou équivalents.

Surveillance & Journalisation

  • Mettre en œuvre une journalisation structurée et le traçage des composants GenAI (ex : ingénierie des prompts, réponses des modèles, latence, utilisation des tokens).

  • Assurer la visibilité sur les performances des modèles, les dérives, les taux d’hallucination et les boucles de retour utilisateur.

Intégration & Automatisation

  • Collaborer avec les équipes MLOps, DevSecOps et les équipes plateformes pour intégrer l’observabilité dans les pipelines CI/CD.

  • Automatiser les contrôles de santé, la détection d’anomalies et les workflows de réponse aux incidents.

Gouvernance & Conformité

  • Soutenir la traçabilité des sorties GenAI conformément aux cadres de gouvernance IA de l’entreprise.

  • Veiller à ce que les solutions d’observabilité respectent les normes de confidentialité des données, de sécurité et d’éthique de l’IA.


Profil recherché

Profil recherché : 

  • Bonne compréhension des architectures cloud (Azure, AWS ou GCP – une première expérience est un plus).

  • Notions de MLOps / IA Générative : familiarité avec les grands modèles de langage (LLM), le fine-tuning, les pipelines d’inférence.

  • Connaissances de base ou intérêt fort pour des outils d’observabilité : Grafana, Prometheus, OpenTelemetry, Azure Monitor, etc.

  • Maîtrise de Python et des outils de gestion de configuration (YAML, JSON).

  • Notions en CI/CD et conteneurisation (Docker, Git, etc.) appréciées.

  • Bonnes capacités de communication, sens de l’organisation, rigueur

  • Bon niveau d’anglais professionnel (écrit et oral)

Avantages du stage : 

  • Travail sur des sujets de pointe : immersion dans l’univers de l’IA Générative (GenAI), un domaine en forte croissance et au cœur de l’innovation technologique.

  • Encadrement de qualité : accompagnement par des experts en MLOps, observabilité et IA pour monter en compétences rapidement.

  • Vision globale d’un projet IA : participation à toutes les étapes du cycle de vie d’un modèle — de l’entraînement à la mise en production et à la supervision.

  • Utilisation d’outils et de technologies modernes : OpenTelemetry, Grafana, Azure Monitor, LLMs, pipelines CI/CD, etc.

  • Environnement stimulant et collaboratif : travail au sein d’équipes pluridisciplinaires (Data, DevOps, SRE, sécurité).

  • Responsabilisation progressive : missions concrètes, valorisables sur le plan professionnel, avec une vraie contribution aux projets en cours.

  • Accès aux formations internes / e-learning : pour approfondir les sujets cloud, IA ou DevOps.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Engineering Disciplines”.