La mission se déroulera au sein du Département Support et Opérations de la DDSI, et plus précisément dans l’entité “ Exploitation des services” qui a pour ambition de mettre en place d’une équipe orientée fiabilité/SRE ayant pour objectif d’aider les équipes Service Delivery à augmenter la disponibilité et la résilience du SI
L’ingénieur(e) fiabilité met en oeuvre des compétences sur la performance applicative et l’administration système. Son rôle principal est d’assurer la fiabilité, la disponibilité, la performance et la sécurité des systèmes informatiques en production.
Responsabilités principales :
- Analyse et Optimisation de la Performance:
- Analyser les performances des systèmes existants et identifier les axes d’amélioration.
- Proposer et mettre en oeuvre des solutions pour optimiser la fiabilité, la disponibilité et la scalabilité de nos infrastructures.
- Suivre les indicateurs de performance clés (SLO, SLA, SLI) et mettre en place des alertes proactives.
- Faire appliquer la Stratégie de Résilience :
- Analyser nos architectures applicatives pour identifier et éliminer les points de défaillance uniques (SPOF).
- Suivre les Objectifs de Niveau de Service (SLO) et les Indicateurs de Niveau de Service (SLI) pour nos applications critiques.
Diffuser les Bonnes Pratiques :
- Maintenir le guide des bonnes pratiques de fiabilité et de résilience pour le développement (build) et l’exploitation (run).
- Faire appliquer les standards pour le monitoring, le logging et l’alerting, en veillant à leur pertinence et à leur efficacité.
- Accompagner les Équipes et Promouvoir la Culture de la Fiabilité :
- Agir référent technique auprès des équipes de développement et d’ops.
- Participer aux revues d’architecture pour garantir que les principes de résilience sont appliqués dès la phase de conception.
- Participer aux analyses post-mortem après les incidents, en assurant le suivi des actions d’amélioration.
Intégrer une Vision d’Architecte de Production :
Assurer une veille technologique sur les outils et les pratiques émergentes en matière de fiabilité (SRE) et de résilience.
Votre profil :
De formation supérieure Bac+5 ou une expérience d’au moins 5 ans dans les métiers de la fiabilité/SRE.
Vous avez une expérience significative en tant qu’Ingénieur Fiabilité (SRE), Ingénieur DevOps, Architecte de Production ou dans un rôle similaire axé sur la fiabilité des systèmes distribués.
Vous justifiez des compétences Techniques dans les domaines :
Bonne maîtrise des environnements Cloud (AWS, GCP ), notamment des services liés à la haute disponibilité et à la scalabilité.
Expérience avec les technologies de conteneurisation
Maîtrise des outils de monitoring et d’observabilité (Dynatrace, splunk, Service Pilote, etc.).
Compétences en développement (Java, Powershell,Bash, … ).
Connaissance des principes de l’Infrastructure as Code (Terraform, Ansible).
Qualités Personnelles :
Bon communicant, pédagogue et capable de vulgariser des concepts techniques complexes.
Sens de la communication et de la pédagogie
Culture de l’amélioration continue et une approche pragmatique de la résolution de problèmes.
* Rigueur, organisation et autonomie.
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.