SRE Network BareMetal

CDI
Paris
Salaire : Non spécifié
Postuler

OVHcloud
OVHcloud

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

SRE Network BareMetal H/F/N

Au sein de votre équipe #OneTeam

  • Au sein du groupe Infrastructure, rejoindre l’équipe en charge de soutenir l’ambition et la croissance d’OVHcloud en mettant à l’échelle, déployant, opérant et gérant toutes les infrastructures réseau, tout en supportant les services réseau associés.
  • En tant que Site Reliability Engineer, vous contribuerez à construire une plateforme résiliente, scalable et efficiente en réduisant les coûts opérationnels et en favorisant l’excellence des services.


Vos principales responsabilités
  • Évaluer et prioriser les incidents affectant l’infrastructure et les plateformes logicielles d’OVHcloud
  • Dépanner les problèmes techniques complexes et coordonner les efforts interfonctionnels pour les résoudre
  • Proposer et mettre en œuvre les meilleures pratiques pour garantir que les incidents sont traités de manière permanente et ne se reproduisent pas
  • Participer aux rotations d’astreinte pour assurer la continuité des services
  • Collaborer avec les équipes de développement et d’infrastructure pour éliminer les goulots d’étranglement, améliorer les performances et réduire les coûts opérationnels
  • Contribuer aux revues post-incidents et aux post-mortems
  • Fournir un support technique aux propriétaires d’applications et aux parties prenantes des pipelines CI/CD
  • Travailler dans un environnement d’infrastructure IT fortement orienté réseau


Votre futur impact

Dans 6 mois
  • Vous gérerez les incidents de manière autonome, en apportant des solutions concrètes et durables. Vous aurez contribué activement aux astreintes et maîtrisé nos outils de monitoring.
  • Vous aurez identifié et commencé à résoudre des points faibles précis de l’infrastructure, notamment via des automatisations en Python ou Go.
  • Vous serez un membre essentiel de l’équipe, apportant votre expertise lors des revues post-incidents et soutenant les équipes applicatives.


Et dans 1 an
  • Vous piloterez des projets majeurs pour améliorer la performance et réduire les coûts, en intégrant des solutions SRE avancées et en étant un référent technique.
  • Vos contributions auront un impact direct sur la stratégie d’infrastructure. Vous partagerez votre savoir et contribuerez à faire évoluer les pratiques d’excellence au sein d’OVHcloud.
  • Vous maîtriserez en profondeur l’écosystème réseau et logiciel, capable de résoudre les défis les plus complexes et de proposer des améliorations structurelles.


Compétences requises :
  • Vous maîtrisez l’anglais et le français, tant à l’écrit qu’à l’oral
  • Vous avez une solide connaissance des systèmes internes Unix/Linux
  • Vous êtes compétent en développement logiciel (Python, Go, Perl)
  • Vous avez de l’expérience dans l’exploitation de systèmes distribués
  • Vous êtes familier avec les technologies de conteneurisation (Docker, Kubernetes)
  • Vous avez une bonne compréhension des outils, plateformes et processus liés au CI/CD/CA
  • Vous avez une expérience pratique avec les pipelines de données et les systèmes de messagerie/pub-sub (RabbitMQ, Redis, Kafka)
  • Vous avez une bonne connaissance des outils de monitoring (Prometheus, Grafana) et des meilleures pratiques associées
  • Vous faites preuve d’un solide esprit d’analyse et d’une capacité à résoudre des problèmes complexes.
  • Vous possédez d’excellentes compétences en communication et en collaboration d’équipe
  • Vous êtes enthousiaste à l’idée de travailler sur des infrastructures à grande échelle et à haute disponibilité


C’est un +
  • Vous êtes à l’aise avec les réseaux (la connaissance de VXLAN est un atout)

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Ingénierie et administration des réseaux”.

Voir toutes les offres
Postuler