Site Reliability Engineer (SRE) F-M-X

Résumé du poste
CDI
Toulouse
Salaire : 45K à 60K €
Début : 02 juin 2024
Télétravail fréquent
Expérience : > 3 ans
Éducation : Bac +5 / Master
Compétences & expertises
Connaissance des protocoles de sécurité
Sécurité du cloud
Droit du travail
Compétences en communication
Outils d'automatisation
+15

Intent Technologies
Intent Technologies

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Nous ouvrons un poste de Site Reliability Engineer (SRE), en charge de garantir la fiabilité, la disponibilité et la performance de notre plateforme SaaS.

Missions principales

  • Collaborer avec les équipes de développement et d’exploitation pour concevoir et mettre en œuvre des solutions cloud sur notre infrastructure technique (AWS, Kubernetes, MongoDB, Kafka, NodeJS).

  • Maintenir l’infrastructure en utilisant des outils de gestion de configuration et d’automatisation.

  • Assurer l’observabilité des systèmes et la prévention des incidents de production.

  • Résoudre les incidents et gérer les problèmes en collaboration avec les équipes concernées.

  • Produire les KPIs de performance (SLOs)

  • Garantir la sécurité du cloud (posture de sécurité, gestion des vulnérabilités, détection et mitigation des menaces)

  • Gérer les plans de continuité d’activité (PCA) et de reprise d’activité (PRA)

  • Maîtriser les coûts d’exploitation.

  • Promouvoir la culture de l’ingénierie de la fiabilité.

Stack technique

  • Cloud : AWS, OVHCloud

  • Backend : NodeJS, Express, Kafka

  • Storage : MongoDB, S3, Algolia

  • Deployment : Kubernetes, Docker

  • Automation : Ansible, Helm, Terraform

  • Mesh : Istio

  • Monitoring : Datadog, Sentry

Conditions de travail

  • Poste à temps plein.

  • Télétravail partiel (jusqu’à 3 jours par semaine)

  • Horaires flexibles avec possibilité de participer à des astreintes.

  • Bureaux modernes au centre-ville de Toulouse (Village by CA 31), à proximité immédiate de tous les commerces et des transports en communs (métro, bus, tramway)


Profil recherché

  • Maîtrise des systèmes d’exploitation (Linux), des technologies de conteneurisation (Docker, Kubernetes) et des plateformes cloud (AWS).

  • Connaissance des langages de script (Python, Bash, PowerShell) et des outils d’automatisation (Ansible, Terraform, Helm).

  • Expérience avec les outils de surveillance et de gestion des logs (ELK, Datadog), et connaissance des stratégies de prévention des incidents de production et de détection précoce.

  • Connaissance des stratégies de continuité et de reprise d’activité (PCA/PRA)

  • Connaissance des politiques et des procédures de sécurité cloud.

  • Capacité à travailler en équipe et à communiquer efficacement.

  • Esprit d’initiative et capacité à résoudre des problèmes complexes.

  • Diplôme en informatique, ingénierie ou domaine connexe, 3 à 5 ans d’expérience professionnelle dans un rôle similaire.

  • Des certifications professionnelles dans les domaines de l’infrastructure cloud et de l’automatisation sont un plus.


Déroulement des entretiens

Dans le cadre de ce recrutement le processus sera le suivant :

  1. Call/visio avec Alexis (CPTO), pour faire connaissance

  2. Call/visio avec Samuel (Platform architect) pour évaluer vos compétences

  3. Rencontre avec l’équipe tech, pour voir par vous même comment ça se passe

  4. Entretien avec Benjamin (CEO), pour vous souhaiter la bienvenue !

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.