Site Reliability Engineer (SRE) F-M-X

Job summary
Permanent contract
Toulouse
Salary: €45K to 60K
Starting date: June 02, 2024
A few days at home
Experience: > 3 years
Education: Master's Degree
Skills & expertise
Safety protocols knowledge
Cloud security
Employment law
Communication skills
Automation tools
+15

Intent Technologies
Intent Technologies

Interested in this job?

jobs.faq.title

The position

Job description

Nous ouvrons un poste de Site Reliability Engineer (SRE), en charge de garantir la fiabilité, la disponibilité et la performance de notre plateforme SaaS.

Missions principales

  • Collaborer avec les équipes de développement et d’exploitation pour concevoir et mettre en œuvre des solutions cloud sur notre infrastructure technique (AWS, Kubernetes, MongoDB, Kafka, NodeJS).

  • Maintenir l’infrastructure en utilisant des outils de gestion de configuration et d’automatisation.

  • Assurer l’observabilité des systèmes et la prévention des incidents de production.

  • Résoudre les incidents et gérer les problèmes en collaboration avec les équipes concernées.

  • Produire les KPIs de performance (SLOs)

  • Garantir la sécurité du cloud (posture de sécurité, gestion des vulnérabilités, détection et mitigation des menaces)

  • Gérer les plans de continuité d’activité (PCA) et de reprise d’activité (PRA)

  • Maîtriser les coûts d’exploitation.

  • Promouvoir la culture de l’ingénierie de la fiabilité.

Stack technique

  • Cloud : AWS, OVHCloud

  • Backend : NodeJS, Express, Kafka

  • Storage : MongoDB, S3, Algolia

  • Deployment : Kubernetes, Docker

  • Automation : Ansible, Helm, Terraform

  • Mesh : Istio

  • Monitoring : Datadog, Sentry

Conditions de travail

  • Poste à temps plein.

  • Télétravail partiel (jusqu’à 3 jours par semaine)

  • Horaires flexibles avec possibilité de participer à des astreintes.

  • Bureaux modernes au centre-ville de Toulouse (Village by CA 31), à proximité immédiate de tous les commerces et des transports en communs (métro, bus, tramway)


Preferred experience

  • Maîtrise des systèmes d’exploitation (Linux), des technologies de conteneurisation (Docker, Kubernetes) et des plateformes cloud (AWS).

  • Connaissance des langages de script (Python, Bash, PowerShell) et des outils d’automatisation (Ansible, Terraform, Helm).

  • Expérience avec les outils de surveillance et de gestion des logs (ELK, Datadog), et connaissance des stratégies de prévention des incidents de production et de détection précoce.

  • Connaissance des stratégies de continuité et de reprise d’activité (PCA/PRA)

  • Connaissance des politiques et des procédures de sécurité cloud.

  • Capacité à travailler en équipe et à communiquer efficacement.

  • Esprit d’initiative et capacité à résoudre des problèmes complexes.

  • Diplôme en informatique, ingénierie ou domaine connexe, 3 à 5 ans d’expérience professionnelle dans un rôle similaire.

  • Des certifications professionnelles dans les domaines de l’infrastructure cloud et de l’automatisation sont un plus.


Recruitment process

Dans le cadre de ce recrutement le processus sera le suivant :

  1. Call/visio avec Alexis (CPTO), pour faire connaissance

  2. Call/visio avec Samuel (Platform architect) pour évaluer vos compétences

  3. Rencontre avec l’équipe tech, pour voir par vous même comment ça se passe

  4. Entretien avec Benjamin (CEO), pour vous souhaiter la bienvenue !

Want to know more?