Nous ouvrons un poste de Site Reliability Engineer (SRE), en charge de garantir la fiabilité, la disponibilité et la performance de notre plateforme SaaS.
Collaborer avec les équipes de développement et d’exploitation pour concevoir et mettre en œuvre des solutions cloud sur notre infrastructure technique (AWS, Kubernetes, MongoDB, Kafka, NodeJS).
Maintenir l’infrastructure en utilisant des outils de gestion de configuration et d’automatisation.
Assurer l’observabilité des systèmes et la prévention des incidents de production.
Résoudre les incidents et gérer les problèmes en collaboration avec les équipes concernées.
Produire les KPIs de performance (SLOs)
Garantir la sécurité du cloud (posture de sécurité, gestion des vulnérabilités, détection et mitigation des menaces)
Gérer les plans de continuité d’activité (PCA) et de reprise d’activité (PRA)
Maîtriser les coûts d’exploitation.
Promouvoir la culture de l’ingénierie de la fiabilité.
Cloud : AWS, OVHCloud
Backend : NodeJS, Express, Kafka
Storage : MongoDB, S3, Algolia
Deployment : Kubernetes, Docker
Automation : Ansible, Helm, Terraform
Mesh : Istio
Monitoring : Datadog, Sentry
Poste à temps plein.
Télétravail partiel (jusqu’à 3 jours par semaine)
Horaires flexibles avec possibilité de participer à des astreintes.
Bureaux modernes au centre-ville de Toulouse (Village by CA 31), à proximité immédiate de tous les commerces et des transports en communs (métro, bus, tramway)
Maîtrise des systèmes d’exploitation (Linux), des technologies de conteneurisation (Docker, Kubernetes) et des plateformes cloud (AWS).
Connaissance des langages de script (Python, Bash, PowerShell) et des outils d’automatisation (Ansible, Terraform, Helm).
Expérience avec les outils de surveillance et de gestion des logs (ELK, Datadog), et connaissance des stratégies de prévention des incidents de production et de détection précoce.
Connaissance des stratégies de continuité et de reprise d’activité (PCA/PRA)
Connaissance des politiques et des procédures de sécurité cloud.
Capacité à travailler en équipe et à communiquer efficacement.
Esprit d’initiative et capacité à résoudre des problèmes complexes.
Diplôme en informatique, ingénierie ou domaine connexe, 3 à 5 ans d’expérience professionnelle dans un rôle similaire.
Des certifications professionnelles dans les domaines de l’infrastructure cloud et de l’automatisation sont un plus.
Dans le cadre de ce recrutement le processus sera le suivant :
Call/visio avec Alexis (CPTO), pour faire connaissance
Call/visio avec Samuel (Platform architect) pour évaluer vos compétences
Rencontre avec l’équipe tech, pour voir par vous même comment ça se passe
Entretien avec Benjamin (CEO), pour vous souhaiter la bienvenue !
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.