Nous recherchons un Ingénieur Site Reliability (SRE) hautement qualifié et motivé pour rejoindre notre équipe dynamique. Le SRE est responsable de garantir la fiabilité, l’évolutivité et la performance de nos systèmes de production. Ce rôle combine l’ingénierie système et le développement logiciel afin d’automatiser les opérations, répondre aux incidents et améliorer la résilience globale de notre infrastructure.
Responsabilités
Concevoir, construire et maintenir l’infrastructure et les outils pour automatiser les opérations et améliorer la fiabilité.
Surveiller les performances des systèmes, identifier les problèmes potentiels et mettre en place des mesures préventives.
Participer aux rotations d’astreinte pour gérer les incidents et assurer leur résolution rapide.
Développer et maintenir la documentation, y compris les runbooks, procédures et diagrammes systèmes.
Collaborer avec les équipes de développement pour s’assurer que les applications sont conçues pour la fiabilité et l’évolutivité.
Réaliser des analyses des causes racines des incidents et mettre en œuvre des solutions pour éviter leur réapparition.
Mettre en place et améliorer les systèmes de surveillance et d’alerte pour identifier et résoudre les problèmes de manière proactive.
Participer à la planification de la capacité et aux activités d’optimisation des performances.
Ce que nous vous offrons en rejoignant Aive :
L’opportunité unique de joindre une startup en pleine croissance à ambition internationale
Package intéressant : salaire à définir (compétences / expériences)
Une mutuelle AXA employé avec un haut niveau de services et remboursement
Une charte de télétravail équitable et responsable est en place permettant à chacun de travailler depuis leur domicile quand bon leur semble
La carte Swile pour les tickets restaurant
Cette liste n’est pas exhaustive
Qualifications
Diplôme en informatique, en ingénierie ou domaine connexe, ou expérience équivalente.
Solide compréhension de l’administration des systèmes Linux/Unix et des réseaux.
Expérience avec les plateformes cloud (AWS, GCP, Azure, etc.).
Maîtrise des langages de script (Python, Bash, etc.).
Connaissance de Kubernetes.
Excellentes compétences en résolution de problèmes et en dépannage.
Excellentes compétences en communication et en collaboration.
Expérience avec les outils d’Infrastructure as Code (IaC), tels que Terraform.
Connaissance des systèmes de surveillance et de journalisation (Prometheus, Grafana, stack ELK, etc.).
Expérience avec les pipelines et outils CI/CD.
Expérience confirmée (5 ans) en tant que SRE ou dans un rôle similaire.
un premier échange par mail avec un membre de l’équipe pour entrer en relation
un entretien technique, en présentiel ou en visio, avec deux ingénieurs, dont un lead au moins, et un membre d’une autre équipe (2h). Il ne s’agit pas d’un exercice de code.
un échange avec les fondateurs (30m)
une proposition
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.