Rattaché au responsable de l'équipe SRE (Site Reliability Engineering), vous gérez la production opérationnelle d'applications critiques en haute disponibilité. Vous assurez la gestion du quotidien de la production, des évolutions techniques et fonctionnelles, des incidents, et le reporting dans le respect des SLA.
Enfin, vous vous intégrez dans une démarche d'anticipation et d'industrialisation des processus et outils.
A ce titre, vos missions principales sont :
• Organiser les rituels de l'équipe et la répartition des taches pour délivrer les projets et le support
• Gérer les améliorations des outils de la plate-forme et être force de proposition pour définir une roadmap
• Etre le référent technique de l'équipe et l'aider à se développer et s'améliorer techniquement et opérationnellement
• Participer à la maintenance et l'évolution des outils des plates-formes dans un contexte Kubernetes/Docker (incluant le déploiement d'une stack Kubernetes sur un IaaS)
• Gérer différents environnements environnement déployés en DC privé & Cloud public
• Piloter et maintenir en condition opérationnelle les plates-formes en s'assurant de leur disponibilité et performance conformément aux engagements SLA
• Fournir une expertise technique sur les outils utilisés dans le cadre de la chaine de déploiement continue, du monitoring.
• Fournir un support et une assistance continue aux clients internes à travers les astreintes (24/7)
SAVOIR
Issu de formation supérieure, vous justifiez d'une expérience de 6 ans minimum dans le déploiement et les opérations en production de solutions digitales.
SAVOIR ETRE :
- Curieux/force de proposition
- Organisé
- Capacité de synthèse et de reporting
- Autonome
- A l'aise avec les clients et utilisateurs
- Excellent communiquant
- Capacité à exercer dans un environnement transverse et multi-site
- Orienté solutions
SAVOIR FAIRE :
- Logiciels et outils de l'infrastructure UNIX
- Bash
- Architecture et principe réseau distribué
- Processus de développement, test et déploiement logiciels
- AWS/Azure
- Git/Jenkins/Ansible/Saltstack/Terraform
- Docker
- Kubernetes (certification CKA appréciée)
- Grafana/Prometheus/VictoriaMetrics
- Elasticsearch/Loki/Splunk
Sont un plus:
- PKI/cryptographie/Certificats/
- Java
- SQL
- Architecture API
- Pratique ITIL/norme de sécurité SI (ISO 27K)
Rencontrez Clara, alternante en Data Science
Rencontrez Thomas, Développeur web fullstack
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.