CONTEXTE DU POSTE :
Nous recherchons un Ingénieur DevOps Confirmé pour rejoindre notre équipe technique. Vous serez co-responsable de la conception, du déploiement, et de la gestion des infrastructures cloud, principalement sur Google Cloud Platform (GCP), et des solutions basées sur Kubernetes (GKE). Ce rôle implique non seulement la maîtrise des technologies d’infrastructure et d’automatisation, mais aussi un accompagnement des équipes de développement sur les bonnes pratiques CI/CD et l’utilisation de Docker.
Vous jouerez un rôle clé dans l’implémentation de solutions sécurisées et performantes, tout en garantissant la disponibilité des systèmes critiques en production. Le poste inclut une participation à un système d’astreinte en rotation avec les autres membres de l’équipe, pour assurer une surveillance continue et une intervention rapide en cas d’incident majeur.
Une appétence pour les sujets liés à l’intelligence artificielle (IA) et/ou à la cybersécurité serait un plus.
MISSIONS PRINCIPALES :
- Conception et gestion d’infrastructures Kubernetes : Maintenir et optimiser nos clusters GKE pour garantir la haute disponibilité et la scalabilité des applications.
- Maintenir et faire évoluer le réseau: maintenir VPCs, VPNs, et règles de Firewalling.
- Automatisation des déploiements : Mettre en place et maintenir des pipelines CI/CD avec Cloud Build, Argo Workflows, et autres outils d’automatisation.
- Accompagnement des équipes de développement : Collaborer étroitement avec les équipes de développement pour les aider à optimiser leurs workflows CI/CD, en les guidant sur les meilleures pratiques d’intégration et de déploiement continus avec Docker et les containers.
- Scalabilité des applications : Configurer et optimiser le scaling automatique des applications avec KEDA et Horizontal Pod Autoscaler (HPA) en fonction des besoins en ressources.
- Création et gestion de Charts Helm : Développer, maintenir et gérer des charts Helm pour simplifier et standardiser le déploiement des applications sur Kubernetes.
- Sécurité de l’infrastructure : Mettre en œuvre les meilleures pratiques en matière de sécurité, y compris la gestion des accès, la surveillance des vulnérabilités, et le durcissement des environnements GCE/Docker/Kubernetes.
- Monitoring et observabilité : Implémenter des solutions de monitoring avec Prometheus, Grafana, et la suite ELK (Elasticsearch, Logstash, Kibana) pour surveiller la performance des systèmes et anticiper les incidents.
- Administration des systèmes Linux : Gérer et automatiser les infrastructures sous Linux via Ansible.
- Gestion des bases de données et caches : Optimiser et maintenir des bases de données telles que MongoDB, des systèmes de cache comme Redis, des caches HTTP tels que Varnish et des systèmes de message brokering comme RabbitMQ.
- Gestion des containers et orchestration : Mettre en œuvre et gérer des environnements de containers avec Docker, et accompagner les équipes de développement dans la création et l’optimisation d’images Docker.
- Collaboration inter-équipes : Travailler en étroite collaboration avec les équipes de développement et de produit pour garantir l’intégration fluide des nouvelles fonctionnalités et des mises à jour.
- Participation aux astreintes : Vous participerez à un roulement d’astreintes pour assurer la disponibilité des systèmes en production et intervenir rapidement en cas d’incidents.