Vos missions
Infrastructure & Scalabilité :
Concevoir, construire et maintenir des infrastructures scalables, hautement disponibles et tolérantes aux pannes pour nos services SaaS
Piloter le passage à l’échelle de nos différents clusters (containers, databases, …)
Garantir la continuité opérationnelle des applications en tenant les SLA de performance et disponibilité
Assurer et réduire les RTO (8 h) et RPO (2 h)
Monitoring & Observabilité :
Implémenter et améliorer les systèmes de monitoring, d’alerting et de réponse aux incidents pour garantir des performances optimales et minimiser les temps d’arrêt
Augmenter les capacités d’observabilité de bout en bout (traces, métriques, logs)
Mettre en place des sanity checks automatisés et des dashboards temps réel
Définir et suivre les KPIs de fiabilité (SLIs, SLOs, error budgets)
Incident Management :
Opérer les systèmes et résoudre les problèmes en environnements de production (incidents, administration courante, scaling d’infrastructure, …)
Participer aux rotations d’astreinte pour répondre aux incidents critiques
Réaliser des RCA afin de mettre en œuvre des mesures préventives
Documenter les post-mortems et les runbooks opérationnels
Infrastructure as Code & CI/CD :
Piloter l’amélioration continue de l’automatisation de l’infrastructure, du déploiement et de l’orchestration (Kubernetes, Terraform, Ansible)
Améliorer les workflows de build et de déploiement
Mettre en place des stratégies de déploiement avancées (blue/green, canary deployments)
Durcir les critères de qualité et de sécurité dans les pipelines CI/CD (GitHub Actions)
Développer des outils et scripts d’automatisation pour améliorer l’efficacité des processus DevOps
Résilience & Disaster Recovery :
Concevoir et réaliser les tests du Plan de Reprise d’Activité (DRP/BCRP)
Améliorer et outiller les stratégies de backup incrémentaux et leur restauration
Implémenter des mécanismes d’auto-diagnostics, health checks et recovery automatiques
Sécurité & Compliance :
Durcir la sécurité dans les étapes de fabrication (CVE scan, supply chain attacks, scan de conteneurs)
Veille active de sécurité
Améliorer les capacités de détection et prévention d’intrusion
Assurer le suivi et l’application des patchs de vulnérabilités
Garantir la conformité aux standards de l’industrie et aux réglementations et certifications (RGPD, ISO 27001, SecNumCloud, …)
Culture & Collaboration :
Collaborer étroitement avec les équipes de développement pour concevoir et implémenter des solutions favorisant la fiabilité, l’observabilité, la performance et la sécurité dès la conception
Participer à la documentation des processus et procédures pour assurer la cohérence et le partage de connaissances
Participer au chapter DevOps qui réunit des acteurs de toutes les squads produit de Whoz pour améliorer de manière continue nos process et nos méthodes DevSecOps
Contribuer à des projets open-source, publications techniques ou conférences
Notre stack technique ⚙️
Hébergement & Cloud :
Hébergeurs : OVH, AWS
Infrastructure cloud : VMware, AWS, OpenStack
Conteneurisation & Orchestration :
CI/CD & Automatisation :
GitHub Actions
Infrastructure as Code : Ansible, Terraform
Observabilité & Monitoring :
Datadog
ELK Stack (Elasticsearch, Logstash, Kibana)
Bases de données :
MongoDB, Neo4J, Elasticsearch
PostgreSQL, RDS
Messaging & Streaming :
Kafka
Flink
Frameworks :
Backend : Spring Cloud
Frontend : Angular
Repository management : Nx
Business Intelligence :
Expérience :
5 d’expérience minimum en tant que DevOps Engineer / Site Reliability Engineer (SRE)
Expérience avérée dans l’exploitation de services SaaS en production avec des enjeux de haute disponibilité
Exposition aux problématiques de fiabilité en environnements critiques (RCA, troubleshooting en production, rotations d’astreinte)
Compétences techniques :
Expérience approfondie en Infrastructure as Code : Ansible, Terraform (obligatoire)
Maîtrise de Kubernetes et des outils d’orchestration de conteneurs
Expérience pratique avec les pipelines CI/CD (GitHub Actions, GitLab CI, Jenkins)
Solide expérience avec les outils de monitoring et observabilité (Datadog, New Relic, Dynatrace, Prometheus, Grafana, ELK Stack, …)
Excellentes compétences en scripting pour l’automation et le développement d’outils
Compréhension approfondie des concepts de networking, sécurité et administration système
Expérience de travail avec des KPIs de fiabilité (SLIs, SLOs, SLAs, error budgets)
Pragmatisme : Vous recherchez sans relâche la solution la plus pragmatique pour une production élégante en environnement contraint
Curiosité : Vous faites preuve d’une grande curiosité et d’ouverture d’esprit face aux nouvelles technologies
Résolution de problèmes : Excellentes capacités d’analyse et de résolution de problèmes complexes
Communication : Excellentes compétences en communication pour collaborer efficacement avec les équipes produit et support
Autonomie : Capacité à travailler de manière autonome dans un environnement dynamique et en croissance rapide
Esprit d’équipe : Vous êtes motivé(e) par le partage de connaissances et l’amélioration collective
Diplôme d’ingénieur ou Master en informatique, ingénierie ou domaine connexe
Aisance d’utilisation des LLM / AI Agents
Expérience avec des environnements multi-cloud (AWS, VMWare, GCP)
Connaissance des systèmes de bases de données NoSQL (MongoDB, Neo4J, Elasticsearch) et de streaming (Kafka)
Expérience avec des frameworks backend JVM
Contributions à des projets open-source ou participation à des conférences techniques
Certifications pertinentes (CKA, AWS Solutions Architect, etc.)
Pourquoi nous rejoindre ?
Un environnement stimulant :
Intégrer un environnement de travail bienveillant, solidaire, propice à l’épanouissement personnel et professionnel
Rejoindre une scale-up en forte croissance avec une dimension internationale (115+ pays)
Travailler sur des enjeux techniques stimulants à l’échelle (800 k+ talents)
Avoir un impact direct sur la fiabilité et les performances d’une plateforme utilisée par les leaders du marché
Notre culture :
Les maîtres-mots sont Trust, Engagement, Ambition & Mastery (TEAM)
Accompagnement et lead de la transformation agentique pour assurer la pérennité de l’entreprise et l’employabilité des Whozzies
Faire partie d’un collectif où chaque voix compte et où chacun est acteur de la réussite du groupe
Une culture de l’innovation, de l’excellence et de l’amélioration continue
Un environnement qui valorise le partage de connaissances et l’apprentissage
Développement professionnel :
Un onboarding soigné pour bien démarrer votre aventure
Des opportunités de développement professionnel et de montée en compétences
La possibilité de participer à des conférences et de contribuer à l’open-source (Whoz publie Coday, son framework agentique)
Une équipe technique passionnée avec qui échanger et progresser
Notre processus de recrutement est conçu pour être transparent, respectueux et vous permettre de découvrir Whoz autant que nous apprenons à vous connaître :
📞 Premier échange avec notre Talent Acquisition Manager (30-45 min)
Faisons connaissance et discutons de vos attentes et de notre culture
💻 Entretien technique avec notre Lead DevOps et un DevOps/SRE Senior (60-90 min)
Approfondissons ensemble vos compétences techniques et votre expérience
🎯 Entretien avec notre CTO (45-60 min)
Discutons vision technique, architecture et enjeux stratégiques
🤝 Dernier échange avec notre CEO (30-45 min)
Discutons de la vision de Whoz
Welcome on board ! 🎉
Chez Whoz, la diversité et l’inclusion sont des piliers fondamentaux. Nous sommes convaincus que la richesse des expériences et des perspectives contribue à notre réussite collective. Tous nos postes sont donc ouverts aux travailleurs handicapés ou considérés comme tels au sens de l’article L5212-13 du Code du travail.
Rencontrez Yannick, Tech lead & data scientist
Rencontrez François, Customer Success Advisor
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.