Site Reliability Engineer (SRE) / Ingénieur SRE

CDI
Paris
Télétravail fréquent
Salaire : 45K à 55K €

Discngine
Discngine

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

[FR]

Le poste

En tant que Site Reliability Engineer (SRE), vous contribuerez à la fiabilité, la performance et l’évolutivité des plateformes et applications utilisées par des chercheurs et ingénieurs travaillant sur des problématiques scientifiques complexes.

Selon les projets, vos missions pourront concerner :

  • l’infrastructure interne de Discngine, qui supporte nos produits et services,

  • les environnements techniques de nos clients, principalement des acteurs de l’industrie pharmaceutique et des sciences de la vie.

Vous interviendrez donc dans des contextes variés, allant de l’exploitation de plateformes internes à l’accompagnement technique de clients utilisant nos solutions.

Vous travaillerez à l’interface entre infrastructure, développement et utilisateurs scientifiques, avec un rôle clé dans la compréhension des problèmes rencontrés par les utilisateurs et leur résolution durable.

Missions principales

Fiabilité et exploitation des plateformes

  • Concevoir et maintenir l’infrastructure nécessaire au fonctionnement des applications scientifiques (cloud, conteneurs, services distribués).

  • Mettre en place des pratiques SRE : observabilité, monitoring, alerting, gestion des incidents.

  • Améliorer la disponibilité, la performance et la résilience des services.

  • Automatiser les opérations et les déploiements (CI/CD, infrastructure as code).

Support technique avancé

  • Diagnostiquer et résoudre les incidents complexes en production.

  • Participer à l’amélioration continue des systèmes suite aux incidents (post-mortem, automatisation).

  • Collaborer avec les équipes de développement pour améliorer la robustesse des applications.

Interaction avec les clients et les équipes scientifiques

  • Échanger directement avec les utilisateurs et clients afin de comprendre leurs problématiques et identifier les causes racines des incidents.

  • Participer à l’analyse technique de leurs environnements et workflows.

  • Proposer des solutions techniques adaptées à leurs usages scientifiques.

Environnement technique

  • Linux / Windows

  • Cloud et infrastructures distribuées (AWS / OCI / Azure / GCP)

  • Kubernetes

  • CI/CD

  • Monitoring et observabilité

  • Scripting et automatisation

(la stack exacte dépendra des projets et des besoins des équipes)

[EN]

The Role

As a  Site Reliability Engineer (SRE), you will contribute to the reliability, performance, and scalability of platforms and aplications used by researchers and engineers working on complex scientific challenges.

Depending on the projects, your responsibilities may involve:

  • Discngine’s internal infrastructure, which supports our products and services

  • Our customers’ technical environments, mainly actors in the pharmaceutical and life sciences industries

You will therefore work in a variety of contexts, ranging from operating internal platforms to providing technical support to customers using our solutions.

You will work at the intersection of infrastructure, development, and scientific users, playing a key role in understanding the issues faced by users and ensuring their sustainable resolution.

Main Responsibilities

Platform Reliability and Operations

  • Design and maintain the infrastructure required to run scientific applications (cloud, containers, distributed services)

  • Implement SRE best practices: observability, monitoring, alerting, incident management

  • Improve service availability, performance, and resilience

  • Automate operations and deployments (CI/CD, infrastructure as code)

Advanced Technical Support

  • Diagnose and resolve complex production incidents

  • Contribute to continuous system improvement following incidents (post-mortems, automation)

  • Collaborate with development teams to improve application robustness

Interaction with Clients and Scientific Teams

  • Work directly with users and clients to understand their issues and identify root causes of incidents

  • Participate in the technical analysis of their environments and workflows

  • Propose technical solutions tailored to their scientific use cases

Technical Environment

  • Linux / Windows

  • Cloud and distributed infrastructures (AWS / OCI / Azure / GCP)

  • Kubernetes

  • CI/CD

  • Monitoring and observability

  • Scripting and automation

(The exact tech stack will depend on the projects and team needs)


Profil recherché

[FR]

Compétences techniques

  • Expérience en administration systèmes ou SRE / DevOps.

  • Bonne compréhension des architectures distribuées et cloud.

  • Maîtrise de Linux et des outils d’automatisation.

  • Connaissances en monitoring, logs, observabilité.

Qualités personnelles

  • Goût pour la résolution de problèmes complexes.

  • Capacité à investiguer et analyser les causes profondes d’un incident.

  • Bon relationnel et envie d’échanger avec les utilisateurs pour comprendre leurs problématiques.

  • Esprit d’équipe et capacité à collaborer avec des profils variés.

  • Bonne organisation (et gestion des priorités).

  • Proactivité et autonomie.

Atouts

  • Intérêt pour les sciences, la recherche ou la bioinformatique.

  • Curiosité scientifique et envie de travailler à l’interface entre tech et science.

[EN]

Technical Skills

  • Experience in system administration or SRE / DevOps roles

  • Solid understanding of distributed and cloud architectures

  • Strong command of Linux and automation tools

  • Knowledge of monitoring, logging, and observability

Personal Qualities

  • Strong interest in solving complex problems

  • Ability to investigate and analyze root causes of incidents

  • Good interpersonal skills and a desire to interact with users to understand their challenges

  • Team spirit and ability to collaborate with diverse profiles

  • Good organizational skills and priority management

  • Proactive and autonomous mindset

Nice to Have

  • Interest in science, research, or bioinformatics

  • Scientific curiosity and a desire to work at the interface between technology and science


Déroulement des entretiens

[FR]

1.      Entretien préliminaire de découverte - 30 minutes

Évaluation des attentes mutuelles et des réponses aux questions initiales du candidat et de Discngine.

2.     Entretien de 2h en ligne

Entretien avec l’équipe de recrutement.

3.     Entretien technique à Paris d’une demi-journée.

Un extrait de casier judiciaire vous sera demandé pour consultation par la direction.

[EN]

1.     Preliminary discovery interview - 30 minutes via Teams or phone

Evaluation of mutual expectations and response to the initial questions from both the candidate and Discngine.

2.     2h online interview

3.     Half day interview in Paris

A criminal record extract will be requested for consultation by the management.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Cloud Computing and DevOps”.

Voir toutes les offres