Site Relialibity Engineer (F/H)

CDI
Échirolles
Télétravail fréquent
Salaire : 50K à 75K €
Expérience : > 7 ans
Éducation : Bac +5 / Master
Postuler

Eviden
Eviden

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

HPC & AI Eviden est le leader du marché en Europe dans les segments des serveurs et des superordinateurs, reconnu pour ses innovations en intelligence artificielle, cybersécurité et quantique. Nos clients utilisent nos ordinateurs haute performance (HPC) pour des projets cruciaux tels que l'étude du changement climatique, la recherche de vaccins, la décarbonisation et les simulations scientifiques.

L'équipe Software Factory, au cœur de la division R&D HPC & AI, est responsable du développement et de l'exploitation (DevOps) d'une pile complète d'intégration et de livraison continues (CI/CD) pour les équipes de développement logiciel en charge des produits HPC et AI. Actuellement, notre plateforme gère plus de 500 builds par semaine sur une infrastructure hybride, combinant cloud public et laboratoire interne, garantissant une production logicielle entièrement automatisée. Nous recherchons un  Site Reliability Engineer, qui jouera un rôle clé dans la gestion et l'optimisation de notre infrastructure.

 

Vos missions :

  • Assurer la surveillance des systèmes et garantir le bon fonctionnement de l'infrastructure du laboratoire et des clusters HPC & AI ; 
  • Installer, mettre à jour et configurer les logiciels, firmwares et matériels ; 
  • Faire évoluer les architectures système et infrastructure pour intégrer de nouveaux matériels ; 
  • Maintenir une infrastructure de développement internationale à la pointe de la technologie ; 
  • Améliorer le SLA de la plateforme.

 


Profil recherché

Description du profil :

Votre profil 

  • Vous êtes diplômé en informatique  ; 
  • Vous avez une expérience en administration Linux ; 
  • Vous avez de bonnes compétences en programmation & scripting, administration des systèmes, plateformes cloud, conteneurs & orchestration (Docker et Kubernetes), surveillance & observabilité, pipelines CI/CD ; 
  • Vous possedez des connaissances en gestion des incidents, récupération après sinistre & haute disponibilité, meilleures pratiques de sécurité. 

 

Compétences personnelles : 

  • Un bon relationnel : Excellentes compétences en communication verbale et écrite. Vous savez établir un contact efficace avec les différents interlocuteurs ; 
  • Un esprit d’équipe :  Capacité à partager et travailler en équipe, à s’intégrer dans une équipe R&D en contexte Agile ; 
  • Une capacité à switcher du français à l’anglais en temps réel et de manière professionnelle dans le cadre d’animation d’ateliers, de réunions, de rédaction des contenus clairs et pédagogiques.

 

Alors, prêt à relever le défi ?

Vous n’êtes pas loin du but, GO ! Postulez !

 

Voici la suite de l’aventure :

  • Si votre profil correspond aux exigences, notre équipe recrutement vous contactera pour faire connaissance et discuter de l’opportunité ;
  • Vous aurez ensuite un ou deux entretiens opérationnels avec le responsable.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.

Postuler