Administrateur système du supercalculateur Jean Zay et des infrastructures virtuelles de l'IDRIS H/F

Job summary
Permanent contract
Orsay
A few days at home
Salary: Not specified
Education: BAC+3
Skills & expertise
Cybersecurity knowledge
Agile methodologies
Communication skills
Programming languages
IT security
+13
Apply

IDRIS (CNRS)
IDRIS (CNRS)

Interested in this job?

Apply
Questions and answers about the job

The position

Job description

L’IDRIS (www.idris.fr) est le centre national du CNRS pour le calcul numérique intensif de très haute performance (HPC) et l’intelligence artificielle (IA), au service des communautés scientifiques de la recherche. Il héberge, exploite et met à disposition de plus de 3700 chercheurs et ingénieurs les ressources de Jean Zay, l’un des supercalculateurs hybrides accélérés parmi les plus puissants d’Europe. Le poste est ouvert dans l’équipe DTI (Direction Technique Informatique) composée de 16 ingénieurs, dans la composante « Calcul, Stockage et SI ».

La personne recrutée sera placée sous la responsabilité hiérarchique directe du responsable de l’équipe DTI.

Cette fonction ouvre droit à la perception de l’Indemnité de Référence pour les Informaticiens (IRI).

Missions :

Participer au déploiement, à la mise à œuvre, au maintien en condition opérationnelle et à l’administration de l’architecture matérielle et logicielle des plateformes du centre de calcul (supercalculateurs nationaux, infrastructures de virtualisation et autres serveurs).

Activités :

- Déployer, mettre en œuvre et administrer l’architecture matérielle et logicielle des plateformes (supercalculateurs, infrastructures de stockage, de virtualisation, de traitement par lot SLURM et autres serveurs) du centre de calcul.
- Contribuer à l’administration des configurations de calcul, de stockage massif et des machines de services et en assurer un support de niveau 2 aux équipes exploitation et support utilisateurs.
- Gérer et organiser le système de surveillance centralisée (Nagios), en assurant son fonctionnement et son évolution.
- Administrer le système de déploiement automatisé « Ansible », mettre en place des infrastructures de tests de et d’intégration continue nouvelles versions.
- Identifier, justifier et mettre en place des mesures de sécurité issues d’audits des plateformes, renforcer la sécurité des composants critiques.
- Participer aux réunions du groupe sécurité et au groupe de travail visant l’organisation des services mutualisés de l’unité.
- Déployer, administrer et faire évoluer les services facilitant l’organisation et le travail collaboratif au sein de l’unité (GitLab, Mediawiki, service interne d’IA générative, etc.).


Preferred experience

Compétences :

- Maîtrise des concepts et techniques d’architecture des systèmes et réseaux
- Maîtrise de l’administration de serveurs sous Linux et des procédures de sécurité associées
- Maîtrise de l’administration de clusters composés de plusieurs milliers de serveurs
- Connaissance de langages de programmation associés aux systèmes d’exploitation (Bash, Python, Perl, C)
- Expérience de systèmes de virtualisation d¿OS, de conteneurisation (OCI, Singularity, Docker), des outils d’orchestration (Ansible, Kubernetes), notions de déploiement d’infrastructures de cloud computing (Openstack)
- Connaissance du fonctionnement des systèmes de fichiers parallèles répartis (GPFS, Lustre), des réseaux de stockage (SAN, NFS) ainsi que celle des systèmes de traitement par lots (Slurm, LSF)
- Compétences en administration de base de données SQL (type Postgres)
- Connaissance des méthodologies Agile et DevSecOps
- Maîtrise générale des procédures de sécurité informatique
- Maîtrise de l’anglais technique à l’écrit et à l’oral niveau B2 du référentiel européen


Recruitment process

Réservé aux agents CNRS (fonctionnaires et CDI) et aux fonctionnaires et CDI de droit public

Portail Emploi CNRS

Want to know more?

These job openings might interest you!

These companies are also recruiting for the position of “Network Engineering and Administration”.

  • Rakuten Tech in Europe

    Security Architect

    Rakuten Tech in Europe
    Rakuten Tech in Europe
    Permanent contract
    Paris
    Artificial Intelligence / Machine Learning, Big Data
    130 employees

  • Philips Health Technology Innovation Paris

    Senior Security Engineer

    Philips Health Technology Innovation Paris
    Philips Health Technology Innovation Paris
    Permanent contract
    Paris
    Artificial Intelligence / Machine Learning, Connected Objects
    250 employees

  • Gleamer

    Deployment & Support Engineer

    Gleamer
    Gleamer
    Permanent contract
    Paris
    A few days at home
    Software, Artificial Intelligence / Machine Learning
    120 employees

  • AQEMIA

    Spontaneous Application

    AQEMIA
    AQEMIA
    Permanent contract
    Paris
    A few days at home
    Artificial Intelligence / Machine Learning, Pharmaceutical / Biotech
    60 employees

  • Dust

    Spontaneous Application

    Dust
    Dust
    Permanent contract
    Paris
    No remote work
    Artificial Intelligence / Machine Learning, SaaS / Cloud Services
    25 employees

  • Qevlar AI

    Spontaneous application

    Qevlar AI
    Qevlar AI
    Permanent contract
    Paris
    No remote work
    Artificial Intelligence / Machine Learning, SaaS / Cloud Services
    18 employees

Apply