L'envoi d'un CV est-il obligatoire pour postuler à cette offre ?

Pour postuler à cette offre, l'envoi de votre CV est obligatoire.

Le télétravail est-il possible pour ce poste ?

Le télétravail occasionnel est autorisé pour ce poste.

Quel est le type de contrat pour ce poste ?

Le contrat pour ce poste est de type {contract_type}.

Une lettre de motivation est-elle obligatoire pour postuler à cette offre ?

La lettre de motivation est optionnelle pour postuler à cette offre.

Architecte Réseau – Usine à GPU – AI Factory - Ples Convergence

Ples Convergence

Architecte Réseau – Usine à GPU – AI Factory

Résumé du poste

CDI

Paris

Télétravail occasionnel

Salaire : Non spécifié

Compétences & expertises

Autonomie

Gestion de la documentation

Intégration de technologies

Communication

Compréhension des architectures réseau

+12

il y a 16 heures

Ples Convergence

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Notre client est un acteur Cloud, opérateur souverain et durable de l’Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance.

Nous recherchons un Architecte Réseau. Vous êtes en charge de l’architecture, de l’optimisation et de l’évolution des infrastructures réseaux, systèmes et GPU fabrics alimentant des charges IA critiques (training, fine-tuning, inference).
L’environnement est international, hautement distribué (Europe, Amérique du Nord, Asie) et orienté performance extrême, faible latence et scalabilité horizontale.

Architecture & design de la GPU Fabric :
– Concevoir et faire évoluer des architectures réseau haut débit, faible latence, adaptées aux NVL72 et aux workloads IA massivement parallèles
– Définir les topologies réseau (leaf-spine, fat-tree, dragonfly le cas échéant) pour :
o Interconnexion intra-NVL72
o Scale-out multi-racks / multi-clusters
– Sélectionner et valider les technologies :
o InfiniBand HDR / NDR
o Ethernet Spectrum / RoCEv2
o Dimensionner les fabrics pour des usages IA à très grande échelle (NCCL-heavy,
all-reduce intensif)

Performance, RDMA & communications GPU :
– Piloter le développement, l’optimisation et le tuning des communications RDMA
– Piles RDMA : libibverbs, rdma-core, NVPeerMemory
– Optimisations GPUDirect / GPUDirect-RDMA
– Garantir des transferts GPU ↔ GPU et GPU ↔ NIC à très haute performance, sans
surcharge CPU
– Optimiser les communications collectives :
o NCCL
o MPI / CUDA-aware MPI
o Identifier et lever les goulots d’étranglement réseau, mémoire et CPU/GPU

Intégration Kubernetes & workloads IA :
– Concevoir l’intégration réseau de clusters GPU dans des environnements Kubernetes
– Gérer l’exposition et l’isolation des interfaces RDMA :
o Device Plugin NVIDIA
o Network Operator / CNI avancés
– Garantir le bon fonctionnement des workloads conteneurisés IA :
o Training distribué
o Jobs MPI / NCCL
o Pipelines data → GPU
Exploitation, observabilité & troubleshooting
– Mettre en place et exploiter des solutions de monitoring avancé :
– Latence, bande passante, congestion, erreurs
– Outils : Prometheus, Grafana, NetQ, UFM (ou équivalents)
– Analyser les performances réseau et GPU fabric en production
– Proposer et implémenter :
o Ajustements MTU
o Affinités CPU/GPU
o Tuning NIC, switch et firmware
– Assurer le support niveau 2 / 3 sur incidents critiques
Documentation
– Rédaction de procédures, schémas d’infrastructure
– Mise à jour du wiki Confluence et du CMDB (NetBox)
Veille technologique
– Suivi des évolutions NVIDIA, Mellanox, standards RDMA, Kubernetes
– Proofofconcept sur les nouvelles générations de NIC (RoCE v2, InfiniBand
Enhanced Speed)

Profil recherché

Formation : ingénieur ou équivalent BAC+5.
Expérience professionnelle antérieure :

Expérience professionnelle : Minimum 4 ans d’expérience pratique avec les technologies NVIDIA RDMA (GPUDirect, RoCE, InfiniBand) dans des environnements HPC ou IA.
Compétences techniques souhaitées :
– Solide expérience en architecture réseau HPC / IA / GPU
– Maîtrise avancée de :
o InfiniBand & RoCEv2
o RDMA, GPUDirect, NCCL
o Architectures GPU scale-up / scale-out
– Bonne connaissance de :
o Kubernetes en contexte GPU
o Linux bas niveau (NUMA, IRQ, CPU pinning)
o Capacité à diagnostiquer des problèmes complexes de performance distribuée

Langues : Français et anglais courants (écrit & oral).
Softskills :
– Analyse & résolution de problèmes complexes
– Esprit d’équipe et bonnes capacités de communication
– Autonomie, sens de l’initiative

Déroulement des entretiens

Entretien cabinet de recrutement
Entretiens client

Envie d’en savoir plus ?

Découvrez l'entreprise

Explorez la vitrine de l’entreprise ou suivez-la pour savoir si elle vous correspond vraiment !

Explorer l’entreprise

Ils sont sociables

L'entreprise

Ples Convergence

IT / Digital, Ressources humaines, Recrutement

Âge moyen : 31 ans

Chiffre d'affaires : 1.2 millions euro en 2021

70%

30%

Qui sont-ils ?

PLES Convergence est un cabinet de chasse de têtes dans le secteur du digital, des télécoms et de l’IT. Concrètement, que font-ils? Ils accompagnent leurs clients dans leurs recrutements, en France comme à l’international.
Le Groupe Kering, la FDJ, CANAL+, mais aussi des starts ups et licornes françaises comme Criteo, Mooncard, Ledger…, sont autant de clients qui font confiance au cabinet au quotidien.

En quelques mots, PLES Convergence c’est un environnement responsabilisant pour les passionnés de technologies et de relations humaines.

Le lieu de travail

Paris, Ile-de-France, France

Les +

Psst... On a plein de choses à vous dire sur les avantages que nous offrons à nos employés.

Découvrir

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Ingénierie et administration des réseaux”.

Security Engineer
Akeneo
CDI
Paris, Nantes
Télétravail fréquent
IT / Digital, SaaS / Cloud Services
450 collaborateurs
il y a 18 heures
Ingénieur Model Based Design H/F
Expleo
CDI
Versailles
Télétravail non autorisé
Salaire : 38K €
IT / Digital, Transformation
18 000 collaborateurs
hier
Ingénieur Systèmes
ITINOV
CDI
Levallois-Perret
Télétravail occasionnel
IT / Digital, FinTech / InsurTech
40 collaborateurs
hier
Ingénieur(e) Sécurité WAF/ WEB - Cybersécurité - Île-de-France
Sopra Steria
CDI
Courbevoie
Télétravail fréquent
IT / Digital, Organisation / Management
50 000 collaborateurs
avant-hier
ADMINISTRATEUR SYSTÈMES DE PRODUCTION - PARIS LA DÉFENSE H/F
ORSYS
CDI
Puteaux
Télétravail non autorisé
Salaire : ≥ 24,7K €
IT / Digital, Audit
420 collaborateurs
avant-hier
Senior Manager en transformation des systèmes embarqués F/H
Accenture France
CDI
Paris
IT / Digital, Big Data
800 000 collaborateurs
il y a 3 jours