Engineering Manager - AI & Infrastructure

Plný úväzok
Nantes
Plat: Neuvedené
Neznáme

OVHcloud
OVHcloud

Máte záujem o túto ponuku?

Otázky a odpovede ohľadne ponuky

Pozícia

Popis pracovnej ponuky

Engineering Manager - AI & Infrastructure H/F/N

Au sein de votre équipe #OneTeam

  • Vous intégrez l’équipe Core IA, qui a à sa charge l’exécution des différentes plateformes que de la conception de nouvelles architectures, l’amélioration de l’automatisation des déploiements / mises à jour / montées de version. L’équipe Core IA crée la magie des solutions d’IA, en tirant le meilleur parti de l’infrastructure OVHcloud et en la mélangeant à une plateforme d’intelligence artificielle de pointe. Du prétraitement à l’inférence, en passant par l’entraînement et les opérations ML, vous serez impliqué dans toute la chaîne de valeur de l’IA.
  • En tant qu’Engineering Manager pour diriger une équipe d’environ 9 experts en IA et Infrastructure. Vous jouerez un rôle crucial dans la définition de la stratégie backend et infrastructure de nos produits d’IA. Votre défi : stimuler l’innovation, assurer l’excellence opérationnelle et aider l’équipe à progresser vers des environnements réglementaires complexes, tels que la conformité SecNumCloud, tout en gérant des services de clusters GPU pour l’entraînement de modèles à grande échelle et en soutenant notre évolution des offres PaaS vers des solutions SaaS complètes.


Vos principales responsabilités

Leadership d’équipe et opérations :
  • Diriger et développer une équipe SRE d’ingénieurs backend et infrastructure (Kubernetes, cloud ops, etc.).
  • Participer aux sprints de livraison (dans une capacité limitée) et prendre part aux rotations d’astreinte.
  • Définir, mettre en œuvre et améliorer continuellement les méthodologies de travail et les cérémonies Agile de l’équipe.
  • Favoriser un fort esprit d’équipe cohésif dans des environnements hybrides et multiculturels.


Orientation stratégique et technique :
  • Servir de liaison entre le département IA et les équipes opérationnelles centrales (NOC, SOC, etc.).
  • Assurer l’alignement entre les décisions techniques et la stratégie globale des produits IA.
  • Garantir la qualité, le coût, le respect des délais et la sécurité des livrables.
  • Piloter la performance à l’aide de KPI techniques et commerciaux clés ; signaler les problèmes et les risques de manière proactive.


Gestion de projets et de ressources :
  • Superviser les ressources humaines et techniques pour atteindre les objectifs de la feuille de route.
  • Gérer les projets techniques en coordination avec les parties prenantes internes.
  • Analyser les échecs techniques et les escalader de manière appropriée.
  • Identifier et promouvoir les opportunités d’amélioration continue et de transformation.


Votre futur impact

Dans 6 mois vous :
  • Vous serez approprié les processus et la méthodologies de l’équipe, veillerez à leur bon respect en vue d’améliorer la qualité et la rapidité des livrables.
  • Aurez développer les relations avec les équipes internes et les parties prenantes sont établies et fonctionnelles, pour faciliter la communication et la collaboration.
  • Représenterez le département AI dans les comités opérationnels, gouvernance et sécurité.


Et dans 1 an
  • Vous aurez mis en place de l’amélioration continue dans les processus de travail et les méthodologies ce qui permettra de réduire davantage les coûts et les délais de livraison.
  • Vous serez reconnue comme une personne clé dans la définition de la stratégie IA de l’entreprise.
  • Vous aurez développer une vision sur les changements nécessaires en termes technologiques et architecturaux pour répondre aux défis du fine-tuning et de la mise à disposition de clusters de calcul.
  • Vous vous serez à l’aise pour gérer tout type d’incident pendant une astreinte.

_

Compétences requises :
  • Expérience solide en gestion de clusters Kubernetes et en opérations d’infrastructure cloud, ainsi qu’en infrastructure as code avec des outils comme Terraform et Ansible.
  • Connaissances approfondies en développement logiciel, avec une préférence pour Golang ou Rust.
  • Compétences avérées en planification, exécution et suivi de projets, en tenant compte des coûts, du temps et de la qualité.
  • Aptitude à définir et analyser des indicateurs de performance pour guider les décisions stratégiques.
  • Excellente communication pour transmettre clairement la stratégie et les priorités.
  • Expérience réussie dans le recrutement, le coaching et le développement de talents techniques.
  • Capacité à comprendre les attentes des clients et à ajuster les priorités des projets en conséquence.


C’est un +
  • Vous avez une expérience avec de la gestion de clusters HPC et GPU.
  • Familiarité avec la conformité et les certifications IT, notamment ISO et HDS.

Chcete sa dozvedieť viac?