Cette offre n’est plus disponible.

Stage R&D- Automatisation d'un process de Clustering continue -H/F

Stage
Mulhouse
Salaire : Non spécifié
Télétravail non autorisé
Éducation : Bac +5 / Master

Atos
Atos

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

STAGE Ingénieur R&D Data Science – Automatisation d’un process de Clustering continue et de la Visualisation associé H/F Contact e-mail trong-ton.pham@atos.net lionel.vincent.dm@atos.net

Nous disposons actuellement d’un système de monitoring et de visualisation complet qui nous permet d’enregistrer, en temps réel, de nombreuses métriques relatives au fonctionnement de l’exécution des programmes sur cluster HPC (volume IO, temps des IO, processus actifs, etc.).

L’ensemble des métriques collectées constitue, sous forme de time-séries multivariées, une description du comportement de ces programmes.

Nous avons développé une fonctionnalité de clustering d’applications HPC basé sur la similarité entre les time-séries de différentes applications.

L’utilisateur peut actuellement sélectionner dans sa base un ensemble de runs d’applications, lancer une « Expérience de Clustering » et visualiser les résultats (table, nuages de point 3D) par l’interface web.

Nous souhaiterions améliorer cette fonctionnalité afin que l’utilisateur puisse visualiser dynamiquement l’ajout de nouveaux runs à son « Expérience de Clustering ».

Cela passe par une réflexion autour de l’expérience utilisateur (ex : refonte du mode de sélection de run d’application, nouveau concept de visualisation des résultats, …) et le développement d’une méthode d’automatisation du lancement des calculs en étendant le pipeline de calcul existant.

Dans ce contexte, le groupe Data Management recherche un(e) stagiaire niveau Bac+5 intéressé(e) par les problématiques de Data Engineering et leurs applications à des cas concrets, pour contribuer à la création et au développement d’un processus permettant d’automatiser le lancement d’un pipeline de clustering, afin d’ajouter dynamiquement, à une « Expérience de Clustering » en cours, de nouveaux enregistrements.

Mission

Intégré(e) dans une équipe mixte d’experts IO en HPC et de Data Scientists, vous serez en charge de :

• Réaliser un état de l’art sur les techniques d’apprentissage incrémental avec des méthodes non-supervisés (comme k-means clustering)

• Implémenter un/des algorithme(s) innovant(s) permettant d’appliquer ces méthodes à notre contexte avec des données complexes (séries temporelles avec multiplicité des types des variables)

• Stratégie de stockage de données intermédiaires pour accélérer la vitesse de rendu

• Visualiser l’évolution des clusters en 3D

• Evaluer la qualité des méthodes choisies sur des applications réelles

• Structurer le code produit sous la forme d’une bibliothèque Python de manière à pouvoir l’intégrer à notre moteur de clustering en temps réel Job Requirements


Profil recherché

Actuellement en dernière année du cycle de formation Bac+5 (Ingénieur, Master, …), vous avez une bonne culture en Data Science et souhaitez participer à un projet concret mêlant à la fois des aspects de recherche méthodologique et d’application pratique.

• Vous possédez des compétences en traitement de données, en statistiques et en apprentissage automatique. Vous maîtrisez l’écosystème Python pour le traitement de données (numpy, scipy, pandas, sklearn, plotly). Dans ce contexte, vous êtes à l’aise dans la manipulation et la transformation de données. De plus, vous maîtrisez la programmation orientée objet et vous pouvez évoluer dans un environnement Linux.

• Des notions en base de données orientées document (MongoDB) seraient un plus.

• De bonnes capacités rédactionnelles et une expérience en rédaction scientifique seraient un plus (possibilité de rédaction d’article, de dépôt de brevet …).

• Vous avez un bon niveau d’anglais.

• Passionné(e) par l’innovation, vous faîtes preuve de curiosité, d’autonomie et d’esprit d’initiative. Venez exprimer tout votre potentiel en rejoignant l’équipe Data Management !

Chez Atos, nous voulons que nos employés se sentent valorisés, appréciés et libres d’être eux-mêmes au travail. Nos process RH sont conçus pour prévenir la discrimination envers l’identité ou l’orientation sexuelle, la religion, l’origine ethnique, l’âge, la neurodiversité, le handicap, la citoyenneté ou tout autre aspect qui rend nos collaborateurs uniques. Partout dans le monde, nous avons créé plusieurs programmes pour soutenir la culture inclusive d’Atos, et nous travaillons pour nous assurer que tous nos collaborateurs aient une chance égale de sentir qu’ils sont exactement là où ils doivent être..

Envie d’en savoir plus ?