Cette offre n’est plus disponible.

Data Scientist F/H

Stage(6 mois)
Châtillon
Salaire : Non spécifié
Télétravail non autorisé
Expérience : < 6 mois
Éducation : Bac +5 / Master

Orange
Orange

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Le domaine du Machine Learning based Early Decision-Making (ML-EDM) consiste à optimiser les moments de décision d’un modèle de Machine Learning observant des données collectées au cours du temps.  D’une part, la collecte d’avantage de données permet souvent d’obtenir une décision plus fiable. D’autre part, le fait d’attendre trop longtemps avant de d’agir peut engendrer des coûts importants.
 Le ML-EDM a été défini récemment dans [1] et peut être vu comme une généralisation de la Classification Précoce de Séries Temporelles (ECTS) [2]. Les meilleures approches d’ECTS forment une famille appelée Economy [2], dont les très bonnes performances s’expliquent par leur propriété de non-myopie. Intuitivement, ce formalisme utilise en entrée des coûts (ex : mauvaise classification, et coût d’attente) et a pour but d’en estimer une espérance pour les instants futurs. Finalement, le caractère non-myope de ces méthodes leur permet d’estimer à tout moment l’instant futur où il sera le plus opportun de déclencher la décision.  
 
Dans un premier temps, le stagiaire s’appropriera les travaux antérieurs [1-5]. Ensuite, un travail de formalisation sera réalisé pour définir un cadre de ML-EDML non-supervisé. Puis, le développement d’une nouvelle approche sera mené, incluant des expérimentations comparatives. Enfin, la rédaction d’un article scientifique sera envisagée si les résultats expérimentaux sont probants.
 Références :
[1] Open challenges for Machine Learning based Early Decision-Making research. SIGKDD Explorations December 2022
[2] Early classification of time series. Machine Learning Journal.
[3] Early Classification of Time Series: Cost-based multiclass Algorithms. DSAA 2021
[4] Early and revocable time series classification. IJCNN 2022
[5] ECOTS: Early Classification in Open Time Series. ACML 2022


Profil recherché

  • Étudiant BAC +5 en master ou école d’ingénieur, spécialisé en : informatique, et/ou Machine Learning, et/ou statistiques.
    - Grande motivation pour mener à bien des travaux de recherche sur le sujet, et éventuellement un thèse CIFRE par la suite.
    - Compétences en développement informatique nécessaires : langage Python et librairie Scikit-learn.
    - Connaissances minimales en statistiques, mathématiques et/ou Machine Learning indispensables.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.