Cette offre n’est plus disponible.

Recherche et développement Intelligence Artificielle

Stage(4 mois)
Saint-Aubin
Salaire : Non spécifié
Télétravail non autorisé
Éducation : Bac +5 / Master

AdvanThink (ISoft)
AdvanThink (ISoft)

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Notre plateforme de Data Science permet aux data scientists de travailler à la volée sur des milliards de lignes et d’industrialiser la production de leurs modèles.
Les stages proposés ont pour but de développer et optimiser notre plateforme, tant du point de vue de l’interaction que des fonctionnalités, en vue d’améliorer l’expérience utilisateur des data scientists.
A la croisée du développement informatique et des Data Sciences, vous aurez l’occasion d’approfondir vos connaissances et de proposer des solutions qui viendront contribuer à l’amélioration de nos outils.
Autonome, inventif et rigoureux, vous possédez des compétences dans un langage de programmation (Java, C++, JavaScript/HTML/CSS).

Prérequis: goût pour les Data Sciences et le Big Data, connaissances statistiques et algorithmiques

PROJET TEXTMINING
Le TextMining est une discipline de l’Intelligence Artificielle (IA) qui a pour but d’étudier les textes et d’extraire de l’information de ceux-ci. Les traitements réalisés en TextMining peuvent être relativement nombreux : détection du contexte d’un mot (nom, verbe…), recherche d’une liste de documents en adéquation avec un mot précis, extraction des mots les plus importants… Ils se découpent en deux parties : l’analyse permettant de reconnaître des mots et l’interprétation de l’analyse permettant de catégoriser les textes (comme un spam par exemple).
Le but du stage est d’étudier et d’étendre les fonctionnalités de TextMining dans notre logiciel de Data Science.
Ce sujet comprend un travail de recherche afin d’être à l’état de l’art de cette discipline, la mise en prototype de ces algorithmes voire leur implémentation en C++ avec validation sur des jeux de données volumineux.

APPRENTISSAGE LIGNE A LIGNE
L’apprentissage ligne à ligne ou incrémental fait référence à une méthode du Machine Learning ayant pour but d’apprendre au fil du temps. Il améliore ses performances avec les nouvelles données fournies.
Le but du stage est d’étudier et d’implémenter une ou plusieurs méthodes d’apprentissage incrémental sur des données transactionnelles dans notre logiciel de Data Science et de l’adapter à la détection de la fraude bancaire.
Ce sujet comprend un travail de recherche bibliographique afin d’être à l’état de l’art de cette discipline, la mise en prototype de cette technique et l’application de cette méthode sur la problématique de la lutte contre la fraude bancaire à partir de données transactionnelles.

APPRENTISSAGE SUR DES DONNEES CENSUREES
La mise en place de systèmes de lutte contre la fraude entraine des lacunes au niveau des données à modéliser (le fraudeur étant bloqué dans ses protocoles).
Le but du stage est d’étudier et d’implémenter une ou plusieurs méthodes de gestion des données censurées sur des données transactionnelles dans notre logiciel de Data Science et de l’adapter à la détection de la fraude bancaire.Ce sujet comprend un travail de recherche bibliographique afin d’être à l’état de l’art de cette discipline, la mise en prototype de cette technique et l’application de cette méthode sur la problématique de la lutte contre la fraude bancaire à partir de données transactionnelles converties en signal.

UTILISATION D’OPERATEURS D’IA POUR LE PARAMETRAGE DES ALGORITHMES
Ce stage s’inscrit dans l’amélioration continue de notre plateforme de DataScience. Il permettra d’augmenter l’ergonomie de cette plateforme en proposant des solutions d’aide à la création de workflow basée sur l’utilisation d’Intelligence Artificielle.
Ce sujet comprend une veille technologique, la sélection de quelques améliorations, leur implémentation et leur test dans notre plateforme.

ÉLAGAGE D’ARBRES SUR DONNEES DESEQUILIBREES
Les arbres sont des techniques incontournables de classification. Nous constatons leur très grande force sur des sujets variés. Toutefois ils peuvent être sujet à de l’overfitting. Un moyen de le contourner et d’élaguer les arbres pour trouver des modèles plus robustes.
Le but du stage est d’étudier et d’implémenter une ou plusieurs méthodes d’élagage d’arbres sur des données déséquilibrées dans notre logiciel de Data Science et de l’adapter à la détection de la fraude bancaire.
Ce sujet comprend un travail de recherche bibliographique afin d’être à l’état de l’art de cette discipline, la mise en prototype de cette technique et l’application de cette méthode sur la problématique de la lutte contre la fraude bancaire à partir de données transactionnelles.

ARBRES OBLIQUES
Une des problématiques à gérer dans certains problèmes de classification est le grand nombre de dimensions. Dans ce cadre, les arbres obliques répondraient à la problématique.
Le but du stage est d’étudier et d’implémenter une ou plusieurs méthodes d’arbres obliques sur des données déséquilibrées dans notre logiciel de Data Science et de l’adapter à la détection de la fraude bancaire.
Ce sujet comprend un travail de recherche bibliographique afin d’être à l’état de l’art de cette discipline, la mise en prototype de cette technique et l’application de cette méthode sur la problématique de la lutte contre la fraude bancaire à partir de données transactionnelles.

DISTRIBUTION D’ALGORITHMES DE ML
Ce stage s’inscrit dans l’amélioration continue de notre plateforme de DataScience. Les algorithmes de Machine Learning de par leur nature nécessitent des calculs complexes et nombreux. C’est pour cela que l’optimisation des traitements est primordiale, pour que les utilisateurs puissent entraîner leurs modèles dans des temps raisonnables. Ce stage se concentrera sur les possibilités de parallélisation des calculs des algorithmes de notre plateforme, pour pouvoir exploiter toute la puissance des processeurs de la machine.
Ce sujet comprend une veille technologique, la sélection de quelques améliorations, leur implémentation et leur test dans notre plateforme.

ECHANTILLONNAGE SUR DONNEES DESEQUILIBREES
Une contrainte dans la modélisation de données déséquilibrées est l’obtention d’échantillons représentatifs et homogènes. Le but du stage est d’étudier et d’implémenter une ou plusieurs méthodes d’échantillonnages dédiés à des classifications sur des données déséquilibrées dans notre logiciel de Data Science et de l’adapter à la détection de la fraude bancaire.
Ce sujet comprend un travail de recherche bibliographique afin d’être à l’état de l’art de cette discipline, la mise en prototype de cette technique et l’application de cette méthode sur la problématique de la lutte contre la fraude bancaire à partir de données transactionnelles.

MODELE LINEAIRE GENERALISE
Ce stage s’inscrit dans l’amélioration continue de notre plateforme de DataScience. Nous souhaitons doter cette plateforme de ce type d’algorithmes pour étendre notre palette d’algorithmes.
Ce sujet comprend un travail de recherche bibliographique afin d’être à l’état de l’art de cet algorithme, la mise en prototype de ce dernier et son application sur la problématique de données déséquilibrées.


Profil recherché

Nos stages sont principalement destinés à des ingénieurs dans leur dernière année d’études.
Vous désirez évoluer dans le domaine des nouvelles technologies, du développement produit, de l’IA ou de la lutte contre la fraude. Vous avez un goût pour l’innovation et vous souhaitez vous investir au sein d’une équipe de professionnels expérimentés et passionnés.

La curiosité, l’attrait pour la recherche et le développement appliqué, tout comme le goût pour la technologie et la science, sont des qualités essentielles pour intégrer nos équipes. Tous les sujets exigent un niveau mathématique avancé, de bonnes capacités de réflexion et d’analyse ainsi que de la rigueur.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres