Stage DataScience Fintech:Génération de données synthétiques F/H

Stage(6 mois)
Caouënnec-Lanvézéac
Télétravail fréquent
Salaire : Non spécifié
Expérience : < 6 mois
Éducation : Bac +5 / Master
Postuler

Orange
Orange

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

Ce stage consiste à développer une méthode de génération de données synthétiques multi-entities et cohérentes, en s’appuyant sur nos prototypes existants. L’objectif est de faciliter le partage sécurisé de données pour la modélisation des risques financiers dans le secteur bancaire en Afrique de l’Ouest, en utilisant l’outil open source Khiops.
Contexte
Nous travaillons avec un grand acteur bancaire en Afrique de l’Ouest, spécialisé dans l’octroi de prêts via mobile. Pour améliorer nos modèles de risque tout en respectant la confidentialité des données, nous souhaitons développer des jeux de données synthétiques réalistes et sécurisés. Cela facilitera aussi le partage d’informations avec nos partenaires experts en modélisation de risques.
Ce que vous allez faire
Ce stage consiste à concevoir une méthode pour générer des données synthétiques complexes, impliquant plusieurs types d’entités (clients, comptes, transactions, produits financiers, etc.) et leurs relations. Vous vous appuyez sur nos travaux et prototypes existants, notamment ceux réalisés pour la génération de données mono-table, pour accélérer le développement.
Vous utilisez notre outil open source Khiops, qui permet de modéliser et générer des données sans recourir à des techniques de deep learning coûteuses.
Vos missions principales sont :
- Définir une approche pour créer des jeux de données cohérents et réalistes, en respectant les relations entre différentes entités.
- Développer un prototype pour générer ces données synthétiques multi-entities, en intégrant des aspects temporels.
- Évaluer la qualité et la confidentialité des données produites.


Profil recherché

Étudiant(e) en Data Science, Statistique, Informatique ou domaine équivalent.
Niveau bac+5
Intérêt pour la modélisation de données, la confidentialité et la génération de données synthétiques.
Connaissance ou curiosité pour les outils open source comme Khiops est un plus.
Rigueur, créativité et capacité à travailler en autonomie.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Postuler