Cette offre n’est plus disponible.

Stagiaire data scientist R&D H/F

Stage(4 à 6 mois)
Paris
Salaire : Non spécifié
Télétravail non autorisé
Expérience : > 6 mois
Éducation : Bac +5 / Master

VIGINUM
VIGINUM

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

VIGINUM propose un stage de R&D sur la détection de coordination inauthentique sur Twitter, révélatrice de comptes automatisés ou bots. En particulier, l’approche de Machine Learning retenue se base sur des algorithmes de Deep Learning apprenant sur des structures de graphes relationnels, développée dans la littérature scientifique récente [1,2]. Elle se base sur la représentation vectorielle du comportement du compte et sa modélisation en utilisant des réseaux Deep Learning hétérogènes. La faisabilité de l’approche sera dans un premier temps validée en utilisant des jeux de données issus de la littérature scientifique [3], avant d’être testée sur des données obtenues dans le cadre des opérations de VIGINUM.

Il/Elle aura pour missions spécifiques :

  • l’implémentation et le test des approches algorithmiques énoncées ;
  • la veille sur les méthodologies de détection développées par le monde académique ;
  • à titre accessoire et selon les nécessités opérationnelles du service, l’analyse visant à la production ; des notes de détection et de caractérisation produites par VIGINUM.

[1] Feng, S, et al, 2021 : Feng, S.,et al, 2019 : BotRGCN: Twitter Bot Detection with Relational Graph Convolutional Networks, Proceedings of the 2021 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining
[2] Feng. S, et al, 2022 : Heterogeneity-Aware Twitter Bot Detection with Relational Graph Transformers, Proceedings of the 2022 AAAI Conference on Artificial Intelligence
[3] Shi. S, et al, 2023 : A Multi-Relational Graph-Based Twitter Account Detection Benchmark, arXiv preprint


Profil recherché

Étudiant(e) en dernière année d’un cursus Bac+5 (Ingénieur ou M2) spécialisé en Data Science, vous justifiez d’un premier projet réussi utilisant du Deep Learning. La maîtrise de Python et Pandas pour l’analyse des données est nécessaire, ainsi qu’une bonne connaissance des plans d’analyse statistiques et une aisance avec l’environnement GNU/Linux.

Envie d’en savoir plus ?