2 Stages Data Science (H/F)
Qui sont-ils ?
L’équipe Document Recognition (DocReco)
L’équipe a pour responsabilité de créer des modèles pour classifier et lire les documents reçus par QuickSign, puis de déployer ces modèles en production et de les maintenir en condition opérationnelle.
Notre équipe est aujourd’hui composée d’un Data Scientist, un ML Engineer, un Data Engineer et un Tech Lead.
Nous avons de nombreux modèles en prod, à l’état de l’art (vision artificielle / NLP), et avons fourni un premier effort d’industrialisation de l’entraînement de nos IA permettant de sortir de nouveaux modèles en moins de 3 mois. Nous engageons un nouvel effort d’industrialisation de la production de nos modèles et considérons la gestion de nouveaux types de données en entrée (vidéo en plus des images et du texte).
Parmi les dimensions importantes pour l’équipe, on peut citer le fait de rendre nos processus de déploiement plus robustes, concevoir des approches de MLOps permettant de garantir la reproductibilité de nos expériences et plus largement industrialiser nos solutions, ainsi qu’outiller et transformer les métiers de QuickSign pour objectiver et guider leur activité quotidienne.
Rencontrez Benoit, Co Fondateur
Descriptif du poste
Sujet de stage 1 (5 à 6 mois de stage)
Nous souhaitons développer un module de reconnaissance faciale dans le cadre de nos enjeux de détection de fraude. Le but du stage est d’implémenter et de tester de récentes techniques de recherche biométrique.
Missions du stage :
Etat de l’art :
Familiariser avec les travaux précédemment réalisés par l’équipe.
Étudier les datasets tels que LFW, YTF, CFP, etc
Analyser les algorithmes comme FaceNet, ArcFace, SphereFace, etc.
Évaluation des algorithmes existants :
Tester les performances des algorithmes de reconnaissance faciale identifiés.
Comparer en termes d’exactitude, de rapidité et de fiabilité pour le contexte spécifique de la détection de fraude.
Évaluer les possibilités d’intégration à nos produits :
Implémenter cette solution dans le système de fraude.
Prototyper, tester et itérer pour améliorer la solution.
Collaboration et communication avec l’équipe :
Participer aux réunions d’équipe et aux discussions techniques
Rédiger des rapports détaillés sur les découvertes et les analyses et documenter les progrès et les résultats du projet
Sujet de stage 2 (3 à 6 mois de stage)
Création de templates pour la reconnaissance de documents structurés :
Utiliser un outil d’annotation pour créer des templates adaptés aux différents types de documents structurés (pièces d’identité, etc.).
Collaborer avec l’équipe pour identifier les types de documents à traiter et les informations importantes à extraire.
Intégration des templates dans le modèle de Machine Learning :
Utiliser le modèle générique d’OCR pour lire les documents correspondant aux nouveaux templates.
Utiliser des techniques de prétraitement et de post-traitement pour améliorer la performance du modèle.
Utiliser des algorithmes de recherche d’hyperparamètres, afin d’optimiser les taux de lecture.
Travailler en étroite collaboration avec l’équipe pour s’assurer que les templates sont correctement intégrés et fonctionnels.
Intégration des templates dans le service web :
Intégrer les templates et le modèle amélioré dans le service web existant.
S’assurer de la compatibilité et de l’interopérabilité des différents composants du système.
Évaluation et optimisation de la qualité de lecture des nouveaux documents :
Créer et maintenir des ensembles de données de validation et de test pour évaluer la performance du modèle.
Utilisation de l’outil interne d’annotation
Mesurer la qualité de lecture des documents et identifier les domaines à améliorer.
Proposer et mettre en œuvre des améliorations pour optimiser la performance du modèle et du service web.
Collaboration et communication avec l’équipe :
Participer aux réunions d’équipe et aux discussions techniques
Rédiger des rapports et des documents techniques pour documenter les progrès et les résultats du projet
Profil recherché
Pour le stage 1 : Étudiant(e) à partir de M1/M2 en école ou université en informatique / mathématiques
Pour le stage 2 : Étudiant(e) à partir de L3 en école ou université en informatique / mathématiques
/!\Merci de bien indiquer le stage pour lequel vous souhaitez postuler.
Compétences requises :
Connaissance en Python et Git
Capacité à travailler en équipe et à communiquer efficacement
Un environnement Linux vous est familier
Compétences bonus :
Connaissance des bibliothèques de Machine Learning (par exemple, TensorFlow ou PyTorch)
Connaissance des techniques de traitement d’image, d’OCR et d’annotation
Certification Python3* serait appréciée
Pourquoi nous rejoindre ?
Parce que nous sommes une start-up de la Fintech, en fort développement, passionnée par l’innovation !
Ce que tu trouveras chez nous :
● Un rôle stratégique qui a un véritable impact sur la croissance de QuickSign,
● Un environnement de travail technophile et stimulant, une quête de l’excellence,
● Un partage de connaissances et de l’entraide en permanence entre équipes.
Informations complémentaires
Nous offrons un environnement de travail épanouissant avec :
· Des bureaux tout neufs au centre de Paris
· Possibilité de faire du télétravail
· Une carte ticket restaurant (Swile)
· Une prise en charge des frais de transport (50%) ou d’un forfait mobilité
Déroulement des entretiens
Pour rappel, merci de bien indiquer le stage pour lequel vous souhaitez postuler.
Le process débutera par un rapide échange et l’envoi d’un test (QCM) à réaliser de chez soi.
Si le test est positif, un entretien avec le manager et un membre de l’équipe est organisé.
Si cet entretien est concluant un dernier échange avec la DRH est programmé.