Pour lire certains documents (cartes d’identité, passeports), nous implémentons des masques, a.k.a templates, permettant de localiser précisément les champs pertinents. Le but du stage est d’accroître le nombre de documents que nous pouvons lire en enrichissant notre base de templates.
Missions du stage :
Amélioration de l’outillage pour la création de templates et l’optimisation de performances :
Prise en main de l’outil de création de template
Ajout de fonctionnalités (preview de résultats, tests sur un dataset complet, rapports d’optimisation, … )
Création de templates pour la reconnaissance de documents structurés :
Utiliser un l’outil précédent pour créer des templates adaptés aux différents types de documents structurés (pièces d’identité, etc.).
Collaborer avec l’équipe pour identifier les types de documents à traiter et les informations importantes à extraire.
Intégration des templates dans la librairie de lecture de docs:
Utiliser le modèle générique d’OCR pour lire les documents correspondant aux nouveaux templates.
Utiliser des techniques de prétraitement et de post-traitement pour améliorer la performance du modèle.
Utiliser des algorithmes de recherche d’hyperparamètres, afin d’optimiser les taux de lecture.
Travailler en étroite collaboration avec l’équipe pour s’assurer que les templates sont correctement intégrés et fonctionnels.
Évaluation et optimisation de la qualité de lecture des nouveaux documents :
Créer et maintenir des ensembles de données de validation et de test pour évaluer la performance du modèle.
Utilisation de l’outil interne d’annotation
Mesurer la qualité de lecture des documents et identifier les domaines à améliorer.
Proposer et mettre en œuvre des améliorations pour optimiser la performance du modèle et du service web.
Intégration des templates dans le service web :
Intégrer les templates et le modèle amélioré dans le service web existant.
S’assurer de la compatibilité et de l’interopérabilité des différents composants du système.
Ré-entraînement de reconnaisseur de texte pour les documents portugais :
Créer une tâche d’annotation pour récupérer les accents sur les documents portugais (carte d’identité, passeport)
Ré-entraîner un décodeur spécial pour le portugais
Mettre à jour les bases de NRT pour inclure les accents si non présents
Intégrer dans le service et mesurer les nouvelles perfs
Collaboration et communication avec l’équipe :
Participer aux réunions d’équipe et aux discussions techniques
Rédiger des rapports et des documents techniques pour documenter les progrès et les résultats du projet
Étudiant(e) à partir de M2 ou césure en école ou université en informatique / mathématiques
Vous êtes à la recherche d’un stage de 5-6 mois.
Compétences requises :
Utilisation de Python et Git
Capacité à travailler en équipe et à communiquer efficacement
Un environnement Linux vous est familier
Compétences bonus :
Connaissance des techniques de traitement d’image, d’OCR et d’annotation
Des compétences en JavaScript et Docker seraient appréciées
MERCI DE BIEN NOTER sur votre candidature :
la date à laquelle vous pouvez démarrer votre stage
la durée de votre disponibilité
\=> sans ces informations nous ne pourrons pas traiter votre candidature
Pourquoi nous rejoindre ?
Parce que nous sommes une start-up de la Fintech, en fort développement, passionnée par l’innovation !
Ce que tu trouveras chez nous :
● Un rôle stratégique qui a un véritable impact sur la croissance de QuickSign,
● Un environnement de travail technophile et stimulant, une quête de l’excellence,
● Un partage de connaissances et de l’entraide en permanence entre équipes.
Informations complémentaires
Nous offrons un environnement de travail épanouissant avec :
· Des bureaux tout neufs au centre de Paris
· Possibilité de faire du télétravail
· Une carte ticket restaurant (Swile)
· Une prise en charge des frais de transport (50%) ou d’un forfait mobilité
Le process débutera par un rapide échange et l’envoi d’un test (QCM) à réaliser de chez soi.
Si le test est positif, un entretien avec le manager et un membre de l’équipe est organisé.
Si cet entretien est concluant un dernier échange avec la DRH est programmé.
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres