CONTEXTE
La valorisation des données, toujours plus précieuses quantitativement et qualitativement parlant, demeure une question ouverte aussi bien d’un point de vue académique (recherche d’un équilibre entre performance et complexité des algorithmes de Machine Learning pour la préparation et la labellisation de données), que d’un point de vue industriel (optimisation du coût d’investissement).
Le projet DATA aborde la question de la valorisation des données sur différents aspects :
Le premier se concentre sur l’accès et la disponibilité des données,
Le deuxième s’intéresse à l’assistance à la labellisation et vise à fournir des données qualitatives à travers le développement d’outils d’aide à la labellisation ; le but est d’exploiter les données existantes afin de répondre à des problématiques connues,
La qualité et la fiabilité des données et de leurs labels associés
Enfin, des scénarios de cas d’usage industriels permettront de valider le processus mis en place.
Mission : Dans le cadre de ce projet, nous souhaitons mettre en place une librairie Python permettant aux utilisateurs de facilement appliquer des méthodes d’augmentation de données (Data Augmentation) sur leurs jeux de données, peu importe le type de données à augmenter.
Description du profil :
VOTRE PROFIL
Issu(e) d’une école d’ingénieur ou d’un cursus universitaire, vous avez suivi une filière informatique et vous vous définissez comme un(e) développeur généraliste et maitrisez la programmation objets et les notions de Deep Learning.
Compétences techniques :
Compétences non-techniques :
CAPGEMINI, entreprise handi accueillante, conformément à la norme AFNOR NF X50-783, est également signataire de la charte de la diversité en entreprise
Rencontrez Khaled, ingénieur logiciel
Rencontrez Chloé, Ingénieure logiciel
Ces entreprises recrutent aussi au poste de “Développement de logiciels et de sites Web”.