Au sein d’une équipe de 6 personnes, vous serez rattaché au Chief Data Officer. Vous êtes le garant de l’accès qualitatif aux données de l’entreprise. Votre périmètre d’intervention est axé sur les systèmes applicatifs autour de la gestion de la donnée et du traitement et sur les plateformes Big Data, IoT, …
Dans ce cadre, vous serez amené à :
- Assurer la maîtrise de la donnée et garantir la qualité de son utilisation (référencement, normalisation, et qualification) afin d’en faciliter l’exploitation par les acteurs métiers (Managers, Data Analysts et Data Scientists).
- Contribuer à la définition de la politique de la donnée et à la structuration de son cycle de vie dans le respect des réglementations en vigueur, en collaboration avec le Chief Data Officer.
- Assurer la supervision et l’intégration des données de diverse nature qui proviennent de ces sources multiples et vérifie la qualité des données qui entrent dans le Data Lake.
Activités et tâches : qualification et gestion des données
- Capter les données (structurées et non structurées) produites dans les différentes applications ou à l’extérieur de l’entité,
- Intégrer les éléments,
- Structurer la donnée (sémantique, etc.),
- Cartographier les éléments à disposition,
- Nettoyer la donnée (normalisation des formats, élimination des doublons, anonymisation…),
- Valider la donnée avec les acteurs métiers.
Planifier
- Conception de l’architecture
- Veille technologique, Innovation
Utiliser
- Fourniture de services
- Gestion des problèmes et supervision
Gérer
- Gestion des cas d’usage et planification
- Gestion des risques
- Gestion de la sécurité de l’information
Développer
Ingénierie et modélisation
Intégration des systèmes et des données
Visualisation des données
Tests
Faciliter
- Amélioration continue de la qualité
- Développement des utilisateurs
- Gestion de l’information et de la connaissance
Livrables
- Data Lake approprié et partagé
- Cartographie des données
- Les éléments permettant de garantir la qualité de la donnée
Indicateurs de performance
- Volume du Data Lake
- Délai de mise à disposition de la donnée
- Qualité et fraîcheur de la donnée
- Taux de rejet