Este puesto ya no está disponible.

[VO2 Data] - Data Engineer GCP

Resumen del puesto
Indefinido
Paris
Unos días en casa
Salario: No especificado
Experiencia: > 3 años
Competencias y conocimientos
Seguimiento de las operaciones
Gestión de la documentación
Investigación y análisis de datos
Lenguajes de programación
Gestión de la calidad
+13

VO2 GROUP
VO2 GROUP

¿Te interesa esta oferta?

Preguntas y respuestas sobre esta oferta

El puesto

Descripción del puesto

Collecte de données : Extraction de données à partir de diverses sources, qu’il s’agisse de bases de données, de fichiers, de flux de données en temps réel.

Nettoyage et transformation des données : Nettoyage, filtrage, enrichissement et transformation des données pour les préparer à l’analyse. Cela peut inclure le traitement des données manquantes, la normalisation, la conversion de formats, etc.

Conception de pipelines de données : Création de pipelines de données pour automatiser le flux de données, y compris la gestion des dépendances entre les différentes étapes du pipeline.

Stockage des données : Choix de la solution de stockage adaptée aux besoins, que ce soit Google Cloud Storage, Bigtable, BigQuery ou d’autres services GCP.

Intégration de données : Intégration de données dans les entrepôts de données, les entrepôts de données en colonnes, les bases de données NoSQL ou les data lakes.

Gestion de la qualité des données : Mise en place de contrôles de qualité des données pour garantir l’intégrité et la qualité des données.

Sécurité des données : Mise en place de mesures de sécurité pour protéger les données sensibles, notamment l’accès aux données, la gestion des identités et des accès, le chiffrement, etc.

Optimisation des performances : Surveillance et optimisation des performances des pipelines de données pour assurer une réponse rapide aux requêtes et une utilisation efficace des ressources.

Documentation : Documentation des pipelines de données, des schémas de données et des processus pour faciliter la compréhension et la collaboration.

Automatisation : Automatisation des processus d’ETL (Extract, Transform, Load) pour minimiser l’intervention manuelle.

Collaboration : Collaboration avec les data scientists, les analystes et d’autres membres de l’équipe pour comprendre leurs besoins et garantir que les données sont prêtes pour l’analyse.

Surveillance : Surveillance constante des pipelines de données pour détecter et résoudre les problèmes potentiels.

Évolutivité : Conception de pipelines de données évolutifs capables de gérer une croissance des volumes de données.


Cette liste de missions n’est pas exhaustive et est susceptible d’évoluer.


Requisitos

Maîtrise de GCP : Une connaissance approfondie des services et des outils de GCP est essentielle pour concevoir et implémenter des solutions d’ingénierie des données.

Traitement des données en temps réel : Capacité à concevoir et mettre en œuvre des pipelines de données en temps réel, en utilisant des services tels que Dataflow ou Pub/Sub.

Traitement des données en batch : Compétence dans la création de flux de traitement de données par lots avec des outils comme Dataprep, Dataprep, et BigQuery.

Langages de programmation : Maîtrise de langages de programmation tels que Python, Java, ou Go pour le développement de scripts et d’applications.

Bases de données : Connaissance des bases de données NoSQL (Cloud Bigtable, Firestore) et SQL (BigQuery, Cloud SQL) pour le stockage et la récupération de données.

Sécurité des données : Compréhension des meilleures pratiques de sécurité des données, y compris la gestion des autorisations, le chiffrement et la conformité.

Outils d’orchestration : Capacité à utiliser des outils d’orchestration tels que Cloud Composer ou Cloud Dataflow pour gérer les pipelines de données.

Problème-solving : Aptitude à résoudre des problèmes complexes liés à la collecte, au traitement et au stockage de données, ainsi qu’à optimiser les performances des pipelines de données.

¿Quieres saber más?

¡Estas ofertas de trabajo te pueden interesar!

Estas empresas también contratan para el puesto de "{profesión}".