Este puesto ya no está disponible.

Data Engineer Internship (M/F)

Prácticas
Paris
Salario: No especificado
Sin trabajo a distancia
Experiencia: > 6 meses
Formación: Licenciatura / Máster

HAPPN
HAPPN

¿Te interesa esta oferta?

jobs.faq.title

El puesto

Descripción del puesto

Tes missions :

Tu souhaites découvrir le métier de Data Engineer?

happn recherche un stagiaire en dernière année d’études (bac +5), à l’aise avec les langages Java ou Python.

Le stagiaire Data Engineer apprendra à organiser et ordonnancer les flux d’extraction, de transformation et de chargement des données en garantissant leur fiabilité, leur disponibilité, etc.

  • Les missions du stagiaire Data Engineer sont les suivantes:

  • Répondre aux besoins de tracking des métiers ou des Data Analysts,

  • Mettre à disposition les données en accord avec les ingénieurs BI,

  • Préparer les données avant leur exploitation par les Data Scientists,

  • Aiguillier et assister les Data Scientists dans le choix de l’architecture et à la mise en production des algorithmes de Machine Learning

  • Assurer le bon fonctionnement de la plateforme Data,

  • Créer et ordonnancer des flux de données,

  • Découvrir les bonnes pratiques liés aux coûts des ressources Cloud (calculs et stockages)

  • Respecter les données privées de nos utilisateurs et les lois RGPD


Requisitos

“It’s a crush !” si :

Issue d’une école d’ingénieur, tu as pu réaliser une première expérience en data…

Mais surtout :

  • Tu as soif d’en apprendre plus et tu es en constante veille technique

  • Tu as le sens du contact, car tu sais que pour répondre au mieux aux besoins des utilisateurs externes & internes, il faut aller chercher l’information

  • Tu aimes partager le fruit de tes recherches et pouvoir échanger sur les bonnes pratiques en équipe

  • Travailler sur un grand volume de données et sur diverses problématiques ne te fait pas peur !

  • Tu cherches le challenge et toujours faire mieux est ta source de motivation

Quelques chiffres:
5k events par seconde en moyenne
+750 To de données répartis sur plusieurs couches (Staging, Datawarehouse, Datamart, etc.)
+20 personnes dans l’équipe Data, composée de Data Analysts, Data Scientists, Ingénieurs BI et Ingénieurs Data

La stack technologique utilisée:

Google Cloud Platform (GCP)Pub/Sub, Cloud Storage ou des APIs tierces pour l’ingestion des donnéesApache Airflow / Cloud Composer (Python) comme ordonnanceurApache Beam / Cloud Dataflow (Java) pour les pipelines ETLCloud Storage et BigQuery pour stocker les donnéesGit avec GitHub afin de versionner nos sources (revues de codes, approbations, etc.)Cloud Build permet d’automatiser le CI/CDGrafana et StackDriver gèrent notre Monitoring et AlertingPulumi et Terraform pour l’aspect Infrastructure as CodeTableau, notre outil de BI, géré par les Ingénieurs BIDocker et Kubernetes pour servir les modèles de Machine Learning développés par les Data Scientists

¿Quieres saber más?

¡Estas ofertas de trabajo te pueden interesar!

Estas empresas también contratan para el puesto de "{profesión}".