Chez MP Data, nous sommes une équipe passionnée d’experts en données, spécialisée dans l’acquisition, le traitement et la valorisation des données pour nos clients industriels. Depuis 2015, nous mettons notre savoir-faire technique et notre engagement au service de missions et de projets pour les grands groupes. Notre approche repose sur les valeurs d’Excellence, de Partage et d’Engagement.
Suite à la forte croissance de MP Data et une forte demande de nos clients en Belgique nous recherchons un(e) Data Engineer pour rejoindre notre équipe à Liège.
Votre role :
Pipeline Engineering : Concevoir, développer et optimiser des pipelines de données (ETL/ELT) massifs et performants en utilisant principalement Python et PySpark.
Orchestration : Mettre en place et maintenir des workflows robustes avec Apache Airflow pour garantir l’automatisation et la fiabilité de l’ensemble de la chaîne de données.
Architecture Data Mesh : Contribuer activement à la migration et à l’évolution de notre plateforme vers un modèle Data Mesh, en assurant que les données sont traitées comme des produits de haute qualité.
Cloud AWS : Gérer les services de stockage et de calcul sur notre infrastructure AWS (notamment S3).
Qualité & Robustesse : Assurer la fiabilité du code par l’implémentation rigoureuse de tests unitaires et des mécanismes de contrôle de qualité des données.
Compétences Techniques Indispensables :
Maîtrise de PySpark : Capacité prouvée à écrire du code Spark optimisé pour le traitement de gros volumes de données.
Expertise en Orchestration : Expérience significative avec Apache Airflow.
Expérience Cloud : Bonne connaissance des services de base d’Amazon Web Services (AWS), en particulier S3.
Fondations Solides : Excellente maîtrise de Python et de SQL.
Ce qui fera la Différence :
Vous comprenez et adhérez aux principes de l’architecture Data Mesh et avez idéalement déjà travaillé dans un environnement similaire.
Vous êtes rigoureux et le concept de Tests Unitaires est une seconde nature pour vous, garantissant des pipelines solides et maintenables.
Vous êtes autonome, proactif(ve) et à l’aise pour travailler sur une dataplatforme interne développée sur mesure.
1 - Prise de Contact (15min par téléphone)
2 - Entretien avec un Ingénieur d’affaires (45min)
3 - Test technique
4 - Entretien Technique (1h)
5 - Visite des locaux
Rencontrez Salma, Ingénieure en Data Science
Rencontrez Faïlor , Directeur Technique