Data Engineer Senior - Spark

Résumé du poste
CDI
Paris
Télétravail fréquent
Salaire : Non spécifié
Expérience : > 5 ans
Éducation : Bac +5 / Master
Compétences & expertises
Méthodologies Agile
Collaboration et travail d'équipe
Gestion de l’infrastructure cloud
Gitlab
Scikit learn
+10

Pulsover
Pulsover

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Pulsover est un cabinet de conseil spécialisé dans la data, le cloud et le delivery, partenaire de Databricks et AWS.

Nous renforçons notre pôle Data en recherchant un.e Senior Data Engineer expérimenté.e sur Databricks pour accompagner la croissance de Pulsover.

Si tu es passionné.e par la data, que tu possèdes une expertise approfondie sur Databricks, Spark et AWS, cette offre d’emploi est faite pour toi.

En tant que Data Engineer Senior, tu joueras un rôle essentiel dans la création, la mise en œuvre et la gestion de nos pipelines de données. Tu seras responsable de concevoir des architectures de données robustes, de développer des solutions d’intégration de données efficaces et d’optimiser les performances de nos infrastructures de données.

Tes missions principales :

  • Participer à des projets de data engineering basés sur un framework méthodologique

  • Développer, industrialiser et maintenir des pipelines de données (principalement ETL et ML)

  • Effectuer de l’exploration de données et du prototypage rapide

  • Mettre en application les meilleures pratiques : versioning, tests automatisés, CI/CD

  • Participer activement à l’automatisation des infrastructures basées sur des services de Cloud Computing

  • Implémenter des architectures de type Lakehouse pour casser les silos

  • Déployer des algorithmes de machine learning at scale et sur des flux de streaming

  • Collaborer avec l’ensemble des équipes depuis les spécifications fonctionnelles jusqu’aux validations métiers des solutions implémentées

  • Contribuer à la mise en place de méthodologies Agile de type Scrum

Socle technologique et méthodologique :

  • Stack technique : Spark, Python, Scala, Scikit learn, MLFlow, Versionning (Git), CI/CD (GitHub Actions/ GitLab/ Jenkins)

  • Job orchestration : Apache Airflow

  • Data platform: Databricks, Snowflake

  • Cloud : AWS et/ ou GCP, Azure

  • Méthodo : développement Agile/ travail en équipe collaborative

  • Tests automatisés : Pytest, Scalatest, Cucumber

Les avantages :

  • Un environnement de travail collaboratif et stimulant, favorisant l’apprentissage continu et l’évolution professionnelle

  • Des missions stimulantes au sein de grands acteurs du marché

  • Des opportunités de formation et de développement professionnel pour rester à jour sur les dernières technologies

  • La possibilité de travailler sur des projets de données complexes et stimulants, ayant un impact direct sur les décisions stratégiques de l’entreprise

  • Une rémunération compétitive et des avantages sociaux attractifs


Profil recherché

  • De formation ingénieur ou équivalent avec une expérience de 5 ans minimum dans ce domaine

  • Expérience significative en tant que Data Engineer, avec une expertise approfondie sur Spark, Databricks, AWS et/ ou GCP

  • Solide compréhension des principes de l’ingénierie des données, des architectures distribuées et des meilleures pratiques de gestion des données

  • Excellentes compétences en programmation, notamment dans les langages tels que Python ou Scala

  • Connaissance des technologies de bases de données, des outils ETL et de l’intégration de données

  • Capacité à travailler de manière autonome, à gérer plusieurs projets simultanément et à respecter les délais

  • Bon niveau en anglais pour nos projets dans un contexte international

  • Et surtout : bonne humeur et attitude positive sont essentielles ;)

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

  • AP-HP - Direction des Services Numériques (DSN)

    Responsable de l'équipe science des données F/H

    AP-HP - Direction des Services Numériques (DSN)
    AP-HP - Direction des Services Numériques (DSN)
    CDI
    Paris
    Télétravail fréquent
    Salaire : 45K à 70K €
    Intelligence artificielle / Machine Learning, Big Data
    570 collaborateurs

  • Bial-X

    Un Consultant Formateur Data

    Bial-X
    Bial-X
    CDI
    Paris, Lyon, Strasbourg
    Télétravail occasionnel
    Intelligence artificielle / Machine Learning, IT / Digital
    72 collaborateurs

  • AQEMIA

    Staff AI Research Scientist

    AQEMIA
    AQEMIA
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, Pharmaceutique / Biotechnologique
    60 collaborateurs

  • Descartes Underwriting

    R&D Data Scientist - CDI

    Descartes Underwriting
    Descartes Underwriting
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, Assurance
    230 collaborateurs

  • Nabla

    Senior Machine Learning Engineer

    Nabla
    Nabla
    CDI
    Paris
    Télétravail fréquent
    Intelligence artificielle / Machine Learning, Big Data
    60 collaborateurs

  • La Javaness

    Data Scientist Confirmé F/H

    La Javaness
    La Javaness
    CDI
    Paris
    Télétravail fréquent
    Logiciels, Intelligence artificielle / Machine Learning
    70 collaborateurs

Voir toutes les offres