Chez Realytics, nous développons BEE, une plateforme innovante qui mesure de manière déterministe l’exposition et l’engagement publicitaire sur tous les types de TV : linéaire, segmentée, BVOD et CTV.
Elle permet aux annonceurs d’optimiser leur stratégie média grâce à une analyse unifiée, fiable et actionnable des performances.
Au sein de l’équipe Data – qui rassemble data engineering et data science – nous recherchons un Senior Data Engineer ayant au moins 4 ans d’expérience pour prendre le lead technique sur nos projets stratégiques de migration vers Airflow et la modernisation de nos pipelines de données.
Vous jouerez un rôle clé dans :
La définition et la mise en œuvre de la stratégie de migration vers Airflow, en structurant et guidant les choix techniques.
L’industrialisation de traitements Spark à grande échelle.
La mise en place de bonnes pratiques et de standards de data engineering pour améliorer la robustesse et la scalabilité de nos pipelines.
La coordination avec les équipes produit et analystes pour garantir l’alignement entre besoins métier et architecture data.
Le pilotage de l’infrastructure data (CI/CD, monitoring, fiabilité en production).
Missions principales
Concevoir, développer et maintenir des pipelines robustes et scalables.
Superviser la migration vers Airflow (BEE et Adperf), en définissant la feuille de route et en guidant l’équipe.
Implémenter et optimiser des traitements Spark performants sur de gros volumes de données hétérogènes.
Anticiper les problèmes de performance et assurer la fiabilité des jobs en production.
Assurer un rôle de référent technique sur les sujets Data Engineering et infrastructure.
Encadrer et accompagner les ingénieurs plus juniors de l’équipe.
Participer activement à la définition technique des évolutions de BEE en lien avec les besoins métier.
Documenter, partager et promouvoir les bonnes pratiques.
Mettre en place des outils d’alerte, de monitoring et de reporting pour fiabiliser les traitements.
Détecter et résoudre de manière proactive les anomalies.
Collaborer avec les équipes Account Management pour résoudre les incidents (erreurs de paramétrage, défaillances fournisseurs, problèmes de données).
Type de contrat : CDI cadre 39h hebdomadaires
Date de début : Dès que possible
Avantages :
Congés supplémentaires (entre 8 et 10 par an)
Télétravail jusqu’à 3 jours par semaine après validation de la période d’essai
Cofinancement d’une offre de sport Wellpass
Mutuelle d’entreprise incluant des avantages salariés
Accès au catalogue de formation en e-learning du groupe
Forfait Mobilités Durables
Activités et évènements organisés tout au long de l’année
Formation et expérience
Master ou diplôme d’ingénieur en informatique, avec spécialisation en data engineering ou traitement de données.
Au moins 4 ans d’expérience en Data Engineering, dont une partie en tant que référent technique / lead.
Compétences indispensables
Maîtrise de Python en production.
Expérience solide avec Apache Spark.
Expérience confirmée avec un orchestrateur de workflows, idéalement Airflow.
Maîtrise de Docker.
Connaissance de Kubernetes.
Expérience avec des outils de CI/CD (Jenkins, GitLab CI, etc.).
Maîtrise opérationnelle de Linux et Git.
Bonne maîtrise de SQL et des bases de données.
Compétences appréciées : Notions en data science et statistiques.
Leadership technique, capacité à fédérer et guider une équipe.
Rigueur dans le développement et la documentation.
Capacité à comprendre et manipuler des données complexes.
Goût pour la collaboration et le travail en équipe pluridisciplinaire.
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.