Vous travaillez au sein de l’équipe technique chargée d’améliorer les pratiques data et de concevoir et maintenir des pipelines de données :
- Définir une architecture data à long terme et assurer la cohérence (type data lake)
- S’assurer de la disponibilité de la donnée
- Conception et mise en œuvre de pipelines de données pour de la mesure de performance et l’entrainement de modèle de machine learning
- Industrialisation de ces pipelines en collaboration avec l’équipe de ML
A ce titre les activités principales à effectuer sont :
- Concevoir et mettre en œuvre un processus ETL automatisé de bout en bout afin de préparer les données pour l’apprentissage automatique et l’analyse ad hoc, y compris l’anonymisation des données
- Structurer et déployer, en lien étroit avec les équipes de machine learning, l’export automatisé de données pour l’entrainement de modèles
- Atteindre les objectifs en collaboration avec les équipes technique, produit et business
- Faire monter en compétence les membres de l’équipe
Hard skills souhaitées :
- Expérience impérative de minimum 3 ans dans la mise en œuvre de pipelines de données idéalement dans un écosystème Python
- Bonnes connaissances en architecture Big Data et systèmes ETL (on-premise)
- Familier avec des systèmes de calcul distribué, type Spark
- Connaissances des bonnes pratiques de développement : versioning, tests, code reviews, CI/CD etc.
Hard skills bonus :
- Compétences en déploiement d’applications conteneurisées (Docker / Kubernetes / Argo Workflow)
- Expériences avec des bases de données distribuées telles que Elasticsearch, Vespa
- Connaissance de spark streaming, kafka stream ou similaire
- Expérience en Rust
- Expérience en langage SQL
Soft skills :
- Capacité à fédérer autour de vos sujets
- Capacité d’écoute
- Savoir coordonner plusieurs parties prenantes
- Proactif sur les sujets de fonds comme sur la résolution des problèmes
- Savoir organiser et de prioriser
Cultural Fit avec le CTO & DRH
Entretien technique avec des membres de l’équipe ML
Entretien de code
These companies are also recruiting for the position of “Données/Business Intelligence”.