Tu as une appétence forte pour les environnements techniques complexes, les architectures hautes performances, et tu veux contribuer à des projets IA ambitieux, mêlant données multimédia, modèles avancés et défis de production ? Ce poste est fait pour toi.
Au sein d’une équipe dédiée à des projets IA de pointe, tu évolueras dans un environnement OnPremise exigeant, basé sur des clusters GPU haute performance.
Tu interviendras sur l’ensemble de la chaîne de traitement de la donnée, depuis l’ingestion jusqu’à l’industrialisation, en lien étroit avec des Data Scientists spécialisés en machine learning, deep learning et GenAI.
Architecture & développement : Concevoir des pipelines de données robustes et scalables, orchestrés via Airflow, basés sur Trino, Iceberg, PostgreSQL et Minio.
Industrialisation & déploiement : Conteneurisation avec Docker, déploiement via Kubernetes, CI/CD avec Jenkins, monitoring des performances avec Grafana et Prometheus.
Collaboration IA : Travailler main dans la main avec les Data Scientists pour garantir la fluidité entre modélisation, expérimentation et mise en production.
Multimédia & open source : Contribuer à des projets innovants sur les données audio/vidéo et s’appuyer sur des solutions open source pour construire des systèmes performants et maintenables.
Diplômé(e) d’un Master 2 d’une grande école d’ingénieur ou d’une université reconnue.
Une première expérience significative en environnement HPC ou OnPrem est requise.
Une exposition à des projets dans les domaines de l’IA, du multimédia ou de l’industrie sera un vrai atout.
Langages & frameworks : Très bonne maîtrise de Python, FastAPI et SQL.
Orchestration & stockage : Expérience confirmée avec Airflow, Apache Iceberg, Trino, PostgreSQL et Minio.
Déploiement & containerisation : À l’aise avec Docker, Kubernetes, Jenkins.
Observabilité : Bonne connaissance de Grafana et Prometheus.
Systèmes & outils : Maîtrise de Linux, Git.
Bonus : Une connaissance de Ray est un plus.
Tu appliques les bonnes pratiques de développement : TDD, SOLID, design patterns, documentation rigoureuse.
Tu as de solides bases en réseau et sécurité, et une bonne compréhension des architectures HPC OnPrem.
Tu es familier(ère) avec les problématiques liées à l’IA (ML/DL/GenAI) et aux données audio/vidéo.
Tu suis de près l’écosystème open source : veille, contributions, réutilisation de briques éprouvées.
Tu es autonome, rigoureux(se) et sais t’intégrer facilement dans une équipe.
Tu évolues avec aisance dans un contexte agile (Daily, DDS…).
Tu sais communiquer efficacement sur des sujets techniques complexes avec des interlocuteurs variés (data scientists, ingénieurs infra, métiers).
Échange RH avec Manon ou Basma
Entretien technique avec un Lead Data Engineer de l’équipe
Rencontre finale avec l’un de nos Partners (Yoan ou Steve)
Inscrivez-vous gratuitement pour découvrir les détails du poste : missions, profil recherché, et plus.
Vous avez déjà un compte ? Identifiez-vous !
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres