Data Engineer OnPrem HPC (Audio/IA)

Résumé du poste
CDI
Paris
Salaire : 50K à 60K €
Télétravail occasionnel
Expérience : > 3 ans
Éducation : Bac +5 / Master
Compétences & expertises
Contenu généré
Réglementation environnementale
Compétences en mécanique
Formation et perfectionnement
Kubernetes
Git
+9

LittleBigCode
LittleBigCode

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Tu as une appétence forte pour les environnements techniques complexes, les architectures hautes performances, et tu veux contribuer à des projets IA ambitieux, mêlant données multimédia, modèles avancés et défis de production ? Ce poste est fait pour toi.

Ton rôle chez LittleBigCode

Au sein d’une équipe dédiée à des projets IA de pointe, tu évolueras dans un environnement OnPremise exigeant, basé sur des clusters GPU haute performance.

Tu interviendras sur l’ensemble de la chaîne de traitement de la donnée, depuis l’ingestion jusqu’à l’industrialisation, en lien étroit avec des Data Scientists spécialisés en machine learning, deep learning et GenAI.

Tes principales missions

  • Architecture & développement : Concevoir des pipelines de données robustes et scalables, orchestrés via Airflow, basés sur Trino, Iceberg, PostgreSQL et Minio.

  • Industrialisation & déploiement : Conteneurisation avec Docker, déploiement via Kubernetes, CI/CD avec Jenkins, monitoring des performances avec Grafana et Prometheus.

  • Collaboration IA : Travailler main dans la main avec les Data Scientists pour garantir la fluidité entre modélisation, expérimentation et mise en production.

  • Multimédia & open source : Contribuer à des projets innovants sur les données audio/vidéo et s’appuyer sur des solutions open source pour construire des systèmes performants et maintenables.


Profil recherché

Formation & expérience

  • Diplômé(e) d’un Master 2 d’une grande école d’ingénieur ou d’une université reconnue.

  • Une première expérience significative en environnement HPC ou OnPrem est requise.

  • Une exposition à des projets dans les domaines de l’IA, du multimédia ou de l’industrie sera un vrai atout.

Compétences techniques

  • Langages & frameworks : Très bonne maîtrise de Python, FastAPI et SQL.

  • Orchestration & stockage : Expérience confirmée avec Airflow, Apache Iceberg, Trino, PostgreSQL et Minio.

  • Déploiement & containerisation : À l’aise avec Docker, Kubernetes, Jenkins.

  • Observabilité : Bonne connaissance de Grafana et Prometheus.

  • Systèmes & outils : Maîtrise de Linux, Git.

  • Bonus : Une connaissance de Ray est un plus.

Méthodologie & environnement

  • Tu appliques les bonnes pratiques de développement : TDD, SOLID, design patterns, documentation rigoureuse.

  • Tu as de solides bases en réseau et sécurité, et une bonne compréhension des architectures HPC OnPrem.

  • Tu es familier(ère) avec les problématiques liées à l’IA (ML/DL/GenAI) et aux données audio/vidéo.

  • Tu suis de près l’écosystème open source : veille, contributions, réutilisation de briques éprouvées.

Soft skills

  • Tu es autonome, rigoureux(se) et sais t’intégrer facilement dans une équipe.

  • Tu évolues avec aisance dans un contexte agile (Daily, DDS…).

  • Tu sais communiquer efficacement sur des sujets techniques complexes avec des interlocuteurs variés (data scientists, ingénieurs infra, métiers).


Déroulement des entretiens

  1. Échange RH avec Manon ou Basma

  2. Entretien technique avec un Lead Data Engineer de l’équipe

  3. Rencontre finale avec l’un de nos Partners (Yoan ou Steve)

Envie d’en voir plus ? Inscrivez-vous en un clic.

Inscrivez-vous gratuitement pour découvrir les détails du poste : missions, profil recherché, et plus.

Vous avez déjà un compte ?

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres