Renault Digital

Renault Digital

Big Data, IT / Digital, Intelligence artificielle / Machine Learning

Boulogne-Billancourt

Explorez leurs posts

Parcourez les posts publiés par l’entreprise pour une immersion dans leur culture et leurs domaines d’expertise.

La Data Science chez Renault Digital

Renault Digital

La Data Science chez Renault Digital

🗣️ Paul Beaujean l'un de nos experts en la matière, vous emmène dans les coulisses de notre approche axée sur la production.

➡️ De l'organisation de notre équipe à l'intégration des modèles de machine learning dans l'architecture IT de Renault Group, découvrez notre approche centrée sur l'excellence opérationnelle. 👇

  1. Comment l'équipe est-elle organisée ?

    Chez Renault Digital, nous sommes un chapitre d'une vingtaine de data scientists. Comme dans beaucoup d'entreprises, nous interagissons avec différents profils : des développeurs, des experts DevOps, des data engineers et bien sûr avec les professionnels du métier dans lequel nous intervenons : manufacturing, marketing, ingénierie, services de mobilité et bien d'autres.

  2. Qu'est-ce qui caractérise la data science chez Renault Digital ?

    Ce qui caractérise la data science chez RD, c'est l'esprit de la production.

    Nous pouvons bien sûr produire des analyses qui répondent aux questions du métier, mais le coeur de notre expertise, c'est de développer des systèmes de machine learning qui s'intègrent dans l'architecture IT de Renault Group.

  3. Quels aspects des données sont essentiels à prendre en compte au cours d'un projet ?

    Il s'agit d'apprendre à connaître les sources, de savoir à quelle fréquence elles sont mises à jour, de pouvoir monitorer leur qualité dans le temps, et d'effectuer les bonnes transformations qui vont fonctionner de manière robuste dans le temps.

  4. Quelles sont les différentes sources d'erreurs auxquelles les data scientists sont confrontés ?

    Avec l’expérience, on devient très familier avec toutes sortes d'erreurs. Certaines viennent des sources de données, d'autres de transformation qui n'ont plus le même sens, et bien sûr quand il s'agit d'apprentissage, on porte une attention particulière aux types d'erreurs de prédiction de nos modèles et à l'impact qu'elles ont sur la problématique métier.

  5. Quels sont les modèles à privilégier quand on veut aller jusqu'en production ?

    On choisit des modèles de machine learning qui sont robustes et qu'on comprend bien.

    Pour les données tabulaires et les séries temporelles, on travaille souvent avec du boosting d'arbres de décision via XGBoost ou LightGBM, qui permet d'obtenir des performances à l'état de l'art tout en étant suffisamment interprétable et analysable.

  6. Qu'est-ce qui change dans le code de production par rapport aux notebooks ?

    On travaille dans le cadre d'un projet informatique et on utilise tous les outils à notre disposition pour mettre en place le "shift left" et traiter les problèmes en amont plutôt qu'en aval. Que ce soit dans nos pipelines de pre-commit, de CI/CD ou d'orchestration, on vise la même excellence que celle des chaînes de production des usines du groupe.