Vos challenges
En tant que Data Scientist, vous jouerez un rôle clé dans la conception, l'expérimentation et la mise en production de modèles IA sur des cas d'usage stratégiques pour les métiers KPMG (Audit, Advisory, Avocats). Vous interviendrez tout au long du cycle de vie d'un projet IA, en lien étroit avec les équipes Data, Software, MLOps et Product.
Vos principales missions seront de :
Analyse & cadrage :
- Comprendre les besoins métiers et les problématiques à adresser
- Participer à la qualification des cas d'usage
- Identifier les sources de données pertinentes (structurées, semi/non structurées)
- Contribuer à la définition des critères de succès et du plan expérimental
Conception & expérimentation :
- Extraire, nettoyer et structurer les données nécessaires à l'entraînement des modèles
- Concevoir et entraîner des modèles de Machine Learning, Deep Learning ou LLM adaptés au besoin
- Évaluer les performances des modèles (métriques, biais, hallucinations, robustesse)
- Collaborer avec les Data Engineers pour la préparation et la qualité des datasets
Industrialisation & suivi :
- Travailler avec les équipes MLOps pour la mise en production et le monitoring des modèles
- Participer à la définition des pipelines d'entrainement, de scoring et de suivi de performance
- Contribuer à la documentation technique et au transfert vers les équipes d'exploitation
Collaboration & amélioration continue :
- Collaborer étroitement avec les autres Data Scientists et le Lead Data Scientist pour capitaliser les bonnes pratiques
- Contribuer à la veille technologique sur les frameworks, modèles open-source et outils IA émergents
- Participer aux partages de connaissances, démonstrations et revues de projets au sein de l'AI Lab
Compétences minimales :
- Langages : Python (pandas, scikit-learn, PyTorch, LangChain), SQL.
- Modèles & Frameworks : LLMs (OpenAI, Mistral, LLaMA, Claude), Machine Learning & Deep Learning, NLP.
- Cloud & MLOps : Azure ML, MLflow, CI/CD, GitHub Actions, Azure DevOps.
- Data & Stockage : Azure Data Lake, SQL Server, Cosmos DB.
- Environnements de développement : Visual Studio Code, Jupyter, Git.
- Bonnes pratiques : gestion de versions, reproductibilité, data quality, monitoring des modèles.
Une connaissance des notions de finance d'entreprise, audit ou conseil constitue un atout fort pour comprendre les enjeux métiers du Cabinet.