Cette offre n’est plus disponible.

Ingénieur.e Data Scientist Experimenté.e

CDI
Paris
Salaire : Non spécifié
Télétravail total
Expérience : > 2 ans

NEXQT
NEXQT

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

En tant que Data Scientist Expérimenté.e, vous intégrerez une équipe consacrée à la Data Science qui suit une forte dynamique de développement.

Sous la supervision du Lead Data Scientist, vous vous appuierez sur une pipeline de traitement de données souveraine ainsi que d’une toolbox (Python + PostgreSQL/PostGIS + Docker) permettant de croiser et d’enrichir plusieurs dizaines de sources de données de volumétrie importante.

Vous apporterez votre expérience pour enrichir cette pipeline sur les plans quantitatifs (amélioration de la précision des modèles, de la performance des calculs) et qualitatifs (ajouts de labels, industrialisation de services). Vous proposerez également de nouvelles méthodologies pour les phénomènes émissifs ainsi que les zones géographiques qui ne sont pas encore couverts par NEXQT. Pour mener à bien votre mission, vous manipulerez des sources de données hétérogènes (données vecteur sur les infrastructures, consommations d’énergie, données satellites, enquêtes statistiques, données GPS, séries temporelles…). Vous interviendrez aussi bien sur le diagnostic des tendances à l’oeuvre au sein du territoire que sur les fonctionnalités de simulation de politiques publiques permettant aux villes de développer des projets efficients de décarbonation.

Votre rôle au sein de l’équipe

● Renforcer les algorithmes existants.

● Définir des nouvelles chaînes de traitement de la collecte de données jusqu’à l’industrialisation en passant par la modélisation statistique (nouvelles zones géographiques, autres secteurs/phénomènes émissifs, de la collecte à l’industrialisation).

● Être un garant de la qualité des données envoyées vers la plateforme utilisateurs.

● Être force de proposition pour l’équipe en faisant émerger de nouvelles méthodes, technologies et sources de données. Cela passera par une veille technologique permanente sur les travaux et les données disponibles en milieu urbain.

● Travailler en étroite collaboration avec le Lead Data Scientist et lui fournir un suivi régulier de l’état des travaux et du système.

● Encadrer des Data Scientists Juniors et stagiaires qui contribueront à l’analyse de données et développement de POCs.

● Valoriser les travaux auprès des villes et des partenaires internationaux du projet au travers de visualisations avancées, de présentations, de rapports, de spécifications fonctionnelles…

Pourquoi nous rejoindre

● Une entreprise passionnée et engagée sur la lutte contre les émissions de gaz à effet de serre, en plein développement

● Une équipe experte sur le cycle du carbone avec un co-fondateur auteur principal d’un rapport du GIEC et un réseau international de labos en appui (France, USA, Chine, Inde)

● Une logique basée sur l’impact : nous outillons les acteurs locaux pour leur permettre de développer des projets, ici et maintenant, évitant concrètement des tonnes de CO2, et contribuons à élaborer les futurs standards de l’intelligence carbone des territoires

● Un poste avec une autonomie et une marge de manoeuvre importante, qui vous permettra d’exprimer votre talent

● Un réseau d’acteurs internationaux de premier plan sur les enjeux climatiques (RMI, WMO, CDP, etc.) donnant accès notamment à des événements internationaux à fort impact


Profil recherché

Compétences

● Vous avez une forte appétence pour les sujets liés à la science, au climat et au développement urbain durable. Vous possédez des connaissances solides sur les sources de données et les méthodes à la pointe dans ce domaine.

● Vous possédez une clarté rédactionnelle et orale pour valoriser vos travaux techniques et ceux de l’équipe.

● Vous faites preuve d’autonomie dans l’apprentissage de nouvelles technologies pour résoudre des verrous technologiques.

● Vous êtes familier.ère avec les concepts de gestion de projet en mode Agile. Vous savez mener de front des développements critiques et des projets de R&D stratégiques. Vous aimez encadrer des travaux de juniors.

● Vous êtes à l’aise avec les workflows de développements propres aux projets data (versionnage, CI/CD, TDD..).

● Vous avez idéalement une expertise en cloud computing (sur AWS de préférence), et en traitement de données géographiques (vecteur et raster).

● Vous maitrisez parfaitement l’anglais dans un contexte professionnel et scientifique.

Expérience et formation

● Vous êtes diplômé.e de l’enseignement supérieur (Bac+4 ou +5) en statistiques, intelligence artificielle, mathématiques appliquées, systèmes d’information géographique, développement informatique ou d’une filière d’ingénieur couvrant tout ou partie de ces domaines (énergie, environnement, data science).

● Vous avez un minimum de 2 ans d’expérience en tant que Data Scientist et avez travaillé sur des projets de modélisation énergie-climat, jumeaux numériques, smart city ou des sujets connexes.

● Vous avez une expérience en gestion de projet data et avez déjà encadré des juniors.

Environnement technique

● Data Science: Les langages privilégiés pour la chaîne de traitement de données sont Python et SQL. Une connaissance avancée des librairies de traitement de données (pandas, geopandas, pyspark, rasterio, xarray), de modélisation (scipy, scikit-learn, openCV), de visualisation (seaborn, plotly, dash, keplerGL, follium, mapbox, carto, arcgis) est demandée. Une connaissance de Javascript ou R serait un plus.

● Cloud: Docker, Kubernetes, environnement AWS

● SGBD: PostgreSQL, PostGIS, AWS RDS, Mapbox Tilesets

● Acquisition: De l’expérience dans l’utilisation de l’API OpenStreetMap, BAN Adress, Google Maps, Google Earth, des standards WFS, voire des compétences en web scrapping.

● Orchestration et Automatisation des traitements : AirFlow ou autres solutions open source.

● Versioning et CI/CD: GitHub Actions, Gitlab pipelines, Jenkins, Pytest, Linters (PEP 8)..

● Pack office.


Déroulement des entretiens

  • Premier entretien technique avec le Lead Data Scientist en charge de la plateforme (Nicolas Megel)

  • Second entretien avec le CEO (Fouzi Benkhelifa).

L’ensemble du processus est d’une durée inférieure à 3 semaines.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres