Au sein du Datalab, l’ingénieur(e) data travaille avec un product owner, des data scientists et un analyste de données pour développer des cas d’usages mobilisant des données et à fort impact. Au sein d’une équipe produit suivant la méthode agile, l’agent a pour mission de mettre en place des outils de traitement de la donnée pour réaliser des cas d’usage.
Il/elle met en œuvre des traitements sur les données manipulées dans le cadre des cas d’usage portés par le Datalab afin de favoriser et de faciliter la réutilisation de celles-ci par son équipe.
Vous serez amené(e) à :
Utiliser et mettre en œuvre des outils de traitements et de stockage de données (bases de données) pour faciliter leur mise à jour et leur mise à disposition. Vous serez sensible à la question de la sécurité et de l’administration système et gérerez cette problématique dans les infrastructures data que vous utiliserez. A ce titre, vous collaborerez étroitement avec le responsable DataSecOps (F/H) de l’équipe.
Faciliter l’interopérabilité des données en intégrant des variables pivots permettant le croisement avec d’autres données et vous assurer du respect de bonnes pratiques techniques permettant une meilleure exploitation des données. Pour cela, vous intégrerez les dimensions de complétude, d’unicité, de conformité, de traçabilité et de coconformité, de traçabilité et de cohérence des données.
Garantir les bonnes pratiques de développements appliquées sur les données (traitements, montée en qualité, calculs d’indicateurs) dans l’optique de maximiser l’impact de projet data à fort potentiel.
Veiller à ce que les outils et traitements développés dans le cadre du Datalab soient transférables aux entités chargées de les exécuter en production dans les administrations lorsque les cas d’usage data ont démontré leur impact et sont finalisés.
Mener une veille technologique active pour mobiliser les meilleures technologies.
Au cours de la réalisation de vos missions, vous devriez être en veille permanente pour détecter des projets à impact à valoriser ou à accompagner.
Vous pourriez, par ailleurs être amené(e) à renforcer ponctuellement les autres agents du département suivant l’intérêt du service.
Enfin, en fonction de l’évolution des priorités fixées à la DINUM et au département Etalab, vous pourrez être amené(e) à prendre ponctuellement en charge d’autres tâches et projets.
De formation supérieure (bac+5), vous disposez d’une expérience d’au moins 5 ans en ingénierie de données. Vous êtes un(e) expert(e) de la donnée. A ce titre, vous êtes sensible à la question de la qualité des données et à leur accessibilité.
Vous disposez également de :
Très bonnes connaissances dans la mise en place d’outils : de stockage de données (Minio, Elasticsearch, Postgres, Mongo, etc.), de traitement de données (Apache Arrow et Spark, Python, Pandas, Polars, etc.), d’ordonnancement de flux (Airflow, Prefect, Luigi, DBT, etc.)
Bonnes connaissances en développement backend, notamment dans la mise en œuvre d’API et en administration système (Linux, Docker)
Connaissance de l’écosystème des outils libres
Connaissance du droit de la donnée et des enjeux juridiques liés au traitement des données sensibles
Bonne connaissance des données manipulées au sein de l’administration serait un plus
Expertise dans les outils liés à l’exploitation de la donnée (data engineering)
Solides compétences en développement (Python, Pandas, Polars, Arrow, etc.) et en outils de développement opérationnel (git, ci/cd, Docker, Airflow, etc.)
Capacité à contribuer sur des logiciels libres
Force de proposition,
Rigueur, réactivité
Esprit analytique et de synthèse
Pour postuler, cliquez sur le lien ci-après : https://choisirleservicepublic.gouv.fr/offre-emploi/2023-1327159/?tracking=1&idOrigine=502
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.