Data Engineer Junior / IA pour la démocratie

Résumé du poste
CDI
Paris
Salaire : Non spécifié
Début : 30 septembre 2024
Télétravail fréquent
Compétences & expertises
Contenu généré
Spacy
Pandas
Docker
Sql
Python

Make.org
Make.org

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Mission

Make.org est une civic-tech dont la mission est d’engager massivement les citoyens dans la transformation positive de la société. Nous croyons que bien utilisée, la technologie permet de recréer du lien et du dialogue constructif, et faire sortir des bulles d’information et de l’invective des réseaux sociaux. Nous développons des plateformes d’engagement massif en ligne qui mettent en œuvre ces principes au service de l’engagement citoyen.

Nous opérons certaines opérations nous même comme nos grandes causes contre les violences faites aux femmes ou pour donner une chance à chaque jeune. Nous travaillons aussi avec des institutions comme le ministère de l’économie pour co-construire la loi sur les influenceurs. Et avec des entreprises comme Orange pour rendre le numérique plus durable.Nous sommes aussi présents en Allemagne et à Bruxelles, et nous sommes capables d’opérer des opérations au niveau européen comme We Europeans en amont les élections européennes qui a réuni 1,7 million de participants. Nous avons vocation à nous développer au niveau européen et mondial.

Nous voyons l’arrivée de l’IA générative à la fois comme une menace et comme une belle opportunité pour la démocratie. Il est important de se défendre contre les usages néfastes de l’IA comme la génération de fake news et de deep fake, et nous portons une initiative collective d’acteurs de la tech pour y répondre : le Democratic Shield. Mais c’est aussi en renforçant les démocraties que nous les rendrons plus résilientes. Et nous croyons que L’IA peut donner encore plus de possibilités aux citoyens de participer à l’élaboration de solution communes.

La mission principale de ce poste de Data Ingénieur est de contribuer à développer les usages de l’IA au service de l’engagement citoyen. Cela va de l’analyse automatique des résultats au développement de solution basée sur des IA génératives pour aider les citoyens à appréhender la complexité des problèmes d’intérêt général, en passant par l’entraînement d’IA générative open-source et à la correction de leur biais. 

Principaux défis

La donnée analysée par nos algorithmes et nos plateformes est essentiellement de la donnée textuelle. Nous mobilisons donc essentiellement des techniques de NLP, aujourd’hui grandement renouvelées par l’IA générative et les LLM.

En tant que Data Ingénieur vous serez amené à déployer les algorithmes développés par les Data Scientists, à contribuer à leur amélioration et à assurer la maintenance des algorithmes et des services en production.

Vous aurez notamment à faire évoluer et à maintenir une architecture RAG, à développer et à maintenir les algorithmes d’ingestion et de nettoyage de données. Vous assurerez aussi le développement et la maintenance de services data interne comme l’analyse automatique des consultations, le suivi de la performance de nos campagnes d’acquisition et le suivi des métriques d’engagement sur nos plateformes.

Un des principaux défis actuellement est l’accélération du rythme d’innovation dans le domaine de l’IA générative qui nécessite une veille et une remise en cause permanente. Malgré ce progrès constant, les LLM restent des technologies récentes et transformer les progrès annoncés en applications concrètes, fiables et utiles reste un défi. Vous devrez donc  tester et valider les nouvelles fonctionnalités permises par les avancées technologiques des LLM.

Nous restons une petite équipe, les Data Scientists seront donc aussi en mesure de développer une bonne partie des applications et vous travaillerez en étroite collaboration avec eux. Mais vous serez en charge de la fiabilité et de la maintenabilité des applications data.


Profil recherché

Vous avez une première expérience en développement d’application data ou une formation avec de beaux projets appliqués.

Python est votre deuxième langue maternelle, vous maîtrisez les librairies standards, vous connaissez les librairies classiques utilisées en data-science et en IA (pandas, sklearn, spacy, transformers, langchain ou llamaindex). Vous êtes à l’aise en SQL, et vous avez quelques connaissances en noSQ. 

Vous êtes à l’aise avec les technologies de mise en production notamment Docker. Vous aimez tester de nouvelles librairies, intégrer de nouvelles API. Bonus : vous avez déjà développé une application intégrant un LLM.

Vous aimez travailler en équipe dans un contexte agile. Vous aimez expérimenter pour trouver de nouvelles approches puis industrialiser vos projets pour les pérenniser. 

Vous voulez rejoindre une équipe data innovante et dynamique et une aventure start-up dédiée à un projet de transformation de la société.

We are an international company, speaking english is mandatory.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.