[Mission] Développeur·euse full stack sur compar:IA

Freelance
Paris
Télétravail fréquent
Salaire : Non spécifié
Expérience : > 5 ans

beta.gouv.fr
beta.gouv.fr

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Vous souhaitez contribuer à l’arène des IA conversationnelles de l’État français ? Participer à la sensibilisation du grand public à la diversité des modèles, à leurs biais et à leur impact environnemental ? Aider à créer l’un des plus grands jeux de données d’alignement de modèles d’IA au monde, au service du français et des langues encore peu représentées ? Rejoignez notre équipe !

Le produit

Intégrée à l’incubateur AllIAnce, compar:IA est une start-up d’État portée par la Direction interministérielle du numérique (DINUM) et le Ministère de la Culture.

Ouvert au public en octobre 2024, compar:IA compte plus de 200 000 visiteurs uniques et a collecté plus de 150 000 votes de préférence. La plateforme est gratuite, accessible sans création de compte, et répond à trois enjeux :

  • Faciliter l’accès à une diversité de modèles conversationnels

  • Informer l’utilisateur sur les caractéristiques des modèles et leur impact environnemental

  • Collecter et partager en open source des jeux de données (conversations, questions et votes) pour en faire bénéficier l’écosystème d’IA.

Pour le grand public, le site https://comparia.beta.gouv.fr permet de tester et comparer les réponses de deux agents conversationnels piochés parmi plus d’une trentaine de modèles semi-ouverts comme propriétaires. Plus de 80 modèles ont été testés sur la plateforme depuis octobre 2024, faisant chacun l’objet d’une fiche descriptive précise et informée.

Pour l’écosystème IA, les données de préférence collectées permettent de constituer des jeux de données de préférences sur des tâches exprimées en français, utiles notamment pour l’observation des usages et l’alignement des LLM. Ces jeux de données sont publiés et partagés sous licence ouverte sur data.gouv.fr et Hugging Face et constituent un commun numérique qui favorise la qualité des modèles sur les usages francophones.

Stack technique:

  • Backend : Python, FastAPI, Gradio

  • Frontend : Svelte/SvelteKit, TailwindCSS, Typescript

  • Infrastructure : Kubernetes, Helm, Jenkins, Sentry, Langfuse

  • Base de données : Redis, PostgreSQL, Metabase

  • Gestion de code : Github (https://github.com/betagouv/comparia), images Docker, Weblate (pipeline de traduction)

La stratégie

Accessible depuis octobre 2024, compar:IA est désormais bien identifié auprès des utilisateurs, notamment dans la sphère éducative, académique et auprès des éditeurs de modèles. Les jeux de données de comparIA en français dépassent les 200 000 lignes et ont fait partie des corpus les plus populaires sur Hugging Face en 2025. Ils constituent une ressource rare et exploitable à la fois par les acteurs industriels et académiques (machine learning et sciences humaines et sociales).

Après un lancement réussi, compar:IA est en phase d’accélération avec plusieurs chantiers prioritaires :

  • Extension du service à d’autres langues européennes, sur la base de partenariats avec trois pays pilotes: la Suède, le Danemark et la Lituanie

  • Publication d’un classement des modèles à partir des votes des utilisateurs (sur la base du modèle Bradley Terry)

  • Intégration continue de nouveaux modèles et adaptation aux évolutions technologiques (modèles de raisonnement, nouvelles architectures etc.)

  • Amélioration de la performance, de l’accessibilité et de la sécurité de la plateforme.

Futures évolutions techniques

La plateforme a d’abord été codée via Gradio pour le backend et le frontend, puis le frontend a été refondé en SvelteKit seulement. Gradio n’est plus utilisé que comme API Python. Plusieurs chantiers techniques sont envisagés pour les mois à venir :

  • Remplacement de Gradio en back-end par du FastAPI et gestion de sessions via Redis

  • Mise au point de plusieurs versions internationalisées :

    • site multilingue (Paraglide + Weblate) et gestion des différents DNS / routage

    • Publication de datasets par langue sur Hugging Face

  • Mise au point et suivi de l’évolution des classements des modèles (partenariat en cours avec le PEReN)

  • Ajout de nouvelles fonctionnalités backend/frontend en collaboration avec l’équipe

L’équipe

Notre équipe évolue et a besoin d’un.e second.e développeur/développeuse full stack, avec une appétence pour le domaine de l’IA, afin d’assurer la continuité et l’évolution du service.

Vous serez intégré·e au sein d’une équipe de cinq personnes, composée d’une intrapreneure, un designer, deux développeurs et un chargé de diffusion/partenariats internationaux. L’équipe est accompagnée par l’Atelier numérique du ministère de la Culture. L’équipe peut aussi s’appuyer sur l’expertise des équipes Etalab de la DINUM (Albert API), de l’incubateur AllIAnce, et bénéficier de l’écosystème beta.gouv.

Missions principales

En lien avec l’autre développeur fullstack, vous serez en charge de concevoir et réaliser techniquement l’application. Vos activités au quotidien seront notamment :

Développement et maintenance

  • Développer de nouvelles fonctionnalités frontend et backend en fonction de la stratégie produit

  • Maintenir et faire évoluer la plateforme existante (bug fixes, optimisations, refactoring)

  • Assurer la qualité du code (tests, revues de code, documentation)

  • Garantir le bon fonctionnement, la performance et la scalabilité de la plateforme face à l’augmentation du trafic

  • Intégrer de nouveaux modèles de langage sur la plateforme

  • Développer les pipelines nécessaires à l’exploitation et au partage des jeux de données

Infrastructure et déploiement

  • Travailler en lien avec l’équipe DevOps du Service du Numérique du ministère à des mises à jour de la charte Helm (Kubernetes)

  • Superviser la bonne exécution des pipelines de CI/CD

  • Assurer le monitoring et l’observabilité de la plateforme

  • Contribuer à l’amélioration de la sécurité et de l’accessibilité du service

Collaboration et open source

  • Travailler en méthodologie agile avec l’équipe produit

  • Documenter le code et les choix technique, contribuer à la pratique open source du projet (code, documentation, partage de connaissances)


Profil recherché

  • Développeur/développeuse full stack Python/Typescript, PostgreSQL. De l’expérience sur FastAPI et/ou Svelte est un plus.

  • Appétence et curiosité pour l’écosystème d’IA générative et des nouveaux outils qui le composent.

  • Connaissance des enjeux infra : réseau, load balancing, monitoring, cycle des images Docker. De l’expérience sur Kubernetes ou Jenkins est un plus.

  • Sensibilité à l’expérience utilisateur, capacité à dialoguer avec un designer pour concevoir des UI performantes, accessibles (RGAA), et conformes au Design système de l’État (DSFR).

  • Connaissance des bonnes pratiques de création d’API et de manipulation de données (usage de Pydantic, la connaissance de Polars/Pandas est un plus).

  • Autonomie et force de proposition

  • Bienveillance et esprit d’équipe

Modalités

  • Poste ouvert pour le statut d’indépendant / prestation.

  • De 2 à 3 jours par semaine

  • Durée minimale souhaitée de 3 mois, renouvelable si le projet atteint ses objectifs.

  • Taux journalier selon profil

  • Démarrage immédiat si possible (octobre 2025).

  • Organisation de travail hybride, en télétravail ou bureau à Paris 01.

  • Des déplacements sont possibles.


Déroulement des entretiens

Envoyez votre CV et lettre de motivation sur cette plateforme.

Les profils retenus seront contactés pour un ou deux entretiens avec l’équipe produit, ainsi que des membres de l’Atelier numérique (incubateur du Ministère de la Culture).

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Développement de logiciels et de sites Web”.