Vous souhaitez contribuer à l’arène des IA conversationnelles de l’État français ? Participer à la sensibilisation du grand public à la diversité des modèles, à leurs biais et à leur impact environnemental ? Aider à créer l’un des plus grands jeux de données d’alignement de modèles d’IA au monde, au service du français et des langues encore peu représentées ? Rejoignez notre équipe !
Intégrée à l’incubateur AllIAnce, compar:IA est une start-up d’État portée par la Direction interministérielle du numérique (DINUM) et le Ministère de la Culture.
Ouvert au public en octobre 2024, compar:IA compte plus de 200 000 visiteurs uniques et a collecté plus de 150 000 votes de préférence. La plateforme est gratuite, accessible sans création de compte, et répond à trois enjeux :
Faciliter l’accès à une diversité de modèles conversationnels
Informer l’utilisateur sur les caractéristiques des modèles et leur impact environnemental
Collecter et partager en open source des jeux de données (conversations, questions et votes) pour en faire bénéficier l’écosystème d’IA.
Pour le grand public, le site https://comparia.beta.gouv.fr permet de tester et comparer les réponses de deux agents conversationnels piochés parmi plus d’une trentaine de modèles semi-ouverts comme propriétaires. Plus de 80 modèles ont été testés sur la plateforme depuis octobre 2024, faisant chacun l’objet d’une fiche descriptive précise et informée.
Pour l’écosystème IA, les données de préférence collectées permettent de constituer des jeux de données de préférences sur des tâches exprimées en français, utiles notamment pour l’observation des usages et l’alignement des LLM. Ces jeux de données sont publiés et partagés sous licence ouverte sur data.gouv.fr et Hugging Face et constituent un commun numérique qui favorise la qualité des modèles sur les usages francophones.
Stack technique:
Backend : Python, FastAPI, Gradio
Frontend : Svelte/SvelteKit, TailwindCSS, Typescript
Infrastructure : Kubernetes, Helm, Jenkins, Sentry, Langfuse
Base de données : Redis, PostgreSQL, Metabase
Gestion de code : Github (https://github.com/betagouv/comparia), images Docker, Weblate (pipeline de traduction)
Accessible depuis octobre 2024, compar:IA est désormais bien identifié auprès des utilisateurs, notamment dans la sphère éducative, académique et auprès des éditeurs de modèles. Les jeux de données de comparIA en français dépassent les 200 000 lignes et ont fait partie des corpus les plus populaires sur Hugging Face en 2025. Ils constituent une ressource rare et exploitable à la fois par les acteurs industriels et académiques (machine learning et sciences humaines et sociales).
Après un lancement réussi, compar:IA est en phase d’accélération avec plusieurs chantiers prioritaires :
Extension du service à d’autres langues européennes, sur la base de partenariats avec trois pays pilotes: la Suède, le Danemark et la Lituanie
Publication d’un classement des modèles à partir des votes des utilisateurs (sur la base du modèle Bradley Terry)
Intégration continue de nouveaux modèles et adaptation aux évolutions technologiques (modèles de raisonnement, nouvelles architectures etc.)
Amélioration de la performance, de l’accessibilité et de la sécurité de la plateforme.
Futures évolutions techniques
La plateforme a d’abord été codée via Gradio pour le backend et le frontend, puis le frontend a été refondé en SvelteKit seulement. Gradio n’est plus utilisé que comme API Python. Plusieurs chantiers techniques sont envisagés pour les mois à venir :
Remplacement de Gradio en back-end par du FastAPI et gestion de sessions via Redis
Mise au point de plusieurs versions internationalisées :
site multilingue (Paraglide + Weblate) et gestion des différents DNS / routage
Publication de datasets par langue sur Hugging Face
Mise au point et suivi de l’évolution des classements des modèles (partenariat en cours avec le PEReN)
Ajout de nouvelles fonctionnalités backend/frontend en collaboration avec l’équipe
Notre équipe évolue et a besoin d’un.e second.e développeur/développeuse full stack, avec une appétence pour le domaine de l’IA, afin d’assurer la continuité et l’évolution du service.
Vous serez intégré·e au sein d’une équipe de cinq personnes, composée d’une intrapreneure, un designer, deux développeurs et un chargé de diffusion/partenariats internationaux. L’équipe est accompagnée par l’Atelier numérique du ministère de la Culture. L’équipe peut aussi s’appuyer sur l’expertise des équipes Etalab de la DINUM (Albert API), de l’incubateur AllIAnce, et bénéficier de l’écosystème beta.gouv.
En lien avec l’autre développeur fullstack, vous serez en charge de concevoir et réaliser techniquement l’application. Vos activités au quotidien seront notamment :
Développement et maintenance
Développer de nouvelles fonctionnalités frontend et backend en fonction de la stratégie produit
Maintenir et faire évoluer la plateforme existante (bug fixes, optimisations, refactoring)
Assurer la qualité du code (tests, revues de code, documentation)
Garantir le bon fonctionnement, la performance et la scalabilité de la plateforme face à l’augmentation du trafic
Intégrer de nouveaux modèles de langage sur la plateforme
Développer les pipelines nécessaires à l’exploitation et au partage des jeux de données
Infrastructure et déploiement
Travailler en lien avec l’équipe DevOps du Service du Numérique du ministère à des mises à jour de la charte Helm (Kubernetes)
Superviser la bonne exécution des pipelines de CI/CD
Assurer le monitoring et l’observabilité de la plateforme
Contribuer à l’amélioration de la sécurité et de l’accessibilité du service
Collaboration et open source
Travailler en méthodologie agile avec l’équipe produit
Documenter le code et les choix technique, contribuer à la pratique open source du projet (code, documentation, partage de connaissances)
Développeur/développeuse full stack Python/Typescript, PostgreSQL. De l’expérience sur FastAPI et/ou Svelte est un plus.
Appétence et curiosité pour l’écosystème d’IA générative et des nouveaux outils qui le composent.
Connaissance des enjeux infra : réseau, load balancing, monitoring, cycle des images Docker. De l’expérience sur Kubernetes ou Jenkins est un plus.
Sensibilité à l’expérience utilisateur, capacité à dialoguer avec un designer pour concevoir des UI performantes, accessibles (RGAA), et conformes au Design système de l’État (DSFR).
Connaissance des bonnes pratiques de création d’API et de manipulation de données (usage de Pydantic, la connaissance de Polars/Pandas est un plus).
Autonomie et force de proposition
Bienveillance et esprit d’équipe
Poste ouvert pour le statut d’indépendant / prestation.
De 2 à 3 jours par semaine
Durée minimale souhaitée de 3 mois, renouvelable si le projet atteint ses objectifs.
Taux journalier selon profil
Démarrage immédiat si possible (octobre 2025).
Organisation de travail hybride, en télétravail ou bureau à Paris 01.
Des déplacements sont possibles.
Envoyez votre CV et lettre de motivation sur cette plateforme.
Les profils retenus seront contactés pour un ou deux entretiens avec l’équipe produit, ainsi que des membres de l’Atelier numérique (incubateur du Ministère de la Culture).
Rencontrez Nadia, Développeuse
Rencontrez Annie, Product Owner & Chargée de Déploiement
Ces entreprises recrutent aussi au poste de “Développement de logiciels et de sites Web”.