Des projets d'intérêt commun

Les projets 10% répondent à trois critères : ils présentent un intérêt commun pour plusieurs administrations, ils ont un impact concret et leurs données sont ouvertes. Découvrez les !


Les 3 étapes des projets 10%

PHASE D'INVESTIGATION

Janvier à février : Après le bootcamp de lancement au cours duquel les participants ont fait remonté leurs idées de projets d'intérêt commun, ils constituent une équipe, trouvent la bonne problématique et identifient le/les cas d'usage.

PHASE DE CONSTRUCTION

Mars à juin : Les équipes interministérielles travaillent sur la solution technique de leurs projets, la teste et la présente aux autres équipes du programme 10% lors du demo day.

PHASE D'AMPLIFICATION

Septembre à novembre : Les équipes proposent leurs projets aux administrations repreneuses qui sont accompagnées tout au long de cette phase. Elle s'achève par une présentation des projets lors du mois de l'innovation publique en novembre.

DSC01329

CHARTGOUV

Les agents de l’Etat, experts ou non experts, peinent à choisir un outil unique de visualisation de données, et cèdent parfois à des solutions commerciales. Ce projet vise à donner un cadre cohérent à la visualisation de données pour les agents de l’Etat en proposant un outil open source adapté esthétiquement (DSFR) et fonctionnellement (libraires JS de dataviz, e.g. ECharts et Observable Plot). Avec ce projet, les experts de la donnée monteront en compétences sur la visualisation de données et sur la connexion à tout type de base de données (SQL Alchemy). Nous ferons des cas d’usage avec des données ouvertes issues de plateformes de l’Etat (e.g. data.gouv.fr), et plus encore selon les besoins de chacun.

Code source
Trouver mon expert data

TROUVER MON EXPERTISE DATA

L’objectif du Ted (TrouverMonExpertiseData) est de mettre en place un moteur de recherche pour trouver les experts de la data de l’Etat par missions, organisations et compétences. Cet outil sera une aide à la fois pour les experts qui pourront trouver leurs pairs par compétence, pour leurs managers et pour les administrations. Tout l’intérêt du projet : identifier des expertises data rares dans les administrations, essentielles à la transformation de l’action publique

DSC01337

CARTIFLETTE

Cartiflette est un outil facilitant la récupération de fonds de carte officiels pour réaliser des cartes géographiques. Le projet Cartiflette a été lancé lors de la saison 1 du programme. Son objectif : rassembler les données géographiques de l’IGN et les référentiels administratifs de l’INSEE dans un point d’entrée clair et normalisé (catalogue et API) pour faciliter l’harmonisation et l’association de données géographiques. Le travail continue lors de la saison 2

Code source
FormIAble(1)

FORMiaBLE

Ce projet a été lancé lors de la saison 1. Son objectif : aider les administrations à exploiter en masse des documents administratifs sous des formats non directement exploitables (PDF scannés, images, etc.). L’information contenue dans ces documents, pour être exploitée, doit passer par une étape d’extraction et de structuration de l’information, qui est vite très chronophage si elle est réalisée à la main, d’où l’idée d’automatiser ce type de tâches. Ce travail se poursuit avec la saison 2: capitaliser sur les livrables de la saison 1 et aller plus loin en traitant un autre cas d’usage : l’extraction des données de formulaires.

Code source
DSC01345(1)

TRANFORMERS

La technologie des gigamodèles de langage fait rapidement évoluer les méthodes et les usages de l’analyse de texte. Ces gigamodèles qui deviennent incontournables en IA changent rapidement et requièrent pour l’inférence des ressources de calcul que le service moyen n’a pas. L’objet de ce défi 10% est de lever cette double contrainte, en instancier des API sur Onyxia qui permettront aux administrations consommer, à des fins exploratoires en phase de développement (pas d’engagement de continuité de service), des gigamodèles de langage libres avec la puissance de calcul mis à disposition par l’INSEE.

Code source
DSC01338

NOUVELLE GENERATION DE RAPPORTS WORD

Ce projet vise à créer un outil pour aider les administrations dans leur production récurrente de rapports. Le premier cas d’usage pour ce projet : analyser les offres d’emploi spécifiquement dans le numérique, pour voir quels sont les profils les plus recherchés, les directions les plus demandeuses, ou d’autres indicateurs encore. Le projet pourrait s’appliquer à d’autres contextes.

Code source
Impact environnemental

IMPACT ENVIRONNEMENTAL

Le projet vise à former à l’impact environnemental et mesurer celui des projets 10%. L’association Data For Good avait lancé le projet Code Carbon en 2021. C’est un projet crée au Canada par un des pères fondateurs du deep learning, Yoshua Bengio pour mesurer l’impact des entrainements de machine learning. Le projet propose d’utiliser cet outil pour mesurer l’impact carbone des projets 10% et, pourquoi pas ensuite le proposer pour mesurer l’impact carbone des projets publics. Le projet sera accompagné par une formation sur l’impact environnemental.

Datanonyme

DATANONYME

De nombreuses administrations souhaitent pouvoir diffuser des données à un niveau fin tout en garantissant la confidentialité des données difusées, notamment dans les cas où le secret statistique s’applique. Différentes familles de méthodes (anonymisation, données synthétiques, confidentialité différentielle) ont été développées à cette fin. L’objectif de ce projet est de faire un état des lieux de l’existant, à la fois dans l’administration et dans le monde académique, afin de dégager des briques techniques qui pourraient être mutualisées entre les différents cas d’usage rencontrés dans l’administration. Cela permettra de favoriser la réutilisation de données à des fins statistiques tout en limitant les risques d’atteinte à la confidentialité et donc de renforcer la confiance du public envers les institutions publiques

Code source