La caisse des depôts parie sur l'Open Data en appui sur la solution française d'OpenDataSoft

Data / IA

La Caisse des Dépôts s’inscrit dans l’écosystème de l’open data

Par François Jeanne, publié le 28 juin 2023

Conformément à la loi sur le numérique de 2018 qui définit le rôle des Administrations dans le développement d’un écosystème de l’open data, et pour accélérer sa transition vers une organisation articulée autour de données mieux partagées, la Caisse des Dépôts a développé deux portails, l’un pour le grand public, l’autre pour l’interne, avec Opendatasoft.

C’est la concomitance de deux grands événements, au moins… D’un côté une vénérable institution, la Caisse des Dépôts qui, en 2018, se réorganise en quatre métiers – banques des territoires, politiques sociales-retraites, gestion des participations stratégiques et gestion d’actifs – et décide d’accélérer une digitalisation initiée deux ans plus tôt. Et de l’autre, une Loi sur le Numérique (dite également Loi Lemaire) qui, toujours en 2018, impose aux Administrations d’ouvrir l’accès aux données publiques.

À l’arrivée, un grand projet pour penser une politique de partage de la donnée, vers le grand public et les partenaires donc, mais aussi en interne, pour améliorer les synergies entre les métiers. Pour soutenir le tout, une plateforme, celle de l’éditeur français Opendatasoft, dont les différents outils vont à la fois supporter la démarche et la structurer au fil de l’eau, en permettant l’acculturation progressive des utilisateurs.

« À mon arrivée en 2018, Opendatasoft était déjà présente, mais peu utilisée », se souvient Isabelle Bridenne, responsable projets data et open data. La statisticienne de formation y voit tout de même rapidement la possibilité de concrétiser une volonté réelle de casser les silos historiques. « Il y avait certes un assez bon usage de la data, mais de façon dispersée et parfois redondante alors qu’on travaillait avec les mêmes partenaires. »

Création d’une direction digitale transverse

Une direction digitale transverse est créée, qui lancera rapidement sa feuille de route avec des objectifs aussi ambitieux que multiples : digitaliser l’institution ; encourager les usages de la data auprès des 6 000 collaborateurs de la Caisse des Dépôts ; organiser sa gouvernance ; mais aussi acculturer les collaborateurs à la donnée. L’ouverture de deux portails, l’un à destination de l’externe pour se conformer à la contrainte légale, l’autre pour les collaborateurs de l’institution, va fournir une opportunité intéressante de démocratisation du partage et de l’utilisation de la data.
Cette feuille de route sera déployée par le pôle Data au sein de la direction digitale, sous l’impulsion du chief data officer, Matthieu Blanc, avec en relais une trentaine de « data owners » des différents métiers.

En particulier pour les portails de partage de données, la décision est prise de les héberger sur la plateforme Opendatasoft, déployée en quelques semaines. Les jeux de données alimentant le portail open data de la CDC sont issus en grande partie des systèmes d’information de l’institution, avec pour certains une alimentation automatisée et planifiée entre le data lake de la Caisse et la solution Opendatasoft.

La réglementation et les nouveaux usages internes ont poussé la vénérable Caisse des Dépôts à organiser des portails d’accès à ses données.

Les jeux de données mis à disposition des collaborateurs peuvent être accompagnés de tableaux de bord et de cartographies, afin de faciliter la compréhension de la donnée et de suivre les mises à jour. Ils se répartissent en quatre grandes familles parmi lesquelles les data liées directement à leurs missions, celles enrichies à la demande du métier, ou encore celles résultant d’analyses plus spécifiques. Enfin, des données métiers accompagnées de dashboards conçus en collaboration avec les métiers sont également publiées.

Les fonctionnalités de partage de la plateforme rendent aussi accessibles des données au grand public selon les thématiques d’activité de la CDC : logements, investissements et territoires, grand âge et retraite, formation, etc. Des API standards et documentées permettent aux utilisateurs métiers de construire des applications ou des services.

Renforcer le réflexe portail chez les utilisateurs

Au-delà des fonctionnalités de publication et de dataviz, l’outil d’Opendatasoft aide à l’enrichissement des datasets internes à disposition des collaborateurs avec des données publiques normalisées tels que les référentiels géographiques (liste des communes, EPCI, régions… et leurs contours), les données sur les entreprises (Sirene) et d’autres données diverses (population par communes, liste des personnes décédées, répertoire national des élus…). Cette mise à disposition normalisée a pour but de renforcer le « réflexe portail » chez les utilisateurs.

Isabelle Bridenne,
Responsable projets data et open data,
Caisse des Dépôts

« En déployant ces portails, l’objectif était de nous positionner à la fois comme producteur et comme consommateur des données. »

Ce gros travail sur les données, leur circulation, leur enrichissement et leur présentation a mis en évidence des besoins d’automatisation des flux : « Nous avons travaillé sur certaines veilles documentaires comme celles portant sur les annonces d’achats publics et celles relatives aux professions juridiques. Dans ce cas, l’automatisation transforme en datasets structurés des documents au format PDF, et permet d’automatiser la veille », précise Isabelle Bridenne.

Une gouvernance nécessaire et légitimée

Au total, 55 datasets sont désormais disponibles sur le portail externe, générant plus de 1,2 million d’appels API sur l’année 2022 (+76 % par rapport à 2021) et 56 000 téléchargements. « En déployant ces portails, notre objectif était de nous positionner comme producteur et consommateur des données. Grâce à ce projet, nous pouvons partager des données enrichies de nos expertises, dans des formats adaptés à la compréhension de toutes nos parties prenantes. La Caisse des Dépôts s’inscrit vraiment dans une démarche de valorisation et de réutilisation des données, et pleinement dans l’écosystème de l’open data. »

Il aura tout de même fallu un gros effort de formation pour en arriver là : acculturation à l’outil, qualification de la donnée, documentation… Mais la plateforme aura ainsi contribué à faciliter la mise en place de la gouvernance associée, en en légitimant le besoin.

Une prochaine étape pourrait se nourrir des réflexions terriblement actuelles sur la sobriété numérique. N’est-il pas inquiétant de voir se multiplier les flux de données avec un risque de surstockage au niveau des postes collaborateurs ? « C’est plutôt l’inverse qui se produit, répond Isabelle Bridenne. Nous avons rationalisé le sourcing de ces données, avec des chargements unifiés des grosses bases sur le data lake et des extractions plus précises, ensuite, par les métiers. Il y a donc un véritable gain sur le stockage, et même des économies sur les abonnements aux bases payantes. »


LE PROJET EN CHIFFRES

6 000 utilisateurs en interne

55 datasets disponibles sur le portail externe

1,2 million d’appels via les API en 2022


L’ORGANISME CAISSE DES DEPOTS

Activité : Banque de financement (secteur public)
Effectif : 6 000 collaborateurs
CA       : 1 067 Md€ (2021)



À LIRE AUSSI :

Dans l'actualité

Verified by MonsterInsights