IRSN repense son infrastructure de stockage pour la rendre plus durable

Green IT

L’IRSN rend son architecture de stockage plus durable

Par Pierre Berlemont, publié le 18 juillet 2023

En revoyant son architecture de stockage, l’institut dédié à la sécurité nucléaire IRSN fait des économies de fonctionnement à volume égal tout en impliquant également les métiers sur la thématique d’une IT durable.

D’un point de vue technique, le projet de l’IRSN (Institut de Radioprotection et de Sûreté Nucléaire) situé à Fontenay-aux-Roses (92), est assez simple à décrire : il s’agit de faire face à l’augmentation du volume de données sur des NAS vieillissants, de passer d’une sauvegarde sur bande à une sauvegarde sur disque, et de l’adapter en taille à la croissance du volume de données à conserver.
Débutée en 2020, la nouvelle architecture de stockage a été mise en production au tout début de l’année.

Les NAS NetApp servant au partage de fichiers et de données, aussi bien chaudes que froides, étaient initialement sauvegardés sur bande via Veritas Netbackup. « Nous avons constaté que, chaque jour, des données qui n’avaient pas été modifiées étaient à nouveau sauvegardées. Notre idée a donc été de déplacer ces fichiers parmi les plus anciens (datant de plus de deux ans) dans des systèmes moins coûteux et d’arrêter cette sauvegarde quotidienne inutile les concernant », résume Simon Tourard, directeur délégué au développement numérique et aux systèmes d’information à l’IRSN.
L’intérêt était aussi économique, en particulier parce que le logiciel de sauvegarde Netbackup a un modèle de licence qui repose sur la volumétrie sauvegardée.


À LIRE AUSSI :

Moins de sauvegardes à effectuer, moins de coûts

La première étape fut l’acquisition de nouveaux NAS NetApp de production d’une capacité totale de 1 Po pour faire face à la croissance des besoins des métiers. Puis l’IRSN a fait l’achat d’appliances Netbackup pour un stockage de premier niveau visant la sauvegarde des données en production, donc fréquemment accédées.

Enfin, l’Institut a mis en place une baie d’archivage Veritas Access Enterprise de 2 Po, à base de disques et non plus de bandes, que Simon Tourard préfère nommer « baie de conservation des données », car elle n’est pas utilisée dans le strict respect de la réglementation de l’archivage. Les données froides sont conservées sur ce second niveau de sauvegarde sur le long terme, avec deux autres baies répliquées sur deux sites différents.

La nouvelle architecture de stockage nécessite que les métiers s’interrogent sur les données qu’ils souhaitent sauvegarder.

Maintenant que le projet est terminé, seules les données ayant fait l’objet d’une modification sont sauvegardées sur les appliances Netbackup en stockage de premier niveau.
Concernant les autres, le logiciel Enterprise Vault réduit l’espace de stockage des NAS et garantit une rétention à long terme des fichiers non modifiés depuis deux ans en les envoyant de façon automatisée sur la baie Veritas Access, sans passer par les NAS intermédiaires NetBackup. Enterprise Vault permet d’économiser énormément d’espace sur les NAS de production, car la majorité (les trois quarts) des fichiers qui s’y trouvaient jusque-là étaient des données froides.
De plus, sortir ces données des NAS signifie aussi qu’il n’est plus nécessaire de les sauvegarder régulièrement, ce qui se traduit par une économie sur les licences et sur l’espace de l’Appliance de sauvegarde. Ces données restent toutefois accessibles à l’utilisateur qui voit dans son répertoire réseau un pointeur l’amenant au fichier stocké dans la baie de disques.
Enfin, dès lors qu’une donnée provenant de la baie de conservation est modifiée, elle revient dans le système de sauvegarde. « Ainsi, nous optimisons nos espaces de stockage en mettant de côté les données plus anciennes, et nous libérons de la place pour les plus chaudes », se réjouit Simon Tourard.
À noter que les data ne sont pas accessibles par internet, le projet ne concernant que l’IRSN, et sont donc conservées dans ses propres datacenters. De même, les informations à caractère sensible sont situées sur un réseau indépendant.


À LIRE AUSSI :

L’idée du projet était aussi d’impliquer les métiers dans la gestion de leurs données. Une bonne partie de l’activité de l’organisme relève de la recherche, un milieu qui évolue de plus en plus vers la science ouverte (open science). Dans ce cadre, les chercheurs sont amenés à partager certaines de leurs informations, et du coup à définir un data management plan (DMP), ou PGD en français (plan de gestion de données), dans lequel ils vont décrire quelles données ils sauvegardent, où et pendant combien de temps. Ces informations stockées concernent les résultats de recherches sur les risques nucléaires et radiologiques (issus de calculs numériques), des expertises notamment pour le compte de l’Autorité de sûreté nucléaire (analyses de dossier), et enfin des données de mesures sur la surveillance de l’environnement.

Alain Tourard,
Directeur délégué au développement numérique et aux systèmes d’information

« L’intérêt du projet est de mettre les métiers face à leur responsabilité en matière de stockage et de conservation des données pour un numérique durable. »

Cette stratégie nécessite de déterminer quelles informations ont un intérêt et doivent être conservées. Par ailleurs, des organismes comme l’ANR (Agence nationale de la recherche) demandent des comptes sur la manière dont les scientifiques gèrent leurs données. Seule, la DSI ne pourrait lui répondre. Les métiers doivent donc s’impliquer, et de son côté la DSI doit leur fournir les outils nécessaires pour mettre en place ce PGD. Elle travaille ainsi à définir des tableaux de bord pour les métiers, afin de leur donner des indicateurs sur l’âge d’une donnée ou la fréquence à laquelle elle est consultée, de manière à ce qu’ils disposent d’outils de management leur indiquant, par exemple, qu’ils ont des données qui n’ont pas été accédées depuis quatre ans. À eux alors de répondre avec une raison légitime de maintenir un statu quo ou non, sachant qu’un organisme comme l’IRSN doit garder sans limitation de durée certaines informations, par exemple les mesures environnementales importantes pour le patrimoine national. Cette revue permet en revanche de détecter des données inutiles, « par exemple le compte-rendu d’une réunion très locale et qui a eu lieu il y a cinq ou dix ans ».

« Des amis archivistes me disent qu’archiver, c’est d’abord détruire », plaisante Simon Tourard. C’est une manière, en effet, de lutter contre l’infobésité dans le cadre d’une politique numérique responsable. « Mais ce n’est pas l’IT qui génère de la donnée, ce sont les métiers, qui ont des besoins de plus en plus importants. Et compte tenu des enjeux climatiques, il est plus que temps de leur faire prendre conscience des aspects environnementaux derrière leurs pratiques de stockage. Stocker énormément de données consomme de l’énergie et a un impact sur l’environnement », conclut Simon Tourard.


LE PROJET EN CHIFFRES

1 Po de data sur NAS
75 % des données considérées comme froides
2 ans : Âge de l’obsolescence des données


L’ORGANISME IRSN

Activité : Sécurité nucléaire
Effectif : 1.750 permanents, et 150 doctorants et post-doctorants
Budget : 285 M€


À LIRE AUSSI :

Dans l'actualité