Data / IA
Le renouveau du stockage : protection, sauvegarde et archivage
Par La rédaction, publié le 10 novembre 2022
Coûts : l’archivage et la bande, toujours bien présents
L’archivage demeure aujourd’hui encore une option claire pour conserver ses données sur le long terme, comme l’impose une règlementation de plus en plus forte. La bande reste quant à elle la technologie amovible la plus sûre et la moins onéreuse.
À écouter certains influenceurs du marché IT, l’archivage des données, c’est du passé. Certes, les entreprises souhaitent remonter toujours plus loin dans leur historique de données, afin de mieux comprendre l’évolution de leur activité. Il n’en reste pas moins qu’un nombre conséquent de documents ne sont conservés que pour des raisons légales. À quoi bon stocker ces données inutiles au quotidien sur des PC et serveurs, voire au sein de services cloud, et d’alourdir ainsi le volume des données actives et des sauvegardes, ce qui fera immanquablement grimper les coûts de stockage ?
Autre aspect à prendre en compte, le RGPD. Il suggère, entre autres, de ne conserver les données que le temps nécessaire à l’accomplissement de la demande client. Si certaines données sont conservées par la suite pour créer un historique client, la majorité des pièces liées à une commande ou à un ordre de mission peuvent – voire devraient, pour respecter la philosophie du RGPD – être archivées. Ceci nécessite toutefois de mettre en place une politique claire de gouvernance de la donnée. Une fois cette étape définie, la bande reste une alternative pertinente.

On comprend mieux le rôle de la bande, une technologie historique dont la mort est régulièrement annoncée, mais n’arrive jamais. Et pour cause : la bande permet de stocker de larges volumes de données sur de longues durées, de façon très économique. Le recours à la bande ne se justifie pas forcément si une entreprise dispose d’un volume de données à sauvegarder et à archiver inférieur à 200 To. Mais même avec des volumes plus restreints, la bande peut répondre à la problématique de la multiplication des sauvegardes et de l’allongement de leur durée de conservation.
Dans les datacenters, la bande s’impose pour le stockage longue durée. Y compris dans le cloud. OVHcloud a ainsi annoncé en début d’année 2021 qu’il allait mettre en place une solution de stockage dans le cloud « sécurisée et de confiance »… basée sur des bandothèques IBM, pilotées par la solution de gestion de données Atempo Miria. Les offres d’archivage longue durée tendent à se multiplier sur le cloud. Attention toutefois aux coûts de conservation des données et de transfert.
3 QUESTIONS À – Benoit Vautrin, développement commercial stockage, IBM France
La bande, clé pour les coûts et la durabilité
La bande a-t-elle toujours sa place en entreprise ?
Oui, et pour une raison simple : les coûts. On pourrait stocker, sauvegarder et archiver uniquement sur de la mémoire flash, mais qui en a les moyens ? En termes de durabilité et de coût, il n’y a pas mieux que la bande : la durée de conservation dépasse en général les dix ans, la consommation électrique des bandes stockées est nulle et les bandothèques chauffent peu. Et comme la bande est un média amovible, elle ne sera pas corrompue par un rançongiciel.
La bande est très utilisée dans les datacenters et par les fournisseurs de services cloud. Par exemple, le CERN utilise beaucoup de robotiques bande, car il génère un volume de données très important, qu’il ne peut stocker uniquement sur disque.
Citons un autre cas d’usage : la sauvegarde de data lakes. Le niveau de protection des données y est en général important, mais, malgré tout, le système pourra être corrompu, ou subir une panne majeure. Les données d’un data lake se sauvegardent. La bande peut ici aider à réaliser cette sauvegarde à prix contenu. Une fois la première sauvegarde réalisée, les autres se feront périodiquement, en mode incrémental.
Doit-on sauvegarder sur bande ou archiver ?
Pour des raisons réglementaires, les entreprises se retrouvent de plus en plus souvent avec de gros volumes de données à conserver sur le temps long. Dans le milieu bancaire ou aéronautique, certaines données doivent être conservées pendant plusieurs décennies. Mais comme ce ne sont pas ici des données actives, les archiver au plus bas coût possible est essentiel. Et donc sur bande.
Certains clients manipulent parfois des données massives, comme des images satellites. Mais toutes ne seront pas exploitées à l’instant T. L’archivage de ces données sur disque, voire sur bande, prend alors tout son sens. Idem pour des données comme des fichiers de vidéosurveillance, que les entreprises souhaitent souvent conserver plusieurs semaines avant de les effacer.
Le problème est qu’il n’est pas aisé de savoir quelle donnée est active et laquelle ne l’est pas. Les systèmes de stockage modernes sont maintenant capables de prendre en compte cet aspect : ils surveillent quelles données sont utilisées fréquemment et transfèrent les informations dormantes sur des médias plus économiques, lorsque cela est pertinent.
Précision utile : il est indispensable d’avoir deux copies de vos données archivées. Les archives aussi se sauvegardent !
La bande est-elle garante de la sécurité des sauvegardes ?
Très honnêtement, et comme l’ANSSI l’a déjà souligné, la seule sauvegarde capable de résister à tout type d’attaque informatique c’est celle réalisée sur des supports amovibles : disque dur externe ou bande. Ce qui n’empêche pas d’utiliser en complément des solutions permettant de faire des sauvegardes sur disques, avec des snapshots immutables par exemple.
N’oubliez pas toutefois que la durée moyenne de détection d’une intrusion est de 206 jours. Il faut donc conserver les sauvegardes sur de longues périodes, ce qui se traduira par des coûts potentiellement élevés si vous optez pour un stockage sur disque.
