Data / IA

Le renouveau du stockage : protection, sauvegarde et archivage

Par La rédaction, publié le 10 novembre 2022

Retour d’expérience : Portalliance troque un SAN pour un NAS

Portalliance a abandonné son SAN au profit d’un NAS de haut de gamme pour alimenter son cluster HPC en données.

Une centaine de serveurs utilisent ce NAS comme espace de stockage principal, avec des performances et une fiabilité comparables à celles d’un SAN.

Créée en 2006, Portalliance est une entreprise d’ingénierie, spécialiste en modélisation et simulation numérique de structures. La société toulousaine compte de grandes entreprises parmi ses clients, dont le géant Airbus. En 2018, elle a été rachetée par Stelia Aerospace (groupe Airbus). Portalliance dispose d’un cluster HPC d’une centaine de serveurs, totalisant plusieurs milliers de cœurs de calculs et des téraoctets de mémoire vive.

« En 2019, nous avons lancé une nouvelle activité de location de puissance de calcul. Il nous
fallait alors une solution de stockage hybride, capable de traiter efficacement des fichiers de toutes tailles,
 explique Vincent Julié, chief innovation officer
de Portalliance. Nous avons décidé d’unifier notre stockage. Mais plutôt que d’opter pour des baies SAN traditionnelles, nous avons choisi un NAS. Nous souhaitions en effet disposer d’une solution permettant de partager aisément des fichiers. »

La société disposait déjà de NAS low cost, dont elle appréciait la souplesse et la facilité d’utilisation. Lors de sa recherche, le CIO de Portalliance a découvert les solutions Qumulo et a opté pour une baie de stockage d’une capacité de 170 To. « La mise en place de la solution a été très rapide. En une semaine, nous étions formés et en production. C’est juste hallucinant ! »

L’emploi de liens Ethernet à 25 Gb/s permet au NAS de proposer des débits solides. « Nous nous y retrouvons à 200 % côté performances. Le protocole NFS n’ajoute que très peu de latence aux transferts. L’accès aux fichiers est transparent. Et pourtant nous torturons notre NAS, de même que nos clients, dont l’un travaille sur du calcul de génome végétal. » Une centaine de serveurs utilisent ce NAS comme espace de stockage principal, avec des performances et une fiabilité comparables à celles d’un SAN. Pari réussi donc pour Portalliance.

L’entreprise utilise ses anciens NAS pour réaliser la sauvegarde de son nouveau système de stockage, mais envisage à terme de tout basculer sur des solutions Qumulo. La capacité de la baie devrait par ailleurs être prochainement étendue. La facilité d’utilisation de la solution, comparée à un SAN, n’est pas le seul argument qui a su convaincre Portalliance : les données d’utilisation de la baie sont remontées à Qumulo, qui peut ainsi anticiper la maintenance ; les mises à jour sont régulières et s’accompagnent de peu de temps d’indisponibilité ; enfin, la disponibilité d’API permet à Portalliance de déployer son savoir-faire DevOps, avec le pilotage de son infrastructure de stockage réalisé au travers de code.

Mais plus que tout, ce projet montre la capacité des NAS de nouvelle génération, associés à des réseaux performants, à aller concurrencer les baies de stockage SAN, y compris sur des infrastructures serveur massives.


 

Retour d’expérience : Yohann Brossard, DPO de Grand Poitiers Communauté urbaine 

La gouvernance des données, essentielle à la conservation des données.

Qui doit gérer les droits d’accès aux données ?

Dans l’écrasante majorité des cas, la gestion des droits d’accès est prise en charge par les applications. En fonction du périmètre d’activité d’un utilisateur, des habilitations sont définies afin de restreindre l’accès aux seules données auxquelles il a le droit d’accéder. Seuls les administrateurs, composés d’un chef de projet informatique et d’un chef de projet métier, disposent de droits étendus.

C’est à la DSI, en lien avec les directions métiers, de préciser quel est le rôle de chacun, afin de définir les droits d’accès aux logiciels et données. C’est à la DRH, en lien avec la DSI, qu’il revient de mettre à jour les fiches des agents pour tenir compte des arrivées, départs et changements de postes, afin que les droits d’accès soient ajustés en conséquence.

Comment allier RGPD, droit à l’oubli et obligation de conservation des données ?

Les applications se chargent de gérer l’aspect protection des données personnelles en ne donnant accès aux informations que le temps nécessaire à leur traitement. La messagerie est toutefois un cas particulier : beaucoup d’utilisateurs devraient supprimer leurs anciens courriers plus régulièrement.

Et quand une personne change de poste, que doit-elle faire des mails relatifs à ses précédentes fonctions ? 

Il n’y a pas de règle particulière en la matière, ni de consigne sur la conservation des messages qui n’ont plus d’utilité. Côté conservation des données, l’obligation de garder certains documents sur de longues périodes impose de définir des règles précises d’archivage. Ici, nous travaillons en trois temps, définis par le service Archives. Le Temps 1 est l’archivage courant. Ce sont les données utilisées au quotidien par les équipes métiers. Elles ne doivent être conservées que le temps nécessaire au service. Un paramètre complexe à ajuster. Grand Poitiers Communauté urbaine compte en effet une cinquantaine de directions, pour 350 métiers.

Le Temps 2 est l’archivage intermédiaire. Il est destiné aux données dont nous n’avons plus besoin au quotidien, mais qu’il faut conserver pour des raisons légales ou juridiques. Seules certaines personnes dûment habilitées pourront y accéder. Notez que lorsqu’un particulier recourt au droit à l’oubli, ses données sont basculées de l’archivage courant vers cet archivage intermédiaire, à l’accès plus restreint.

Enfin le Temps 3 porte sur l’archivage au long cours. Il s’agit d’un archivage définitif sur une longue, voire une très longue durée. À Grand Poitiers Communauté urbaine, nous le réservons principalement aux données ayant un intérêt historique ou patrimonial particulier.

Qui se charge de tous ces aspects ?

La gestion des droits d’accès est un travail faisant intervenir DSI, DRH et DPO. Savoir quand et quelles données archiver est le travail de la responsable des archives, un intervenant avec lequel nous travaillons régulièrement au service juridique. La protection des données et l’archivage sont en effet des sujets qui ont besoin de se parler.

Pour la plupart des documents administratifs, la durée de conservation est très encadrée. Toutefois, nous regrettons que les prestataires ne prévoient pas plus souvent de systèmes automatiques d’archivage et de purge des données. Nous nous battons au quotidien pour que les éditeurs suivent le cycle de vie des données fixé par les textes réglementaires. Faute de cela, il devient bien plus difficile de se mettre en conformité.

    Suite de l'article : 123456

Dans l'actualité

Verified by MonsterInsights