Crédit photo : DigitalGenetics - Adobe Stock

Cloud

L’ADN : un support de stockage prometteur

Par Laurent Delattre, publié le 21 juillet 2018

Utiliser l’ADN comme support de stockage des données : l’idée n’est pas nouvelle. Mais les progrès réalisés ces derniers mois rapprochent désormais cette technologie d’une prochaine concrétisation en entreprise.

L’informatique s’apprête à vivre d’importantes révolutions technologiques. Chaque jour qui passe nous rapproche un peu plus de l’exploitation commerciale des ordinateurs quantiques. Par ailleurs, le « Memory-Driven Computing », ordinateurs dotés d’une mémoire permanente non volatile dans laquelle la donnée n’est plus stockée puis chargée avant d’être utilisée mais simplement immédiatement présente et utilisable, s’expérimente déjà chez HPE. Enfin, le stockage sur ADN fonctionne dans les laboratoires et pourrait trouver sa place en entreprise dans la prochaine décennie selon un récent rapport du MIT.

Stocker la donnée dans l’ADN

Cette technologie connaît en effet un regain d’activité et d’intérêt depuis quelques mois. Il y a moins d’un an, Microsoft Research annonçait avoir stocké un clip vidéo musical d’environ 200 Mo sur de l’ADN. En début d’année, les chercheurs du Waterford Institute of Technology (associés aux chercheurs italiens de l’université de Padua) publiaient un document expliquant comment ils avaient réussi à encoder un message textuel dans de l’ADN porté par une bactérie E.coli. De son côté, le Pentagone annonçait en juin dernier un grand programme de recherche destiné à stocker des exaoctets de données confidentielles sur de l’ADN d’ici 2028 !
Enfin, la startup de Boston Catalog, spinoff du MIT formée par les chercheurs qui avaient stocké un poème sur de l’ADN il y a 18 mois, vient d’annoncer avoir encodé le Guide du Routard Galactique (de Douglas Adams) sur de l’ADN, mais clame aussi désormais son intention de commercialiser sa première unité de stockage ADN dans le courant de l’année 2019 !

Densité et longévité

Dans un monde qui génère annuellement 16 zettaoctets (soit 16 millions de Po), chiffre qui sera multiplié par 10 d’ici 2025 selon IDC, le stockage sur ADN présente deux qualités fondamentales : la densité et la longévité.
L’ADN est déjà en soi une unité de stockage. Elle « code » le vivant dans des chaines de nucléotides, une succession de A, T, G, C (Adenine, Thymine, Guanine, Cytosine) regroupés par paire. Une cellule humaine contient 3 milliards de paires de base. L’ADN est tout simplement le support de stockage le plus dense de l’univers si l’on s’appuie sur nos connaissances actuelles et les lois de la physique. Selon certains experts, les 16 zettaoctets générés actuellement tiendraient dans un “gros” dé de 16 centimètres cubes !

Au-delà de cette densité maximale, l’ADN est aussi un support avec une surprenante longévité. Les paléontologues estiment en général qu’un ADN devient impossible à lire au-delà de 1,5 million d’années. Évidemment, une dégradation des informations surgit bien avant mais cela donne toutefois une idée de la longévité du support. D’autant que l’ADN présente un autre avantage mésestimé : intimement lié à la vie humaine, il ne passera pas de mode de sitôt contrairement aux bandes, aux disques souples et aux disquettes si rapidement disparus et oubliés.

La question des coûts

Bref, l’ADN pourrait être l’ultime solution aux problèmes d’archivage. Aujourd’hui, le principal frein à l’émancipation de cette technologie reste son coût. La vidéo de 200 Mo écrite et stockée sur 13 448 372 fragments uniques d’ADN synthétiques par Microsoft Research aurait coûté 800 000 dollars ! La startup Catalog espère arriver à réduire les coûts par une approche différente : elle consiste à générer à faible coût une large quantité d’un jeu très restreint de molécules ADN différentes et limitées à une trentaine de paires de base puis d’utiliser les milliards de réactions enzymatiques pour encoder l’information en recombinant les « patterns » formés par ces bits d’ADN préfabriqués. L’information n’est plus enregistrée bit par bit sur une paire nucléique, mais arrangée sous forme de matrices multidimensionnelles. En d’autres termes, la quête vers la production d’ADN à bas coût a démarré et les startups se multiplient comme des petits pains : Evonetix, Genome Foundry, Molecular Assemblies, Helixworks, NAScript, Nuclera Nucleics, …

 

Dans l'actualité