L’université de Washington et Microsoft Research ont mis au point un premier prototype de système de stockage hybride « moléculaire & électronique » entièrement automatisé permettant de sauver, stocker et lire une information numérique sur de l’ADN !

Depuis trois ans, de nombreuses universités et centre de recherche travaillent sur l’utilisation de filaments d’ADN comme support de stockage. Cette technique présente deux avantages majeurs sur les systèmes de stockage actuels : la longévité et la densité. Côté longévité, l’acide désoxyribonucléique reste tout au moins partiellement lisible pendant 1,5 million d’années. Certes, on estime à 521 ans la conservation du matériel génétique après la mort d’un être vivant mais les technologies de stockage utilisent un ADN synthétique dans un milieu optimal qui n’est pas soumis aux mêmes conditions accélérant la dégradation naturelle d’un ADN animal. Côté densité, l’ADN est le support de stockage le plus dense de l’univers : une cellule humaine contient 3 milliards de paires de nucléotides. Une telle densité permettrait ainsi de stocker les actuels 16 Zettaoctets de données générées par l’humanité dans un dé de 16 centimètres cubes.

Bref, en matière d’efficience de stockage à des fins d’archivage de données notamment, l’ADN est sans comparaison aucune avec les technologies inventées par l’être humain jusqu’ici. Rappelons que la durée de vide d’un disque dur est d’environ 5 ans, celle d’une bande est d’approximativement 30 ans, celle d’une clé USB d’environ 75 ans et celle d’un CD dépasse difficilement les 100 ans. Le film argentique a une durée d’environ 140 ans, le papyrus survit entre 2 000 et 3 000 ans. Le stockage le plus résilient inventé par les humains demeure la gravure sur pierre avec une durée de vie de 21 000 ans mais ses applications numériques sont évidemment plus que limitées.

Microsoft Research est l’un des centres de recherche les plus actifs en matière de stockage ADN. En 2018, ses chercheurs avaient réussi à écrire et stocker une vidéo de 200 Mo sur 13 448 372 fragments d’ADN. Mais jusqu’ici toutes les expérimentations étaient totalement manuelles avec des chercheurs passant leurs journées à manipuler des pipettes.

En association avec l’université de Washington, Microsoft Research vient d’annoncer avoir mis au point un premier appareil automatisé de lecture et écriture de données numériques sur ADN. « Cette expérience est une étape importante dans la compréhension et la résolution des challenges liés à la construction de systèmes hybrides moléculo-électronique » explique Karin Strauss, Principal Researcher chez Microsoft Research. L’appareil permet, sans aucune intervention manuelle, de transformer une séquence de bits en molécules d’ADN codé puis de lire cet ADN codé pour restituer la séquence de bits enregistrée.

Le système encode donc une série de 0 et de 1 en une succession de A, T, G, C (Adenine, Thymine, Guanine, Cytosine) regroupés par paire de base. Chaque paire est transférée vers une « colonne » qui l’incorpore dans un brin d’ADN. Les brins d’ADN sont ensuite transférés dans une mixture chimique, elle-même stockée dans une bouteille. Un autre mécanisme permet ensuite d’aspirer la mixture, de lire les séquences ADN, de transférer la succession de A, T, G, C résultante vers un système numérique qui la décode ensuite en 0 et 1.

L’objectif de l’expérience était principalement de démontrer que l’on pouvait entièrement automatiser le processus « encodage-écriture-stockage-lecture-désencodage ». Pour l’instant, la séquence de bits encodées se limitait au message « Hello ». Voilà qui illustre bien l’immensité des recherches et progrès à réaliser avant d’arriver à une solution industrielle. D’ailleurs, un peu à la manière de ce que l’on voit avec l’informatique quantique, il est fort probable que les premiers systèmes d’archivage sur ADN apparaîtront d’abord dans les grands clouds publics sous forme de service.

Pour en savoir plus:
Nature Scientific Reports, “Demonstration of End-to-End Automation of DNA Data Storage.” par Takahashi, Nguyen, Strauss, Ceze.
L’ADN, un support de stockage prometteur