Shakespeare stocké dans l’ADN
Par Thierry Lucas - Publié le 02 février 2013, à 08h55
La revue Nature, qui publie les résultats des chercheurs britanniques, a fait le calcul : les 90 petaoctets (millions de milliards d’octets) de données stockés par le Cern de Genève, le laboratoire européen de physique des particules, tiendraient dans… 41 grammes d’ADN !
C’est cette exceptionnelle densité de l’enregistrement dans la molécule d’ADN qui stimule les efforts des chercheurs pour en faire un moyen de stockage d’informations. Les premiers essais, qui remontent à 1999, étaient modestes – quelques caractères enregistrés dans un brin de matériel génétique. Mais depuis, les progrès considérables réalisés dans les techniques de séquençage (la "lecture" de l’information), puis de synthèse de l’ADN (l’"écriture"), ont complètement changé la donne.
Récemment, un chercheur américain de la Harvard Medical School avait enregistré la totalité de son dernier livre, soit 5,27 Mbits de données, sur des milliers de brins d’ADN. L’équipe de l’European Bioinformatics Institute a voulu aller plus loin en enregistrant des informations d’origines très diverses, textes, images, et sons : les 154 sonnets de Shakespeare, un enregistrement audio d’un discours de Martin Luther King, une photo… Et surtout en proposant une méthode de codage et d’enregistrement qui – c’est un point clé - limite les erreurs, et permet de relire 100% de l’information stockée.
Les fichiers numériques choisis pour l’expérience (5,2 Mbits) ont été codés en utilisant des séquences des 4 bases chimiques contenus dans l’ADN, de la même manière que les gènes sont codés dans le matériel génétique de nos cellules. Mais la longue chaîne d’informations est en fait codée sur un grand nombre de petits brins d’ADN, avec un système de redondance et d’indexation entre les brins qui permet de détecter d’éventuelles erreurs. Au total, les 5 fichiers numériques se sont transformés en 153335 brins d’ADN, synthétisés par la société californienne Agilent Technologies. Avec cet ADN, les chercheurs britanniques ont pu reconstruire les informations initiales dans leur intégrité.
Evidemment, pour le moment, c’est plutôt cher. Coût estimé du mégaoctet stocké: 12 000 dollars à l’enregistrement, 220 dollars pour la lecture… Mais vu la chute exponentielle des prix dans le séquençage et la synthèse de l’ADN, cette solution pourrait devenir compétitive pour des stockages de longue durée. Car l’autre point fort du stockage sur ADN, c’est sa longévité. Moyennant quelques précautions, les molécules d’ADN se conservent très bien (même dans des fossiles). Et comme il est probable que l’on aura toujours besoin de séquencer de l’ADN, il y aura toujours des équipements pour lire les enregistrements… Une manière de mettre fin au cauchemar des archivistes, qui voient régulièrement les technologies d’enregistrement devenir obsolète au fil des années ?