Microsoft y la Universidad de Washington están investigando y realizando demostraciones de un sistema automático para almacenar y recuperar datos en moléculas «fabricadas» con ADN. En un trabajo publicado en Nature Scientific Reports se explica en detalle sobre el proceso (Demonstration of End-to-End Automation of DNA Data Storage), sobre el que también puede leerse en el blog de Microsoft.
La base del esta idea es convertir los datos originales –cualquier secuencia binaria de unos y ceros– en secuencias de las cuatro bases de las moléculas de ADN (ACGT). En el experimento han convertido y almacenado 01001000 01000101 01001100 01001100 01001111 («HELLO» en binario) en 1 mg de ADN (con las secuencias en solo 4 πg o 100 pmol). La decodificación y lectura se hacen al revés, leyendo el material genético y convirtiéndolo en binario, eliminando los errores.
El proceso no es todavía tan rápido, directo y seguro como nos gustaría; parte del truco es guardar muchas copias y luego comprobarlas a la hora de la lectura para descartar las que estén «corrompidas». Por ejemplo en el experimento con HELLO se pudieron leer 3.469 secuencias, de las cuales 1.973 estaba alineadas, de 30 se podían extraer datos, 29 fallaron y se descartaron como no válidas y sólo una era correcta, con el mensaje original de 40 bits impoluto. Pero todo se andará.
Una de las máquinas de laboratorio que a modo de prototipo sirve para almacenar y recuperar los datos en moléculas de ADN / Universidad de Washington
El sistema tampoco …