ADN en lugar de servidores: la IA abre el camino hacia archivos eternos

ADN en lugar de servidores: la IA abre el camino hacia archivos eternos

¿Podremos ahora preservar la memoria de la humanidad durante millones de años?

image

Científicos israelíes del Instituto Tecnológico de Israel (Technion) han desarrollado un algoritmo de inteligencia artificial que permite acelerar 3200 veces la extracción de información almacenada en moléculas de ADN. Además, lograron mejorar significativamente la precisión de este proceso.

El almacenamiento de datos en ADN es una de las áreas más prometedoras en el desarrollo de sistemas de memoria digital. Las moléculas del material genético pueden conservar datos durante cientos de miles de años. Así lo demuestran, por ejemplo, las exitosas extracciones del código genético de los restos de un caballo antiguo de 700 mil años y de mamuts que vivieron hace más de un millón de años. En comparación, los dispositivos magnéticos actuales utilizados en centros de datos tienen una vida útil de solo algunas décadas.

Las ventajas del ADN como soporte digital no se limitan a su longevidad. Actualmente, los centros de datos consumen alrededor del 3 % de toda la electricidad mundial y generan un 2 % de las emisiones globales de dióxido de carbono. Con el crecimiento exponencial del volumen de información, esta carga sobre el medio ambiente no hará más que aumentar. El uso de soportes biológicos podría reducir considerablemente el consumo energético.

Particularmente impresionante es la densidad de almacenamiento del ADN: supera en 100 millones de veces la de los soportes digitales tradicionales. En un volumen que hoy alberga un solo megabyte, teóricamente se pueden almacenar hasta 100 terabytes mediante tecnologías biológicas.

El principio de este tipo de almacenamiento se basa en la secuencia de compuestos orgánicos, los nucleótidos de cuatro tipos, representados por las letras A, C, G y T. A diferencia de los ordenadores, que utilizan código binario compuesto por ceros y unos, el alfabeto de cuatro letras proporciona una cantidad mucho mayor de combinaciones posibles.

Sin embargo, existen obstáculos. Durante la grabación de datos se produce una síntesis química del ADN, en la que los nucleótidos no siempre se insertan con precisión en la secuencia requerida: algunos pueden quedar fuera, otros aparecer en lugares no deseados, y algunos ser reemplazados incorrectamente. Además, cada molécula portadora se reproduce en múltiples copias no idénticas que se mezclan caóticamente en la solución. Como resultado, al intentar leer la información, se trabaja con un conjunto de copias inexactas, parte de las cuales incluso se pierde durante el análisis bioquímico.

Frente a estos desafíos, los especialistas del Technion crearon DNAformer, un sistema capaz de reconstruir las secuencias originales a partir de múltiples copias defectuosas. El método se basa en una red neuronal tipo transformador entrenada con datos virtuales para reconocer y corregir errores típicos de síntesis y secuenciación. El algoritmo se complementa con un código especial de corrección que resulta especialmente eficaz para fragmentos altamente distorsionados del texto genético.

La funcionalidad de la tecnología se probó con un conjunto diverso de archivos de 3,1 megabytes. Este conjunto incluía una fotografía a color, una grabación histórica de las primeras palabras de Neil Armstrong en la Luna, un texto científico sobre las perspectivas del almacenamiento en ADN y un bloque de datos cifrados para verificar la universalidad del método.

Los resultados superaron todas las expectativas: DNAformer procesa hasta 100 megabytes de información con una velocidad 3200 veces mayor que los métodos existentes con la misma precisión. En comparación con técnicas rápidas pero menos fiables, el nuevo sistema mostró un 40 % menos de errores y una velocidad significativamente superior.

El equipo de investigación planea desarrollar versiones especializadas de su tecnología para diferentes tareas. La arquitectura del sistema permite una fácil ampliación de sus capacidades, lo que permitirá que el método evolucione junto con los avances en la síntesis y lectura del ADN, procesando volúmenes cada vez mayores de datos.

¿Estás cansado de que Internet sepa todo sobre ti?

¡Únete a nosotros y hazte invisible!