Sistema de almacenamiento de ADN: ¿es real y cómo funciona?



Los sistemas de almacenamiento de datos basados ​​en ADN pueden ser una salida para la humanidad, que genera cada vez más información. En comparación con todos los demás medios, el ADN tiene una densidad de registro de datos fenomenal. Otra ventaja es que en el caso del ADN, el almacenamiento de datos en condiciones óptimas no requiere energía y la información se puede almacenar durante cientos de años. Después de varios siglos, los datos se pueden leer sin problemas, por supuesto, sujeto a la disponibilidad de la tecnología adecuada.



Pero el ADN tiene sus inconvenientes. Por ejemplo, actualmente no existen estándares para codificar información en una cadena de ADN. Sintetizar moléculas artificiales es bastante caro y leer la información almacenada puede llevar días o semanas. El acceso repetido a las cadenas de ADN para obtener información conduce a una violación de la estructura de las moléculas, por lo que eventualmente pueden ocurrir errores. Ahora se ha propuesto un método que ayudará a resolver algunos de estos problemas. El sistema de almacenamiento de datos (hasta ahora solo imágenes) es un cruce entre un sistema de archivos normal y una base de datos basada en metadatos.



Más sobre los problemas



Los sistemas de almacenamiento de datos desarrollados en el ADN permiten la adición de ciertas etiquetas de secuencia a las regiones de ADN que contienen datos. Para obtener la información necesaria, se añaden a la molécula regiones que son capaces de formar pares de bases con los marcadores deseados. Todo esto se utiliza para amplificar la secuencia completa. Algo como etiquetar cada imagen en una colección con su propia ID y luego configurar todo para que se amplifique una ID específica.



El método es bastante efectivo, pero tiene dos limitaciones. Primero, el paso de amplificación, que se realiza mediante el proceso de reacción en cadena de la polimerasa (PCR), tiene limitaciones en el tamaño de la secuencia amplificada. Sin embargo, cada etiqueta ocupa parte de un espacio ya limitado, por lo que agregar etiquetas detalladas reduce la cantidad de espacio de almacenamiento.



Otra limitación es que la PCR, que amplifica ciertos fragmentos de ADN con datos, consume parte de la biblioteca de ADN original. Es decir, cada vez que leemos datos, algunos de ellos se destruyen. Los científicos comparan este método de búsqueda de información con la quema de un pajar para encontrar una aguja. Si hace esto con frecuencia, puede terminar perdiendo toda la base de datos. Es cierto que hay formas de recuperar áreas perdidas, pero este método no es ideal, porque al usarlo, aumenta la probabilidad de errores en las áreas de ADN y de datos.





El nuevo método separa la información de la etiqueta de los datos maestros. Además, los investigadores han creado un sistema que permite acceder solo a los datos que nos interesan. El resto de la información permanece intacta, por lo que las moléculas de ADN permanecen intactas y no dañadas.



Nuevo sistema



La tecnología se basa en cápsulas de dióxido de silicio que almacenan archivos individuales. Se adjuntan etiquetas de ADN a cada cápsula para mostrar lo que hay en el archivo. Cada cápsula tiene un tamaño aproximado de 6 micrómetros. Gracias a este sistema, los científicos han logrado aprender a extraer imágenes individuales con una precisión del 100%. El conjunto de archivos que crearon no es muy grande, solo hay 20. Pero si se tienen en cuenta las capacidades del ADN, ese sistema se puede escalar a un sextillón de archivos.



Estos 20 archivos se codificaron en fragmentos de ADN de aproximadamente 3000 nucleótidos de longitud, que son aproximadamente 100 bytes de datos. Una cápsula de sílice puede acomodar un archivo de hasta un gigabyte de tamaño. Una vez que se envuelve el archivo, se colocan etiquetas de ADN monocatenario en su superficie. Se pueden adjuntar varias etiquetas a un shell para que sirvan como palabras clave. Por ejemplo, "rojo", "gato", "animal".



Las cápsulas de sílice etiquetadas de esta manera se combinan en una única biblioteca de datos. No es tan compacto como un repositorio hecho de ADN puro, pero los datos no se dañan en este caso.



Buscar archivos



Se utiliza un grupo de palabras clave: etiquetas para buscar archivos. Por ejemplo, si desea buscar una imagen de un gato, las etiquetas son naranja, gato y doméstico. Para buscar un tigre, solo "naranja" y "gato". La velocidad de búsqueda en un sistema de este tipo sigue siendo muy baja, alrededor de 1 KB por segundo.



Otro truco proviene del hecho de que cada etiqueta está asociada con moléculas fluorescentes de diferentes colores. Por lo tanto, durante la solicitud, las cápsulas con las etiquetas requeridas brillarán en un color determinado. Ahora hay dispositivos que utilizan láseres para separar objetos según el color de la fluorescencia, por lo que es técnicamente posible separar los datos necesarios.



En este caso, el resto de la biblioteca no se verá afectado, lo que significa que los datos no se verán afectados. Ya no es necesario quemar un pajar para encontrar una aguja. Un plus adicional en la posibilidad de búsqueda lógica con diferentes criterios. Por ejemplo, las condiciones de consulta pueden ser complejas: verdadero para "gato", falso para "hogar", verdadero para "negro", etc.



No solo buscar



Sí, porque la tarea de encontrar los datos necesarios es solo una parte del caso, y ni siquiera la mitad. Aún es necesario secuenciar los datos detectados. Y para ello, se requiere abrir la cubierta de sílice, quitar el hilo almacenado en la cápsula, inyectar ADN en la bacteria y luego leer los datos. Este es un proceso extremadamente lento, e incluso los streamers son una tecnología muy rápida en comparación.



Por otro lado, los sistemas basados ​​en ADN no serán rápidos, su objetivo principal es almacenar grandes cantidades de información que no necesita ser recuperada con frecuencia. Además, la tecnología se mejorará con el tiempo, por lo que es de esperar que la velocidad de lectura de la información aumente.






All Articles