Los Bits del ADN: Una nueva forma de Almacenamiento y transmisión de información

Investigadores del Instituto Europeo de Bioinformática EMBL (EMBL-EBI) han desarrollado una manera de almacenar información en forma de ADN. El nuevo método, publicado en Nature, hace posible guardar 100 millones de horas de video de alta definición en una porción de ADN.

La elaboración, transmisión y almacenamiento digital de la información, ha cambiado la forma de acceder y usar los datos. Sin embargo, cada vez se requiere una mejor organización de la misma así como de una revisión continua de los medios digitales. Este gran reto ha conducido a centrarse en el DNA como herramienta para su almacenamiento, dada su capacidad para la información y resistencia frente a la degradación siempre que esté en las condiciones óptimas.

Los sistemas para almacenar datos anteriores al DNA solamente son capaces de recopilar cantidades ínfimas, sin posibilidad de aumentar o ampliar la transmisión de información. Por otro lado, estas herramientas no poseen un sistema tan elegante de corrección y prueba de errores.

Se trata por tanto, de una herramienta reproducible, que puede almacenar más información que ningún otro que se haya desarrollado antes. Para demostrar que este sistema era viable, se sintetizó una molécula de DNA en la que se almacenaron diferentes archivos, equivalentes a un total de 739 Kilobytes de tal forma que fue posible secuenciar la molécula y reconstruir los archivos anteriores con total eficacia.

Nick Goldman del EMBL-EBI, mirando el DNA sintetizado. (Fuente: EMBL Photolab)

El nuevo método requiere sintetizar el DNA con la información codificada, lo que se hizo introduciendo la Tecnología de Agilent una compañía de california especializada en dicho método. Birney y Goldman, autores de estudio, les enviaron las versiones codificadas de diferentes archivos de los tipos: txt/.pdf/ .mp3 /.jpg y un archivo que describía el sistema de codificación.

“Descargamos los archivos de la Web y los utilizamos para sintetizar cientos de miles de secciones de ADN”, explica Emily Leproust, de Agilent. La compañía envió la muestra a EMBL-EBI donde los investigadores fueron capaces de secuenciar el ADN y descodificar los archivos sin errores.

“Hemos creado un código que es tolerante a los errores mediante la utilización de una forma molecular de la cual sabemos que dura en las condiciones adecuadas unos 10.000 años, o incluso más”, comenta Nick Goldman. “Siempre que el receptor sepa cuál es el código, será capaz de leerlo si tiene un dispositivo adecuado”.

Un análisis indica que este método puede utilizarse para almacenar volúmenes de información mucho más contundentes. De esta forma, se ha desarrollado una tecnología real y eficiente que facilita el acceso a datos, siendo muy resistente al paso de los años. Aunque las técnicas para manipular, copiar y modificar el DNA se han establecido a lo largo del desarrollo de la genética molecular, una de las principales dificultades del uso del DNA, será la síntesis de grandes moléculas de DNA de forma específica y sin error alguno. Uno de los métodos o técnicas que se plantean los expertos es usar fragmentos de DNA más cortos. De esta manera, podemos aislar fragmentos de DNA que son fácilmente manipulables “in vitro”.

Referencias Bibliográficas

Notas de Prensa

3 comentarios sobre “Los Bits del ADN: Una nueva forma de Almacenamiento y transmisión de información

  • Pingback:Los Bits del ADN: Una nueva forma de Almacenamiento y transmisión de información

  • el mayo 22, 2013 a las 10:43 am
    Permalink

    Al codificar el binario, hay cuatro bases en el ADN, por lo que pasaríamos de un sistema binario a un sistema cuaternario y reducimos el número de dígitos en 2. ¿Por qué hay cinco dígitos por letra? ¿No deberían ser 4?

    ¿Cómo está codificado?

    Respuesta
    • el mayo 22, 2013 a las 9:20 pm
      Permalink

      ¡Buenas Vincent!

      Verás, el sistema es un poco complicado y puedes encontrar toda la información en un documento complementario al artículo, aquí: http://www.nature.com/nature/journal/vaop/ncurrent/extref/nature11875-s2.pdf

      Básicamente, según explicaba unos de los redactores de BiotecMur para el equipo, el funcionamiento es el siguiente:

      Se pasa del código binario al “terciario”: Cada archivo digital fue codificado representado cada uno por una secuencia de 3 nucleótidos o “trits” (0,1,2) usando el código creado a propósito (Huffman code10).

      Cada 256 bytes posibles se representan por 5 o 6 “trits” (como se puede ver en la figura de arriba) usando dicho código.

      Los trits se pasan al lenguaje del DNA (4 bases: A, T, G, C) pero en forma de tripletes. Y por último, cada triplete no puede comenzar por la última letra con la que acaba el triplete anterior.

      La última línea de la figura, por tanto, tiene un error: los colores deben separar tripletes de bases/letras.

      Para cualquier cosa que necesites, aquí andamos 🙂

      Respuesta

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *