top of page
  • feliperibbe

Qual a solução para o tsunami de dados gerados diariamente? DNA!

Atualizado: 25 de set. de 2018

Que a quantidade de dados produzidos a cada segundo no planeta – e fora também – cresce assustadoramente todos os dias não é novidade para ninguém. E este número só irá aumentar. Um estudo da empresa de análise IDC mostra que a quantidade de dados gerados em 2025 será de 163 zettabytes (163 trilhões de gigabytes!!!). Uma dúvida, no entanto, surge a partir desta constatação: como conseguiremos guardar tamanha magnitude de informação? A resposta, talvez, surpreenda a maioria das pessoas comuns: no DNA.


Isso mesmo. Cientistas ao redor do mundo têm explorado a capacidade do DNA de armazenar dados e os resultados têm sido mais do que animadores. Se hoje os dados são guardados em fitas magnéticas que ocupam galpões gigantescos e têm vida útil curta (em cerca de 10 anos elas precisam ser reescritas para que as informações não sejam perdidas), o DNA tem altíssima densidade: apenas um milímetro cúbico pode armazenar cerca de 1 bilhão de gigabytes. Segundo Yaniv Erlich, cientista da Universidade de Columbia, nos Estados Unidos, com 10 toneladas de DNA seria possível armazenar todos os dados do mundo e alocá-los em um caminhão. Além da densidade, a durabilidade também não teria precedentes, uma vez que especialistas já conseguiram sequenciar o DNA de ancestrais de humanos que viveram há 400 mil anos.


Como funciona?


Basicamente, todo arquivo digital é um código binário, de 0s e 1s. Os pesquisadores pegam estes códigos e os transformam em pares de bases de DNA, os nucleotídeos A, C, G  e T.  A partir daí são produzidas fitas de DNA de acordo com as sequências criadas e pronto, os arquivos estão armazenados. Para extraí-los, usam-se máquinas de sequenciamento de DNA para ler os códigos genéticos e transformá-los novamente nos códigos binários.

Gráfico por Financial Times

Apesar de estudos mostrarem evoluções na forma de armazenar e extrair informações de moléculas de DNA, ainda deve demorar um tempo considerável até que esta tecnologia consiga competir com as fitas magnéticas e comece a ser utilizada comercialmente. Um dos motivos é o alto custo. A Twist Bioscience, empresa tida como a maior fornecedora mundial de fitas de DNA, estima que, atualmente, armazenar 12mb de dados ficaria em torno de U$100 mil. A Microsoft, que vem estudando como utilizar a metodologia, afirma que, para a mesma poder ser utilizada em larga escala, os custos devem cair cerca de 10 mil vezes o valor de hoje.


Outro obstáculo está no tempo necessário para codificar e depois extrair os dados. As estimativas hoje são de que a velocidade para armazená-los esteja em cerca de 400 bytes por segundo. A Microsoft estima que esta velocidade deveria chegar a 100 megabytes por segundo para ser viável. Para extrair, a capacidade deveria ser o equivalente a sequenciar em torno de 10 mil genomas humanos por dia. Hoje, são cerca de três por dia.


Nada, porém, que seja considerado improvável. Em 1991, era possível fazer apenas quatro fitas de DNA em um dia. Hoje, a Twist Bioscience faz três milhões no mesmo período. Ou seja, é questão de tempo até que esta tecnologia comece a mudar o mercado de armazenagem de dados.

Comments


bottom of page