Lar Notícias e Análises Precisa de algum armazenamento extra? tente dna

Precisa de algum armazenamento extra? tente dna

Índice:

Vídeo: This Is How Your DNA Made You (Novembro 2024)

Vídeo: This Is How Your DNA Made You (Novembro 2024)
Anonim

Os engenheiros têm empurrado com sucesso mais armazenamento para espaços menores por décadas, mas isso não pode durar para sempre. O próximo grande salto no armazenamento de dados pode assumir a forma do DNA dentro de toda a matéria orgânica: cientistas de laboratórios de todo o país estão experimentando o DNA sintético como meio de armazenamento.

"Se você olhar para onde a eletrônica está indo, a tecnologia de silício, grande parte da tecnologia básica que usamos para construir computadores hoje, estamos chegando ao limite em quase todas", diz Luis Henrique Ceze, professor associado de ciência da computação e engenharia na Universidade de Washington. "O DNA é muito denso, é muito durável e requer muito pouca energia para mantê-lo; portanto, há muitas vantagens em usar o DNA para armazenamento de dados".

Ceze trabalha com Karin Strauss, pesquisadora de arquitetura de computadores da Microsoft Research, em uma colaboração entre as duas instituições - um projeto que une ciência da computação e biologia. Para uma equipe de aproximadamente 20 pessoas, a universidade fornece os biólogos moleculares e a Microsoft fornece os cientistas da computação.

Para entender como o DNA pode ser usado para armazenamento, considere que todos os dados do computador são binários ou base-2. O DNA é a base-4, composta de adenina, citosina, guanina e timina (abreviada como A, C, G e T). O primeiro passo é converter as informações da base 2 em base 4, de modo que A corresponde a 00, C a 01, G a 10 e T a 11 (que simplifica um pouco, mas transmite a ideia).

Em seguida, os cientistas usam uma máquina chamada sintetizador de DNA para combinar os quatro produtos químicos na ordem certa. O resultado armazena as informações várias vezes como um cluster semelhante ao sal menor que a ponta de um lápis. A leitura dessas informações requer um seqüenciador de DNA.

Embora isso possa parecer frágil - como algo que pode explodir quando uma porta se abre repentinamente - o DNA é o meio de armazenamento de dados mais forte que já vimos. Os cientistas leram com sucesso o DNA com centenas de milhares de anos.

O seqüenciamento do DNA envolve a remoção de um pouquinho do material armazenado, e o processo esgota essa amostra. Consequentemente, uma gravação de DNA pode ser lida um número finito de vezes. Porém, isso não é um problema, pois o material armazenado possui muitos dados redundantes; pode ser amostrada repetidamente. Os meios de armazenamento atuais também têm um número limitado de ciclos de gravação e leitura antes que falhem, portanto isso não é novidade.

Como Ceze aponta, o DNA nunca será obsoleto. Enquanto muitos de nós têm disquetes no fundo de uma gaveta que não podemos mais ler, esse não será o destino do DNA. "Sempre nos preocupamos com o DNA por ciências da vida e por razões de saúde, para que você sempre tenha uma maneira de ler as informações armazenadas no DNA", diz Ceze.

Em julho de 2016, a Microsoft e a Universidade de Washington codificaram com êxito 200 MB de dados na forma de DNA, superando o recorde anterior de 22 MB. Usando o DNA, diz Strauss, será possível armazenar 1 exabyte de dados - 1 bilhão de GB - em um cubo de 1 polegada.

"Fizemos uma estimativa da quantidade de dados que você poderia colocar em um volume específico", diz Strauss. "Tentamos estimar qual seria o volume se hoje decidíssemos arquivar toda a Internet acessível, ou seja, tudo que não está atrás de uma senha ou qualquer tipo de parede eletrônica, e criamos o tamanho de uma grande caixa de sapatos".

Parece uma proposta distante, mas Ceze acredita que veremos sistemas comerciais de armazenamento de DNA no mercado em uma década. Eles não funcionarão exatamente como o armazenamento de microprocessador, já que o DNA exige um ambiente químico úmido para a criação, mas fornecerão capacidade massiva e acesso aleatório nas mesmas velocidades que os sistemas de fita corporativos fornecem agora.

Um campo que avança rapidamente

O DNA existe há bilhões de anos, mas as demonstrações do DNA como uma tecnologia de armazenamento utilizável começaram em 1986, quando o pesquisador do MIT Joe Davis codificou uma imagem binária simples em 28 pares de DNA.

Outro pioneiro nesse campo é George Church, professor de genética que trabalha na Harvard Medical School desde 1977 e dirige seu próprio laboratório desde 1986. Church está interessado em reduzir o custo da leitura e escrita de DNA desde a década de 1970, acreditando que algum dia eles se reuniam para criar armazenamento prático de dados. Ele ficou interessado em trabalhar na pesquisa de DNA por volta de 2000 e realizou testes críticos de seqüenciamento e síntese em 2003 e 2004. Em 2012, ele conseguiu reunir as duas áreas e criar um sistema para codificação de dados. Ele escreveu esse trabalho em um influente artigo de 2012 na Science .

"Antes de 2003 e 2004, o seqüenciamento e a síntese eram feitos essencialmente em capilares - ou pequenos tubos - onde você teria um tubo por sequência", explica Church. "Foi bastante manual e não escalável. A lição que aprendemos com a indústria de semicondutores de microfabricação foi que você precisava criar uma maneira de colocá-los essencialmente em um plano bidimensional e depois reduzir o tamanho do recurso. Nenhum desses métodos baseados em colunas eram compatíveis com isso e, em 2003, mostramos como você pode distribuir seqüências em um plano bidimensional e depois imaginá-las com imagens fluorescentes, que agora são a maneira dominante de seqüenciamento. você poderia fabricar DNA em um avião e depois retirá-lo, e então poderia ser ainda mais compacto; portanto, o avião era apenas um local temporário para sintetizá-los, e então compactá-los em um objeto tridimensional milhões de vezes mais compacto que o armazenamento de dados normal.

"Esses foram exercícios de prova de conceito em 2003 e 2004. Em 2012, nós e outros aperfeiçoamos os métodos de leitura e escrita do DNA, e eu os reuni em um experimento em que codifiquei um livro que acabei de escrever no DNA, incluindo imagens, mostrando que basicamente qualquer coisa digital pode ser codificada com DNA ".

Embora o custo seja um obstáculo significativo para o armazenamento de DNA, Church observa que o preço caiu acentuadamente no curto espaço de tempo em que a pesquisa foi realizada. O custo da leitura do DNA melhorou cerca de 3 milhões de vezes, enquanto o custo da escrita melhorou em um bilhão de vezes. Ele pode ver os dois melhorando em mais um milhão de vezes em menos tempo. Ele também aponta que o custo de copiar material de DNA é quase gratuito, assim como o custo do armazenamento a longo prazo. Para armazenamento de arquivo, o custo da leitura de dados não é um grande obstáculo, pois muito material arquivado nunca é lido e alguns itens são lidos seletivamente. Veja os custos de todo o sistema, ele aconselha. Os métodos tradicionais de armazenamento movem-se à velocidade da Lei de Moore e alcançam o platô em breve. Mas a tecnologia de armazenamento de DNA está se movendo mais rápido que a lei de Moore e não mostra sinais de platô.

O armazenamento em arquivo e em nuvem é onde a Igreja vê o armazenamento de dados de DNA sendo adotado primeiro. Empresas como IBM, Microsoft e Technicolor têm suas próprias equipes de pesquisa e desenvolvimento estudando a área, observa ele. Ele colaborou com a Technicolor em 2015 para armazenar A Trip to the Moon , um filme clássico de 1902 que se acreditava perdido, no DNA. Agora, o Technicolor tem muitas cópias de DNA que, combinadas, não são maiores que um grão de poeira.

A Church possui um laboratório de 93 pessoas trabalhando no armazenamento de DNA e atualmente se concentrando em dois objetivos. O primeiro é melhorar radicalmente a velocidade por ciclo. As informações são armazenadas em centenas de camadas, cada uma com a espessura de uma molécula. Atualmente, cada adição leva três minutos, mas a Igreja acredita que isso pode ser reduzido a menos de um milissegundo. Isso é 200.000 vezes mais rápido, ele observa, e significa uma mudança da química orgânica para a bioquímica. Ele também quer mudar a maneira como os instrumentos usados ​​para ler e escrever são fabricados para torná-los muito menores. Atualmente, eles são do tamanho de grandes geladeiras. Ele quer isso reduzido.

Redundância incorporada e necessidade de correção de erros

Um pesquisador que foi influenciado pelo artigo de Ciências da Igreja em 2012 é o professor Olgica Milenkovic, da Universidade de Illinois, Urbana-Champaign. O artigo mencionava a necessidade de codificação, o que imediatamente despertou seu interesse. A codificação na pesquisa de armazenamento é uma técnica para adicionar redundância aos dados, redundância que pode ser usada posteriormente para corrigir erros que ocorrem durante o processo de leitura e gravação. Para um exemplo de por que isso é importante, veja as duas fotos do Citizen Kane aqui. Ambos foram codificados em DNA pela equipe de Milenkovic e depois lidos. Adivinha qual deles usou redundância.

Você está certo: a imagem da esquerda foi codificada com redundância e a imagem da direita não.

Uma maneira simples de adicionar redundância é repetir cada caractere um número definido de vezes. Em vez de escrever um 0, escreva-o quatro vezes. Essa é a abordagem da força bruta - simples, mas terrivelmente ineficiente. O trabalho de Milenkovic é conseguir a mesma correção de erros de uma maneira mais sofisticada. Envolve técnicas chamadas de verificação de paridade ou de congruência linear para fornecer formas de verificação de dados.

"Todo o campo consiste basicamente em ajudá-lo a corrigir erros se eles aparecerem ou, melhor ainda, a evitar erros que você sabe que provavelmente aparecerão", diz Milenkovic. "Introduzimos redundância controlada para eliminar erros, e essa redundância controlada não tem a forma de repetição simples, porque é muito ineficaz."

Foi isso que trouxe Milenkovic para o campo, mas sua pesquisa agora trata de reduzir o enorme custo da síntese de DNA.

"Meu aluno, H. Tabatabae Yazdi, que foi muito ativo nesse tópico, e eu tenho tentado muito encontrar uma maneira inteligente de evitar a síntese de DNA. A síntese de DNA é absolutamente um gargalo para essa tecnologia devido ao alto custo ", Diz Milenkovic.

Embora Milenkovic desconfie de revelar muito sobre pesquisas não publicadas, sua solução envolve "abordagens matemáticas astutas" e tem tudo a ver com o tempo, em que o tamanho do intervalo entre bits de informação é significativo.

"Se você dispensa a formalidade de usar ATGCs para realmente codificar símbolos binários em um determinado local, pode criar meios muito mais inteligentes e eficientes de armazenar informações, porque não é necessário sintetizar repetidamente os fios novamente ", explica Milenkovic. "Você pode sintetizá-los uma vez de uma certa maneira e, em seguida, reutilizar o DNA sintetizado de uma maneira combinatória inteligente".

Através de seu trabalho, Milenkovic espera reduzir o custo de sintetizar DNA em pelo menos três ordens de magnitude. Isso ainda não é suficiente, ela observa, mas é progresso. Também está contribuindo para uma linha de pesquisa que ela acha fascinante.

"É muito emocionante, para ser honesto, brincar de Deus e codificar suas próprias informações no DNA", diz Milenkovic. "Isso dá a uma pessoa uma sensação de excitação ao saber que você está brincando com uma molécula da natureza escolhida e fazendo com que ela faça o que deseja armazenar, codificar e transmitir informações para o futuro".

Ganhar dinheiro a qualquer momento

Nem tudo é pesquisa acadêmica empoeirada com armazenamento de DNA. A Helixworks, uma empresa sediada na Irlanda, já está tentando ganhar dinheiro com isso. Ele tem um produto na Amazon - mais ou menos.

"Lançamos na Amazon para que você possa codificar 512KB de dados digitais no DNA", explica Nimesh Pinnamaneni, cofundador da empresa. "É algo muito pequeno. Talvez uma imagem ou talvez um poema, algo assim."

É uma compra incomum, mas poderia ser o símbolo de amor perfeito para a pessoa que tem tudo, especialmente se essa pessoa for um cientista:

"Lembro-me de um cliente que nos ligava. Ele queria presentear sua esposa - ambos são biotecnologistas - ele queria presentear sua esposa no aniversário de casamento. Ele queria colocar uma mensagem no DNA e presenteá-la com um DNA", lembra Pinnamaneni. "Ela teria que sequenciar o DNA para ler a mensagem. É uma maneira bastante complicada de enviar uma mensagem de amor, mas talvez seja fofo para os biotecnologistas, sabia?"

Mas a Helixworks ficou um pouco à frente de publicar seu produto na Amazon em agosto de 2016, antes de estar pronto para atender aos pedidos. Duas pessoas compraram o DNADrive de US $ 199 da empresa - uma cápsula de ouro de 14 quilates com um aglomerado de DNA dentro - antes que a Helixworks fosse forçada a retirar seu produto da lista. O DNADrive ainda está na Amazon, mas não pode ser adquirido.

Isso não significa que o Helixworks acabou, apenas ansioso demais. Chegou longe demais para parar agora. A empresa começou na Universidade de Borås, na Suécia, onde Pinnamaneni (foto acima, à esquerda) e Sachin Chalapati (direita), o outro cofundador da empresa, estavam obtendo mestrado em biotecnologia. Eles arrecadaram fundos para a pesquisa de armazenamento de DNA, continuaram seu trabalho em Bangalore, na Índia, e desenvolveram uma prova de conceito.

A busca por fundos adicionais os levou ao programa acelerador IndieBio, administrado pela SOSV, uma empresa iniciante de capital de risco em San Francisco, Califórnia. O Helixworks foi selecionado pelo programa e ganhou US $ 50.000 em dinheiro e a capacidade de trabalhar em um laboratório no Condado de Cork, onde está nos últimos seis meses. O programa inclui orientação sobre o lançamento de um produto, que a Helixworks utilizará no festival South by Southwest deste ano, onde competirá em um evento de pitch.

Embora a produção de cápsulas de DNA de ouro possa eventualmente ser uma linha lateral lucrativa, Pinnamaneni diz que o futuro de sua empresa está nas compactas impressoras de DNA de residências e escritórios que estão desenvolvendo agora. Ele quer tornar o armazenamento de DNA fácil e acessível o suficiente para qualquer um usar.

"Nós descobrimos que você precisa ter algo que funcione como um cartucho em uma impressora", explica Pinnamaneni. "Você tem apenas quatro cores, e essas quatro cores podem combinar para formar qualquer cor possível, certo? É assim que a sua impressora a tinta funciona. Descobrimos que precisamos ter algo parecido com isso em nosso sistema. Projetamos um cartucho de 32 reagentes que pode ser combinado para formar qualquer sequência de DNA possível ".

Enquanto outros laboratórios pagam cerca de US $ 30.000 cada vez que precisam sintetizar o DNA, uma operação que leva semanas para ser concluída, Pinnamaneni diz que sua invenção pode reduzir drasticamente o custo e o tempo. A Helixworks está trabalhando com a Opentrons, uma empresa que fabrica equipamentos de laboratório automatizados, para criar a impressora. É isso que será lançado no SXSW.

"O que demonstraremos no salão da exposição é a escrita de DNA diante de seus olhos", diz Pinnamaneni.

A empresa ainda não receberá pedidos. E isso é bom, porque esse biotecnólogo romântico ainda está esperando seu presente de aniversário.

Precisa de algum armazenamento extra? tente dna