Pesquisadores agora podem tentar decodificar informações escondidas no DNA humano graças ao Grover, novo modelo grande de linguagem (inteligência artificial, para facilitar). Isso é importante porque entender o armazenamento dessas informações no genoma é um dos maiores mistérios científicos do século 21.

O Grover é treinado em DNA humano. É como se ele tivesse aprendido a falar a “língua” do nosso genoma. A IA foi desenvolvida por uma equipe do Centro de Biotecnologia (Biotec) da Universidade Técnica de Dresden. E o artigo sobre o modelo foi publicado na revista científica Nature Machine Intelligence.

publicidade

IA aprender a falar ‘língua’ do DNA humano para desvendar mistério científico

O Grover o genoma humano como se fosse texto, aprendendo suas regras e contexto para extrair informações funcionais sobre as sequências de DNA. Daí seu nome, que é sigla para “Genome Rules Obtained via Extracted Representations”.

Mão quase tocando linhas coloridas de código em formato que ilustra conceito de inteligência artificial
IA pode ser a chave para decodificar segredos do DNA humano (Imagem: NicoElNino/Shutterstock)

“O Grover aprendeu as regras do DNA. Em termos de linguagem, estamos falando de gramática, sintaxe e semântica”, explica Melissa Sanabria, pesquisadora por trás do projeto, em entrevista ao site da universidade. “Para o DNA, isso significa aprender as regras que governam as sequências, a ordem dos nucleotídeos e sequências, e o significado das sequências.”

publicidade

E Melissa vai além: “Como os modelos GPT aprendendo línguas humanas, o GROVER basicamente aprendeu a ‘falar’ [a língua do] DNA.”

Leia mais:

publicidade

Segredos do DNA

Desde a descoberta da dupla hélice, cientistas têm buscado entender as informações codificadas no DNA. Sete décadas depois, sabe-se que as informações escondidas no genoma se organizam em camadas. E apenas de 1% a 2% do genoma consiste em genes, sequências que codificam proteínas.

O que sabemos sobre DNA é só a ponta do iceberg, segundo pesquisa que desenvolveu IA capaz de decodificar genoma (Imagem: Piyaset/Shutterstock)

“O DNA tem muitas funções além de codificar proteínas. Algumas sequências regulam genes, outras servem a propósitos estruturais, a maioria das sequências serve múltiplas funções ao mesmo tempo”, diz Anna Poetsch, líder do grupo de pesquisa no Biotec.

publicidade

“Atualmente, não entendemos o significado da maior parte do DNA. Quando se trata de entender as regiões não codificantes do DNA, parece que apenas começamos a arranhar a superfície. É aqui que a IA e os grandes modelos de linguagem podem ajudar.”

Por isso, a ferramenta pode revolucionar a genômica, além de acelerar a medicina personalizada. Se o DNA fosse uma caixinha de surpresas, a IA seria a chave para abrí-la. A ver o que mais vai sair dela.