Pesquisadores agora podem tentar decodificar informações escondidas no DNA humano graças ao Grover, novo modelo grande de linguagem (inteligência artificial, para facilitar). Isso é importante porque entender o armazenamento dessas informações no genoma é um dos maiores mistérios científicos do século 21.
O Grover é treinado em DNA humano. É como se ele tivesse aprendido a falar a “língua” do nosso genoma. A IA foi desenvolvida por uma equipe do Centro de Biotecnologia (Biotec) da Universidade Técnica de Dresden. E o artigo sobre o modelo foi publicado na revista científica Nature Machine Intelligence.
IA aprender a falar ‘língua’ do DNA humano para desvendar mistério científico
O Grover o genoma humano como se fosse texto, aprendendo suas regras e contexto para extrair informações funcionais sobre as sequências de DNA. Daí seu nome, que é sigla para “Genome Rules Obtained via Extracted Representations”.
“O Grover aprendeu as regras do DNA. Em termos de linguagem, estamos falando de gramática, sintaxe e semântica”, explica Melissa Sanabria, pesquisadora por trás do projeto, em entrevista ao site da universidade. “Para o DNA, isso significa aprender as regras que governam as sequências, a ordem dos nucleotídeos e sequências, e o significado das sequências.”
E Melissa vai além: “Como os modelos GPT aprendendo línguas humanas, o GROVER basicamente aprendeu a ‘falar’ [a língua do] DNA.”
Leia mais:
- Mark Zuckerberg quer vozes de Hollywood na IA da Meta
- Como usar IA da Meta no WhatsApp
- 5 dicas para se proteger ao usar ChatGPT, Google Gemini e outras IAs
Segredos do DNA
Desde a descoberta da dupla hélice, cientistas têm buscado entender as informações codificadas no DNA. Sete décadas depois, sabe-se que as informações escondidas no genoma se organizam em camadas. E apenas de 1% a 2% do genoma consiste em genes, sequências que codificam proteínas.
“O DNA tem muitas funções além de codificar proteínas. Algumas sequências regulam genes, outras servem a propósitos estruturais, a maioria das sequências serve múltiplas funções ao mesmo tempo”, diz Anna Poetsch, líder do grupo de pesquisa no Biotec.
“Atualmente, não entendemos o significado da maior parte do DNA. Quando se trata de entender as regiões não codificantes do DNA, parece que apenas começamos a arranhar a superfície. É aqui que a IA e os grandes modelos de linguagem podem ajudar.”
Por isso, a ferramenta pode revolucionar a genômica, além de acelerar a medicina personalizada. Se o DNA fosse uma caixinha de surpresas, a IA seria a chave para abrí-la. A ver o que mais vai sair dela.