Siga o Olhar Digital no Google Discover
Um novo modelo de inteligência artificial chamado popEVE pode identificar mutações em proteínas humanas que têm maior probabilidade de causar doenças, mesmo aquelas que nunca foram observadas antes. O sistema foi criado por pesquisadores da Harvard Medical School e do Centro de Regulação Genômica (CRG) em Barcelona, e pode transformar a maneira como os médicos diagnosticam doenças genéticas.
“As clínicas nem sempre têm acesso ao DNA dos pais e muitos pacientes chegam sozinhos. O popEVE pode ajudar esses médicos a identificar mutações causadoras de doenças, e já estamos vendo isso em colaborações com clínicas”, diz a Dra. Mafalda Dias, coautora correspondente do estudo e pesquisadora do Centro de Regulação Genômica.
O modelo foi criado usando dados de centenas de milhares de espécies diferentes e da variação genética em toda a população humana. Esse registro evolutivo permite que a ferramenta veja quais partes de cada uma das aproximadamente 20.000 proteínas humanas são essenciais para a vida e quais podem tolerar mudanças. Assim, o popEVE não apenas identifica as mutações, mas também classifica sua gravidade.

Além disso, o modelo pode funcionar apenas com as informações genéticas do paciente. Isso tem implicações importantes para o tratamento de doenças raras em sistemas de saúde com recursos limitados, tornando os diagnósticos mais rápidos, simples e baratos do que antes.
Definindo limites
O genoma de cada indivíduo contém muitas pequenas diferenças que o tornam único. Isso inclui mutações de sentido trocado, alterações que modificam um único aminoácido em uma proteína. Muitas são inofensivas, mas algumas causam doenças ou distúrbios graves. O desafio é determinar quais são benignas e quais são prejudiciais.
No entanto, nem todas as mutações prejudiciais são igualmente nocivas. Algumas causam sintomas leves, outras deficiências graves e algumas são fatais na infância. Existem muitas ferramentas de IA para prever se uma mutação é perigosa ou não, mas elas não oferecem uma escala gradual desse comportamento.
Para condições “tão raras quanto uma única mutação”, não há histórico de casos para consultar. Mesmo que toda a população mundial fosse sequenciada, as mutações desses pacientes seriam completamente novas. Os métodos tradicionais que dependem da identificação de padrões em grupos de pacientes ou em grandes coortes não são úteis nesses casos isolados.

Por isso, em 2021, a equipe criou o EVE (Modelo Evolutivo do Efeito de Variantes), um algoritmo que utiliza padrões evolutivos para classificar mutações em genes de doenças humanas como benignas ou prejudiciais. Embora o EVE pudesse avaliar o impacto de mutações dentro de um gene, suas pontuações não eram diretamente comparáveis entre genes. Uma variante que parecia grave em uma proteína não podia ser comparada de forma justa com uma variante em outra.
O modelo mais recente da família EVE, o popEVE, resolve essa situação combinando dados evolutivos com informações do UK Biobank e do gnomAD, dois conjuntos de dados que mostram quais variantes estão presentes em pessoas saudáveis, ajudando o modelo a calibrar suas previsões para humanos.
Leia Mais:
- Estas atitudes simples podem reduzir o risco de Parkinson
- O que é a Síndrome de Reye? Veja a relação com a aspirina e vírus
- Novo composto químico pode ajudar a combater Alzheimer
Passo à frente
O resultado é o primeiro modelo capaz de classificar mutações de forma significativa em todo o proteoma humano, o conjunto completo de aproximadamente 20.000 proteínas codificadas no genoma humano. Uma mutação no gene A agora pode ser comparada diretamente com uma no gene B, na mesma escala de gravidade. Isso permite que os médicos, pela primeira vez, se concentrem primeiro nas variantes potencialmente mais prejudiciais.
Para validar o popEVE, os pesquisadores analisaram dados genéticos de mais de 31.000 famílias com crianças afetadas por distúrbios graves do desenvolvimento. Em 98% dos casos em que uma mutação causal já havia sido identificada, o popEVE classificou corretamente essa variante como a mais prejudicial no genoma da criança. Ele superou concorrentes de última geração, como o AlphaMissense da DeepMind.

Ao procurarem novos genes candidatos a doenças, os pesquisadores descobriram 123 que nunca haviam sido associados a distúrbios do desenvolvimento. Muitos deles são ativos no cérebro em desenvolvimento e interagem fisicamente com proteínas de doenças conhecidas. Destes, 104 foram observados em apenas um ou dois pacientes.
Um dos pontos fortes do popEVE é que ele evita penalizar pessoas cuja ancestralidade é sub-representada em bancos de dados genéticos, que são predominantemente tendenciosos em relação a pessoas de ascendência europeia. Isso é um problema em outras ferramentas que sinalizam possíveis mutações causadoras de doenças simplesmente porque essas variantes não haviam sido observadas antes.
Os autores do estudo enfatizam que o popEVE interpreta apenas alterações no DNA que modificam proteínas — portanto, não abrange todos os tipos de variação genética. Além disso, não substitui o julgamento clínico. Os médicos devem usar o histórico médico e a análise dos sintomas para auxiliar no diagnóstico.