Cientistas do Instituto Big Data, da Universidade de Oxford, no Reino Unido, deram um grande passo para rastrear a totalidade das relações genéticas entre os seres humanos. Eles conseguiram mapear a maior árvore genealógica de que se tem notícia, em um estudo publicado nesta sexta-feira (25), na revista científica Science.

Nas duas últimas décadas, avanços extraordinários foram alcançados na pesquisa genética humana, possibilitando a identificação e o armazenamento de dados genômicos de centenas de milhares de indivíduos, incluindo pessoas pré-históricas. 

publicidade
Visualizando linhagens ancestrais humanas inferidas ao longo do tempo e do espaço. Cada linha representa uma relação ancestral-descendente em nossa genealogia inferida de genomas modernos e antigos. A largura das linhas corresponde a quantas vezes a relação é observada, e as cores são determinadas com base na idade estimada do ancestral. Imagem: Yan Wong e equipe via Science

Isso significa uma forte esperança de se traçar as origens da diversidade genética humana para produzir um mapa completo de como os indivíduos em todo o mundo estão relacionados uns com os outros.

Trabalhar uma maneira de combinar sequências de genomas de muitos bancos de dados diferentes e desenvolver algoritmos para lidar com tanta informação pareciam dois grandes desafios. No entanto, essa nova abordagem conseguiu, facilmente, combinar dados de múltiplas fontes e escalas para acomodar milhões de sequências de genomas.

publicidade

Estudo analisa como a sequência genética de cada pessoa se relaciona com outras

Yan Wong, geneticista evolucionário do Big Data, é um dos principais autores do estudo. “Basicamente construímos uma enorme árvore genealógica, uma genealogia para toda a humanidade, que modela exatamente a história que gerou toda a variação genética que encontramos em humanos hoje”, diz ele. “Essa genealogia nos permite ver como a sequência genética de cada pessoa se relaciona com todas as outras, ao longo de todos os pontos do genoma”.

Uma vez que regiões genômicas individuais são herdadas apenas de um dos genitores, seja da mãe ou do pai, a ancestralidade de cada ponto no genoma pode ser considerada como uma árvore. O conjunto de árvores, conhecido como “sequência de árvores” ou “gráfico de recombinação ancestral”, liga regiões genéticas de volta ao tempo a ancestrais onde a variação genética apareceu pela primeira vez.

publicidade

Leia mais:

“Essencialmente, estamos reconstruindo os genomas de nossos ancestrais e usando-os para formar uma vasta rede de relacionamentos. Podemos então estimar quando e onde esses ancestrais viveram”, disse Anthony Wilder Wohns, autor principal, que realizou a pesquisa para seu doutorado em Big Data e agora é pesquisador de pós-doutorado em Harvard. “O poder de nossa abordagem é que ela faz pouquíssimas suposições sobre os dados subjacentes e também pode incluir amostras de DNA modernas e antigas”.

publicidade

O estudo integrou dados sobre genomas humanos modernos e antigos de oito bancos de dados diferentes e incluiu um total de 3.609 sequências de genomas individuais de 215 populações. 

Maior árvore genealógica da história volta mais de 100 mil anos no tempo

Entre os genomas antigos estavam amostras encontradas em todo o mundo com idades que variam de mil a mais de 100 mil anos. Os algoritmos previram onde ancestrais comuns devem estar presentes nas árvores evolutivas para explicar os padrões de variação genética. A rede resultante continha quase 27 milhões de ancestrais.

Após a adição de dados de localização desses genomas amostrais, os autores usaram a rede para estimar onde os ancestrais comuns previstos haviam vivido. Os resultados recapturaram com sucesso eventos-chave na história evolutiva humana, incluindo a migração para fora da África.

Embora o mapa genealógico já seja um recurso extremamente rico, a equipe de pesquisa planeja torná-lo ainda mais abrangente, continuando a incorporar dados genéticos à medida do disponível. 

Como as sequências de árvores armazenam informações de forma altamente eficiente, o banco de dados poderia facilmente acomodar milhões de genomas adicionais. “Este estudo está lançando as bases para a próxima geração de sequenciamento de DNA. À medida que a qualidade das sequências de genomas de amostras de DNA modernas e antigas melhorar, as árvores se tornarão ainda mais precisas e eventualmente seremos capazes de gerar um único mapa unificado que explique a descendência de toda a variação genética humana que vemos hoje”, acredita Wong.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!