Inteligência Artificial consegue imitar sua voz em 5 segundos

Software analisa uma amostra da voz original e a converte em um modelo matemático, que pode ser aplicado a um sistema capaz de ler qualquer texto

Rafael Rigues, editado por Daniel Junqueira 14/11/2019 10h16
reconhecimento de voz
A A A

Vivemos em um mundo em que é cada vez mais difícil confiar em nossos olhos e ouvidos. Tecnologias como os deepfakes são capazes de gerar fotos e vídeos colocando pessoas em cenas e situações onde nunca estiveram, e agora um novo modelo de rede neural é capaz de clonar a voz de um humano usando uma amostra com meros 5 segundos de duração.


O software é parte do artigo “Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis”, publicado no site arXiv da Universidade de Cornell, nos EUA, e escrito por Ye Jia, Yu Zhang, Ron J. Weiss, Quan Wang, Jonathan Shen, Fei Ren, Zhifeng Chen, Patrick Nguyen, Ruoming Pang, Ignacio Lopez Moreno e Yonghui Wu.

O sistema analisa a voz a ser clonada, gerando um modelo matemático. Este modelo é aplicado a um sistema de geração de texto-para-voz, que pode então reproduzir qualquer texto usando uma cópia da voz original. Embora a matemática por trás do sistema seja complexa, os resultados são impressionantes e fáceis de compreender:

Além de reproduzir uma voz já existente o sistema é capaz de gerar novas vozes, usando trechos aleatórios das amostras, e também pode ser usado em técnicas de tradução, analisando uma voz em um idioma e gerando uma voz similar à original em inglês.

Fonte: BoingBoing

Áudio Inteligência Artificial rede neural clonagem Deepfake Som clone
Compras na Internet? Para aproveitar as melhores ofertas, baixe a nova extensão do Olhar Digital. Além da garantia do melhor preço, você ainda ganha descontos em várias lojas. Clique aqui para instalar.

Recomendados pra você