Um estudo recente publicado pelo Instituto de Engenheiros Eletricistas e Eletrônicos (IEEE) dos Estados Unidos divulgou que, cada vez mais, as novas tecnologias de inteligência artificial estão conseguindo “enganar” os humanos: desta vez, a audição de participantes foi testada e falhou ao detectar quais sons eram produzidos por IA e quais eram apenas uma reprodução de áudio comum.

O estudo avaliou a audição de 53 participantes, que tinham que responder se o som que ouviam era de uma reprodução comum de áudio ou de um som criado por IA. Ao todo, 41 dos participantes foram “enganados” pelos sons, sem saber que os áudios haviam sido criados por computadores. 

publicidade

Os sons foram criados por meio de uma técnica de machine learning chamada “AutoFoley”, na qual a máquina determina quais ações estão ocorrendo em um videoclipe e reprouz os efeitos sonoros em cima dessas imagens.

512151_982834.jpg

publicidade

As tecnologias de IA já estão sendo utilizadas para manipular áudios, otimizando o trabalho dos mixadores de sons. Créditos: Unsplash

O efeito é originário do Foley, uma técnica de edição de som no qual os artistas devem criar um som artificial que capta a verdadeira essência daquilo que será representado no vídeo. Esse procedimento é muito aplicado na dublagem de desenhos ou na edição de um filme

publicidade

Jeff Prevost, professor da Universidade do Texas, em San Antonio, que co-criou o AutoFoley, contou à IEEE Spectrum que a adição de efeitos sonoros por meio de Foley é uma técnica utilizada desde 1930. “Os filmes pareceriam vazios e distantes sem a camada controlada de uma trilha sonora realista de Foley. No entanto, o processo de síntese de som de Foley adiciona tempo e custo significativos à criação de um filme”, ressaltou. 

Veja uma das amostras de áudio que foram utilizadas para enganar os participantes:

 

publicidade

Apesar do sucesso dos áudios no estudo, a IA para este tipo de efeito específico está longe de ser perfeita. O desafio agora é descobrir como misturar o áudio feito por machine learning com vídeos reais. Para enganar 100% do público, os sons terão de ser combinados com a ação dos vídeos. 

Ainda não sabemos até que ponto a IA nos levará, no entanto, já é possível dizer que alguns dos seus efeitos brevemente poderão ser sentidos nas telas de cinema ou em nossas salas de estar. 

Via: Futurism