Desde que o ChatGPT foi lançado, a Inteligência Artificial generativa, aquela que é capaz de criar vários tipos de conteúdo, despontou como uma inovação em diversos âmbitos. Agora, a IA pode ler na voz de uma pessoa que já faleceu.

Foi o que aconteceu com Edward Herrmann, um ator que narrou dezenas de audiolivros e morreu há 10 anos. Isso não impediu que ele voltasse a dar voz a livros recentes.

publicidade

Leia mais:

Entenda o caso

O trabalho mais recente de Herrmann como narrador foi gerado pela DeepZen Ltd., uma startup de IA. Com a permissão da família, a empresa teve acesso a gravações anteriores do ator e, a partir dos arquivos, conseguiu replicar a voz para que ele lesse novos audiolivros, com diferentes sons e entonações, como se fosse o próprio Herrmann.

publicidade

O filho de Edward Herrmann, Rory Herrmann, disse que ficou impressionado ao ouvir a voz do pai novamente.

Sentimos que era uma maneira incrível de continuar seu legado. É um momento ‘uau’.

Rory Herrmann

Mercado de narração por IA

  • A DeepZen revela ter assinado acordos com 35 editoras nos Estados Unidos e no exterior, além de com 25 autores para a narração com IA generativa.
  • A startup criou quase uma centena de audiolivros com a narração de Herrmann e está buscando por outras estrelas conhecidas que já morreram.
  • A tecnologia de narração por inteligência artificial ainda não é amplamente adotada por grandes editoras de livros nos Estados Unidos.
  • A prática, porém, pode ser benéfica para pequenas editoras e autores, que não têm uma grande projeção de vendas. Gravar uma versão de um livro em áudio custa pelo menos US$ 5.000.
  • Grandes empresas, como a Apple e o Google, permitem que os usuários criem audiolivros gratuitamente usando vozes humanas replicadas digitalmente.
  • No entanto, as versões oficiais dos audiolivros lançados pelas companhias vêm de pessoas reais, cujas vozes ajudam a treinar a narração automatizada.

IA: prós e contras

Charles Watkinson, diretor da University of Michigan Press, disse que a editora produziu cerca de 100 audiolivros na plataforma de narração automática do Google e que a nova tecnologia foi o que tornou isso possível. Antes, os custos de um estúdio, narradores humanos e uma equipe de suporte impossibilitavam a produção.

publicidade

A escritora Simi Linton também aderiu a uma voz sintética para narrar seu livro de memórias My Body Politic, sobre sua vida como uma mulher deficiente. Ela diz não gostar de “Mary”, a voz artificial escolhida pela University of Michigan Press, mas que concordou com o uso de IA para tornar o livro mais acessível.

A razão pela qual concordei em fazer essa criação sintética foi aumentar a acessibilidade do meu livro para leitores cegos e pessoas com outras deficiências.

Simi Linton

Do outro lado, apesar dos benefícios e da democratização do processo de produção de um audiolivro, a narração via IA geradora pode, futuramente, diminuir a necessidade de vozes humanas e atrapalhar o trabalho de narradores profissionais.

publicidade

IA vai extinguir narradores?

Segundo o CEO e cofundador da DeepZen, Taylan Kamis, a empresa contratou mais de 30 atores profissionais para ajudar o mecanismo de IA a capturar os níveis de emoção humana. Ou seja, os narradores ainda são necessários.

Melissa Papel, uma atriz francesa, foi uma delas. Ela diz ter gravado conteúdo para a DeepZen lendo livros no idioma em diferentes entonações. E foi isso que ajudou a empresa a ter uma ferramenta automatizada que pudesse imitá-la. Papel, porém, acredita que esse processo é inicial e pode se extinguir posteriormente, quando as IAs já estiverem configuradas.

Jeffrey Bennett, conselheiro geral da Screen Actors Guild-American Federation of Television and Radio Artists, um sindicato nacional que representa artistas, inclusive narradores profissionais, disse que a IA pode atrapalhar a indústria artística e de narração de audiolivros. Ele está trabalhando para proteger os direitos de voz e imagem dos profissionais.

Já a Audible, empresa de audiolivros, está avaliando a abordagem.

A narração profissional sempre foi e continuará sendo essencial para a experiência de audição Audible, mas vemos um futuro em que performances humanas e conteúdo gerado por conversão de texto em fala podem coexistir.

Porta-voz da Audible

As inovações da IA generativa vêm em meio a uma carta aberta pedindo por uma pausa nas pesquisas, para que o risco seja avaliado, e por demissões de equipes de éticas.

Com informações de The Wall Street Journal

Imagem: Shutterstock

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!