IA vai provocar revolução nos audiolivros; entenda

Pesquisadores desenvolveram um sistema que permite a narração de histórias com vozes mais realistas e "emocionais" alimentadas pela IA
Por Alessandro Di Lorenzo, editado por Bruno Capozzi 22/09/2023 03h20, atualizada em 02/10/2023 10h35
Audiobook Audiolivro
Pixel-Shot/Shutterstock
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Os audiolivros se tornarão mais “emocionais” e realistas. Pesquisadores desenvolveram um sistema baseado na inteligência artificial que permite a narração de histórias com vocalizações alimentadas pela última geração de processos neurais de conversão de texto em fala. A tecnologia também reduzira o tempo e os custos do processo de criação dos audiolivros.

Leia mais

IA permitirá narrações mais humanas

  • Segundo os pesquisadores, a nova abordagem vai gerar narração com nuances emocionais distintas.
  • A narração é lida em uma só voz, enquanto o diálogo dos personagens da história é reproduzido a partir de vozes variadas.
  • O tom e o estilo de fala são determinados pelo sistema de inferência neural.
  • As informações são da Tech Xplore.
Usuários poderão gravar própria voz em audiolivros (Imagem: muse studio/Shutterstock)

Usuários poderão gravar própria voz e carregar ela nos audiolivros

Os pesquisadores observaram que estão preparando uma demonstração ao vivo e que permitirá ao público gerar um audiolivro em sua própria voz. Ele exigirá apenas pequenas amostras de sua voz que serão usadas para gerar um volume completo.

Usamos um alto-falante automático e um sistema de inferência de emoções para alterar dinamicamente a voz e o tom de leitura com base no contexto. Isso torna passagens com vários personagens e diálogos emocionais mais realistas e envolventes.

Brendan Walsh, engenheiro de software da Microsoft

Os usuários, por exemplo, podem recitar um prefácio ou dedicatória em sua própria voz e, em seguida, carregar o texto completo de seu livro. Isso significa que, por exemplo, uma mãe que precisa trabalhar até tarde e não consegue ler uma história para dormir para o filho, poderá gravar todo o conteúdo na própria voz e reproduzir a história completa para a criança.

A tecnologia faz parte do Project Gutenberg, que já publicou cerca de 5 mil livros, totalizando 35 mil horas de narração online. Qualquer pessoa pode fazer login e ouvir os audiolivros. O serviço é gratuito.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Alessandro Di Lorenzo
Colaboração para o Olhar Digital

Alessandro Di Lorenzo é formado em Jornalismo pela Universidade Federal do Rio Grande do Sul (UFRGS) e atua na área desde 2014. Trabalhou nas redações da BandNews FM em Porto Alegre e em São Paulo.

Bruno Capozzi é jornalista formado pela Faculdade Cásper Líbero e mestre em Ciências Sociais pela PUC-SP, tendo como foco a pesquisa de redes sociais e tecnologia.