A Microsoft criou uma nova e poderosa ferramenta de IA chamada VALL-E 2, mas você não conseguirá experimentar a novidade. Se trata de um sintetizador de voz que usa inteligência artificial para criar vozes realistas a partir de instruções em texto ou pequenos trechos de áudio.

Pesquisadores da empresa revelaram em um artigo que esta é a primeira vez que um sistema de conversão de texto em fala alcança a “paridade humana”. Talvez por isso, a gigante da tecnologia tenha optado por impedir que usuários comuns usem o modelo.

publicidade

“Isso pode acarretar riscos potenciais no uso indevido do modelo, como falsificação de identificação de voz ou personificação de um locutor específico”, diz um post oficial da Microsoft.

Modelo de IA será usado apenas em pesquisas pela Microsoft

  • “Atualmente, não temos planos de incorporar o VALL-E 2 em um produto ou expandir o acesso ao público”, acrescenta a Microsoft;
  • O sistema será usado “para fins de demonstração de pesquisa” e ainda precisa de melhorias;
  • A semelhança e a naturalidade da voz “clonada”, por exemplo, depende de alguns fatores. Um deles é a qualidade da amostra de áudio original, destacou a empresa;
  • Por enquanto, além do que foi dito pelos pesquisadores sobre as capacidades do sistema, nenhum trecho oficial de áudio usando o modelo foi compartilhada.
voz ia
Imagem: MMD Creative/ Shutterstock

Leia mais:

publicidade

Vale mencionar que outras empresas também estão testando ferramentas similares. Um delas é a OpenAI. Em abril, a dona do ChatGPT apresentou ao mundo o Voice Engine, uma ferramenta alimentada por IA capaz de copiar vozes usando apenas 15 segundos de amostras de áudio.

A empresa planeja explorar o potencial do sistema nas áreas de educação e acessibilidade, recuperando a voz de pacientes com limitações de fala, por exemplo.