OpenAI prometeu uma ferramenta de clonagem de voz. Até agora, sem novidades

Um ano depois de seu anúncio, o recurso não foi liberado ao público, e segue sem uma previsão de lançamento
Por Leandro Costa Criscuolo, editado por Bruno Capozzi 07/03/2025 06h12
Logo da OpenAI em um smartphone na horizontal
(Imagem: jackpress / Shutterstock.com)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Em março de 2024, a OpenAI anunciou o Voice Engine, uma ferramenta de IA que poderia clonar a voz de uma pessoa com apenas 15 segundos de fala. Um ano depois, o serviço continua em pré-visualização, sem previsão de lançamento.

Ofertas

Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Vendido por Amazon
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
De: R$ 17.375,50
Por: R$ 15.522,79
USB C Hub 8 em 1 USB Tipo C para HDMI 4k RJ45 Ethernet Carregamento PD Charger, 2 portas USB 3.0 e leitor de cartões SD/TF, compátivel com Macbook, tablets,celulares-Thee Brothers
Vendido por Amazon
USB C Hub 8 em 1 USB Tipo C para HDMI 4k RJ45 Ethernet Carregamento PD Charger, 2 portas USB 3.0 e leitor de cartões SD/TF, compátivel com Macbook, tablets,celulares-Thee Brothers
De: R$ 57,90
Por: R$ 47,40
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
Vendido por Amazon
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
De: R$ 156,00
Por: R$ 140,00
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
Vendido por Amazon
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
De: R$ 199,99
Por: R$ 178,49
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Vendido por Amazon
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
De: R$ 299,99
Por: R$ 183,99
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
Vendido por Amazon
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
De: R$ 259,35
Por: R$ 198,99
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Vendido por Amazon
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
De: R$ 2.299,00
Por: R$ 1.888,99
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
Vendido por Amazon
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
De: R$ 5.299,00
Por: R$ 3.999,00
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
Vendido por Amazon
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
De: R$ 229,00
Por: R$ 160,65
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
Vendido por Amazon
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
De: R$ 289,90
Por: R$ 189,90
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Vendido por Amazon
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
De: R$ 419,99
Por: R$ 368,99
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
Vendido por Amazon
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
De: R$ 369,00
Por: R$ 209,90
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Vendido por Amazon
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
De: R$ 464,65
Por: R$ 393,05
Pentel Caneta Gel Retrátil Energel 0.7mm Preta SM/BL77TL-A
Vendido por Amazon
Pentel Caneta Gel Retrátil Energel 0.7mm Preta SM/BL77TL-A
De: R$ 23,35
Por: R$ 14,80

A empresa tem hesitado em expandir o acesso ao público, possivelmente devido a preocupações com o uso indevido e ao escrutínio regulatório.

O Voice Engine já está sendo testado por um grupo limitado de desenvolvedores confiáveis e está sendo utilizado para aplicações como terapia da fala, aprendizado de idiomas e suporte ao cliente.

A ferramenta usa IA para gerar fala natural, adaptando-se a diferentes vozes, sotaques e estilos de fala. Inicialmente, a OpenAI planejava lançar o Voice Engine em março de 2024, mas o lançamento foi adiado sem uma explicação clara.

Leia mais:

Pessoa segurando celular com logomarca da OpenAI na tela na frente de monitor exibindo foto do CEO da empresa, Sam Altman
Temor de uso indevido tem impedido OpenAI de lançar a ferramenta que clona vozes usando IA (Imagem: Meir Chaimowitz/Shutterstock)

Em um comunicado enviado ao TechCrunch, empresa agora afirma estar aprendendo com o uso da tecnologia por seus parceiros antes de tomar decisões sobre um lançamento mais amplo.

Startup ainda calcula os riscos

  • O Voice Engine está em desenvolvimento desde 2022 e foi apresentado a formuladores de políticas no verão de 2023.
  • A OpenAI destaca o potencial da ferramenta para ajudar pessoas com deficiência, como a startup Livox, que a utiliza para criar vozes naturais em diferentes idiomas.
  • No entanto, a OpenAI também está ciente dos riscos de abuso, especialmente durante ciclos eleitorais e em fraudes, e implementou medidas de segurança, como marca d’água para rastrear o áudio gerado.

A empresa tem discutido a importância de obter consentimento explícito do falante original e de evitar a criação de vozes semelhantes a figuras públicas.

Embora a OpenAI tenha implementado algumas proteções, a empresa ainda está avaliando se lançará o serviço de forma ampla ou o manterá em uma escala menor.

Voz IA
Recurso de clonagem de voz pode ser útil e ajudar pessoas, mas também pode ser usado para fraudes e ações ilegais – Imagem: peterschreiber.media/Shutterstock
Leandro Costa Criscuolo
Colaboração para o Olhar Digital

Leandro Criscuolo é jornalista formado pela Faculdade Cásper Líbero. Já atuou como copywriter, analista de marketing digital e gestor de redes sociais. Atualmente, escreve para o Olhar Digital.

Bruno Capozzi é jornalista formado pela Faculdade Cásper Líbero e mestre em Ciências Sociais pela PUC-SP, tendo como foco a pesquisa de redes sociais e tecnologia.

Ícone tagsTags: