Dubladores processam empresa por clonarem suas vozes com IA

Dupla descobriu ocorrido em 2022, ao ver vídeo no YouTube que tratava da invasão à Ucrânia com narração realizada por voz similar a de um deles
Rodrigo Mozelli16/05/2024 20h35
Ilustração de inteligência artificial falando
Imagem: ArtemisDiana/Shutterstock
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Os dubladores Paul Skye Lehrman e Linnea Sage estão processando a Lovo, empresa que teria recriado as vozes de ambos de forma ilegal usando inteligência artificial (IA).

Ofertas

Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
Vendido por Amazon
Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
De: R$ 1.156,80
Por: R$ 727,20
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
Vendido por Amazon
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
De: R$ 30,90
Por: R$ 27,81
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
Vendido por Amazon
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
De: R$ 79,99
Por: R$ 50,10
Tilibra - Estojo Triplo Grande Académie Azul
Vendido por Amazon
Tilibra - Estojo Triplo Grande Académie Azul
De: R$ 110,90
Por: R$ 67,95
Giz Pastel Oleoso Pentel Arts 12 Cores
Vendido por Amazon
Giz Pastel Oleoso Pentel Arts 12 Cores
De: R$ 17,90
Por: R$ 10,90
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
Vendido por Amazon
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
De: R$ 2.699,00
Por: R$ 2.069,90
Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045
Vendido por Amazon
Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045
De: R$ 89,90
Por: R$ 56,60
Adaptador Wireless TP-Link Archer T2U Nano USB
Vendido por Amazon
Adaptador Wireless TP-Link Archer T2U Nano USB
De: R$ 109,90
Por: R$ 75,85
SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202
Vendido por Amazon
SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202
De: R$ 616,58
Por: R$ 334,32
Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios
Vendido por Amazon
Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios
De: R$ 33,90
Por: R$ 23,83
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Vendido por Amazon
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Por R$ 17.180,00
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
Vendido por Amazon
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
De: R$ 156,00
Por: R$ 140,00
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
Vendido por Amazon
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
De: R$ 199,99
Por: R$ 178,49
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Vendido por Amazon
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Por R$ 299,99
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
Vendido por Amazon
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
De: R$ 259,35
Por: R$ 198,99
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Vendido por Amazon
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Por R$ 2.399,00
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
Vendido por Amazon
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
De: R$ 5.299,00
Por: R$ 3.999,00
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
Vendido por Amazon
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
De: R$ 229,00
Por: R$ 160,65
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
Vendido por Amazon
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
De: R$ 289,90
Por: R$ 187,00
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Vendido por Amazon
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Por R$ 419,99
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
Vendido por Amazon
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
De: R$ 369,00
Por: R$ 209,90
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Vendido por Amazon
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
De: R$ 464,65
Por: R$ 330,00

A dupla descobriu o ocorrido em 2022, quando Lehrman encontrou um vídeo no YouTube que tratava da invasão à Ucrânia com narração realizada por voz similar à dele.

Leia mais:

“É minha voz falando sobre armamento no conflito russo-ucraniano”, disse o profissional. “Fico branco como um fantasma – e arrepios nos braços. Eu sabia que nunca tinha dito essas palavras nessa ordem.”

Eles se chocaram ainda mais enquanto escutavam o podcast “Deadline Strike Talk”, tempos depois, no qual o apresentador entrevistou um chatbot de nome Poe, cuja voz parecia muito com a de Lehrman.

“Ele estava entrevistando minha voz sobre os perigos da IA ​​e os danos que ela poderia causar à indústria do entretenimento. Paramos o carro e ficamos ali sentados, incrédulos, tentando descobrir o que aconteceu e o que deveríamos fazer.”, disse Lehrman ao The New York Times.

O problema é que a situação não para por aí. O casal descobriu também que a startup, localizada em Berkeley, Califórnia (EUA), também criou um clone de voz com IA de Sage.

E o número de artistas, editores, programadores e demais criadores que processam fabricantes de tecnologias de IA vem aumentando. Eles argumentam que as empresas usaram seus trabalhos sem permissão para criar ferramentas que podem, inclusive, substituí-los no mercado de trabalho.

Imagem: sdx15/Shutterstock

Processo do casal de dubladores contra empresa de IA

  • O processo foi aberto nesta quinta-feira (16) no tribunal federal de Manhattan (EUA);
  • Nele, o casal afirma que funcionários anônimos da Lovo pagaram para que eles realizassem algumas gravações de voz entre 2019 e 2020, mas não revelaram a razão;
  • Afirmam ainda que a empresa fundada em 2019 violou a lei federal de marcas registradas e diversas leis estaduais de privacidade ao promover os clones de IA de suas vozes;
  • Eles buscam alterar o caráter do processo para ação coletiva, com Lehrman e Sage convidando outros dubladores a se juntarem na ação;
  • O advogado do casal, Steve Cohen, informou que “não sabemos quantas outras pessoas foram afetadas”;
  • Já o advogado da Lovo, David Case, informou que a empresa nega as acusações, indicando ainda que, se todos os envolvidos que forneceram gravações de voz à startup deram seu consentimento, “então, não haveria problema”.

Em episódio de podcast realizado em 2023, Tom Lee, presidente-executivo da Lovo, afirmou que a empresa passou a oferecer programa de divisão de receitas que permite aos dubladores a ajudarem a empresa a criar clones de voz de IA de suas próprias vozes e receber parte do lucro gerado com esses clones.

Segundo Jeffrey Bennett, conselheiro-geral do SAG-AFTRA, sindicado de 160 mil profissionais da comunicação social no mundo todo, esse processo parece ser o primeiro do gênero.

“Este processo mostrará às pessoas – especialmente às empresas de tecnologia – que existem direitos na sua voz, que existe um grupo inteiro de pessoas que ganha a vida usando a voz”, disse.

Como foi a abordagem da Lovo ao casal de dubladores

Em 2019, Lehrman e Sage promoviam seu trabalho em site de profissionais freelancers, o Fiverr, onde conseguiram vários trabalhos de voz para comerciais, anúncios de rádio, vídeos, games e outros.

Foi no mesmo ano que Sage foi contatada por um anônimo, que pagou a ela US$ 400 (R$ 2.052, na conversão direta) para realizar a gravação de diversos roteiros de rádio. O anônimo explicou que as gravações não seriam utilizadas para fins públicos, segundo a ação.

“Estes são roteiros de teste para anúncios de rádio”, disse a pessoa anônima, segundo o processo movido pelo casal. “Eles não serão divulgados externamente e serão consumidos apenas internamente, portanto, não exigirão direitos de qualquer espécie.”

Sete meses depois, Lehrman foi contatado por outra pessoa anônima para realizar um trabalho similar. O também ator de TV e cinema questionou o contato não-identificado sobre como os clipes de voz seriam usados.

Por mais de uma vez, a pessoa teria dito que eles seriam utilizados apenas para fins acadêmicos e de pesquisa, segundo dados da ação. Como suas gravações foram maiores que as de Sage, Lehrman recebeu US$ 1,2 mil (R$ 6.156).

vOZ ia
Imagem: MMD Creative/ Shutterstock

Identificando os autores

Quando se depararam com o vídeo no YouTube, o casal buscou um advogado para descobrir quem tinha feito o vídeo e como a voz de Lehrman foi recriada, mas o dono do canal no YouTube parecia ser da Indonésia, impossibilitando encontrar a pessoa.

Já ao ouvirem o podcast, foi possível identificar a origem da voz de Lehrman clonada via IA: o chatbot foi montado por um professor do Instituto de Tecnologia de Massachusetts a partir de tecnologia de síntese de voz da Lovo.

Sage também encontrou um vídeo na internet no qual a Lovo apresenta sua tecnologia de voz a investidores em evento em Berkeley no início de 2020. Nele, uma voz gerada por IA idêntica à da moça foi apresentada, ao lado de foto de outra mulher.

“Eu estava no vídeo de apresentação deles para arrecadar dinheiro”, afirmou a profissional. Desde então, a startup arrecadou US$ 7 milhões (R$ 35,9 milhões) e tem carteira com mais de dois milhões de clientes em todo o planeta.

Lehrman e Sage também encontraram suas vozes clonadas em propaganda da tecnologia no site da empresa. Após o casal enviar à Lovo carta de cessação e desistência, a companhia informou ter removido as vozes clonadas de seu site.

Só que, para a dupla de dubladores, o software que acionava os clones de voz já fora baixado por inúmeros clientes da empresa, permitindo que suas vozes continuem a ser utilizadas.

Lehrman ainda questionou se a startup usou as vozes do casal com várias outras para construir a tecnologia central impulsionadora de seu sistema de clonagem de voz, já que os sintetizadores de voz costumam desenvolver habilidades a partir da análise de milhares de horas de palavras faladas.

No processo, consta que a Lovo reconheceu ter treinado seu produto com milhares de horas de gravações de milhares de vozes humanas. Case, advogado da Lovo, afirmou que isso foi realizado a partir de banco de dados de gravações em inglês gratuito, chamado Openslr.org.

Quando questionado se as vozes de Lehrman e Sage foram utilizadas para o mesmo fim, Case não respondeu.

“Esperamos recuperar o controle sobre nossas vozes, sobre quem somos, sobre nossas carreiras”, disse Lehrman. “Queremos representar outras pessoas a quem isso aconteceu e aquelas a quem isso acontecerá se nada mudar.”

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.