A Inteligência Artificial já pode se passar por você

Empresas oferecem serviços de criação de avatar real e clonagem de voz
Rodrigo Mozelli29/04/2023 01h21
Ilustração de inteligência artificial falando
Imagem: ArtemisDiana/Shutterstock
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Talvez você já tenha brincado com chatbots, como o ChatGPT e o Bard, ou geradores de imagens, como o Dall-E. Se você pensou que eles confundiam a linha entre IA e inteligência humana, você ainda não viu – ou ouviu – nada.

Ofertas

Battle Royale: Hunger Games Online in Blockman Go Style
Vendido por Amazon
Battle Royale: Hunger Games Online in Blockman Go Style
Por R$ 5,29
Fone de Ouvido Headphone P47 Sem Fio Bluetooth Wireless Micro Sd 5.0 Dobrável Com Microfone Regulável Para Corrida Academia Escritório Caminhada Linha Premium (Preto)
Vendido por Amazon
Fone de Ouvido Headphone P47 Sem Fio Bluetooth Wireless Micro Sd 5.0 Dobrável Com Microfone Regulável Para Corrida Academia Escritório Caminhada Linha Premium (Preto)
De: R$ 39,90
Por: R$ 19,90
Smart TV Multi Roku 32" HD 3 HDMI 2 USB Compatível com Alexa e Google Home - TL052M
Vendido por Amazon
Smart TV Multi Roku 32" HD 3 HDMI 2 USB Compatível com Alexa e Google Home - TL052M
De: R$ 1.149,00
Por: R$ 819,00
Carregador Super Turbo 50W Ultra Rápido Tipo C e USB Com Carregamento Rápido + Cabo Tipo C Compatível Com Todos Os Dispositivos, Android, Ios 15/16, Xiaomi - Todos Dispositivos Celulares
Vendido por Amazon
Carregador Super Turbo 50W Ultra Rápido Tipo C e USB Com Carregamento Rápido + Cabo Tipo C Compatível Com Todos Os Dispositivos, Android, Ios 15/16, Xiaomi - Todos Dispositivos Celulares
De: R$ 32,90
Por: R$ 22,90
Placa de Video MSI RTX 5060 Shadow 2X OC, 8GB, GDDR7-912-V537-037
Vendido por Amazon
Placa de Video MSI RTX 5060 Shadow 2X OC, 8GB, GDDR7-912-V537-037
De: R$ 2.920,14
Por: R$ 2.240,00
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
Vendido por Amazon
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
De: R$ 2.499,00
Por: R$ 1.998,89
Freezer Vertical Consul 231 Litros - CVU26FB 110V
Vendido por Amazon
Freezer Vertical Consul 231 Litros - CVU26FB 110V
De: R$ 3.279,35
Por: R$ 2.498,89
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
Vendido por Amazon
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
De: R$ 599,90
Por: R$ 404,90
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
Vendido por Amazon
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
De: R$ 189,90
Por: R$ 129,90
Climatizador de Ar Digital Midea 127V 60Hz
Vendido por Amazon
Climatizador de Ar Digital Midea 127V 60Hz
De: R$ 529,99
Por: R$ 412,69
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
Vendido por Amazon
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
De: R$ 799,00
Por: R$ 593,00
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
Vendido por Amazon
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
De: R$ 3.799,00
Por: R$ 3.598,94
Anker MagGo Power Bank, Bateria Magnética Ultra Fina de 10.000mAh, Certificação Qi2, Portátil, Carregador MagSafe Compatível de 15W Ultra Rápido, Compatível com iPhone 17/16/15, Samsung,Xiaomi e Mais
Vendido por Amazon
Anker MagGo Power Bank, Bateria Magnética Ultra Fina de 10.000mAh, Certificação Qi2, Portátil, Carregador MagSafe Compatível de 15W Ultra Rápido, Compatível com iPhone 17/16/15, Samsung,Xiaomi e Mais
De: R$ 649,00
Por: R$ 469,00
Notebook Acer Nitro V15 ANV15-41-R4Q9 R77735HS AMD Ryzen 7 32GB 512GB SSD NVIDIA RTX 4050 15.6” FHD LED IPS 165Hz AGPOS
Vendido por Amazon
Notebook Acer Nitro V15 ANV15-41-R4Q9 R77735HS AMD Ryzen 7 32GB 512GB SSD NVIDIA RTX 4050 15.6” FHD LED IPS 165Hz AGPOS
De: R$ 7.799,00
Por: R$ 5.610,00
Pentel Tinta Aquarela Wfrs Arts à Base de Água 24 Cores WFRS-24
Vendido por Amazon
Pentel Tinta Aquarela Wfrs Arts à Base de Água 24 Cores WFRS-24
De: R$ 94,90
Por: R$ 88,50
Luminária de Mesa LED Bola de Cristal 3D Space Brilhante (Via Láctea)
Vendido por Amazon
Luminária de Mesa LED Bola de Cristal 3D Space Brilhante (Via Láctea)
De: R$ 79,00
Por: R$ 19,99
Tablet Infantil Princesas com Controle Parental 4GB RAM + 64GB + Tela 7 pol + Case + Wi-fi + Android 13 + Quad Core Multi - NB418
Vendido por Amazon
Tablet Infantil Princesas com Controle Parental 4GB RAM + 64GB + Tela 7 pol + Case + Wi-fi + Android 13 + Quad Core Multi - NB418
De: R$ 559,99
Por: R$ 449,00
Kit Câmera Instax Mini 12 com pack 10 fotos Mermaid Tail e Bolsa Lilás
Vendido por Amazon
Kit Câmera Instax Mini 12 com pack 10 fotos Mermaid Tail e Bolsa Lilás
De: R$ 749,00
Por: R$ 597,00
Visions of Mana - PlayStation 5
Vendido por Amazon
Visions of Mana - PlayStation 5
De: R$ 299,90
Por: R$ 209,90
Cabo USB-C Turbo 2 Metros Tipo C 60W Nylon Trançado e Reforçado Compativel Com Iphone 15, Iphone 16 Notebook Tablet Qualidade Premium Carregamento Transferência de Dados Compativel ANDROID
Vendido por Amazon
Cabo USB-C Turbo 2 Metros Tipo C 60W Nylon Trançado e Reforçado Compativel Com Iphone 15, Iphone 16 Notebook Tablet Qualidade Premium Carregamento Transferência de Dados Compativel ANDROID
Por R$ 23,88
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
Vendido por Amazon
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
De: R$ 699,00
Por: R$ 499,00
Soundbar Samsung HW-B400F, com 2.0 canais, Bluetooth, Subwoofer integrado e HDMI ARC
Vendido por Amazon
Soundbar Samsung HW-B400F, com 2.0 canais, Bluetooth, Subwoofer integrado e HDMI ARC
De: R$ 849,00
Por: R$ 720,00
Tablet Lenovo Tab K11 Octa-Core 4GB 128GB Wi-Fi Android 13 11" WUXGA com caneta e capa protetora ZADC0075BR
Vendido por Amazon
Tablet Lenovo Tab K11 Octa-Core 4GB 128GB Wi-Fi Android 13 11" WUXGA com caneta e capa protetora ZADC0075BR
De: R$ 1.559,00
Por: R$ 1.481,05
Samsung Galaxy Buds3, Fone de Ouvido sem fio, Cancelamento ativo de Ruído, Galaxy AI - Branco
Vendido por Amazon
Samsung Galaxy Buds3, Fone de Ouvido sem fio, Cancelamento ativo de Ruído, Galaxy AI - Branco
De: R$ 1.699,00
Por: R$ 999,00
Controles Nintendo Joy-Con™ Azul Neon e Vermelho Neon
Vendido por Amazon
Controles Nintendo Joy-Con™ Azul Neon e Vermelho Neon
De: R$ 499,00
Por: R$ 419,00
Philco, PAC12000F5, Ar-Condicionado Portátil Frio Vírus Protect, 220V, Branco
Vendido por Amazon
Philco, PAC12000F5, Ar-Condicionado Portátil Frio Vírus Protect, 220V, Branco
De: R$ 3.300,00
Por: R$ 2.315,00
PlayStation DualSense Controle sem fio – Branco
Vendido por Amazon
PlayStation DualSense Controle sem fio – Branco
De: R$ 499,90
Por: R$ 379,00
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
Vendido por Amazon
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
De: R$ 2.489,00
Por: R$ 1.616,02
Câmera de vídeo digital 8K 64MP,Transmissão WiFi, Zoom de 18X,Tela sensível ao toque de 3,0 polegadas, microfone externo, controle remoto, duas baterias, visão noturna infravermelha,64 GB
Vendido por Amazon
Câmera de vídeo digital 8K 64MP,Transmissão WiFi, Zoom de 18X,Tela sensível ao toque de 3,0 polegadas, microfone externo, controle remoto, duas baterias, visão noturna infravermelha,64 GB
De: R$ 1.099,00
Por: R$ 788,40
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
Vendido por Amazon
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
De: R$ 259,90
Por: R$ 179,90
PHILIPS, Boombeat, Caixa de Som Bluetooth Boombox, TAX400B/00, USB, Auxiliar, TWS, USB Powerbank, Entrada para Microfone, Resistente a Água e Poeira, com Alça para Transporte
Vendido por Amazon
PHILIPS, Boombeat, Caixa de Som Bluetooth Boombox, TAX400B/00, USB, Auxiliar, TWS, USB Powerbank, Entrada para Microfone, Resistente a Água e Poeira, com Alça para Transporte
De: R$ 1.799,00
Por: R$ 1.200,00
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
Vendido por Amazon
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
De: R$ 5.299,00
Por: R$ 3.999,00
Reprodutor remoto PlayStation Portal™ – Midnight Black
Vendido por Amazon
Reprodutor remoto PlayStation Portal™ – Midnight Black
De: R$ 1.499,90
Por: R$ 1.319,00
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
Vendido por Amazon
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
De: R$ 3.599,00
Por: R$ 2.759,00
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
Vendido por Amazon
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
De: R$ 299,90
Por: R$ 199,00
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
Vendido por Amazon
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
De: R$ 899,90
Por: R$ 399,00
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
Vendido por Amazon
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
De: R$ 229,90
Por: R$ 132,00
Smartphone Motorola Edge 60 5G - 512GB 24GB (12GB RAM+12GB Ram Boost) Tela Quad-Curve moto AI 50MP Sony Camera ultrarresistencia militar IP68 + IP69 - Azul Marinho
Vendido por Amazon
Smartphone Motorola Edge 60 5G - 512GB 24GB (12GB RAM+12GB Ram Boost) Tela Quad-Curve moto AI 50MP Sony Camera ultrarresistencia militar IP68 + IP69 - Azul Marinho
De: R$ 2.789,00
Por: R$ 1.999,00
CAMERA INSTAX MINI 12 ROSA GLOSS
Vendido por Amazon
CAMERA INSTAX MINI 12 ROSA GLOSS
De: R$ 649,00
Por: R$ 473,00

Nos últimos meses, a colunista do The Wall Street Journal, Joanna Stern, vem testando o Synthesia, ferramenta que cria avatares artificialmente inteligentes a partir de vídeo e áudio gravados (também conhecidos como deepfakes). Digite qualquer coisa e seu avatar de vídeo repete.

Leia mais:

Stern faz muito trabalho de voz e vídeo, então, pensou que IA poderia torná-la mais produtiva e eliminar um pouco do trabalho árduo, promessa da IA. Ela gravou cerca de 30 minutos de vídeo e quase duas horas de áudio que a Synthesia usaria para treinar o clone. Algumas semanas depois, IA Joanna estava pronta.

Ela se questionou se poderia a IA – emparelhada com o texto gerado pelo ChatGPT – substituir seu eu real em vídeos, reuniões e telefonemas. Eventualmente, a IA Joanna pode escrever colunas e hospedar seus vídeos. Por enquanto, ela está no seu melhor ilustrando a faca de dois gumes das ferramentas de voz e vídeo de IA generativa.

O vídeo dá muito trabalho e custo. Cabelo, maquiagem, guarda-roupa, câmeras, iluminação, microfones. A Synthesia promete erradicar esse trabalho, e é por isso que as corporações já o utilizam.

Por que pagar atores para estrelar uma versão live-action quando a IA pode fazer tudo? A Synthesia cobra US$ 1 mil por ano para criar e manter um avatar personalizado, além de uma taxa de assinatura mensal adicional. Oferece avatares de ações por um custo mensal menor.

Stern pediu ao ChatGPT para gerar um script do TikTok sobre uma dica do iOS, escrito na voz de Joanna Stern. Colou no Synthesia, clicou em “gerar” e de repente “ela” estava falando, mas sem gestos das mãos e expressões faciais. Para frases rápidas, o avatar pode ser bastante convincente. Quanto mais longo o texto, mais sua natureza bot aparece.

@wallstreetjournal

Joanna Stern, personal technology columnist, dives into an obscure iPhone feature—Back Tap gestures. Be sure to watch until the end 🤫 📷: Bloomberg #joannastern #iphone #iphonetips #tech #ai #chatgpt #wsj #wallstreetjournal #thewallstreetjournal #ForYouPizza

♬ Neon Bass – Tangelene Bolton

No TikTok, esses atributos de computador são menos perceptíveis. Ainda assim, alguns rapidamente perceberam isso.

O bot ficou muito óbvio nas videochamadas de trabalho. Stern baixou clipes dela dizendo comentários comuns em reuniões (“Olá pessoal!” “Desculpe, fui silenciado.”) Depois, usou software para colocá-los no Google Meet. Aparentemente, a postura perfeita e a falta de humor da IA Joanna eram revelações claras.

Tudo isso vai melhorar, no entanto. A Synthesia tem alguns avatares em beta que podem acenar para cima e para baixo, levantar as sobrancelhas e muito mais.

Em chamadas telefônicas, a colunista usou voz gerada pelo ElevenLabs, desenvolvedor de software de fala de IA. Foram reunidos cerca de 90 minutos de sua voz de vídeos anteriores e carregados na ferramenta – sem necessidade de visita ao estúdio. Em menos de dois minutos, ele clonou a voz da moça. Na ferramenta baseada na web do ElevenLabs, digite qualquer texto, clique em Gerar e, em segundos, “sua” voz diz em voz alta. A criação de um clone de voz com o ElevenLabs começa em US$ 5 por mês.

Comparado com a Joanna da Synthesia, o ElevenLabs soa mais humano, com melhores entonações e fluxo.

Em ligação para sua irmã, para quem liga várias vezes por semana, sua irmã disse que o bot soava como Stern, mas notou que o bot não parava para respirar. Quando ligou para seu pai e pediu seu número do Seguro Social, ele só sabia que algo estava acontecendo porque parecia uma gravação.

A voz do ElevenLabs era tão boa que enganou o sistema biométrico de voz de seu cartão de crédito.

A IA Joanna respondeu várias coisas que o sistema iria perguntar, então ligou para o atendimento ao cliente. Na etapa biométrica, quando o sistema automatizado pedia seu nome e endereço, a IA Joanna respondeu. Ao ouvir a voz do bot, o sistema o reconheceu como sendo ela e imediatamente se conectou a um representante. Quando o estagiário de vídeo do jornal ligou e fez sua melhor impressão de Joanna, o sistema automatizado solicitou verificação adicional.

Uma porta-voz do fornecedor do cartão disse que o banco usa biometria de voz, juntamente com outras ferramentas, para verificar se os chamadores são quem dizem ser.

Ela acrescentou que o recurso destina-se a que os clientes se identifiquem com rapidez e segurança, mas para concluir transações e outras solicitações financeiras, os clientes devem fornecer informações adicionais.

O mais preocupante é que a ElevenLabs fez um clone muito bom sem muita coisa. Tudo o que precisa fazer é clicar em um botão dizendo ter os “direitos ou consentimentos necessários” para fazer upload de arquivos de áudio e criar o clone, e que não o usaria para fins fraudulentos.

Isso significa que qualquer pessoa na internet pode levar horas da voz de qualquer pessoa no planeta para salvar e usar. A FTC (Federal Trade Commission) já está alertando sobre golpes relacionados à voz de IA.

No caso da Synthesia, a empresa exige que o áudio e o vídeo incluam consentimento verbal.

O ElevenLabs permite apenas a clonagem em contas pagas, portanto, qualquer uso de voz clonada que viole as políticas da empresa pode ser rastreado até o titular da conta, disse o cofundador da empresa, Mati Staniszewski.

A companhia está trabalhando em ferramenta de autenticação para que as pessoas possam enviar qualquer áudio para verificar se ele foi criado com a tecnologia ElevenLabs.

Ambos os sistemas permitiram à colunista gerar algumas coisas horríveis com sua voz, incluindo ameaças de morte.

Um porta-voz da Synthesia disse que a conta de Stern foi designada para uso com uma organização de notícias, o que significa que ela pode dizer palavras e frases que, de outra forma, poderiam ser filtradas.

A empresa afirmou que seus moderadores sinalizaram e deletaram suas frases problemáticas posteriormente. Quando sua conta foi alterada para o tipo padrão, não conseguiu mais gerar essas mesmas frases.

Staniszewski disse que a ElevenLabs pode identificar todo o conteúdo feito com seu software. Se o conteúdo violar os termos de serviço da empresa, acrescentou, a ElevenLabs pode banir sua conta de origem e, em caso de violação da lei, auxiliar as autoridades.

Hany Farid, especialista forense digital da Universidade da Califórnia, em Berkeley, afirmou ser muito difícil detectar áudio e vídeo sintéticos. “Não só posso gerar essas coisas, como posso bombardear a internet com elas”, afirmou, acrescentando que você não pode transformar todos em detetives de IA.

“Não só posso gerar essas coisas, como posso bombardear a Internet com elas”, disse ele, acrescentando que você não pode transformar todos em detetives de IA.

Contudo, existe uma iniciativa de autenticidade de conteúdo liderada pela Adobe. Mais de mil empresas de mídia e tecnologia, acadêmicos e mais visam criar “rótulo nutricional” incorporado para a mídia. Fotos, vídeos e áudio na internet podem um dia vir com informações verificáveis anexadas. A Synthesia é membro da iniciativa.

Via The Wall Street Journal

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.