A Inteligência Artificial já pode se passar por você

Empresas oferecem serviços de criação de avatar real e clonagem de voz
Rodrigo Mozelli29/04/2023 01h21
Ilustração de inteligência artificial falando
Imagem: ArtemisDiana/Shutterstock
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Talvez você já tenha brincado com chatbots, como o ChatGPT e o Bard, ou geradores de imagens, como o Dall-E. Se você pensou que eles confundiam a linha entre IA e inteligência humana, você ainda não viu – ou ouviu – nada.

Ofertas

Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt
Vendido por Amazon
Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt
De: R$ 67,44
Por: R$ 59,95
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
De: R$ 4.699,00
Por: R$ 3.099,00
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
Vendido por Amazon
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
De: R$ 3.499,00
Por: R$ 3.324,00
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
Vendido por Amazon
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
De: R$ 1.049,00
Por: R$ 799,00
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
Vendido por Amazon
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
De: R$ 299,00
Por: R$ 241,44
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
De: R$ 499,90
Por: R$ 349,90
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
Vendido por Amazon
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
De: R$ 2.399,00
Por: R$ 2.159,00
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 188,99
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
Vendido por Amazon
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
De: R$ 88,00
Por: R$ 45,00
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
Vendido por Amazon
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
De: R$ 399,00
Por: R$ 379,00
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
Vendido por Amazon
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
De: R$ 1.629,90
Por: R$ 1.239,90
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
Vendido por Amazon
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
De: R$ 1.179,00
Por: R$ 943,20
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
Vendido por Amazon
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
De: R$ 999,00
Por: R$ 798,99
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
Vendido por Amazon
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
De: R$ 329,90
Por: R$ 205,91
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
De: R$ 599,90
Por: R$ 476,10
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
Vendido por Amazon
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
De: R$ 1.199,00
Por: R$ 1.139,05
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
Vendido por Amazon
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
De: R$ 1.199,00
Por: R$ 949,00
Cis Cola Em Bastão Fix 34 Gramas, Blister
Vendido por Amazon
Cis Cola Em Bastão Fix 34 Gramas, Blister
De: R$ 9,60
Por: R$ 7,60
Estojo Escolar Organizador Box Grande Para Lapis Feminino Masculino Material Escolar (Azul)
Vendido por Amazon
Estojo Escolar Organizador Box Grande Para Lapis Feminino Masculino Material Escolar (Azul)
Por R$ 38,70
Compasso Escolar 106-S, CIS, 18.7700, Estojo c/1 sortido (Não é possível escolher cor)
Vendido por Amazon
Compasso Escolar 106-S, CIS, 18.7700, Estojo c/1 sortido (Não é possível escolher cor)
De: R$ 31,40
Por: R$ 21,77
Ecolapis Cor Pastel F.Castell 10 Cores, Faber-Castell, 120510P, Multicor, pacote de 10
Vendido por Amazon
Ecolapis Cor Pastel F.Castell 10 Cores, Faber-Castell, 120510P, Multicor, pacote de 10
De: R$ 21,00
Por: R$ 16,63
Tilibra - Estojo Box Académie Cinza
Vendido por Amazon
Tilibra - Estojo Box Académie Cinza
De: R$ 106,90
Por: R$ 59,95
Estojo Escolar Box Grande Organizador com Divisórias e Alça - Estojo Necessaire Unissex Capacidade Ampla para Lápis, Canetas, Material Escolar (Preto)
Vendido por Amazon
Estojo Escolar Box Grande Organizador com Divisórias e Alça - Estojo Necessaire Unissex Capacidade Ampla para Lápis, Canetas, Material Escolar (Preto)
Por R$ 34,90
Chamequinho Papel A4, 75 g, 100 Folhas, Verde Sulfite
Vendido por Amazon
Chamequinho Papel A4, 75 g, 100 Folhas, Verde Sulfite
De: R$ 9,90
Por: R$ 7,20
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
Vendido por Amazon
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
De: R$ 169,90
Por: R$ 139,90
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
De: R$ 149,90
Por: R$ 119,90
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
Vendido por Amazon
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
De: R$ 699,00
Por: R$ 398,99
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
Vendido por Amazon
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
De: R$ 109,90
Por: R$ 79,90
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
Vendido por Amazon
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
De: R$ 299,90
Por: R$ 199,90

Nos últimos meses, a colunista do The Wall Street Journal, Joanna Stern, vem testando o Synthesia, ferramenta que cria avatares artificialmente inteligentes a partir de vídeo e áudio gravados (também conhecidos como deepfakes). Digite qualquer coisa e seu avatar de vídeo repete.

Leia mais:

Stern faz muito trabalho de voz e vídeo, então, pensou que IA poderia torná-la mais produtiva e eliminar um pouco do trabalho árduo, promessa da IA. Ela gravou cerca de 30 minutos de vídeo e quase duas horas de áudio que a Synthesia usaria para treinar o clone. Algumas semanas depois, IA Joanna estava pronta.

Ela se questionou se poderia a IA – emparelhada com o texto gerado pelo ChatGPT – substituir seu eu real em vídeos, reuniões e telefonemas. Eventualmente, a IA Joanna pode escrever colunas e hospedar seus vídeos. Por enquanto, ela está no seu melhor ilustrando a faca de dois gumes das ferramentas de voz e vídeo de IA generativa.

O vídeo dá muito trabalho e custo. Cabelo, maquiagem, guarda-roupa, câmeras, iluminação, microfones. A Synthesia promete erradicar esse trabalho, e é por isso que as corporações já o utilizam.

Por que pagar atores para estrelar uma versão live-action quando a IA pode fazer tudo? A Synthesia cobra US$ 1 mil por ano para criar e manter um avatar personalizado, além de uma taxa de assinatura mensal adicional. Oferece avatares de ações por um custo mensal menor.

Stern pediu ao ChatGPT para gerar um script do TikTok sobre uma dica do iOS, escrito na voz de Joanna Stern. Colou no Synthesia, clicou em “gerar” e de repente “ela” estava falando, mas sem gestos das mãos e expressões faciais. Para frases rápidas, o avatar pode ser bastante convincente. Quanto mais longo o texto, mais sua natureza bot aparece.

@wallstreetjournal

Joanna Stern, personal technology columnist, dives into an obscure iPhone feature—Back Tap gestures. Be sure to watch until the end 🤫 📷: Bloomberg #joannastern #iphone #iphonetips #tech #ai #chatgpt #wsj #wallstreetjournal #thewallstreetjournal #ForYouPizza

♬ Neon Bass – Tangelene Bolton

No TikTok, esses atributos de computador são menos perceptíveis. Ainda assim, alguns rapidamente perceberam isso.

O bot ficou muito óbvio nas videochamadas de trabalho. Stern baixou clipes dela dizendo comentários comuns em reuniões (“Olá pessoal!” “Desculpe, fui silenciado.”) Depois, usou software para colocá-los no Google Meet. Aparentemente, a postura perfeita e a falta de humor da IA Joanna eram revelações claras.

Tudo isso vai melhorar, no entanto. A Synthesia tem alguns avatares em beta que podem acenar para cima e para baixo, levantar as sobrancelhas e muito mais.

Em chamadas telefônicas, a colunista usou voz gerada pelo ElevenLabs, desenvolvedor de software de fala de IA. Foram reunidos cerca de 90 minutos de sua voz de vídeos anteriores e carregados na ferramenta – sem necessidade de visita ao estúdio. Em menos de dois minutos, ele clonou a voz da moça. Na ferramenta baseada na web do ElevenLabs, digite qualquer texto, clique em Gerar e, em segundos, “sua” voz diz em voz alta. A criação de um clone de voz com o ElevenLabs começa em US$ 5 por mês.

Comparado com a Joanna da Synthesia, o ElevenLabs soa mais humano, com melhores entonações e fluxo.

Em ligação para sua irmã, para quem liga várias vezes por semana, sua irmã disse que o bot soava como Stern, mas notou que o bot não parava para respirar. Quando ligou para seu pai e pediu seu número do Seguro Social, ele só sabia que algo estava acontecendo porque parecia uma gravação.

A voz do ElevenLabs era tão boa que enganou o sistema biométrico de voz de seu cartão de crédito.

A IA Joanna respondeu várias coisas que o sistema iria perguntar, então ligou para o atendimento ao cliente. Na etapa biométrica, quando o sistema automatizado pedia seu nome e endereço, a IA Joanna respondeu. Ao ouvir a voz do bot, o sistema o reconheceu como sendo ela e imediatamente se conectou a um representante. Quando o estagiário de vídeo do jornal ligou e fez sua melhor impressão de Joanna, o sistema automatizado solicitou verificação adicional.

Uma porta-voz do fornecedor do cartão disse que o banco usa biometria de voz, juntamente com outras ferramentas, para verificar se os chamadores são quem dizem ser.

Ela acrescentou que o recurso destina-se a que os clientes se identifiquem com rapidez e segurança, mas para concluir transações e outras solicitações financeiras, os clientes devem fornecer informações adicionais.

O mais preocupante é que a ElevenLabs fez um clone muito bom sem muita coisa. Tudo o que precisa fazer é clicar em um botão dizendo ter os “direitos ou consentimentos necessários” para fazer upload de arquivos de áudio e criar o clone, e que não o usaria para fins fraudulentos.

Isso significa que qualquer pessoa na internet pode levar horas da voz de qualquer pessoa no planeta para salvar e usar. A FTC (Federal Trade Commission) já está alertando sobre golpes relacionados à voz de IA.

No caso da Synthesia, a empresa exige que o áudio e o vídeo incluam consentimento verbal.

O ElevenLabs permite apenas a clonagem em contas pagas, portanto, qualquer uso de voz clonada que viole as políticas da empresa pode ser rastreado até o titular da conta, disse o cofundador da empresa, Mati Staniszewski.

A companhia está trabalhando em ferramenta de autenticação para que as pessoas possam enviar qualquer áudio para verificar se ele foi criado com a tecnologia ElevenLabs.

Ambos os sistemas permitiram à colunista gerar algumas coisas horríveis com sua voz, incluindo ameaças de morte.

Um porta-voz da Synthesia disse que a conta de Stern foi designada para uso com uma organização de notícias, o que significa que ela pode dizer palavras e frases que, de outra forma, poderiam ser filtradas.

A empresa afirmou que seus moderadores sinalizaram e deletaram suas frases problemáticas posteriormente. Quando sua conta foi alterada para o tipo padrão, não conseguiu mais gerar essas mesmas frases.

Staniszewski disse que a ElevenLabs pode identificar todo o conteúdo feito com seu software. Se o conteúdo violar os termos de serviço da empresa, acrescentou, a ElevenLabs pode banir sua conta de origem e, em caso de violação da lei, auxiliar as autoridades.

Hany Farid, especialista forense digital da Universidade da Califórnia, em Berkeley, afirmou ser muito difícil detectar áudio e vídeo sintéticos. “Não só posso gerar essas coisas, como posso bombardear a internet com elas”, afirmou, acrescentando que você não pode transformar todos em detetives de IA.

“Não só posso gerar essas coisas, como posso bombardear a Internet com elas”, disse ele, acrescentando que você não pode transformar todos em detetives de IA.

Contudo, existe uma iniciativa de autenticidade de conteúdo liderada pela Adobe. Mais de mil empresas de mídia e tecnologia, acadêmicos e mais visam criar “rótulo nutricional” incorporado para a mídia. Fotos, vídeos e áudio na internet podem um dia vir com informações verificáveis anexadas. A Synthesia é membro da iniciativa.

Via The Wall Street Journal

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.