Saiba mais sobre a Midjouney, que tem causado furor com suas fotos geradas por IA

Imagens geradas na ferramenta têm causado muita confusão online
Rodrigo Mozelli31/03/2023 00h16, atualizada em 19/04/2023 19h05
shutterstock_2261936639
Imagem: salarko/Shutterstock
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

O gerador de imagens por IA, Midjourney, rapidamente se tornou uma das ferramentas mais atraentes da Internet, criando visuais falsos de aparência realista do ex-presidente Donald Trump sendo preso e do Papa Francisco vestindo um casaco estiloso visando “expandir os poderes imaginativos da espécie humana”.

Ofertas

Pasta Sanfonada DAC A4 Com 12 Divisões All Black Preto
Vendido por Amazon
Pasta Sanfonada DAC A4 Com 12 Divisões All Black Preto
De: R$ 27,90
Por: R$ 22,59
Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt
Vendido por Amazon
Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt
De: R$ 67,44
Por: R$ 59,95
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
De: R$ 4.699,00
Por: R$ 3.099,00
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
Vendido por Amazon
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
De: R$ 3.499,00
Por: R$ 3.324,00
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
Vendido por Amazon
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
De: R$ 1.049,00
Por: R$ 799,00
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
Vendido por Amazon
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
De: R$ 299,00
Por: R$ 241,44
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
De: R$ 499,90
Por: R$ 349,90
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
Vendido por Amazon
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
De: R$ 2.399,00
Por: R$ 2.159,00
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 188,99
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
Vendido por Amazon
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
De: R$ 88,00
Por: R$ 45,00
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
Vendido por Amazon
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
De: R$ 399,00
Por: R$ 379,00
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
Vendido por Amazon
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
De: R$ 1.629,90
Por: R$ 1.239,90
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
Vendido por Amazon
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
De: R$ 1.179,00
Por: R$ 943,20
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
Vendido por Amazon
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
De: R$ 999,00
Por: R$ 798,99
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
Vendido por Amazon
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
De: R$ 329,90
Por: R$ 205,91
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
De: R$ 599,90
Por: R$ 476,10
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
Vendido por Amazon
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
De: R$ 1.199,00
Por: R$ 1.139,05
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
Vendido por Amazon
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
De: R$ 1.199,00
Por: R$ 949,00
Cis Cola Em Bastão Fix 34 Gramas, Blister
Vendido por Amazon
Cis Cola Em Bastão Fix 34 Gramas, Blister
De: R$ 9,60
Por: R$ 7,60
Estojo Escolar Organizador Box Grande Para Lapis Feminino Masculino Material Escolar (Azul)
Vendido por Amazon
Estojo Escolar Organizador Box Grande Para Lapis Feminino Masculino Material Escolar (Azul)
Por R$ 38,70
Compasso Escolar 106-S, CIS, 18.7700, Estojo c/1 sortido (Não é possível escolher cor)
Vendido por Amazon
Compasso Escolar 106-S, CIS, 18.7700, Estojo c/1 sortido (Não é possível escolher cor)
De: R$ 31,40
Por: R$ 21,77
Ecolapis Cor Pastel F.Castell 10 Cores, Faber-Castell, 120510P, Multicor, pacote de 10
Vendido por Amazon
Ecolapis Cor Pastel F.Castell 10 Cores, Faber-Castell, 120510P, Multicor, pacote de 10
De: R$ 21,00
Por: R$ 16,63
Tilibra - Estojo Box Académie Cinza
Vendido por Amazon
Tilibra - Estojo Box Académie Cinza
De: R$ 106,90
Por: R$ 59,95
Estojo Escolar Box Grande Organizador com Divisórias e Alça - Estojo Necessaire Unissex Capacidade Ampla para Lápis, Canetas, Material Escolar (Preto)
Vendido por Amazon
Estojo Escolar Box Grande Organizador com Divisórias e Alça - Estojo Necessaire Unissex Capacidade Ampla para Lápis, Canetas, Material Escolar (Preto)
Por R$ 34,90
Chamequinho Papel A4, 75 g, 100 Folhas, Verde Sulfite
Vendido por Amazon
Chamequinho Papel A4, 75 g, 100 Folhas, Verde Sulfite
De: R$ 9,90
Por: R$ 7,20
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
Vendido por Amazon
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
De: R$ 169,90
Por: R$ 139,90
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
De: R$ 149,90
Por: R$ 119,90
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
Vendido por Amazon
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
De: R$ 699,00
Por: R$ 398,99
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
Vendido por Amazon
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
De: R$ 109,90
Por: R$ 79,90
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
Vendido por Amazon
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
De: R$ 299,90
Por: R$ 199,90

Mas a empresa de um ano de vida, administrada em São Francisco com apenas uma pequena coleção de consultores e engenheiros, também tem autoridade ilimitada para determinar como esses poderes são usados.

Leia mais:

Ele permite, por exemplo, que os usuários gerem imagens do presidente Biden, Vladimir Putin, da Rússia, e outros líderes mundiais – mas não do presidente da China, Xi Jinping.

“Só queremos minimizar o drama”, disse o fundador e CEO da empresa, David Holz, no ano passado em post no serviço de bate-papo Discord. “A sátira política na China não é legal”, acrescentou, e “a capacidade das pessoas na China de usar essa tecnologia é mais importante do que sua capacidade de gerar sátira”.

A inconsistência mostra como um poderoso líder inicial em arte de IA e mídia sintética está criando regras para seu produto em tempo real. Sem padrões uniformes, empresas individuais estão decidindo o que é permitido – e, neste caso, quando se curvar a governos autoritários.

A abordagem da Midjourney ecoa o manual inicial das principais redes sociais, cujas regras de moderação negligentes as tornavam vulneráveis a interferência estrangeira, desinformação viral e discurso de ódio.

Mas pode representar riscos únicos, uma vez que algumas ferramentas de IA criam cenas fictícias envolvendo pessoas reais – cenário propício para assédio e propaganda.

“Houve queima lenta da IA por um bom tempo, e agora há incêndio”, disse Katerina Cizek, do MIT Open Documentary Lab, que estuda a interação humano-computador e a narrativa interativa, entre outros tópicos.

A Midjourney oferece exemplo especialmente revelador de como o desenvolvimento da inteligência artificial ultrapassou a evolução das regras para seu uso. Em um ano, o serviço conquistou mais de 13 milhões de membros e, graças às suas assinaturas mensais, fez da Midjourney um dos novos negócios mais promissores do setor de tecnologia.

Mas o site da Midjourney lista apenas um executivo, Holz, e quatro consultores; uma equipe de pesquisa e engenharia de oito pessoas; e uma equipe jurídica e financeira de duas pessoas.

Ele diz que tem cerca de três dúzias de “moderadores e guias”. Seu site diz que a empresa está contratando: “Venha nos ajudar a escalar, explorar e construir infraestrutura humanista focada em ampliar a mente e o espírito humanos.”

Muitas das falsificações do Midjourney, como imagens de paparazzi recentemente fabricadas do proprietário do Twitter, Elon Musk, com a deputada Alexandria Ocasio-Cortez, podem ser criadas por um artista habilidoso usando um software de edição de imagem como o Adobe Photoshop.

Mas as ferramentas de imagem de IA da empresa permitem que qualquer pessoa as crie instantaneamente – incluindo, por exemplo, uma imagem falsa do presidente John F. Kennedy apontando um rifle – simplesmente digitando um texto.

A Midjourney está entre várias empresas que estabeleceram domínio inicial no campo da arte da IA, de acordo com especialistas, que identificam seus principais pares como Stable Diffusion e DALL-E, desenvolvido pela OpenAI, criadora do modelo de linguagem AI ChatGPT. Todos foram lançados publicamente no ano passado.

Mas as ferramentas têm diretrizes completamente diferentes para o que é aceitável. As regras da OpenAI instruem os usuários do DALL-E a se aterem ao conteúdo “classificado para menores” e bloqueiam a criação de imagens envolvendo políticos, bem como “grandes conspirações ou eventos relacionados a grandes eventos geopolíticos em andamento”.

O Stable Diffusion, lançado com poucas restrições a imagens sexuais ou violentas, impôs algumas regras, mas permite que as pessoas baixem seu software de código aberto e o usem sem restrições.

Emad Mostaque, CEO da Stability AI, a start-up por trás da Stable Diffusion, disse ao The Verge no ano passado que “em última análise, é responsabilidade das pessoas saber se são éticas, morais e legais”.

As diretrizes da Midjourney ficam no meio, especificando que os usuários devem ter pelo menos 13 anos e afirmando que a empresa “tenta tornar seus serviços familiares”, enquanto avisa: “Esta é nova tecnologia e nem sempre funciona como esperado.”

As diretrizes proíbem conteúdo adulto e gore, bem como prompts de texto que são “inerentemente desrespeitosos, agressivos ou abusivos”. Eliot Higgins, fundador do canal investigativo de código aberto Bellingcat, disse que foi expulso da plataforma sem explicação na semana passada depois que uma série de imagens que ele fez no Midjourney fabricando a prisão de Trump em Nova York se tornou viral nas redes sociais.

Na terça-feira (28), a empresa interrompeu os testes gratuitos devido a “demanda extraordinária e abuso de teste”, escreveu Holz no Discord, sugerindo que usuários não pagantes estavam manipulando mal a tecnologia e dizendo que suas “novas seguranças para abuso não parecem ser suficiente.” As taxas de assinatura mensal variam de US$ 10 a US$ 60.

Imagem: Midjourney

E em sessão de “horário comercial” do Midjourney na quarta-feira (29), Holz disse a audiência ao vivo de cerca de duas mil pessoas no Discord que estava lutando para determinar as regras de conteúdo, especialmente para retratar pessoas reais, “à medida que as imagens se tornam cada vez mais realistas e as ferramentas ficam cada vez mais poderosas.”

“Existe argumento para ir totalmente para a Disney ou para o Velho Oeste, e tudo no meio é meio doloroso”, disse ele. “Estamos meio que no meio agora e não sei como me sentir sobre isso.”

A empresa, disse ele, estava trabalhando para refinar as ferramentas de moderação de IA que revisariam as imagens geradas por má conduta.

Holz não respondeu aos pedidos de comentários doThe Washington Post. Consultas enviadas a um endereço de imprensa da empresa também ficaram sem resposta.

Em entrevista ao Post em setembro passado, Holz disse que o Midjourney era um “laboratório muito pequeno” de “dez pessoas, sem investidores, apenas fazendo isso pela paixão, para criar mais beleza e expandir os poderes imaginativos do mundo”.

A Midjourney, ele disse na época, tinha 40 moderadores em diferentes países, alguns deles pagos, e que o número mudava constantemente. As equipes de moderadores, disse ele, foram autorizadas a decidir se precisavam expandir seus números para lidar com o trabalho, acrescentando: “Acontece que 40 pessoas podem ver muito do que está acontecendo.”

Mas ele também disse que a Midjourney e outros geradores de imagens enfrentaram o desafio de policiar o conteúdo em “economia sensacionalista”, na qual as pessoas que ganham a vida alimentando a indignação tentariam fazer mau uso da tecnologia.

A experiência de Holz varia de neuroimagem de cérebros de ratos a sensoriamento remoto na NASA, de acordo com seu perfil no LinkedIn. Ele tirou licença de programa de doutorado em matemática aplicada na Universidade da Carolina do Norte em Chapel Hill para cofundar a Leap Motion em 2010, desenvolvendo tecnologia de reconhecimento de gestos para experiências de realidade virtual. Ele deixou a empresa em 2021 para fundar a Midjourney.

Holz ofereceu algumas pistas sobre os fundamentos da tecnologia da Midjourney, especialmente quando a ferramenta estava prestes a ser lançada ao público.

No início do ano passado, ele escreveu no Discord que o sistema utilizava os nomes de quatro mil artistas. Ele disse que os nomes vieram da Wikipédia. Holz desviou as conversas dos dados de treinamento da IA, escrevendo ainda no ano passado: “Este provavelmente não é um bom lugar para discutir questões legais.”

A empresa estava entre os vários réus em ação coletiva movida em janeiro por três artistas que acusaram a Midjourney e duas outras empresas de violar a lei de direitos autorais usando “bilhões de imagens protegidas por direitos autorais sem permissão” para treinar suas tecnologias.

Os artistas “buscam acabar com essa violação flagrante e enorme de seus direitos antes que suas profissões sejam eliminadas por um software alimentado inteiramente por seu trabalho árduo”, de acordo com a queixa, apresentada no Tribunal Distrital dos EUA para o Distrito norte da Califórnia.

A Midjourney ainda não respondeu às reivindicações no tribunal, e a empresa não respondeu a uma pergunta do The Post sobre o processo.

Os termos de serviço online da empresa buscam abordar questões de direitos autorais. “Respeitamos os direitos de propriedade intelectual de terceiros”, declaram os termos, fornecendo instruções sobre como entrar em contato com a empresa com reclamação de violação de direitos autorais. Os termos de serviço também especificam que os usuários possuem o conteúdo que criam apenas se forem membros pagantes.

Um documento apresentado no mês passado pelos advogados da Midjourney no processo federal afirma que Holz é a única pessoa com interesse financeiro na empresa.

As finanças da empresa são opacas. Na primavera estadunidense do ano passado, vários meses antes de a tecnologia ser lançada publicamente, Mostaque, chefe da empresa-mãe da Stable Diffusion, escreveu no servidor Discord público da Midjourney que havia “ajudado a financiar a expansão beta” e estava “falando de perto com a equipe.”

Mostaque também sugeriu que a Midjourney oferecia alternativa ao lucro do Vale do Silício. Ele disse que a empresa estava trabalhando “de forma colaborativa e alinhada versus extrativa”. Seria fácil, escreveu ele, obter financiamento de capital de risco “e vender para grandes empresas de tecnologia”, mas sugeriu que isso “não vai acontecer”.

Um porta-voz da Stability AI disse que a empresa “fez contribuição modesta para a Midjourney em março de 2021 para financiar seu poder de computação”, acrescentando que Mostaque “não tem função na Midjourney”.

Na corrida para construir geradores de imagem de IA, a Midjourney ganhou vantagem inicial sobre seus concorrentes no verão passado, produzindo gerações mais artísticas e surreais.

Essa técnica estava em exibição quando o proprietário de uma empresa de jogos de tabuleiro de fantasia usou o Midjourney para vencer uma competição de artes plásticas na Feira Estadual do Colorado.

A qualidade altamente estética das imagens também parecia, pelo menos para Holz, uma proteção contra o abuso da ferramenta para criar imagens fotorrealistas.

“Você realmente não pode forçá-lo a fazer um deepfake agora”, disse Holz em uma entrevista em agosto ao The Verge.

Nos meses seguintes, a Midjourney implementou atualizações de software que melhoraram muito sua capacidade de transformar rostos reais em arte gerada por IA – e a tornaram um popular brinquedo de mídia social para suas falsificações virais.

As pessoas que desejam criar um precisam apenas acessar o Discord e digitar um prompt, ao lado da palavra “/imagine”, e descrever o que desejam que a IA crie. Em segundos, a ferramenta produz imagem que o solicitante pode baixar, modificar e compartilhar como bem entender.

Shane Kittelson, um web designer e pesquisador em Boca Raton, Flórida, disse que passa várias horas todas as noites depois que seus dois filhos vão para a cama usando Midjourney para criar o que ele chama de “história ligeiramente alterada” de pessoas reais em cenas imaginárias.

Muitas de suas criações, que ele publica em uma conta do Instagram chamada Schrödinger’s Film Club, abordam a cultura pop dos anos 80, com algumas de suas primeiras imagens mostrando os atores originais de “Star Wars” no lendário festival de música Woodstock.

https://www.instagram.com/p/CqRzpbzMc3N/

Mas ultimamente ele tem experimentado mais com imagens de celebridades e legisladores modernos, algumas das quais foram compartilhadas no Reddit, Twitter e YouTube.

Em uma coleção recente, as principais figuras políticas parecem se soltar em festa de primavera: Trump desmaia na areia; o ex-presidente Barack Obama é banhado em notas de dólar; e o senador Marco Rubio desmorona em “desespero em uma viagem ruim”.

Kittelson disse que sempre rotula suas imagens como geradas por IA, embora não possa controlar o que as pessoas fazem com elas quando estão online. E ele teme que o mundo não esteja preparado para o quão realistas as imagens se tornaram, especialmente devido à falta de ferramentas para detectar falsificações ou regulamentações governamentais que restringem seu uso.

Há dias em que a mudança de ritmo em termos de IA me desconcerta, e eu fico tipo: isso está indo rápido demais. Como vamos entender isso?

Shane Kittelson, web designer e pesquisador

As imagens geradas no Midjourney por Seb Diaz, usuário em Ontário que trabalha com incorporação imobiliária, também provocaram discussões sobre a capacidade de fabricar eventos históricos.

Na semana passada, ele delineou com detalhes precisos um desastre falso que chamou de terremoto Great Cascadia que, segundo ele, atingiu a costa de Oregon em 3 de abril de 2001 e devastou o noroeste do Pacífico.

Para imagens, ele gerou uma foto de crianças atordoadas no aeroporto de Portland; cenas de destruição no Alasca e no estado de Washington; fotos falsas de equipes de resgate trabalhando para libertar residentes presos dos escombros; e até mesmo uma foto falsa de um repórter ao vivo no local.

Ele disse que usou frases como “câmera de vídeo amadora” e “imagens de notícias” para emular as gravações analógicas da época. Em outra coleção, ele criou falsa supertempestade solar de 2012, incluindo entrevista coletiva fictícia da NASA e Obama como presidente assistindo do telhado da Casa Branca.

O detalhe realista das cenas surpreendeu alguns espectadores em fórum de discussão do Reddit dedicado ao Midjourney, com um usuário escrevendo: “As pessoas em 2100 não saberão quais partes da história eram reais.”

Imagem: Midjourney

Outros, porém, temiam como a ferramenta poderia ser mal utilizada. “O que mais me assusta são as nações com armas nucleares […] gerando imagens e áudio falsos para criar bandeiras falsas”, disse outro usuário. “Isso é ouro de propaganda.”

Se o dano é feito, em última análise, é imprevisível, disse Diaz. “Vai ser responsabilidade do criador”, disse ele.

Nas mensagens do Discord no ano passado, Holz disse que a empresa havia “bloqueado um monte de palavras relacionadas a tópicos em diferentes países” com base em reclamações de usuários locais, mas que não listaria os termos banidos para minimizar o “drama”, segundo logs de bate-papo revisados pelo The Post.

Os usuários relataram que as palavras “Afeganistão”, “afegão” e “afegani” estão fora dos limites. E parece haver novas restrições à representação de prisões depois que a apreensão imaginária de Trump se tornou viral.

Holz, em seus comentários no Discord, disse que as palavras proibidas não eram todas relacionadas à China. Mas ele reconheceu que o país era um caso especialmente delicado porque, segundo ele, a sátira política poderia colocar em risco os usuários chineses.

Empresas de tecnologia mais estabelecidas têm enfrentado críticas sobre os compromissos que fazem para operar na China. No Discord, Holz procurou esclarecer os incentivos por trás de sua decisão, escrevendo: “Não somos motivados por dinheiro e, neste caso, o bem maior é obviamente que as pessoas na China tenham acesso a essa tecnologia”. A lógica intrigou alguns especialistas.

“Para os ativistas chineses, isso limitará sua capacidade de se envolver em conteúdo crítico, tanto dentro quanto fora da China”, disse Henry Ajder, pesquisador de IA baseado no Reino Unido. “Também parece um padrão duplo se você permite que presidentes e líderes ocidentais sejam visados, mas não líderes de outras nações”.

A política também parecia fácil de contornar. Enquanto os usuários que solicitam a tecnologia para gerar imagem envolvendo “Jinping” ou o “presidente chinês” são frustrados, um prompt com uma variação dessas palavras, tão simples quanto “presidente da China”, produz rapidamente uma imagem de Xi. Um site taiwanês oferece um guia sobre como usar o Midjourney para criar imagens zombando de Xi e apresenta muito do Ursinho Pooh, o personagem de desenho animado censurado na China e comumente usado como provocação de Xi.

Outros geradores de arte de IA foram construídos de forma diferente, em parte para evitar tais dilemas. Entre eles está o Firefly, revelado na semana passada pela Adobe.

A gigante do software, treinando sua tecnologia em banco de dados de fotografias licenciadas e com curadoria da empresa, criou modelo “com a intenção de ser comercialmente seguro”, disse o conselheiro geral e diretor de confiança da Adobe, Dana Rao, em entrevista. Isso significa que a Adobe pode gastar menos tempo bloqueando solicitações individuais, disse Rao.

A Midjourney, ao contrário, enfatiza sua autoridade para aplicar suas regras arbitrariamente. “Não somos uma democracia”, afirma o conjunto sobressalente de diretrizes da comunidade publicado no site da empresa. “Comporte-se com respeito ou perca seus direitos de usar o serviço.”

Via The Washington Post

Imagem destacada: salarko/Shutterstock

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.