Essa IA manipula imagens em segundos e fica perfeito; veja!

Uma nova ferramenta de inteligência artificial consegue realizar edições complexas com apenas alguns cliques
Por William Schendes, editado por Bruno Capozzi 19/05/2023 13h23
IA manipula imagens
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Já pensou realizar edições complexas em imagens apenas arrastando o mouse? Um novo projeto desenvolvido por pesquisadores da Alemanha e Estados Unidos permite alterar a dimensão das fotos, trocar a posição de corpos, mudar a expressão de rostos e mais! Tudo isso, com apenas alguns comandos simples.

Embora não seja o foco da ferramenta, o DragGAN também funciona como um gerador de imagens — como o Stable Diffusion e Dall-E.

Leia mais:

O DragGAN processa imagens realistas e usa o modelo de aprendizado GAN (Generative Adversarial Networks, ou rede generativa contraditória, na tradução livre) para processar o conjunto de dados e realizar as alterações na imagem.

Nos vídeos divulgados pela equipe criadora, a ferramenta mostra seu potencial. Nos exemplos, vemos que o DragGAN consegue alterar a posição do rosto de um leão, abrir um sorriso no rosto de uma mulher, alterar o tamanho de roupas no corpo, mudar dimensões de um carro e mais.

Atualmente, já existem ferramentas de IA utilizando GANs, mas elas geralmente não são muito flexíveis. Então, não é possível pedir que essas tecnologias construam uma imagem na posição exata que o usuário deseja. Diferentemente das demais ferramentas, o DragGAN permite alterar a posição dos objetos e manipular detalhes.

Outra diferença é que o DragGAN edita as imagens sem precisar borrá-las ou misturar pixels: 

Através do DragGAN, qualquer pessoa pode deformar uma imagem com controle preciso sobre onde os pixels vão, manipulando, assim, a pose, forma, expressão e layout de diversas categorias.

Como essas manipulações são realizadas no coletor de imagens generativas aprendidas de uma GAN, elas tendem a produzir saídas realistas, mesmo para cenários desafiadores.

Pesquisadores que desenvolveram o DragGAN.

Com informações de The Verge e The Decoder.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Jornalista em formação pela Universidade Metodista de São Paulo (UMESP). Mesmo com alguns assuntos negativos, gosta ficar atualizado e noticiar sobre diferentes temas da tecnologia.

Bruno Capozzi é jornalista formado pela Faculdade Cásper Líbero e mestre em Ciências Sociais pela PUC-SP, tendo como foco a pesquisa de redes sociais e tecnologia.