Nova IA de vídeo do Google, Lumiere supera concorrentes com vídeos de animais fofos

IA de vídeo do Google promete maior qualidade no movimento dos objetos - e demonstrou isso com animais em situações fofas
Por Vitoria Lopes Gomez, editado por Bruno Ignacio de Lima 30/01/2024 03h20
google-lumiere-3.png
Demonstrações do Google Lumiere (Foto: Google/Reprodução de tela)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

O Google é conhecido por manter suas invenções de IA sob controle, mas não deixa de avançar no setor. Agora, a big tech apresentou o Lumiere, um modelo de geração de vídeos usando inteligência artificial que parece superar concorrentes em relação à qualidade e precisão. No entanto, o modelo ainda está em desenvolvimento e deve continuar restrito por algum tempo.

Leia mais:

Google Lumiere

O Google Lumiere ainda é uma pesquisa, divulgado pela big tech com um artigo pré-impresso.

De acordo com a empresa, o Lumiere se diferencia de outros modelos de IA do setor ao utilizar um modelo de difusão chamado Space-Time-U-Net, em que o vídeo é gerado a partir de um processo.

Primeiro o software descobre onde as coisas estão na imagem ou texto (espaço) e depois como elas se movem e mudam ao decorrer do movimento (tempo). Então, aproxima as imagens umas das outras e uma movimentação contínua, semelhante à natural.

Segundo o Google, isso contrasta com outros modelos de IA de vídeo, que reúnem partes pequenas (como quadros distantes e estáticos) para formar um todo, o que por vezes acaba em resultados não tão próximos à realidade.

Processo de criação do Google Lumiere (Foto: Google/Reprodução)

Mais informações sobre o modelo de IA de vídeo

  • Como revelou o site Ars Technica, o Lumiere gera 80 quadros a 16 fps. Os vídeos têm 1024×1024 pixels com cinco segundos de duração, ainda em baixa resolução.
  • Em comparação, o Stable Video Diffusion, uma ferramenta de IA já usada para fazer vídeos, gera 25 quadros. A ferramenta também é uma evolução do próprio Google, que no Imagen Video, um modelo de vídeo anterior, poderia gerar vídeos curtos com 24 quadros.
  • A companhia revelou que treinou a IA usando um conjunto de dados com 30 milhões de vídeos e legendas de texto, mas não revelou de onde eles foram tirados.
  • O Lumiere pode gerar vídeos a partir de prompts de texto, conversão de imagens estáticas ou imagens de referência. Ainda, o Google afirma que é possível aplicar edições nos vídeos ou criar animações específicas em uma foto estática, como um vestido se movendo, por exemplo,

Testes com a IA de vídeo Lumiere

O Google já fez demonstrações de como o Lumiere se sai na prática – incluindo animais fofos.

Apesar da aparência artificial dos vídeos, que são facilmente detectados como IA, imitam um movimento semelhante ao real dos animais e humanos, além de ser fluido.

Veja as demonstrações:

Quando o Lumiere estará disponível

O artigo do Lumiere fez ressalvas ao modelo, revelando que “há um risco de uso indevido para a criação de conteúdo falso ou prejudicial com a nossa tecnologia”.

Os responsáveis escreveram que ainda é necessário aplicar ferramentas para detectar preconceitos e tentativas de usos maliciosos.

Ou seja, ao que tudo indica, o Lumiere não será disponibilizado tão cedo.

Vitória Lopes Gomez é jornalista formada pela UNESP e redatora no Olhar Digital.

Bruno Ignacio é jornalista formado pela Faculdade Cásper Líbero. Com 10 anos de experiência, é especialista na cobertura de tecnologia. Atualmente, é editor de Dicas e Tutoriais no Olhar Digital.