O Google é conhecido por manter suas invenções de IA sob controle, mas não deixa de avançar no setor. Agora, a big tech apresentou o Lumiere, um modelo de geração de vídeos usando inteligência artificial que parece superar concorrentes em relação à qualidade e precisão. No entanto, o modelo ainda está em desenvolvimento e deve continuar restrito por algum tempo.

Leia mais:

Google Lumiere

O Google Lumiere ainda é uma pesquisa, divulgado pela big tech com um artigo pré-impresso.

De acordo com a empresa, o Lumiere se diferencia de outros modelos de IA do setor ao utilizar um modelo de difusão chamado Space-Time-U-Net, em que o vídeo é gerado a partir de um processo.

publicidade

Primeiro o software descobre onde as coisas estão na imagem ou texto (espaço) e depois como elas se movem e mudam ao decorrer do movimento (tempo). Então, aproxima as imagens umas das outras e uma movimentação contínua, semelhante à natural.

Segundo o Google, isso contrasta com outros modelos de IA de vídeo, que reúnem partes pequenas (como quadros distantes e estáticos) para formar um todo, o que por vezes acaba em resultados não tão próximos à realidade.

Processo de criação do Google Lumiere (Foto: Google/Reprodução)

Mais informações sobre o modelo de IA de vídeo

  • Como revelou o site Ars Technica, o Lumiere gera 80 quadros a 16 fps. Os vídeos têm 1024×1024 pixels com cinco segundos de duração, ainda em baixa resolução.
  • Em comparação, o Stable Video Diffusion, uma ferramenta de IA já usada para fazer vídeos, gera 25 quadros. A ferramenta também é uma evolução do próprio Google, que no Imagen Video, um modelo de vídeo anterior, poderia gerar vídeos curtos com 24 quadros.
  • A companhia revelou que treinou a IA usando um conjunto de dados com 30 milhões de vídeos e legendas de texto, mas não revelou de onde eles foram tirados.
  • O Lumiere pode gerar vídeos a partir de prompts de texto, conversão de imagens estáticas ou imagens de referência. Ainda, o Google afirma que é possível aplicar edições nos vídeos ou criar animações específicas em uma foto estática, como um vestido se movendo, por exemplo,

Testes com a IA de vídeo Lumiere

O Google já fez demonstrações de como o Lumiere se sai na prática – incluindo animais fofos.

Apesar da aparência artificial dos vídeos, que são facilmente detectados como IA, imitam um movimento semelhante ao real dos animais e humanos, além de ser fluido.

Veja as demonstrações:

Quando o Lumiere estará disponível

O artigo do Lumiere fez ressalvas ao modelo, revelando que “há um risco de uso indevido para a criação de conteúdo falso ou prejudicial com a nossa tecnologia”.

Os responsáveis escreveram que ainda é necessário aplicar ferramentas para detectar preconceitos e tentativas de usos maliciosos.

Ou seja, ao que tudo indica, o Lumiere não será disponibilizado tão cedo.