Nova IA do Google consegue transformar muita coisa em animação

O VideoPoet permite incorporar animação a imagens e combina várias capacidades de geração de vídeo num único modelo grande de linguagem
Pedro Spadoni21/12/2023 15h03
Montagem com animações criadas pela nova IA do Google, o VideoPoet
(Imagem: Reprodução/Google)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

O Google anunciou o VideoPoet, um modelo de linguagem de grande escala (LLM, na sigla em inglês) capaz de gerar vídeos por meio de inteligência artificial (IA). Este modelo vem para enfrentar desafios atuais no campo, principalmente a dificuldade de produzir movimentos grandes e coerentes, segundo a empresa.

Ofertas

Controle Remoto Tv Samsung Smart
Vendido por Amazon
Controle Remoto Tv Samsung Smart
De: R$ 19,90
Por: R$ 7,39
STAEDTLER Caneta Ponta Fina Triplus Fineliner 0.3mm Estojo 8 Cores Sortidas + 2-334 BK10 TA - Corpo Ergonômico Triangular – Ideal para Escrita e Bullet Journal
Vendido por Amazon
STAEDTLER Caneta Ponta Fina Triplus Fineliner 0.3mm Estojo 8 Cores Sortidas + 2-334 BK10 TA - Corpo Ergonômico Triangular – Ideal para Escrita e Bullet Journal
De: R$ 76,53
Por: R$ 31,75
Nobreak Interativo XNB 720 BIvolt Preto Intelbras
Vendido por Amazon
Nobreak Interativo XNB 720 BIvolt Preto Intelbras
De: R$ 642,59
Por: R$ 481,00
Tilibra - Estojo Tilibra Box Academie Preto
Vendido por Amazon
Tilibra - Estojo Tilibra Box Academie Preto
De: R$ 85,90
Por: R$ 58,01
Stranger of Paradise Final Fantasy Origin - PlayStation 5
Vendido por Amazon
Stranger of Paradise Final Fantasy Origin - PlayStation 5
Por R$ 159,89
Volante para Nintendo Switch 2 (2025), Steering Wheel Volantes de Corrida para Mario Kart World 8 Deluxe, Pacote com 4 Volantes para Switch 2 Mario Kart para Switch 2 Acessórios (Azul, Laranja e 2 Pretos)
Vendido por Amazon
Volante para Nintendo Switch 2 (2025), Steering Wheel Volantes de Corrida para Mario Kart World 8 Deluxe, Pacote com 4 Volantes para Switch 2 Mario Kart para Switch 2 Acessórios (Azul, Laranja e 2 Pretos)
De: R$ 99,00
Por: R$ 94,05
DAC - Pasta Polipropileno Oficio Decorada Transparente
Vendido por Amazon
DAC - Pasta Polipropileno Oficio Decorada Transparente
Por R$ 5,05
Post-it Notas super adesivas, coleção de cores de edição limitada, 7,6 x 7,6 cm, 15 blocos/pacote, 45 folhas/bloco
Vendido por Amazon
Post-it Notas super adesivas, coleção de cores de edição limitada, 7,6 x 7,6 cm, 15 blocos/pacote, 45 folhas/bloco
De: R$ 113,95
Por: R$ 60,58
House Construction Builder: offroad Dump Truck Simulator
Vendido por Amazon
House Construction Builder: offroad Dump Truck Simulator
Por R$ 19,99
Caderno 1 materia 96 folhas Lilás Linha Colors Tamoio
Vendido por Amazon
Caderno 1 materia 96 folhas Lilás Linha Colors Tamoio
Por R$ 23,80
Notebook Acer Aspire GO 15, Intel Core i5-1334U, 8GB RAM, 256GB SSD, 15" WUXGA IPS, Windows 11 Home, AG15-51P-55LL
Vendido por Amazon
Notebook Acer Aspire GO 15, Intel Core i5-1334U, 8GB RAM, 256GB SSD, 15" WUXGA IPS, Windows 11 Home, AG15-51P-55LL
Por R$ 2.899,00
Pasta sanfonada A4 com 12 divisórias Linho serena Verde pastel 6096.vp Dello
Vendido por Amazon
Pasta sanfonada A4 com 12 divisórias Linho serena Verde pastel 6096.vp Dello
De: R$ 34,00
Por: R$ 20,79
Garmin Relógio Venu 3 Preto 45mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Venu 3 Preto 45mm com Monitor Cardíaco de Pulso e GPS
De: R$ 4.699,00
Por: R$ 3.799,00
Mouse Gamer Redragon Bullseye Pro, Wireless 2.4GHz Cabo ou Bluetooth, RGB, 7 Botões, 26000DPI, Preto - M806RGB-PRO
Vendido por Amazon
Mouse Gamer Redragon Bullseye Pro, Wireless 2.4GHz Cabo ou Bluetooth, RGB, 7 Botões, 26000DPI, Preto - M806RGB-PRO
De: R$ 316,25
Por: R$ 225,90
AuroraLink Adaptador Carplay sem fio para Apple iPhone e Android Auto 2 em 1, adaptador sem fio Carplay rápido e estável, converte com fio para dongle de reprodução de carro sem fio para iOS 10+
Vendido por Amazon
AuroraLink Adaptador Carplay sem fio para Apple iPhone e Android Auto 2 em 1, adaptador sem fio Carplay rápido e estável, converte com fio para dongle de reprodução de carro sem fio para iOS 10+
De: R$ 416,17
Por: R$ 241,03
Baba Eletronica, Camera de Segurança Wifi, Tela LCD, Áudio Bidirecional, VOX (Ativação por Voz), Alerta de Temperatura, Lembrete de Alimentação, 8 Canções, Sinal FHSS Criptografado
Vendido por Amazon
Baba Eletronica, Camera de Segurança Wifi, Tela LCD, Áudio Bidirecional, VOX (Ativação por Voz), Alerta de Temperatura, Lembrete de Alimentação, 8 Canções, Sinal FHSS Criptografado
De: R$ 399,99
Por: R$ 237,99
Câmera IP Sem Fio de Segurança Externa HD 3MP, Câmera de Visão Noturna Infravermelha WiFi, tripla Lente Grande Angular, IP68 à Prova D'água e à Prova de Poeira
Vendido por Amazon
Câmera IP Sem Fio de Segurança Externa HD 3MP, Câmera de Visão Noturna Infravermelha WiFi, tripla Lente Grande Angular, IP68 à Prova D'água e à Prova de Poeira
De: R$ 299,00
Por: R$ 216,11
Suporte Celular com Rastreamento Automático de Movimento e Rosto, Rotação de 360° Automática, Segue Seus Movimentos, Tripé Estabilizador Celular Câmera Inteligentecom, Com Controle Remoto, Lives
Vendido por Amazon
Suporte Celular com Rastreamento Automático de Movimento e Rosto, Rotação de 360° Automática, Segue Seus Movimentos, Tripé Estabilizador Celular Câmera Inteligentecom, Com Controle Remoto, Lives
De: R$ 84,90
Por: R$ 79,90
Basike Power Bank 30000mAh, Carregador Portátil com Carregamento Rápido, USB-A (até 22,5W, QC) + USB-C (até 20W, PD) + 2 Cabos Integrados (USB-C e Lightning), LED Numeric Power Display – Preto
Vendido por Amazon
Basike Power Bank 30000mAh, Carregador Portátil com Carregamento Rápido, USB-A (até 22,5W, QC) + USB-C (até 20W, PD) + 2 Cabos Integrados (USB-C e Lightning), LED Numeric Power Display – Preto
De: R$ 198,00
Por: R$ 174,00
CROWNFUL Balança de alimentos, balança digital de cozinha de 5 kg, peso onças e gramas para cozinhar e assar, 6 unidades com função de tara (bateria incluída)
Vendido por Amazon
CROWNFUL Balança de alimentos, balança digital de cozinha de 5 kg, peso onças e gramas para cozinhar e assar, 6 unidades com função de tara (bateria incluída)
De: R$ 59,99
Por: R$ 37,99
Redragon MOUSE GAMER INVADER CHROMA RGB - M719-RGB
Vendido por Amazon
Redragon MOUSE GAMER INVADER CHROMA RGB - M719-RGB
De: R$ 101,16
Por: R$ 94,90
Teclado Magnético Gamer Redragon Kumara PRO K552RGB USB RGB Preto Switch Marrom
Vendido por Amazon
Teclado Magnético Gamer Redragon Kumara PRO K552RGB USB RGB Preto Switch Marrom
De: R$ 330,05
Por: R$ 299,90
Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
Vendido por Amazon
Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
De: R$ 1.156,80
Por: R$ 948,90
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
Vendido por Amazon
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
De: R$ 2.699,00
Por: R$ 2.069,90
Garmin Relógio Forerunner 965 Preto 47mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Forerunner 965 Preto 47mm com Monitor Cardíaco de Pulso e GPS
De: R$ 6.149,00
Por: R$ 5.489,00
HP, Impressora HP Laser 107a. Tecnologia de impressão Laser Impressora para Pequenas e Médias Empresas. Conectividade: USB 2.0 de alta velocidade (4ZB77A), Branco/Cinza
Vendido por Amazon
HP, Impressora HP Laser 107a. Tecnologia de impressão Laser Impressora para Pequenas e Médias Empresas. Conectividade: USB 2.0 de alta velocidade (4ZB77A), Branco/Cinza
Por R$ 899,00

Para quem tem pressa:

  • Lançamento do VideoPoet pelo Google: O Google anunciou o VideoPoet, um modelo de linguagem de grande escala (LLM) para geração de vídeos usando inteligência artificial;
  • Versatilidade do VideoPoet: O modelo se destaca pela sua versatilidade, integrando funcionalidades como texto-para-vídeo, imagem-para-vídeo, estilização de vídeo e geração de áudio a partir de vídeos, conforme divulgado no blog Google Research;
  • Capacidades e Diferenciais: O VideoPoet permite animar imagens, editar vídeos através de técnicas como inpainting e outpainting, e combina várias capacidades de geração de vídeo em um único LLM, diferenciando-se de modelos baseados em difusão como o Imagen Video;
  • Aplicações Diversas e Edição Interativa: Entre suas aplicações, o VideoPoet possibilita a geração de vídeos a partir de textos, animação de imagens estáticas, estilização de vídeos, criação de clipes de áudio e suporta a geração de vídeos em orientação retrato;
  • Potencial dos LLMs e Extensões Futuras: O modelo demonstra o potencial imenso dos LLMs na geração de conteúdo de vídeo, com alta qualidade dos vídeos gerados e possibilidades de extensão para outras áreas, como texto-para-áudio, áudio-para-vídeo e legendagem automática.

O VideoPoet se destaca por sua versatilidade, conforme divulgado no Google Research, blog voltado para divulgação de avanços na área de pesquisa da big tech. Isso porque incorporou funções como texto-para-vídeo, imagem-para-vídeo, estilização de vídeo e até a geração de áudio a partir de vídeos.

Leia mais:

VideoPoet: a nova IA do Google

A capacidade de animar imagens e editar vídeos através de inpainting (preenchimento de espaços) e outpainting (extensão de imagens) é um dos destaques do novo modelo, segundo a empresa. Diferentemente de modelos baseados em difusão, como o Imagen Video, o VideoPoet integra várias capacidades de geração de vídeo em um único LLM.

Entre suas diversas aplicações, o VideoPoet permite a geração de vídeos a partir de textos, animação de imagens estáticas, estilização de vídeos com base em informações de profundidade e fluxo óptico, e criação de clipes de áudio sem orientação textual. Além disso, oferece suporte para geração de vídeos na orientação retrato, ideal para conteúdo de curta duração.

O VideoPoet demonstrou sua habilidade em gerar vídeos mais longos mantendo a consistência visual dos objetos, segundo o Google. A edição interativa de vídeos permite a manipulação de objetos para realizar ações variadas, enquanto o controle preciso dos movimentos da câmera é possível através de comandos de texto.

De acordo com a postagem no blog, este modelo evidencia o potencial imenso dos LLMs na geração de conteúdo de vídeo. A alta qualidade dos vídeos gerados sugere possíveis extensões para outras áreas, como texto-para-áudio, áudio-para-vídeo e legendagem automática de vídeos, abrindo novos horizontes no campo da inteligência artificial e multimídia, segundo o Google.

Pedro Spadoni
Redator(a)

Pedro Spadoni é jornalista formado pela Universidade Metodista de Piracicaba (Unimep). Já escreveu para sites, revistas e até um jornal. No Olhar Digital, escreve sobre (quase) tudo.