Assim como aconteceu com o Sora, da OpenAI, o lançamento VASA-1, da Microsoft, impressionou pelo realismo. É verdade que a sincronização dos lábios não é perfeita (ainda), mas a simples ideia de colocar palavras na boca de fotos é bastante assustadora.

Leia mais

publicidade

Para quem não acompanhou, o VASA-1 é um modelo de Inteligência Artificial que gera vídeos hiper-realistas. A novidade, apresentada na semana passada, pode gerar clipes a partir de apenas uma foto ou áudio de fala.

Imagem: Divulgação/Microsoft

A promessa da empresa são vídeos com movimentos labiais sincronizados, expressões faciais e movimentos da cabeça, tudo para parecerem mais naturais.

publicidade

Você pode ver nesse link a seguir alguns exemplos de como a IA funciona:

O vídeo da Monalisa é divertido, mas não mostra todo o potencial da nova ferramenta. Se você assistir aos outros vídeos (clique no link do X acima), verá que a IA da Microsoft consegue resultados fantásticos.

publicidade

As expressões faciais realmente enganam, emulando o que fazemos naturalmente – movimento de sobrancelhas, olhos se fechando e boca articulada.

Diante disso, a Microsoft decidiu não lançar o VASA-1 para o público, assim como fez a OpenAI com o Sora.

publicidade

O temor das deepfakes

  • Apesar de a ferramenta despertar muita curiosidade das pessoas, a Microsoft decidiu, por enquanto, não liberá-la para o público.
  • A ideia inicial é usar o VASA-1 apenas para fins de pesquisa.
  • A geração de vídeos hiper-realistas de pessoas reais com qualquer áudio facilita a criação das chamadas deepfakes.
  • Em comunicado, a companhia afirmou que o propósito da ferramenta não é enganar.
  • Porém, reconheceu também, no texto, que, caso libere o VASA-1 para todo o público, não poderá controlar o uso indevido da IA.
  • E o estrago poderia ocorrer em várias camadas e esferas diferentes da sociedade.
  • Do ataque a um colega da escola à manipulação dentro de uma empresa.
  • Em escala maior, estamos falando na criação de deepfakes que podem influenciar eleições, como a disputa presidencial nos Estados Unidos, neste ano.
(Imagem: Vitória Gomez via DALL-E/Olhar Digital)
  • Como já disse, a OpenAI tomou uma decisão parecida em relação ao seu Sora, que também cria vídeos hiper-realistas.
  • A empresa afirmou que estuda ao lado de especialistas em IA possíveis aplicações que possam gerar benefícios à humanidade.
  • Só assim o Sora poderá, um dia, ir para o público geral.

A Microsoft e a IA

Como a gente vem informando aqui no Olhar Digital, a Microsoft ocupa, hoje, uma posição privilegiada no mercado quando o assunto é Inteligência Artificial. A ponto de o CEO da big tech, Satya Nadella, ter provocado a concorrência em fevereiro deste ano.

São inúmeras notícias de investimentos da companhia em IA em todos os cantos do mundo. Teve injeção de recursos na Espanha, quase US$ 3 bilhões no Japão e, mais recentemente, outro investimento bilionário em IA, só que no Oriente Médio.

Devemos conhecer os próximos passos da empresa no mês que vem, quando a Microsoft promove o chamado Build 2024. O evento para desenvolvedores ocorre em Seattle, nos EUA, entre os dias 21 e 23 de maio.

O Build não terá transmissão ao vivo pela internet e apenas jornalistas credenciados poderão conferir as discussões. A Microsoft deve focar bastante no próximo hardware do Surface, o laptop com touch screen da empresa, e nas mudanças no Windows, todas focadas em Inteligência Artificial.

Depois do lançamento bombástico do VASA-1, a expectativa é que a companhia fale também sobre a ferramenta.

As informações são do Engadget.