(Imagem: The Art of Pics/Shutterstock)
A Microsoft introduziu um novo modelo de inteligência artificial (IA) capaz de gerar vídeos hiper-realistas de rostos humanos. Chamado de VASA-1, a novidade pode gerar clipes a partir de apenas uma foto ou áudio de fala.
A promessa da empresa são vídeos com movimentos labiais sincronizados, expressões faciais e movimentos da cabeça, tudo para parecerem mais naturais.
Leia mais:
Alguns exemplos de vídeos criados com o modelo de IA da Microsoft foram compartilhados no X (antigo Twitter):
Além de renderizar vídeos de até um minuto em alta qualidade a partir de uma única imagem, a Microsoft também destacou a capacidade do VASA-1 de gerar movimentos labiais que correspondam ao arquivo de áudio, bem como expressões faciais.
O modelo de geração de vídeo AI também oferece ajustes granulares ao usuário para controlar diferentes aspectos do vídeo, como direção do olhar, distância da cabeça, compensações emocionais e mais. Por enquanto, a gigante da tecnologia diz que não planeja lançar um produto alimentado pelo VASA-1.
A geração de vídeo hiper-realista de pessoas reais com qualquer áudio também levanta uma questão sobre seu uso antiético, especialmente para criar deepfakes.
A empresa destacou que não cogita divulgar o modelo de IA ao público. A ideia é apenas criar personagens virtuais interativos a partir dele “melhorando a acessibilidade para indivíduos com dificuldades de comunicação e oferecendo companhia ou apoio terapêutico aos necessitados”
“Estamos empenhados em desenvolver IA de forma responsável, com o objetivo de promover o bem-estar humano“, acrescentou a empresa em comunicado.
Esta post foi modificado pela última vez em 19 de abril de 2024 21:41