O Google anunciou recentemente o Gemini, seu modelo de inteligência artificial (IA) mais avançado até o momento. No entanto, a empresa enfrentou acusações de exagerar as capacidades da tecnologia num vídeo promocional.

Para quem tem pressa:

  • O Google anunciou recentemente o Gemini, seu modelo de inteligência artificial mais avançado até o momento, mas enfrentou críticas sobre a veracidade das capacidades apresentadas em um vídeo promocional;
  • Um artigo publicado na Bloomberg criticou o Google por supostamente exagerar as capacidades do Gemini no vídeo, que mostrava a IA realizando tarefas complexas de reconhecimento de imagem e interação em tempo real de forma eficiente;
  • Uma nota na descrição do vídeo no YouTube revelou que houve redução de latência e encurtamento das respostas do Gemini para a demonstração, indicando que a apresentação não ocorreu inteiramente em tempo real;
  • O artigo apontou que é comum empresas editarem vídeos de demonstração, mas ressaltou que o Google já enfrentou questionamentos semelhantes no passado;
  • A colunista sugeriu que, em vez de usar vídeos editados que podem ser interpretados como enganosos, o Google deveria permitir que jornalistas e desenvolvedores testassem o Gemini diretamente.

Um artigo, escrito pela colunista Parmy Olson, da Bloomberg, critica o Google por, supostamente, ter deturpado o poder do Gemini. O vídeo de seis minutos mostra o Gemini realizando tarefas complexas de reconhecimento de imagem e interação em tempo real, parecendo extremamente eficiente.

Leia mais:

Vídeo do Gemini: um pouco demais?

O vídeo destacou a habilidade multimodal do Gemini, que inclui a combinação de comandos de voz e reconhecimento de imagem. Nele, a IA reconhece imagens rapidamente e responde a elas, além de rastrear um objeto em movimento num jogo de truque.

publicidade

Contudo, uma nota na descrição do vídeo no YouTube revelou que a latência foi reduzida e as respostas do Gemini foram encurtadas para a demonstração, indicando que a apresentação não aconteceu inteiramente em tempo real.

Olson argumenta que o Google admitiu que a demonstração não foi ao vivo e utilizou quadros de imagem estática com comandos de texto, ao invés de uma interação em tempo real. Isso contradiz a impressão inicial de que o Gemini poderia realizar interações suaves e contínuas de voz em tempo real.

O artigo também aponta que não é incomum para empresas editarem vídeos de demonstração. Mas ressalta que o Google já enfrentou questionamentos sobre a autenticidade de suas demonstrações anteriores, como o Google Duplex. Além disso, menciona a queda nas ações da Baidu após a divulgação de vídeos editados do seu Ernie Bot.

Demonstração em discussão

gemini
(Imagem: Divulgação/Google)

A colunista sugere que a abordagem do Google com o Gemini pode ser uma tentativa de desviar a atenção do sucesso do GPT da OpenAI. O Google, por sua vez, defende a validade da demonstração.

Oriol Vinyals, líder de pesquisa no DeepMind do Google e co-líder do Gemini, afirmou que o vídeo foi feito para inspirar desenvolvedores e que todas as interações apresentadas eram reais, embora encurtadas.

Por fim, o artigo sugere que, em vez de usar vídeos editados que podem ser interpretados como enganosos, o Google deveria permitir que jornalistas e desenvolvedores testassem o Gemini diretamente. Isso proporcionaria uma demonstração mais transparente e confiável das capacidades reais do novo modelo.