O Google anunciou hoje (13), durante o evento do Pixel 9, o lançamento de um novo modo de conversa por voz para o Gemini, chamado Gemini Live. Disponível para assinantes do plano Gemini Advanced, o recurso funciona de maneira semelhante ao modo de chat por voz do ChatGPT, permitindo conversas naturais com a inteligência artificial (IA), incluindo a capacidade de interromper a resposta sem precisar tocar em botões.

Segundo o Google, as conversas com o Gemini Live podem ser “fluidas”, permitindo que o usuário interrompa a IA no meio de uma frase ou pause a conversa e retome-a posteriormente. O Gemini Live também funcionará em segundo plano ou com o telefone bloqueado.

publicidade

O Google havia anunciado pela primeira vez o Gemini Live durante a conferência de desenvolvedores I/O, no início deste ano, onde também revelou que o Gemini Live seria capaz de interpretar vídeos em tempo real.

teste do gemini live
David Citron, um dos apresentadores do evento, faz demonstração ao vivo do Gemini Live, pedindo para o Gemini adicionar um item a sua lista de compras. (Imagem: Google / Reprodução)

Durante o evento, o Google apresentou demonstrações ao vivo, que incluíram uma falha em fazer o que foi pedido, mas uma troca de aparelhos resolveu a questão. Talvez o teste mais impressionante ficou por conta do pedido para listar alimentos consumidos em um vídeo no YouTube.

publicidade
teste do gemini live
Jessica Carpenter faz teste ao vivo de funcionalidade do Gemini. (Imagem: Google / Reprodução)

Além disso, o Google introduziu 10 novas vozes para o Gemini, que os usuários poderão escolher conforme sua preferência. O recurso começou a ser liberado hoje, inicialmente em inglês, para dispositivos Android. A empresa afirmou que o Gemini Live estará disponível para iOS e em mais idiomas “nas próximas semanas”.

Leia mais:

Outras novas funcionalidades do Gemini

  • Além do Gemini Live, o Google anunciou novas funcionalidades para seu assistente de IA, incluindo extensões para aplicativos como Keep, Tarefas, Utilitários e YouTube Music, que serão lançadas futuramente.
  • O Gemini também está ganhando a capacidade de entender o contexto da tela do usuário, semelhante aos recursos de IA apresentados pela Apple no WWDC deste ano.
  • Após o usuário tocar em “Perguntar sobre esta tela” ou “Perguntar sobre este vídeo”, o Google afirma que o Gemini poderá fornecer informações detalhadas, como extrair destinos de vídeos de viagem e adicioná-los ao Google Maps.