Google: Gemini 1.5 Pro agora também pode ouvir

Tudo sobre Google

A nova versão do Gemini 1.5 Pro foi lançada oficialmente pelo Google. Agora, o modelo de IA (inteligência artificial) intermediário da empresa recebeu a capacidade de ouvir arquivos de áudio e produzir informações a partir de som e vídeo sem precisar de nenhum comando escrito.

Leia mais:

Novo Google Gemini 1.5 Pro

A novidade foi anunciada durante o evento Google Next e será disponibilizada ao público empresarial para criar aplicativos de IA por meio da plataforma Vertex AI.
Por enquanto, apenas quem tem acesso ao Vertex AI poderá acessar a nova versão.
Segundo o Google, a nova versão do Gemini Pro também pode entender instruções mais longas.
A maioria dos usuários usa a versão mais simples do modelo de linguagem por meio do chatbot Gemini (conhecido antes como Bard).

Pessoa usando celular com logomarca do Gemini atrás — *O Gemini pro fica posicionado abaixo do Gemini Ultra, o modelo de IA mais poderoso do Google. (Imagem: rafares/Shutterstock)*

Vale mencionar que o Gemini 1.5 Pro foi apenas uma das grandes atualizações de IA confirmadas pelo Google durante o evento. O Imagen 2, nova versão do modelo de geração de texto para imagem, também recebeu a capacidade de adicionar ou remover elementos das imagens.

O Google também disponibilizou seu recurso de marca d’água digital, o SynthID, que estará em todas as imagens criadas usando os seus modelos de inteligência artificial. A função adiciona uma marca d’água invisível que aparece apenas em ferramentas de detecção, informou a empresa.

O evento Cloud Next 2024, da divisão de nuvem do Google, acontece em Las Vegas e vai até esta quinta-feira, 11 de abril. Confira aqui um resumo das principais novidades anunciadas pela big tech.