Na edição desta quarta-feira (06) da coluna Olhar do Amanhã, o neurocientista e colunista do Olhar Digital News Alvaro Machado Dias trouxe mais detalhes sobre a nova IA do Google

A empresa anunciou o seu mais recente avanço em inteligência artificial com a introdução do Gemini, um modelo que vai além da compreensão baseada em texto para entender fotos e vídeos. A principal novidade é a integração do Bard com o Gemini, que promete trazer recursos mais avançados de raciocínio, planejamento, compreensão e outras capacidades para o chatbot.

publicidade

O Gemini marca uma mudança significativa em relação aos modelos tradicionais de IA, que se concentravam principalmente na comunicação baseada em texto. Ao contrário dos seus antecessores, o Gemini introduz suporte nativo para vídeo, áudio e fotos, permitindo que o chatbot de IA Bard do Google compreenda e responda a informações mais ricas.

Alvaro Machado Dias analisou o cenário da corrida da IAs com a chegada da nova tecnologia.

publicidade

Ele é multimodal por design, a arquitetura dele começa sendo multimodal. Isso significa que ele tem um desempenho muito superior em vídeo, na tradução, na interpretação de conteúdos em vídeo, no uso de prompts para construção de música, ou qualquer outro tipo de estímulo que não seja textual, na capacidade de computar gráficos junto com palavras, e assim por diante.

Alvaro Machado Dias

A coluna Olhar do Amanhã é exibida toda quarta-feira durante o Olhar Digital News. Acompanhe!