Siga o Olhar Digital no Google Discover
O Google DeepMind lançou dois modelos de inteligência artificial (IA): Gemini Robotics e Gemini Robotics-ER. Ambos foram projetados para ajudar robôs a “executar gama mais ampla do que nunca de tarefas no mundo real”.
Ofertas
Por: R$ 22,59
Por: R$ 59,95
Por: R$ 3.099,00
Por: R$ 3.324,00
Por: R$ 799,00
Por: R$ 241,44
Por: R$ 349,90
Por: R$ 2.159,00
Por: R$ 188,99
Por: R$ 45,00
Por: R$ 379,00
Por: R$ 1.239,90
Por: R$ 943,20
Por: R$ 798,99
Por: R$ 205,91
Por: R$ 476,10
Por: R$ 1.139,05
Por: R$ 949,00
Por: R$ 7,60
Por: R$ 21,77
Por: R$ 16,63
Por: R$ 59,95
Por: R$ 7,20
Por: R$ 139,90
Por: R$ 119,90
Por: R$ 398,99
Por: R$ 79,90
Por: R$ 199,90
O Gemini Robotics é um modelo de visão-linguagem-ação capaz de entender situações mesmo sem ter sido treinado para elas, segundo o Google. Já o Gemini-ER (sigla em inglês para raciocínio incorporado) a big tech descreve como um modelo avançado de linguagem visual que pode “entender nosso mundo complexo e dinâmico”, segundo postagem em seu blog.
Novos modelos de IA do Google para robôs usam Gemini
O Gemini Robotics roda Gemini 2.0, a versão mais recente do modelo de IA principal do Google. O novo modelo “aproveita o entendimento multimodal do Gemini sobre o mundo e o transfere para o mundo real, adicionando ações físicas como uma nova modalidade”, disse a diretora sênior e chefe de robótica no Google DeepMind, Carolina Parada, numa coletiva de imprensa, segundo o Verge.

O Robotics avança em três áreas consideras essenciais pelo Google DeepMind para construir robôs úteis: generalidade, interatividade e destreza.
Além da capacidade de generalizar novos cenários, o Gemini Robotics é melhor na interação com pessoas e seu ambiente. Também é capaz de executar tarefas físicas mais precisas, como dobrar um pedaço de papel ou remover uma tampa de garrafa.
Sobre o Gemini Robotics-ER, Carolina dá o seguinte exemplo: quando você prepara sua lancheira e tem itens sobre uma mesa à sua frente, é preciso saber onde está cada item, como abrir a lancheira, como pegar os itens e onde colocá-los. Esse é o tipo de raciocínio que o Gemini Robotics-ER deve realizar.
Leia mais:
- Google lança o Gemma 3, modelo de IA que supera todos os rivais
- Vale a pena comprar um celular exclusivamente devido à inteligência artificial (IA)?
- O que é e o que faz um agente de inteligência artificial?
Segurança ‘em camadas’

O pesquisador do Google DeepMind, Vikas Sindhwani, disse aos repórteres que a empresa desenvolve “abordagem em camadas” no que diz respeito à segurança. Sindhwani acrescentaou que os modelos do Gemini Robotics-ER “são treinados para avaliar se uma ação potencial é segura para ser realizada num determinado cenário”.
A big tech também lançou benchmarks e frameworks para ajudar a pesquisa de segurança na indústria de IA. E deu acesso a “testadores confiáveis” ao seu modelo Gemini Robotics-ER. Entre eles, estão: Agile Robots, Agility Robotics, Boston Dynamics e Enchanted Tools.