O Google anunciou, nesta quarta-feira (21), a Gemma, nova “família de modelos abertos leves e de última geração” voltada para desenvolvedores e pesquisadores de inteligência artificial (IA). A Gemma foi desenvolvida pelo Google DeepMind e outras equipes da empresa.

Para quem tem pressa:

  • O Google anunciou a Gemma, nova geração de modelos de inteligência artificial (IA) leves e abertos, desenvolvidos pelo Google DeepMind e outras equipes da empresa. A ideia é facilitar o acesso dos desenvolvedores e pesquisadores a tecnologias avançadas de IA;
  • Disponível nos tamanhos Gemma 2B e Gemma 7B, os modelos foram filtrados para remover informações sensíveis e passaram por testes de segurança rigorosos, com os resultados publicamente acessíveis;
  • Os modelos Gemma são projetados para serem executados localmente em diversos dispositivos, incluindo IoT, nuvem e dispositivos móveis, com implantação e otimização possíveis para GPUs da Nvidia, além dos TPUs do Google Cloud;
  • O Google permite o uso e distribuição comercial dos modelos Gemma, acompanhado de um Kit de Ferramentas para IA Generativa Responsável, fornecendo orientações, uma ferramenta de depuração de modelos e classificação de segurança.

Segundo a empresa, a “família” Gemma é “construída a partir da mesma pesquisa e tecnologia usada para criar os modelos Gemini”, incluindo componentes técnicos e de infraestrutura. Em termos de nome, é latim para “pedra preciosa”.

Leia mais:

Gemma: a ‘joia’ do Google

Google
(Imagem: Jay Fog/Shutterstock)

A tal “família” está disponível nos tamanhos Gemma 2B e Gemma 7B atualmente, com variantes pré-treinadas e ajustadas. Para o primeiro, o Google filtrou “certas informações pessoais e outros dados sensíveis dos conjuntos de treinamento”. Ele passou por “red teaming [teste de segurança] manual, testes adversariais automatizados e avaliações das capacidades do modelo para atividades perigosas”. Os resultados dos testes estão disponíveis on-line.

publicidade

Além disso, a empresa utilizou um “ajuste fino extensivo e aprendizado por reforço a partir de feedback humano (RLHF)” para alinhar seus modelos ajustados por instrução com “comportamentos responsáveis”, informou a empresa numa postagem em seu blog.

Os modelos Gemma podem ser executados localmente em notebooks e computadores de mesa (desktops). Também são compatíveis com IoT, nuvem e dispositivos móveis. O Google destaca a fácil implantação no Vertex AI e no Google Kubernetes Engine (GKE) e uma parceria que otimiza a Gemma para GPUs da Nvidia além dos TPUs do Google Cloud.

Ainda de acordo com a empresa, a Gemma oferece “desempenho de melhor classe para seus tamanhos em comparação a outros modelos abertos” e “supera modelos significativamente maiores em benchmarks”. O Google disponibilizou o relatório técnico dos modelos Gemma cobrindo desempenho, composição do conjunto de dados e metodologias de modelagem.

Em termos de uso, o Google permite “uso e distribuição comercial responsáveis para todas as organizações, independentemente do tamanho”. A empresa também lançou um Kit de Ferramentas para “IA Generativa Responsável” que inclui orientações, uma ferramenta de depuração de modelos para “investigar o comportamento de Gemma e abordar possíveis questões” e classificação de segurança.