Pesquisadores dos EUA criam IA por menos de US$ 50

Cálculos passaram pelo processo de “ajuste fino supervisionado”, método mais barato de aprendizado por reforço em larga escala
Por Bruna Barone, editado por Ana Luiza Figueiredo 06/02/2025 18h54
iStock-2012883461-1920x1080
IA foi treinada por processo conhecido como "destilação" (Imagem: WANAN YOSSINGKUM/iStock)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Contrariando as expectativas de investimentos milionários, um modelo de inteligência artificial foi treinado por menos de US$ 50 (R$ 288 pela cotação atual) por pesquisadores das Universidades de Stanford e de Washington, nos Estados Unidos

Conhecido como s1, o modelo é baseado em computação em nuvem e apresentou desempenho semelhante ao o1 da OpenAI e o R1 da DeepSeek nos testes de habilidades matemáticas e de cálculo. As informações são do site Tech Crunch.

A nova tecnologia utilizou o mesmo processo adotado no mês passado por pesquisadores da universidade de Berkeley, que criaram o Sky-T1 — um modelo de cálculo de IA — por cerca de US$ 450 (R$ 2,5 mil).

Vista aérea da Universidade de Stanford, na Califórnia (Imagem: Wirestock/iStock)

Leia Mais:

Uma IA imitando outra IA?

O protótipo foi feito a partir de um sistema do laboratório chinês de IA Qwen, de propriedade do Alibaba, que pode ser acessado gratuitamente na internet. Foram usados dados de mais de 1.000 perguntas e respostas disponíveis no Gemini 2.0 Flash Thinking, a IA experimental do Google.

A ferramenta da big tech está disponível de forma gratuita, mas a empresa não permite engenharia reversa para criar serviços com a IA. A reportagem do Tech Crunch procurou o Google para comentar o projeto dos pesquisadores, mas ainda não recebeu um retorno.

gemini 2.0
IA do Google foi usada para fornecer dados em novo modelo (Imagem: FilipArtLab / Shutterstock.com)

A técnica é conhecida como “destilação”, um processo que extrai as capacidades de “raciocínio” de outro modelo de IA por meio do treinamento em suas respostas. Além disso, os cálculos passaram por um “ajuste fino supervisionado” — ou SFT —, um método mais barato de aprendizado por reforço em larga escala.

Os autores explicam que o modelo ficou pronto em menos de 30 minutos usando 16 GPUs Nvidia H100. O sistema foi ensinado a “esperar” antes de concluir os pensamentos, o que permitiu uma espécie de verificação duplicada e respostas mais precisas, segundo o artigo. Os dados usados estão disponíveis no GitHub.

Bruna Barone
Colaboração para o Olhar Digital

Bruna Barone é formada em Jornalismo pela Faculdade Cásper Líbero. Atuou como editora, repórter e apresentadora na Rádio BandNews FM por 10 anos. Atualmente, é colaboradora no Olhar Digital.

Ana Luiza Figueiredo é repórter do Olhar Digital. Formada em Jornalismo pela Universidade Federal de Uberlândia (UFU), foi Roteirista na Blues Content, criando conteúdos para TV e internet.