DeepSeek revela quanto gastou para treinar seu modelo de IA

Esta é a primeira vez que a startup chinesa divulga uma estimativa sobre os custos de treinamento de seu modelo de IA R1
Alessandro Di Lorenzo18/09/2025 11h14
Logo do DeepSeek na tela de um smartphone
(Imagem: Mojahid Mottakin/Shutterstock)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

No início deste ano, a chinesa DeepSeek provocou um verdadeiro alvoroço global ao lançar o seu próprio modelo de inteligência artificial. O grande diferencial foi o custo extremamente baixo para treinar a ferramenta.

O caso motivou grandes questionamentos sobre as capacidade tecnológicas da China em meio à disputa com os Estados Unidos. Agora, a startup revelou o quanto realmente foi gasto no processo, o que pode reacender as discussões sobre o tema.

Ao fundo, bandeira da China; à frente, logo da DeepSeek em um smartphone
DeepSeek revelou informações sobre o treinamento do modelo R1 (Imagem: Rokas Tenys/Shutterstock)

Valor é muito menor do que o gasto por concorrentes

Segundo reportagem da Reuters, foram gastos apenas US$ 294 mil (cerca de R$ 1,5 milhão) para treinar o modelo R1 da chinesa DeepSeek. O valor é muito abaixo do gasto por empresas concorrentes. No caso do ChatGPT, o CEO da OpenAI, Sam Altman, declarou que o modelo de IA custou mais de US$ 100 milhões.

Esta é a primeira vez que a startup com sede em Hangzhou divulga uma estimativa sobre os custos de treinamento de sua inteligência artificial. Ela ainda afirmou que foram usados 512 chips Nvidia H800 para desenvolver o modelo R1.

Ilustração digital de chip da Nvidia
Startup chinesa confirmou que usou chips da Nvidia (Imagem: Nor Gal/Shutterstock)

Estes dispositivos foram projetados especificamente para o mercado chinês depois que o governo dos EUA tornou ilegal, em outubro de 2022, a venda de versões H100 e A100 AI para a China. Estes são chips considerados mais poderosos. Essas informações mostram que, apesar dos esforços da Casa Branca, Pequim conseguiu contornar as sanções e continuar avançando tecnologicamente.

Leia mais

Ícones dos aplicativos do ChatGPT e do DeepSeek na tela inicial de iPhone
DeepSeek virou um dos principais concorrentes do ChatGPT (Imagem: Poetra.RH/Shutterstock)

Lançamento do DeepSeek foi um marco

  • A IA do DeepSeek foi projetada para lidar com tarefas complexas de raciocínio e tem apresentado resultados surpreendentes.
  • O grande diferencial é o baixo custo da tecnologia, o que pode ameaçar a posição dominante dos principais players.
  • Para se ter uma ideia, o modelo chinês foi treinado ao custo de aproximadamente US$ 6 milhões, enquanto ferramentas como o Llama 3.1, da Meta, custaram mais de US$ 60 milhões para serem desenvolvidos.
  • A empresa chinesa adota estratégias como o chamado aprendizado por reforço, que permite que os modelos aprendam por tentativa e erro.
  • Além disso, ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.
  • E melhora a capacidade dos modelos de processar dados e identificar padrões complexos.
  • A startup ainda adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos.
  • Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.
Alessandro Di Lorenzo
Colaboração para o Olhar Digital

Alessandro Di Lorenzo é formado em Jornalismo pela Universidade Federal do Rio Grande do Sul (UFRGS) e atua na área desde 2014. Trabalhou nas redações da BandNews FM em Porto Alegre e em São Paulo.