Nova DeepSeek? Alibaba lança IA “boa, bonita e barata”

A Alibaba anunciou uma nova IA que promete bater de frente com as líderes do setor. E o mercado reagiu muito bem à novidade
Por Bruno Capozzi, editado por Rodrigo Mozelli 06/03/2025 11h02, atualizada em 08/03/2025 10h01
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

A Alibaba apresentou nesta quinta-feira (6) um novo modelo de inteligência artificial: o QwQ-32B. E a empresa está otimista. Segundo o anúncio, feito no X, a tecnologia compete de igual para igual com a DeepSeek, que sacudiu o mercado no começo deste ano.

Notícias empolgantes! Hoje, lançamos o QwQ-32B, nosso novo modelo de raciocínio com apenas 32 bilhões de parâmetros, oferecendo desempenho comparável a outros modelos de ponta maiores. Explore-o e compartilhe suas ideias conosco! Vamos impulsionar a inovação juntos! #OpenSource #Qwen

Alibaba, nas redes sociais

A Alibaba repostou ainda uma postagem do braço de IA da empresa, a Qwen: “Hoje, lançamos o QwQ-32B, nosso novo modelo de raciocínio com apenas 32 bilhões de parâmetros, que rivaliza com modelos de ponta, como o DeepSeek-R1”.

Na sequência, um gráfico mostra uma série de comparações de desempenho em relação a outras IAs de ponta, como o o1-mini, da OpenAI, e o DeepSeek-R1 original. Os testes envolvem raciocínio matemático, codificação e capacidade para resolver problemas.

Em uma IA, menos parâmetros pode ser sinônimo de mais eficiência.

Depois doo anúncio, as ações da Alibaba chegaram a subir 8,4%, atingindo uma máxima desde o final de 2021.

Alibaba anuncia que está trabalhando em chatbot para rivalizar com a OpenAI
Será que vem uma nova DeepSeek por aí? Imagem: Ascannio/Shutterstock

O segredo da tecnologia

Segundo o comunicado do blog da Qwen, a equipe seguiu a mesma metodologia usada pela DeepSeek e teve grande sucesso.

O Scaling Reinforcement Learning (RL) tem o potencial de aprimorar o desempenho do modelo além dos métodos convencionais de pré-treinamento e pós-treinamento. Estudos recentes demonstraram que o RL pode melhorar significativamente as capacidades de raciocínio dos modelos. Por exemplo, o DeepSeek R1 atingiu desempenho de ponta ao integrar dados de inicialização a frio e treinamento em vários estágios, permitindo pensamento profundo e raciocínio complexo. Nossa pesquisa explora o RL e seu impacto no aprimoramento da inteligência de grandes modelos de linguagem. 

Qwen, da Alibaba, em comunicado

Traduzindo: nesse modo de “se fazer uma IA”, combina-se raciocínio de cadeia de pensamento com aprendizado por reforço. Um agente autônomo aprende a executar uma tarefa por tentativa e erro e sem nenhuma instrução de um usuário humano.

“Esses avanços não apenas demonstram o potencial transformador do RL, mas também abrem caminho para mais inovações na busca da inteligência artificial geral“- concluiu a Qwen.

O especialista em tecnologia e inovação, Arthur Igreja, explanou ao Olhar Digital como a tecnologia do Alibaba é chega para bater de frente com o DeepSeek:

Quando comparamos o número de parâmetros [do Alibaba com o DeepSeek], é uma comparação de quase 21 para um, então é 20,96 em relação à DeepSeek. E por que é importante enfatizar isso? Porque a DeepSeek, o grande salto que deram, foi, justamente, trazer um modelo de treinamento muito mais enxuto, mais eficiente, com menos parâmetros e com aprendizado ao longo da rota de aprendizado.

Arthur Igreja, especialista em tecnologia e inovação, em entrevista ao Olhar Digital

Igreja também pontuou sobre a quebra de paradigma na corrida das IAs com a concorrência das duas tecnologias emergentes.

O que chama a atenção é que, até então, estávamos numa corrida do modelo mais poderoso, do maior modelo, do modelo com mais parâmetros. E, agora, começamos a ver primeiro com o DeepSeek e, agora, o próprio DeepSeek enfrentando essa concorrência interessantíssima do Alibaba, numa busca por otimização e eficiência. É como se tivéssemos uma primeira fase de expansão e uma segunda de otimização.

Agora a IA generativa busca por estratégias otimizadas durante o processo de aprendizado e por consequência menos dependência de GPUs e até de investimento bruto. É impressionante também o efeito nas ações do Alibaba e nos próximos dias podemos analisar como o mercado repercute a esse avanço.

Arthur Igreja, especialista em tecnologia e inovação, em entrevista ao Olhar Digital

“O que estamos vendo dos modelos chineses é uma otimização nas duas pontas. Número de parâmetros, investimento para treinamento, dependência de recursos, seja hardware, software, energia. Porque a generativa basicamente está se tornando uma corrida”, prosseguiu o especialista.

Sobre as acusações recentes em cima das IAs chinesas e supostas respostas falsas, bem como supervalorização do custo da tecnologia, Igreja entende que pode não ser bem assim.

Temos um histórico de milagres industriais chineses que, depois, ficaram comprovados que não era bem isso. A própria DeepSeek tem toda uma polêmica em relação a usar o próprio modelo da OpenAI, quase como um aprendizado reverso, uma engenharia reversa, ou seja, não é que se está gastando exatamente aquele recurso que é tão menor, porque está se amparando em modelos que tiveram investimentos maiores e o aprendizado vem deles.

Grande parte dessas empresas começou a usar uma estratégia que é diferente, como o caso da DeepSeek, que são os modelos abertos. Por isso que, mesmo que o número não seja aquele, em relação ao custo do treinamento e tudo mais, bom, de toda forma, são modelos de código aberto, então, podem ser testados.

Arthur Igreja, especialista em tecnologia e inovação, em entrevista ao Olhar Digital

Por fim, o especialista destacou que a IA da Alibaba apimenta bastante a corrida das IAs. “[A IA da Alibaba] apimenta e muito. É mais um competidor chinês batendo de frente com o que seria a empresa que chamou a atenção do mundo inteiro, que foi a DeepSeek. Estamos vendo não só mais empresas, mas elas batendo recordes de eficiência. As grandes têm uma série de respostas para dar. Do ponto de vista de por que usam tanto recurso, por que usam tantos parâmetros. É uma competição não só geopolítica, mas de mercado”, concluiu.

Como faço para testar as IAs da Alibaba?

Os chatbots da Qwen estão disponíveis no site da empresa. É só clicar aqui!

Bruno Capozzi é jornalista formado pela Faculdade Cásper Líbero e mestre em Ciências Sociais pela PUC-SP, tendo como foco a pesquisa de redes sociais e tecnologia.

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.