Stability AI lança modelo de geração de música que funciona direto no celular

Imagem: Mehaniq/Shutterstock

A startup Stability AI anunciou o lançamento do Stable Audio Open Small, um modelo de inteligência artificial voltado para a geração de áudio estéreo, projetado para ser extremamente leve, rápido e eficiente.

Segundo a empresa, trata-se do modelo de geração de áudio mais veloz disponível atualmente e capaz de operar diretamente em dispositivos móveis, como smartphones e tablets, sem necessidade de conexão à nuvem.

Desenvolvido em colaboração com a Arm, fabricante de chips amplamente utilizada em dispositivos móveis, o modelo conta com 341 milhões de parâmetros e foi otimizado para CPUs baseadas em arquitetura Arm.

Capacidades do novo modelo da Stability AI

O Stable Audio Open Small consegue gerar até 11 segundos de áudio em menos de 8 segundos, diretamente em um celular, o que representa um avanço importante frente a ferramentas como Suno e Udio, que dependem fortemente de processamento remoto em servidores.
Outro diferencial do novo modelo está em sua origem dos dados de treinamento.
A Stability AI afirma que o Stable Audio Open Small foi treinado exclusivamente com conteúdos livres de royalties, oriundos do Free Music Archive e do Freesound, evitando o uso de obras protegidas por direitos autorais — uma crítica comum aos concorrentes do setor.

Stable Audio Open Small, da Stability AI, usa apenas músicas livres de royalties em seu treinamento – Imagem: rafapress/Shutterstock

Leia mais:

Modelo ainda apresenta limitações

A ferramenta só aceita comandos em inglês, não é capaz de gerar vocais realistas nem músicas completas com alta fidelidade, e tem desempenho desigual entre estilos musicais, reflexo de um viés ocidental presente nos dados de treinamento.

Mesmo com restrições, o lançamento representa um avanço no desenvolvimento de modelos de IA capazes de operar de forma local e acessível, com potencial para impulsionar aplicativos criativos em dispositivos móveis.

Stability AI desafia Suno e Udio com gerador de áudio – Imagem: Zhuravlev Andrey/Shutterstock

Esta post foi modificado pela última vez em 15 de maio de 2025 16:48

Publicado por

Leandro Costa Criscuolo

Tags: Inteligência ArtificialStability AI

15 de maio de 2025 16:48