Imagem: Mehaniq/Shutterstock
A startup Stability AI anunciou o lançamento do Stable Audio Open Small, um modelo de inteligência artificial voltado para a geração de áudio estéreo, projetado para ser extremamente leve, rápido e eficiente.
Segundo a empresa, trata-se do modelo de geração de áudio mais veloz disponível atualmente e capaz de operar diretamente em dispositivos móveis, como smartphones e tablets, sem necessidade de conexão à nuvem.
Desenvolvido em colaboração com a Arm, fabricante de chips amplamente utilizada em dispositivos móveis, o modelo conta com 341 milhões de parâmetros e foi otimizado para CPUs baseadas em arquitetura Arm.
Leia mais:
A ferramenta só aceita comandos em inglês, não é capaz de gerar vocais realistas nem músicas completas com alta fidelidade, e tem desempenho desigual entre estilos musicais, reflexo de um viés ocidental presente nos dados de treinamento.
Mesmo com restrições, o lançamento representa um avanço no desenvolvimento de modelos de IA capazes de operar de forma local e acessível, com potencial para impulsionar aplicativos criativos em dispositivos móveis.
Esta post foi modificado pela última vez em 15 de maio de 2025 16:48