A Cerebras Systems, empresa norte-americana de inteligência artificial, apresentou o chip de IA mais rápido do mundo: Wafer Scale Engine 3 (WSE-3), que alimenta o supercomputador de IA Cerebras CS-3 capaz de executar 900 mil núcleos de IA e 44 GB de SRAM (Static Random Acess Memory, ou memória estática de acesso aleatório — modelo de memória com o processo RAM) no chip, fornecendo até 125 petaFLOPS (medida de velocidade de processamento) de desempenho máximo de IA.
Entenda:
- A Cerebras Systems, empresa norte-americana de inteligência artificial, apresentou o Wafer Scale Engine 3 (WSE-3), novo chip de IA mais rápido do mundo;
- O WSE-3 alimenta o supercomputador de IA Cerebras CS-3, que pode executar 900 mil núcleos de IA e 44 GB de SRAM no chip com até 125 petaFLOPS de desempenho máximo;
- O chip possui quatro trilhões de transistores e tamanho aproximado de uma caixa de pizza;
- Graças ao processo de produção de wafer dos chips WSE-3, o CS-3 consegue treinar modelos de IA envolvendo até 24 trilhões de parâmetros e obter maior escalabilidade, alcançando uma capacidade de até 256 exaFLOPS.
Com quatro trilhões de transistores, o novo modelo é capaz de proporcionar o dobro de desempenho do chip anterior da empresa com o mesmo custo e consumo de energia, fornecendo uma performance comparável a uma sala cheia de servidores com uma única unidade que possui o tamanho aproximado de uma caixa de pizza.
Leia mais:
- Nvidia revela chip “mais poderoso” para IAs; conheça
- Nvidia lança plataforma para ‘alimentar’ robôs humanoides com IA
- Segurança dos EUA testa IA em várias frentes em parceria com desenvolvedoras
Novo chip da Cerebras agiliza processos de IA
As opções de memória externa do chip incluem 1,5 TB, 12 TB ou 1,2 petabytes (PB) – que equivalem a 1.200 TB. De acordo com a empresa, o CS-3 pode treinar modelos de IA envolvendo até 24 trilhões de parâmetros – ou seja, um modelo de um trilhão de parâmetros poderia ser treinado tão facilmente quanto os atuais computadores baseados em GPU treinam um modelo de um bilhão de parâmetros.
O processo de produção de wafer dos chips WSE-3 permite que o CS-3 possua uma maior escalabilidade, agrupando até 2.048 unidades em um supercomputador quase insondável – o que possibilita uma capacidade de até 256 exaFLOPS, sendo que os principais supercomputadores do mundo atualmente alcançam pouco mais de um exaFLOP.