A Cerebras Systems, empresa norte-americana de inteligência artificial, apresentou o chip de IA mais rápido do mundo: Wafer Scale Engine 3 (WSE-3), que alimenta o supercomputador de IA Cerebras CS-3 capaz de executar 900 mil núcleos de IA e 44 GB de SRAM (Static Random Acess Memory, ou memória estática de acesso aleatório — modelo de memória com o processo RAM) no chip, fornecendo até 125 petaFLOPS (medida de velocidade de processamento) de desempenho máximo de IA.

Entenda:

publicidade
  • A Cerebras Systems, empresa norte-americana de inteligência artificial, apresentou o Wafer Scale Engine 3 (WSE-3), novo chip de IA mais rápido do mundo;
  • O WSE-3 alimenta o supercomputador de IA Cerebras CS-3, que pode executar 900 mil núcleos de IA e 44 GB de SRAM no chip com até 125 petaFLOPS de desempenho máximo;
  • O chip possui quatro trilhões de transistores e tamanho aproximado de uma caixa de pizza;
  • Graças ao processo de produção de wafer dos chips WSE-3, o CS-3 consegue treinar modelos de IA envolvendo até 24 trilhões de parâmetros e obter maior escalabilidade, alcançando uma capacidade de até 256 exaFLOPS.

Com quatro trilhões de transistores, o novo modelo é capaz de proporcionar o dobro de desempenho do chip anterior da empresa com o mesmo custo e consumo de energia, fornecendo uma performance comparável a uma sala cheia de servidores com uma única unidade que possui o tamanho aproximado de uma caixa de pizza.

Leia mais:

Novo chip da Cerebras agiliza processos de IA

Supercomputador da Cerebras
Supercomputador da Cerberas. (Imagem: Cerebras Systems / Divulgação)

As opções de memória externa do chip incluem 1,5 TB, 12 TB ou 1,2 petabytes (PB) – que equivalem a 1.200 TB. De acordo com a empresa, o CS-3 pode treinar modelos de IA envolvendo até 24 trilhões de parâmetros – ou seja, um modelo de um trilhão de parâmetros poderia ser treinado tão facilmente quanto os atuais computadores baseados em GPU treinam um modelo de um bilhão de parâmetros.

O processo de produção de wafer dos chips WSE-3 permite que o CS-3 possua uma maior escalabilidade, agrupando até 2.048 unidades em um supercomputador quase insondável – o que possibilita uma capacidade de até 256 exaFLOPS, sendo que os principais supercomputadores do mundo atualmente alcançam pouco mais de um exaFLOP.