Apple e Nvidia unem forças para acelerar desempenho de modelos de IA

Parceria entre as empresas foca na melhoria da eficiência e redução da latência em modelos de linguagem grande
Leandro Costa Criscuolo20/12/2024 06h12, atualizada em 20/12/2024 21h29
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

A Apple confirmou que firmou uma parceria com a Nvidia para melhorar o desempenho de modelos de inteligência artificial (IA), focando em aumentar a velocidade e a eficiência enquanto reduz a latência.

A colaboração se concentra na otimização de modelos de linguagem grande (LLM), e a Apple aplicou uma técnica chamada Recurrent Drafter (ReDrafter), que foi divulgada publicamente no início deste ano.

Essa técnica foi combinada com a estrutura de aceleração de inferência Nvidia TensorRT-LLM para aprimorar os resultados.

Leia mais:

Logo da Nvidia
Otimização dos modelos de linguagem tem a tecnologia das duas empresas e utiliza a técnica ReDrafter (Imagem: JRdes/Shutterstock)

Inferência em IA

  • A inferência em IA é o processo de fazer previsões ou decisões com base em um conjunto de dados, sendo uma etapa crucial no processamento de modelos de IA.
  • A técnica ReDrafter utiliza uma rede neural recorrente (RNN) e combina pesquisa de feixe com atenção dinâmica de árvore, acelerando a geração de tokens em até 3,5 tokens por etapa de geração.
  • Embora a Apple tenha observado algumas melhorias de desempenho, não houve um aumento significativo de velocidade até a integração com a plataforma da Nvidia.

Como parte da colaboração, a Nvidia adicionou novos operadores à sua plataforma, resultando em uma aceleração de 2,7 vezes na geração de tokens por segundo durante o processo de decodificação gananciosa.

A Apple destacou que essa tecnologia não só melhora a velocidade, mas também permite reduzir a latência, o consumo de energia e o uso de GPUs, tornando o processamento de IA mais eficiente e sustentável.

apple
Modelo deve garantir sustentabilidade, com uma IA que consome menos energia e atua mais rápido – Imagem: maodoltee/Shutterstock
Leandro Costa Criscuolo
Colaboração para o Olhar Digital

Leandro Criscuolo é jornalista formado pela Faculdade Cásper Líbero. Já atuou como copywriter, analista de marketing digital e gestor de redes sociais. Atualmente, escreve para o Olhar Digital.

Ícone tagsTags: