A mais recente pesquisa da Apple sobre a execução de grandes modelos de linguagem em smartphones indica claramente que a empresa planeja alcançar seus concorrentes do Vale do Silício em inteligência artificial (IA) generativa.

O estudo, intitulado “LLM em Flash”, apresenta solução para o gargalo computacional atual, abrindo caminho para inferência eficaz de LLMs em dispositivos com memória limitada.

publicidade

Leia mais:

A inferência refere-se à forma como os modelos de linguagem respondem às consultas dos usuários. Normalmente, chatbots e LLMs são executados em data centers com muito mais poder de computação do que um iPhone.

publicidade
  • Conforme o Financial Times, a Apple está buscando trazer recursos de IA para seus dispositivos diretamente, ao contrário de seus concorrentes, que oferecem esses serviços por meio de plataformas de computação em nuvem;
  • Esse foco em IA em dispositivos móveis busca reviver o mercado de smartphones e impulsionar as vendas, que diminuíram aproximadamente 5% no último ano;
  • A Apple tem sido considerada atrasada em relação aos seus concorrentes no campo de IA generativa, apesar de ter lançado a assistente virtual Siri em 2011;
  • A contratação de John Giannandrea, ex-executivo do Google, em 2018, também não foi o suficiente para colocar a Apple no mesmo patamar de seus rivais do Vale do Silício.

Nosso trabalho não apenas fornece solução para gargalo computacional atual, mas também abre precedente para pesquisas futuras. Acreditamos que, à medida que os LLMs continuam a crescer em tamanho e complexidade, abordagens, como este trabalho, serão essenciais para aproveitar todo o seu potencial em ampla gama de dispositivos e aplicações.

Pesquisadores da Apple em artigo

O artigo foi publicado em 12 de dezembro, mas chamou mais atenção depois que o Hugging Face o destacou na noite desta quarta-feira (20). É o segundo artigo da Apple sobre IA generativa este mês e segue medidas anteriores para permitir que modelos de geração de imagens, como o Stable Diffusion, sejam executados em seus chips personalizados.

Concorrência

Embora Microsoft e Google tenham se concentrado principalmente no fornecimento de chatbots e outros serviços generativos de IA pela Internet a partir de suas vastas plataformas de computação em nuvem, a pesquisa da Apple sugere que ela se concentrará em IA que pode ser executada diretamente em um iPhone.

publicidade

Rivais da empresa da maçã, como a Samsung, estão se preparando para lançar novo tipo de “smartphone da IA” já em 2024. O Google, por sua vez, este mês, revelou versão de seu novo Gemini LLM, que rodará “nativamente” em seus smartphones Pixel.

Já o presidente-executivo da Qualcomm, Cristiano Amon, prevê que levar a IA aos smartphones criaria experiência totalmente nova para os consumidores e reverteria o declínio nas vendas de dispositivos móveis.

publicidade

Veremos dispositivos sendo lançados no início de 2024 com uma série de casos de uso generativos de IA. À medida que essas coisas são ampliadas, elas começam a fazer mudança significativa na experiência do usuário e permitem novas inovações que têm potencial de criar novo ciclo de atualização em smartphones.

Cristiano Amon, presidente-executivo da Qualcomm, em entrevista recente ao Financial Times

A Counterpoint estimou que mais de 100 milhões de smartphones focados em IA serão vendidos em 2024, com 40% dos novos dispositivos oferecendo tais capacidades até 2027.