Avançando em seus planos de adicionar ao Grok, inteligência artificial (IA) de Elon Musk, a capacidade de processar imagens, a xAI revelou em documentos púbicos de desenvolvimento que os usuários poderão agora fazer upload de fotos para o chatbot e receber respostas em texto, consolidando o programa como um sistema multimodal. 

O que você precisa saber: 

publicidade
  • Musk anunciou, em março, uma nova versão de sua IA, o Grok 1.5; 
  • O chatbot ganhou diversas melhorias, entre elas a capacidade de processar imagens; 
  • O modelo, considerado agora multimodal, suporta, além de textos, “documentos, diagramas, gráficos, capturas de tela e até fotografias”; 
  • Disponível apenas paga assinantes do X Premium Plus, essa é a atualização mais recente e significativa do Grok; 
  • O último update aconteceu com a chegada do Grok 1.5, quando a IA ganhou recursos aprimorados. 

Leia mais! 

O anúncio da xAI chega após eventos do Google e OpenAI com diversas novidades relacionadas à IA, como o GPT-4o, o que deve ter acelerado a equipe de desenvolvimento da startup. Vale pontuar que, no que diz respeito a tecnologia, a empresa de Musk ainda fica atrás das companhias, embora esteja diminuindo essa distância — tudo indica que os chatbots de conversação multimodais serão a próxima fronteira para a IA. 

publicidade

De acordo com comunicado do X sobre o Grok 1.5, o modelo é treinado “em uma variedade de dados de texto de fontes publicamente disponíveis na Internet até o terceiro trimestre de 2023 e conjuntos de dados revisados e selecionados por humanos”. O programa também está diminuindo a lacuna com o GPT-4 em vários marcadores.