Siga o Olhar Digital no Google Discover
A xAI, empresa de inteligência artificial (IA) de Elon Musk, adicionou compreensão de imagens ao Grok, chatbot do X (antigo Twitter) – outra empresa de Musk. O bilionário disse, numa postagem na rede social, que a IA agora entende piadas também graças a essa nova capacidade.
Ofertas
Por: R$ 194,99
Por: R$ 28,31
Por: R$ 39,90
Por: R$ 678,90
Por: R$ 2.359,00
Por: R$ 1.998,89
Por: R$ 2.498,89
Por: R$ 491,92
Por: R$ 129,90
Por: R$ 412,69
Por: R$ 592,00
Por: R$ 3.598,94
Por: R$ 369,00
Por: R$ 1.616,02
Por: R$ 3.099,00
Por: R$ 199,00
Por: R$ 166,19
Por: R$ 399,00
Por: R$ 132,00
Por: R$ 473,00
Os usuários pagantes do X, que têm acesso ao Grok, podem fazer upload de imagens no chatbot e, em seguida, fazer perguntas sobre elas. Na postagem em questão, Musk diz que a função ainda está em estágio inicial. Ainda segundo o bilionário, ela vai “melhorar rapidamente“.
Além de imagens, Grok vai entender documentos em breve, segundo Elon Musk
Um usuário reclamou, na rede social, que o Grok não entende alguns tipos de arquivo – por exemplo, PDFs. “Não por muito tempo“, respondeu Musk. “Estamos terminando em meses o que levou anos para todos os outros“, acrescentou.

Em agosto, a empresa de IA de Musk lançou o modelo Grok-2, versão aprimorada do chatbot que gerava imagens (caóticas, diga-se) usando o modelo FLUX.1 da Black Forest Labs. Como costuma ser nos negócios de Musk, o Grok-2 foi disponibilizado apenas para desenvolvedores e usuários pagantes do X.
- Na época, a xAI disse que uma futura versão adicionaria compreensão multimodal ao Grok no X e ao modelo que oferece por meio da API para desenvolvedores, segundo o TechCrunch.
A empresa de IA de Musk trabalha para melhorar as capacidades do Grok. “No entanto, isso ainda não impediu que o Grok fornecesse informações enganosas sobre a eleição presidencial [dos EUA]“, pondera o Engadget. “Por enquanto, é melhor abordar a IA preferida de Musk com uma boa dose de ceticismo.“
Leia mais:
- Opera para Android lança Aria com compreensão de imagens e sem login
- O que é e como funciona a Aria, a inteligência artificial nativa dos navegadores Opera
- Real ou deepfake? Veja como identificar se uma imagem foi gerada por inteligência artificial
Nova IA da Meta cria podcasts a partir de texto
Enquanto o Grok explica imagens e piadas, o NotebookLlama, da Meta, gera podcasts a partir de texto. É a resposta da big tech ao NotebookLM, do Google (que faz essencialmente o mesmo).

Primeiro, a IA cria uma transcrição de um arquivo — por exemplo, um PDF de um artigo, notícias ou uma postagem de um site. Então, adiciona “dramatização” e interrupções na transcrição para adaptar o texto para fala.
Saiba mais sobre a nova IA da Meta nesta matéria do Olhar Digital.