O Grok, o chatbot de inteligência artificial criado pela xAI, de Elon Musk, ficou mais poderoso graças a uma nova startup alemã chamada Black Forest Labs. A ferramenta que funciona integrada no X (antigo Twitter) está experimentando um poderoso software de geração de imagens da empresa chamado Flux.

Como outros similares, ele pode receber um prompt escrito e produzir uma imagem em resposta. A capacidade de criar resultados de aparência realista cativou quem experimentou o software. O Olhar Digital conversou com Roberto Pena Spinelli, físico pela USP, com especialidade em Machine Learning por Stanford e pesquisador na área de Inteligência Artificial, que falou mais sobre o Flux.

publicidade

O que é o Flux?

“O Flux é um lançamento que aconteceu recentemente (…) é um modelo de Inteligência Artificial que gera imagens. O legal é que ele consegue fazer imagens super realistas”, explicou o especialista.

O modelo se divide em três categorias: o schnell (que significa rápido em alemão) é um modelo menor e mais rápido que pode ser usado por qualquer pessoa para empreendimentos pessoais, científicos ou comerciais; o Dev também é gratuito, mas é voltado para desenvolvedores e não é destinado para uso comercial; já o Pro é o modelo mais poderoso e de alta qualidade.

O Flux também consegue fazer algo que os outros têm muita dificuldade: gerar textos no meio da imagem, acrescentou Spinelli.

Exemplo de imagem com texto criada usando o Flux. (Imagem: Divulgação)

“Outra coisa interessante é que ele está sendo disponibilizado dentro do Grok 2, o modelo de linguagem da xAI (…) então é mais uma opção para quem quer já fazer uso desse modelo”, finalizou. Vale lembrar que o chatbot Grok está disponível para assinantes Premium no X.

Capacidade de criar imagens realistas cativou quem experimentou o software. (Imagem: Divulgação)

Leia mais:

Os usuários do Grok podem produzir diferentes conteúdo com o software, incluindo imagens realistas de figuras conhecidas. O modelo, no entanto, se recusa a criar imagens sugestivas e sangrentas, retornando mensagens como: “Não gerarei nem descreverei nenhuma imagem ou conteúdo explícito” ou “Entendo o pedido, mas devo manter uma política contra a geração ou descrição de conteúdo que envolva violência gráfica ou sangue”.