A Mistral, startup francesa de inteligência artificial, lançou seu primeiro modelo multimodal, o Pixtral 12B, que integra a capacidade de processar tanto imagens quanto texto. Com 12 bilhões de parâmetros e cerca de 24 GB de tamanho, o Pixtral 12B é baseado no modelo de texto da Mistral, o Nemo 12B.
Ele pode lidar com imagens de diferentes tamanhos e formatos, incluindo URLs e imagens codificadas, permitindo a execução de tarefas como legendar imagens e contar objetos em fotos, semelhante a outros modelos multimodais como o Claude da Anthropic e o GPT-4 da OpenAI.
O modelo está disponível para download no GitHub e na plataforma “Hugging Face” sob a licença Apache 2.0, o que permite que seja baixado, ajustado e utilizado sem restrições.
Sophia Yang, chefe de relações com desenvolvedores da Mistral, anunciou que o modelo estará disponível para testes nas plataformas de chatbot e API da Mistral, Le Chat e Le Plateforme, em breve.
Leia mais:
- Microsoft Copilot Pro ou ChatGPT Plus: o que vale mais a pena?
- Big techs firmarão acordo para combater uso da IA em fraudes eleitorais
- Maioria dos brasileiros teme perder empregos para IA, revela pesquisa

Dados usados para treinar o novo modelo não foram divulgados
- A Mistral não revelou quais dados de imagem foram usados no treinamento do Pixtral 12B.
- Modelos de IA generativos, como os da Mistral, são frequentemente treinados em grandes volumes de dados públicos da web, que podem ser protegidos por direitos autorais.
- Embora alguns fornecedores de modelos aleguem que o “uso justo” permite a extração desses dados, muitas disputas legais surgiram sobre o uso de material protegido.
O lançamento do Pixtral 12B ocorre após uma significativa rodada de financiamento de US$ 645 milhões liderada pela General Catalyst, que avaliou a Mistral em US$ 6 bilhões. Com pouco mais de um ano de operação e uma participação minoritária da Microsoft, a Mistral é considerada uma importante resposta europeia à OpenAI.
A empresa tem se concentrado em oferecer modelos “abertos” gratuitos, versões gerenciadas e serviços de consultoria para clientes corporativos.
