Uma equipe de pesquisadores da Apple desenvolveu novo modelo de inteligência artificial (IA) chamado MLLM-Guided Image Editing (MGIE), que permite uma série de edições avançadas em fotos.

O MGIE foi projetado em parceria com a Universidade da Califórnia (EUA), sendo uma das primeiras iniciativas públicas de IA “moderna” da Apple.

Leia mais:

O diferencial do MGIE está em sua alta capacidade de interpretação, permitindo que ele compreenda e execute qualquer pedido do usuário, mesmo que não seja tecnicamente descrito.

publicidade

Interpretação avançada de solicitações

  • O modelo combina dois diferentes modelos de linguagem multimodal, possibilitando interpretar solicitações e “desvendar” o que a pessoa tem em mente para a edição da foto;
  • Exemplos de solicitações que o MGIE pode interpretar são: tornar o céu mais azul em foto aumentando o brilho, ou deixar uma foto de pizza de calabresa mais saudável substituindo a carne por uma cobertura de legumes e vegetais;
  • Caso o resultado não seja o desejado, o usuário pode solicitar nova interpretação, permitindo que a IA faça outras edições na imagem;
  • A Apple destaca a importância de comandos claros e detalhados para que as edições se aproximem o máximo possível do resultado esperado.

Onde baixar o MGIE

O MGIE já está disponível para download no GitHub neste link e no Hugging Face aqui, abrindo espaço para especulações sobre sua aplicação em produtos da Apple, como o iOS 18, iPhone 16 e Apple Vision Pro. Contudo, nada foi confirmado (nem negado) pela empresa da maçã.