O Google lançou um recurso para o Google Fotos chamado “Ask Photos” (“Pergunte ao Fotos”, em tradução livre) durante a abertura do Google I/O 2024, na tarde desta terça-feira (14). Esta funcionalidade, alimentada pelo Gemini (IA do Google), permitirá aos usuários pesquisar em “linguagem natural” no aplicativo. 

Google Fotos ganha pesquisa com IA (e otras cositas más)

  • Durante o Google I/O 2024, o Google introduziu o “Ask Photos”, um recurso de pesquisa em linguagem natural no Google Fotos, alimentado pela IA Gemini, que promete tornar as pesquisas mais intuitivas e menos manuais;
  • O “Ask Photos” permite buscas complexas, como encontrar a “melhor foto de cada Parque Nacional visitado”, analisando fatores como iluminação, nitidez, geolocalização e datas para identificar as fotos relevantes. Isso se baseia na funcionalidade “Photo Stacks”, que agrupa fotos quase duplicadas e destaca as melhores;
  • O recurso pode responder a perguntas detalhadas sobre eventos, como temas de festas de aniversário, utilizando as capacidades multimodais da IA para analisar textos nas fotos e fornecer respostas precisas. Ele também ajuda a gerar legendas para imagens, inicialmente com resumos básicos;
  • O “Ask Photos” será lançado primeiro em inglês nos Estados Unidos. O Google garante que os dados pessoais dos usuários não serão usados para anúncios ou para treinar outros produtos de IA generativa, priorizando a privacidade e segurança dos usuários.

O “Ask Photos” representa um avanço em relação à pesquisa tradicional – separada nas categorias pessoas, lugares ou coisas. Na prática, o novo recurso pode deixar as pesquisas mais intuitivas e menos manuais.

publicidade

Leia mais:

‘Ask Photos’ consegue responder solicitações complexas, diz CEO

Montagem com capturas de tela de recurso Ask Photos do Google Fotos
(Imagem: Google)

Durante o evento, o CEO do Google, Sundar Pichai, afirmou que, por meio do “Ask Photos”, os usuários poderão realizar buscas complexas, como solicitar a “melhor foto de cada um dos Parques Nacionais que visitei”. 

publicidade

No caso usado como exemplo, o sistema empregaria inteligência artificial para analisar fatores como iluminação e nitidez, e utilizaria metadados como geolocalização e datas para identificar as fotos relevantes.

O recurso “Ask Photos” se baseia na funcionalidade recentemente lançada, Photo Stacks, que agrupa fotos quase duplicadas e destaca as melhores de um conjunto. Com mais de seis bilhões de imagens sendo carregadas diariamente no Google Fotos, a nova ferramenta promete ajudar os usuários a gerenciar e encontrar conteúdo desejado mais facilmente em suas coleções de imagens.

publicidade
gemini
(Imagem: rafapress/Shutterstock)

Além de identificar as melhores fotos de eventos ou viagens, o “Ask Photos” possibilita perguntas que requerem um entendimento mais profundo do conteúdo das fotos. Por exemplo, um usuário pode perguntar sobre os temas das últimas quatro festas de aniversário de seu filho, e o sistema pode responder prontamente com detalhes visuais e textuais relevantes, segundo a empresa.

Esta capacidade de entender consultas complexas é possível porque o Google Fotos não apenas reconhece palavras-chave, mas também compreende conceitos de linguagem natural e contextos específicos. Ele também se beneficia das capacidades multimodais da IA, que podem analisar textos presentes nas fotos para fornecer respostas mais precisas.

publicidade

Google Fotos também vai gerar sugestões de legendas

(Imagem: sdx15/Shutterstock)

Além de organizar e responder a consultas sobre o conteúdo das fotos, o “Ask Photos” ajudará os usuários a gerar legendas para imagens. Atualmente, o sistema oferece apenas resumos básicos, mas o suporte do modelo Gemini IA sugere que futuramente poderá adaptar-se a estilos de resposta mais variados.

O recurso “Ask Photos” será inicialmente lançado apenas em inglês e nos Estados Unidos, operando como uma interação baseada em texto semelhante a um chatbot de IA. 

O Google enfatizou que os dados pessoais dos usuários no Google Fotos não serão usados para anúncios, nem para treinar outros produtos de IA generativa. A privacidade e segurança dos usuários são prioridades, com garantias de que as interações com a IA serão protegidas e revisadas apenas em circunstâncias excepcionais para prevenir abusos, segundo a empresa.