Siga o Olhar Digital no Google Discover
Os sistemas de inteligência artificial do Google estão cada vez mais inteligentes. Nesta semana, pequisadores da empresa afirmaram que conseguiram ensinar os computadores a detectar quem é a pessoa mais importante de uma imagem. Além disso, os sistemas também detectar partes individuais do corpo e descrever aquilo que estão vendo, em uma linguagem tão boa quanto a humana.
Ofertas
Por: R$ 26,90
Por: R$ 49,80
Por: R$ 194,99
Por: R$ 28,31
Por: R$ 35,90
Por: R$ 499,90
Por: R$ 144,90
Por: R$ 412,69
Por: R$ 592,00
Por: R$ 3.598,94
Por: R$ 499,00
Por: R$ 369,00
Por: R$ 1.616,02
Por: R$ 3.099,00
Por: R$ 199,00
Por: R$ 166,19
Por: R$ 588,90
Por: R$ 139,99
Por: R$ 473,00
A primeira habilidade, desenvolvida em colaboração com a universidade de Stanford, foi testada em fotos de jogos de basquete, que contém dezenas ou até centenas de pessoas. O sistema de controle de visão usa uma rede neural para criar uma “máscara de atenção”, controlando a relevância de cada objeto ou pessoa.
Depois de alguns treinos, o sistema é capaz de reconhecer não só o ator mais importante da cena, como os potenciais atores importantes e os eventos a eles associados.
Os pesquisadores criaram, em parceria com a universidade de Edimburgo, um sistema para identificar partes separadas de uma imagem. Nos testes, o sistema foi treinado para detectar as pernas de tigres mesmo quando elas se movimentam de maneiras diferentes e separadamente.
Na prática, isso significa que em breve os computadores poderão rastrear partes individuais de determinada pessoa, o que pode, por exemplo, ajudar a identificar criminosos apenas por partes de seu corpo.
A terceira novidade é uma capacidade que já conhecemos. Há algum tempo os sistemas já conseguem classificar aquilo que enxergam: uma pessoa, um carro, um vaso. Apesar da tecnologia já existir, nem sempre ela é exata.
O novo trabalho, em parceria com a UCL, permite que o computador identifique os objetos de maneira mais detalhada. Algo como “o homem que toma o sorvete vermelho está se sentando”.
Para isso, o computador procura descrições disponíveis para os objetos existentes na cena e encontra uma combinação deles.
Via TechCrunch