Microsoft cria inteligência artificial que rastreia olhar e funciona em qualquer câmera

Objetivo da tecnologia é facilitar a inclusão de pessoas com dificuldades motoras, que, hoje, despendem milhares de dólares em recursos similares, mas que apresentam falhas
Rafael Arbulu22/10/2020 14h52, atualizada em 22/10/2020 15h17
20200731064719-1920x1080
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

A Microsoft criou um sistema de inteligência artificial que faz o mapeamento dos olhos de um usuário a fim de rastrear seus movimentos oculares. A proposta é usar a tecnologia para criar um método de navegação mais preciso e que simule, com o olhar, os movimentos de um mouse comum. A ideia é ajudar pessoas com dificuldades motoras, que, hoje, precisam gastar milhares de dólares em equipamentos mecânicos ou, no caso de soluções baseadas em software, lidar com a alta probabilidade de falhas de leitura.

Ofertas

Material Dourado Com 74 Peças Pais & Filhos Dourado
Vendido por Amazon
Material Dourado Com 74 Peças Pais & Filhos Dourado
De: R$ 11,85
Por: R$ 8,28
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
Vendido por Amazon
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
De: R$ 2.499,00
Por: R$ 1.998,89
Freezer Vertical Consul 231 Litros - CVU26FB 110V
Vendido por Amazon
Freezer Vertical Consul 231 Litros - CVU26FB 110V
De: R$ 3.279,35
Por: R$ 2.498,89
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
Vendido por Amazon
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
De: R$ 599,90
Por: R$ 491,92
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
Vendido por Amazon
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
De: R$ 189,90
Por: R$ 129,90
Climatizador de Ar Digital Midea 127V 60Hz
Vendido por Amazon
Climatizador de Ar Digital Midea 127V 60Hz
De: R$ 529,99
Por: R$ 412,69
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
Vendido por Amazon
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
De: R$ 799,00
Por: R$ 593,00
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
Vendido por Amazon
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
De: R$ 3.799,00
Por: R$ 3.598,94
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
Vendido por Amazon
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
De: R$ 699,00
Por: R$ 499,00
PlayStation DualSense Controle sem fio – Branco
Vendido por Amazon
PlayStation DualSense Controle sem fio – Branco
De: R$ 499,90
Por: R$ 369,00
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
Vendido por Amazon
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
De: R$ 2.489,00
Por: R$ 1.616,02
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
Vendido por Amazon
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
De: R$ 259,90
Por: R$ 179,90
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
Vendido por Amazon
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
De: R$ 3.599,00
Por: R$ 2.759,00
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
Vendido por Amazon
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
De: R$ 299,90
Por: R$ 199,00
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
Vendido por Amazon
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
De: R$ 899,90
Por: R$ 399,00
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
Vendido por Amazon
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
De: R$ 229,90
Por: R$ 132,00
CAMERA INSTAX MINI 12 ROSA GLOSS
Vendido por Amazon
CAMERA INSTAX MINI 12 ROSA GLOSS
De: R$ 649,00
Por: R$ 505,00

A documentação primária publicada pela Microsoft não estabelece um nome para o recurso, mas detalha como ele encontra a sua origem em outra pesquisa similar: o EyeGazer, desenvolvido pelo MIT (Instituto de Tecnologia de Massachusetts), serve de inspiração para a empresa liderada por Satya Nadella. Vale citar, o Windows 10 foi o primeiro sistema operacional da Microsoft a contar com os recursos EyeControl, que permitem o controle do mouse pelo olhar; e o Eye Drive Library, que dá o mesmo controle a um joystick plugado no computador.

Reprodução

Gráfico que ilustra o mapeamento do rosto e olhos na tecnologia da Microsoft. Imagem: Microsoft/Divulgação

No modelo mais recente, a Microsoft mapeou a região frontal da face, o olho esquerdo e olho direito, separando-os em grades. Tais imagens são comparadas a modelos implementados em uma biblioteca (esta, baseada no algoritmo ResNet18). O resultado disso é o processamento de pontos de direção do olhar, separados em coordenadas. E o mais interessante: funciona em qualquer webcam.

O modelo criado pela Microsoft então pega tudo isso e “treina” suas capacidades preditivas na biblioteca de dados do EyeGazer, ao mesmo tempo em que conduz aprimoramentos de dados para conseguir antecipar eventuais alterações de ângulo e movimentos do rosto, imitando possibilidades no mundo real. De forma aleatória, o modelo altera volumes de brilho, contraste, saturação e cor a fim de aprender a lidar com mudanças que softwares de rastreamento ocular atuais não conseguem processar.

Finalmente, o modelo completo ainda usa uma biblioteca de sistemas de detecção facial chamada “Dlib”, que considera movimentos como rotação da cabeça e tronco, exibindo imagens mais vívidas, em melhor definição e de melhor qualidade. Isso é importante, já que o EyeGazer do MIT, por exemplo, não considera capturas acima das sobrancelhas ou abaixo dos lábios. Depois de um processo que envolve remapear as imagens da Dlib ao modelo pré-existente da Microsoft, a tecnologia resultante insere movimentos completos da cabeça, olhos e expressões faciais no quadro original de 25 x 25 linhas.

Reprodução

Ilustração que mostra a captura do sistema desenvolvido pelos pesquisadores. Imagem: Microsoft/Divulgação

Os autores do projeto determinaram que os modelos tendem a se concentrar mais no monitoramento dos olhos, mas também prestam atenção na sobrancelha e na borda inferior da pálpebra. Em outras palavras, não enxergam apenas o movimento do olhar, mas também identificam os músculos faciais ativados quando uma pessoa, por exemplo, move o olho junto do rosto em uma direção qualquer.

“Modelos trigonométricos que se concentram apenas na pupila e na íris não necessariamente captam esses detalhes e, por isso, esse é o ponto que o aprendizado aprofundado [da IA] pode explorar a fim de aprimorar a sua precisão”, disseram os pesquisadores.

Como o estudo publicado ainda é uma premissa, ou seja, ainda não tem uma aplicação em ambiente real, o objetivo dos autores agora é o de estabelecer arquiteturas de redes neurais customizadas para melhorar ainda mais a performance: “O rastreamento do olhar, enquanto tecnologia de acessibilidade, tem muitos obstáculos, incluindo a falta de interoperabilidade e a inexistência de um conjunto de dados diversificado e grande, que cubra problemas de ocultação da face, movimentos e poses da cabeça e diversas condições dos olhos”, os estudiosos afirmaram. “Essa pesquisa traz a promessa de que, um dia, qualquer computador, tablet ou smartphone seja controlável pelo dos seus olhos graças à capacidade preditiva de redes neurais”.

Fonte: Venture Beat

Jornalista formado pela Universidade Paulista, Rafael é especializado em tecnologia, cultura pop, além de cobrir a editoria de Ciências e Espaço no Olhar Digital. Em experiências passadas, começou como repórter e editor de games em diversas publicações do meio, e também já cobriu agenda de cidades, cotidiano e esportes.