Pesquisadores da Universidade de East Anglia, no Reino Unido, desenvolveram um sistema que consegue interpretar as palavras ditas por um ser humano por meio da leitura labial. A tecnologia usa o aprendizado de máquina para classificar o aspecto visual de sons produzidos na fala. Em testes, mesmo sem conhecer o contexto das frases, o sistema se mostrou capaz de entender com maior grau de precisão até que os leitores de lábios humanos.

O principal desafio para as técnicas de leitura labial é que existem, pelo menos para o olho humano, menos dicas visuais do que sonoras, em palavras com P, B e M, por exemplo, o que normalmente causa dificuldades na tarefa. No entanto, os novos sistemas são capazes de distinguir pequenas variações entre as pronúncias, algo que as pessoas não conseguem perceber.

publicidade

Aplicações

Por enquanto, o sistema está em fase de testes, mas, segundo os pesquisadores, existem dezenas de aplicações para a tecnologia, como ajudar deficientes auditivos, melhorar o entendimento de vídeos de câmeras de segurança sem áudio e até automatização de legendas.

publicidade

Via TechCrunch