Telepatia? Óculos leem seus lábios sem você emitir um único som

Óculos funciona como um sonar e pode ajudar quem não consegue falar a realizar tarefas básicas; entenda como acessório funciona
Pedro Spadoni26/04/2023 13h43, atualizada em 26/04/2023 13h48
Rapaz usando óculos com IA
Vocabulário do óculos com IA é expansível - e não seria difícil dar esse salto (Imagem: Divulgação/Universidade Cornell)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Equipe de cientistas do SciFi (Laboratório de Interfaces Inteligentes de Computadores para Interações Futuras), da Universidade Cornell (EUA), desenvolveu um sistema de reconhecimento de fala capaz de identificar até 31 palavras em inglês. Mas o EchoSpeech, como o sistema é chamado, não é um aplicativo – é um par de óculos inteligente, com IA (inteligência artificial).

Ofertas

Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
Vendido por Amazon
Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
De: R$ 1.156,80
Por: R$ 727,20
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
Vendido por Amazon
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
De: R$ 30,90
Por: R$ 27,81
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
Vendido por Amazon
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
De: R$ 79,99
Por: R$ 50,10
Tilibra - Estojo Triplo Grande Académie Azul
Vendido por Amazon
Tilibra - Estojo Triplo Grande Académie Azul
De: R$ 110,90
Por: R$ 67,95
Giz Pastel Oleoso Pentel Arts 12 Cores
Vendido por Amazon
Giz Pastel Oleoso Pentel Arts 12 Cores
De: R$ 17,90
Por: R$ 10,90
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
Vendido por Amazon
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
De: R$ 2.699,00
Por: R$ 2.069,90
Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045
Vendido por Amazon
Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045
De: R$ 89,90
Por: R$ 56,60
Adaptador Wireless TP-Link Archer T2U Nano USB
Vendido por Amazon
Adaptador Wireless TP-Link Archer T2U Nano USB
De: R$ 109,90
Por: R$ 75,85
SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202
Vendido por Amazon
SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202
De: R$ 616,58
Por: R$ 334,32
Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios
Vendido por Amazon
Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios
De: R$ 33,90
Por: R$ 23,83
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Vendido por Amazon
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Por R$ 17.179,99
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
Vendido por Amazon
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
De: R$ 156,00
Por: R$ 140,00
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
Vendido por Amazon
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
De: R$ 199,99
Por: R$ 178,49
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Vendido por Amazon
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
De: R$ 299,99
Por: R$ 204,99
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
Vendido por Amazon
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
De: R$ 259,35
Por: R$ 198,99
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Vendido por Amazon
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Por R$ 2.399,00
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
Vendido por Amazon
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
De: R$ 5.299,00
Por: R$ 4.299,00
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
Vendido por Amazon
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
De: R$ 229,00
Por: R$ 160,65
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
Vendido por Amazon
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
De: R$ 289,90
Por: R$ 187,00
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Vendido por Amazon
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Por R$ 419,99
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
Vendido por Amazon
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
De: R$ 369,00
Por: R$ 209,90
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Vendido por Amazon
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Por R$ 449,00

Acessório consegue ler lábios do usuário e ajudar aqueles que não podem falar a realizar tarefas básicas – por exemplo, desbloquear celular ou pedir à Siri para aumentar o volume da TV. Tudo sem precisar emitir um único som. Parece telepatia, mas é ciência.

Leia mais:

Como óculos ‘telepata’ funciona

Pessoa segurando e apontando para óculos com IA
Óculos com IA têm dois microfones, dois alto-falantes e um microcontrolador pequeno (Imagem: Divulgação/Universidade Cornell)

Com dois microfones, dois alto-falantes e um microcontrolador tão pequeno que praticamente se misturam, óculos desenvolvido pelos cientistas de Cornell funciona como uma espécie de sonar.

Mais de mil espécies usam sonar para caçar e sobreviver. Talvez o mais popular entre eles seja a baleia, capaz de enviar pulsos de som que ricocheteiam em objetos na água e depois retornam para que o mamífero possa processar esses ecos e construir uma imagem mental de seu ambiente, incluindo o tamanho e a distância dos objetos ao redor.

O EchoSpeech funciona de maneira semelhante, exceto que o sistema não se concentra na distância. Em vez disso, ele rastreia como as ondas sonoras (inaudíveis ao ouvido humano) viajam pelo seu rosto e como elas atingem várias partes móveis dele. O processo pode ser resumido em quatro etapas principais.

  1. Alto-falantes (num dos lados dos óculos) emitem ondas sonoras;
  2. Ondas sonoras viajam pelo rosto e atingem lábios, mandíbula e bochechas;
  3. Microfones (no outro lado dos óculos) coletam essas ondas sonoras;
  4. Microcontrolador as processa junto a qualquer dispositivo com o qual óculos estejam emparelhados.

Assista abaixo uma demonstração do óculos, publicada por Ruidong Zhang, principal autor da pesquisa:

Leitura labial

Mas como o sistema sabe atribuir uma determinada palavra a um determinado movimento facial? Aqui, os pesquisadores usaram uma forma de IA (inteligência artificial) conhecida como algoritmo de aprendizado profundo, que ensina computadores a processarem dados da mesma forma que o cérebro humano.

Em vez de outro humano inferir conteúdo de sua fala, equipe usou modelo de IA previamente treinado para reconhecer certas palavras e combiná-las com um “perfil de eco” correspondente do rosto de uma pessoa.

Para treinar a IA, a equipe pediu a 24 pessoas que repetissem um conjunto de palavras enquanto usavam os óculos. Eles tiveram que repetir as palavras várias vezes, mas não consecutivamente.

Óculos capaz de ler lábios do usuário
Sistema de reconhecimento de fala do óculos com IA é capaz de identificar até 31 palavras em inglês (Imagem: Divulgação/Universidade Cornell)

Por enquanto, o EchoSpeech tem o vocabulário de uma criança. Ele pode reconhecer os dez algarismos, capturar direções (“para cima”, “para baixo”, “esquerda” e “direita”) e ativar assistentes de voz (por exemplo, Alexa, Google e Siri). Além disso, acessório se conecta a outros dispositivos com Bluetooth.

Um teste recente durante o qual a equipe emparelhou o sistema com um iPad alcançou 95% de precisão, mas ainda há trabalho a ser feito para melhorar sua usabilidade. E o principal autor da pesquisa disse que aumentar vocabulário do sistema para até 200 palavras não deve ser difícil com a IA atual. Mas qualquer coisa maior do que isso exigiria modelo de IA mais avançado.

Já assistiu aos nossos novos vídeos no YouTube? Inscreva-se no nosso canal!

Pedro Spadoni
Redator(a)

Pedro Spadoni é jornalista formado pela Universidade Metodista de Piracicaba (Unimep). Já escreveu para sites, revistas e até um jornal. No Olhar Digital, escreve sobre (quase) tudo.