Google desenvolve sistema de separação de áudio e voz

Plataforma promete ajudar na elaboração de outras tecnologias; treinamento considerou pacote de sons e vozes faladas
Leticia Riente14/11/2020 17h22, atualizada em 16/11/2020 11h41
20201114022918-1920x1080
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Google pode ter criado uma ferramenta que pode separar sons de áudio de ruídos. Por meio do serviço oferecido pela plataforma SoundFilter baseada em IA, a empresa acredita que o recurso poderá auxiliar na criação de uma variedade de tecnologias úteis. O Google Meet, por exemplo, já possui uma opção parecida em seu sistema de cancelamento de ruído alimentado por inteligência artificial.

Ofertas

Microsoft Xbox Wireless Controller Storm Breaker Special Edition - Wireless & Bluetooth Connectivity - New Hybrid D-Pad - New Share Button - Featuring Textured Grip
Vendido por Amazon
Microsoft Xbox Wireless Controller Storm Breaker Special Edition - Wireless & Bluetooth Connectivity - New Hybrid D-Pad - New Share Button - Featuring Textured Grip
De: R$ 599,00
Por: R$ 549,00
Carregador Portátil (Power Bank) 20000Mah Turbo 22.5w Carregamento Ultra Rápido PD Visor Led com 2 Saídas Compatível com Android e IOS (Preto)
Vendido por Amazon
Carregador Portátil (Power Bank) 20000Mah Turbo 22.5w Carregamento Ultra Rápido PD Visor Led com 2 Saídas Compatível com Android e IOS (Preto)
Por R$ 89,49
Lata EcoLápis Grip 24 Cores, Faber-Castell, 121024LT, Grafite
Vendido por Amazon
Lata EcoLápis Grip 24 Cores, Faber-Castell, 121024LT, Grafite
De: R$ 63,00
Por: R$ 49,90
Controle sem fio Microsoft Xbox - Edição Especial Heart Breaker [android,ios,windows,xbox_one,xbox_series_s,xbox_series_x]
Vendido por Amazon
Controle sem fio Microsoft Xbox - Edição Especial Heart Breaker [android,ios,windows,xbox_one,xbox_series_s,xbox_series_x]
De: R$ 599,00
Por: R$ 549,00
Havit Mouse Gamer Tri-Mode MS966SE Black, Sem Fio e Com Fio, USB, Bluetooth, Wireless 2.4GHz, RGB, 7 Botões, 800-1600-2400-3200-600-10000 DPI, Preto
Vendido por Amazon
Havit Mouse Gamer Tri-Mode MS966SE Black, Sem Fio e Com Fio, USB, Bluetooth, Wireless 2.4GHz, RGB, 7 Botões, 800-1600-2400-3200-600-10000 DPI, Preto
Por R$ 137,00
Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
Vendido por Amazon
Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
De: R$ 1.156,80
Por: R$ 727,20
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
Vendido por Amazon
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
De: R$ 30,90
Por: R$ 27,81
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
Vendido por Amazon
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
De: R$ 79,99
Por: R$ 50,10
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Vendido por Amazon
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Por R$ 17.179,99
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
Vendido por Amazon
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
De: R$ 156,00
Por: R$ 140,00
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
Vendido por Amazon
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
De: R$ 199,99
Por: R$ 178,49
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Vendido por Amazon
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
De: R$ 299,99
Por: R$ 204,99
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
Vendido por Amazon
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
De: R$ 259,35
Por: R$ 198,99
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Vendido por Amazon
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Por R$ 2.399,00
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
Vendido por Amazon
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
De: R$ 5.299,00
Por: R$ 4.299,00
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
Vendido por Amazon
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
De: R$ 229,00
Por: R$ 160,65
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
Vendido por Amazon
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
De: R$ 289,90
Por: R$ 187,00
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Vendido por Amazon
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Por R$ 419,99
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
Vendido por Amazon
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
De: R$ 369,00
Por: R$ 209,90
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Vendido por Amazon
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Por R$ 449,00

A gigante da tecnologia diz que a aplicação pode ser ajustada para filtrar fontes de som arbitrárias, mesmo aquelas que não foram vistas durante o treinamento de máquina. Resumidamente, o recurso funciona da seguinte forma: recebe como entrada a mistura de áudio a ser filtrada e um pequeno exemplo do som a ser filtrado. Uma vez treinado, o SoundFilter pode extrair esse tipo de som da mistura, se houver.

Reprodução

Nova tecnologia da Google é capaz de separar voz de ruídos externos. Créditos: Metamorworks/Shutterstock

Para que o sistema ficasse completo, os pesquisadores treinaram a plataforma com dois conjuntos de códigos abertos, sendo um formado por mais de 50 mil sons e outro por quase mil horas de fala em inglês. Depois deste processo, os estudiosos relatam que o codificador de condicionamento aprendeu a produzir embeddings que representam as características acústicas do áudio de condicionamento. A partir daí, a IA permite a separação das vozes de misturas de alto-falantes.

“Nosso trabalho poderia ser estendido explorando como usar a incorporação aprendida como parte do SoundFilter como uma representação para um classificador de eventos de áudio”, escreveram os pesquisadores no artigo sobre o trabalho.

Mas, afinal, o que é um SoundFilter?

SoundFilter trata-se de uma arquitetura de rede neural onda a onda. Isso quer dizer o que sistema pode ser treinado com a utilização de amostras de áudio sem a necessidade de rótulos que denotam qual o tipo de fonte. Para que isso ocorra, um codificador de condicionamento pega o áudio, também de condicionamento, e calcula a incorporação correspondente, ou seja, a representação numérica.

Enquanto isso, um gerador condicional pega a mistura de áudio e a incorporação de condicionamento como entrada e produz a saída filtrada. De acordo com o site Venture Beat, desta forma, “o sistema assume que a coleção de áudio original consiste em muitos clipes de alguns segundos de duração que contêm o mesmo som por toda a duração. Além disso, o SoundFilter presume que cada clipe contém uma única fonte de áudio, como um alto-falante, um instrumento musical ou um canto de pássaro”.

Reprodução

SoundFilter considera três partes principais para fazer a separação de sons. Créditos: Sertaa/Shutterstock

De forma geral, este modelo é treinado para produzir um áudio alvo, considerando a mistura e o áudio condessado como entradas. Para entender melhor como o processo acontece, o treinamento de SoundFilter contém três principais partes: o áudio de destino que possui apenas um som, uma mistura que contém dois sons diferentes, um dos quais é o áudio alvo, e um sinal de áudio de condicionamento, outro exemplo com o mesmo tipo de som que o áudio de destino. O processo considera as três partes, resultando na separação entre voz e áudio.

 

Via: Venture Beat

Redator(a)

Leticia Riente é redator(a) no Olhar Digital