Conheça o Translatotron, o tradutor capaz de imitar a voz humana

Esse tradutor foi possível por meio do investimento do Google em melhorar a forma como as pessoas de diferentes idiomas se comunicam
Luiz Nogueira16/05/2019 15h00, atualizada em 16/05/2019 16h50
20190429014346
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Que o Google vem há anos aperfeiçoando os meios de tradução não é uma novidade. Através de seu blog oficial, a empresa apresentou sua mais nova aposta no campo da tradução. O Translatotron é uma ferramenta capaz não só de traduzir o que é dito em um idioma e pronunciá-lo em outro, mas também imitar a voz de quem disse a frase.

Ofertas

Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
Vendido por Amazon
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
De: R$ 30,90
Por: R$ 27,81
Steal n Catch Memerot: Funny Meme Shooter Battle Game
Vendido por Amazon
Steal n Catch Memerot: Funny Meme Shooter Battle Game
Por R$ 53,49
meu jogo de pizza dos sonhos pronto: simulador divertido de cozinhar, assar e fazer comida
Vendido por Amazon
meu jogo de pizza dos sonhos pronto: simulador divertido de cozinhar, assar e fazer comida
Por R$ 21,79
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
Vendido por Amazon
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
De: R$ 79,99
Por: R$ 50,10
Tilibra - Estojo Triplo Grande Académie Azul
Vendido por Amazon
Tilibra - Estojo Triplo Grande Académie Azul
De: R$ 110,90
Por: R$ 67,95
Giz Pastel Oleoso Pentel Arts 12 Cores
Vendido por Amazon
Giz Pastel Oleoso Pentel Arts 12 Cores
De: R$ 17,90
Por: R$ 10,90
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
Vendido por Amazon
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
De: R$ 2.699,00
Por: R$ 2.069,90
Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045
Vendido por Amazon
Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045
De: R$ 89,90
Por: R$ 56,60
Adaptador Wireless TP-Link Archer T2U Nano USB
Vendido por Amazon
Adaptador Wireless TP-Link Archer T2U Nano USB
De: R$ 109,90
Por: R$ 75,85
SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202
Vendido por Amazon
SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202
De: R$ 616,58
Por: R$ 334,32
Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios
Vendido por Amazon
Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios
De: R$ 33,90
Por: R$ 23,83
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Vendido por Amazon
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Por R$ 17.180,00
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
Vendido por Amazon
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
De: R$ 156,00
Por: R$ 140,00
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
Vendido por Amazon
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
De: R$ 199,99
Por: R$ 178,49
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Vendido por Amazon
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Por R$ 299,99
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
Vendido por Amazon
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
De: R$ 259,35
Por: R$ 198,99
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Vendido por Amazon
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Por R$ 2.399,00
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
Vendido por Amazon
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
De: R$ 5.299,00
Por: R$ 3.999,00
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
Vendido por Amazon
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
De: R$ 229,00
Por: R$ 160,65
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
Vendido por Amazon
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
De: R$ 289,90
Por: R$ 187,00
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Vendido por Amazon
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Por R$ 419,99
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
Vendido por Amazon
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
De: R$ 369,00
Por: R$ 209,90
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Vendido por Amazon
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
De: R$ 464,65
Por: R$ 330,00

Com esse novo sistema, o Google planeja melhorar a comunicação entre pessoas que falam idiomas diferentes. O recurso funciona de uma forma distinta do conhecido sistema de cascata que conhecemos, em que a frase é traduzida na forma como está escrita, sem respeitar regras linguísticas, por exemplo. Com a nova ferramenta, ele passará a funcionar de sequência em sequência, com isso, haverá uma melhora na velocidade, nos erros provenientes dessas traduções e na tradução em si.

Com esse sistema, a empresa pretende mostrar que a fala pode ser traduzida de uma língua para a outra sem a necessidade de uma representação intermediária de texto em qualquer um dos dois idiomas – como o sistema de cascata necessita. Para que isso seja possível, é usado um Vocoder Neural, que se encarrega de sintetizar a voz humana e dar a forma desejada para as ondas de saída, esse codificador é capaz de preservar as características da voz gravada.

Em resumo, o Translatotron consegue registrar as características do discurso de um interlocutor, além de sua voz. Com isso, ele consegue gerar um áudio traduzido para o idioma de destino, mantendo as características de fala. O grande objetivo do Google é fazer com que os assistentes do futuro busquem a naturalidade da conversação desses sistemas.

Como forma de comparação, o Google mostrou como o Translatotron funciona em modelo de cascata, basicamente o que é utilizado pela maioria dos assistentes de hoje, que apresentam uma linguagem meio travada e sequencial. Em seguida, o teste foi feito com a nova tecnologia, e a diferença é bastante clara.

A empresa está transformando a fala travada e muitas vezes robótica, em algo natural e com características de pronúncia próprias. Os testes com o tradutor ainda estão em andamento, mas já podemos prever que a tecnologia avança em passos largos para a criação assistentes cada vez mais humanos.

A tecnologia do Translatotron

O surgimento desse modelo de tradução de fala começou em 2016, quando foi demonstrado a sua viabilidade de uso como modelo de tradução de fala para texto. Em 2017, foi demonstrado que esses modelos de tradução de um idioma para outro em formato de voz pode substituir o modelo de cascata.

Agora, o Translatotron está se consolidando como o único modelo de tradução que pode traduzir diretamente a fala de uma linguagem para outra, sem depender de um intermédio. No próprio blog da empresa, é possível se ter uma ideia de como funciona esse sistema por meio dos áudios de comparação que foram disponibilizados pelo Google.


Fonte: Blog do Google

Via: Genbeta

Redator(a)

Luiz Nogueira é redator(a) no Olhar Digital