O Google adicionou 110 idiomas ao Google Tradutor – a maior expansão já feita para o serviço, conforme divulgado pela empresa nesta quinta-feira (27). Até então, o Tradutor entendia 133 idiomas. Ou seja, o número quase dobrou nesta atualização.
O modelo de linguagem AI PaLM 2 da big tech, antecessor do Gemini, ajudou o Google Tradutor a aprender esses novos idiomas. O modelo foi eficaz principalmente em aprender idiomas relacionados entre si, como idiomas “próximos ao hindi, como Awadhi e Marwadi, e crioulos franceses como crioulo seichelense e crioulo mauriciano”, explicou Isaac Caswell, engenheiro de software, num post no blog do Google.
Leia mais:
- Drone secreto dos EUA aparece no Google Maps
- Como usar modo satélite no Google Maps [PC e celular]
- Veja as vantagens de usar o Gemini em vez do Google Assistente no seu celular
Entre os novos idiomas suportados pelo serviço do Google, está o Cantonês, que “há muito tempo tem sido um dos idiomas mais solicitados para o Google Tradutor”, diz Caswell. “Como o Cantonês muitas vezes se sobrepõe ao Mandarim na escrita, é complicado encontrar dados e treinar modelos [de linguagem].”
Expansão do Google Tradutor abrange idiomas falados por 614 milhões de pessoas
![Celular com logotipo do Google Tradutor na tela colocado sobre livro aberto](https://img.odcdn.com.br/wp-content/uploads/2024/06/Google-Tradutor-1024x576.jpg)
Caswell também mencionou no post que “cerca de um quarto dos novos idiomas são originários da África”. No total, a expansão abrange idiomas com mais de 614 milhões de falantes, “abrindo traduções para cerca de 8% da população mundial”, afirmou o engenheiro de software.
“Alguns são idiomas mundiais importantes, com mais de 100 milhões de falantes. Outros são falados por pequenas comunidades de povos indígenas, e alguns têm praticamente nenhum falante nativo, mas esforços ativos de revitalização.” – Isaac Caswell, engenheiro de software, num post no blog do Google
![Celular com o aplicativo Google Tradutor](https://img.odcdn.com.br/wp-content/uploads/2019/07/20190711123532-e1719488598718-1024x576.jpg)
Confira abaixo detalhes sobre idiomas que chegam ao Google Tradutor, além do Cantonês:
- Afar: língua tonal falada no Djibouti, Eritreia e Etiópia. Entre os idiomas incluídos na expansão, o Afar teve a maior contribuição voluntária da comunidade;
- Manx: idioma celta da Ilha de Man. Quase foi extinto com a morte de seu último falante nativo, em 1974. Mas graças a um movimento de revitalização em toda a ilha, agora há milhares de falantes;
- N’Ko: forma padronizada das línguas mandingas da África Ocidental, unificando muitos dialetos num idioma comum. Seu alfabeto único foi inventado em 1949 e possui uma comunidade ativa de pesquisa que desenvolve recursos e tecnologia para ele atualmente;
- Punjabi (Shahmukhi): variação do Punjabi escrito no script Perso-Árabe (Shahmukhi). É o idioma mais falado no Paquistão;
- Tamazight (Amazigh): idioma berbere falado em toda a África do Norte. Embora haja muitos dialetos, a forma escrita é geralmente mutuamente compreensível. É escrito no alfabeto latino e no alfabeto Tifinagh, ambos suportados pelo Google Tradutor;
- Tok Pisin: crioulo baseado no inglês e a língua franca da Papua Nova Guiné.