O Google adicionou 110 idiomas ao Google Tradutor – a maior expansão já feita para o serviço, conforme divulgado pela empresa nesta quinta-feira (27). Até então, o Tradutor entendia 133 idiomas. Ou seja, o número quase dobrou nesta atualização.

O modelo de linguagem AI PaLM 2 da big tech, antecessor do Gemini, ajudou o Google Tradutor a aprender esses novos idiomas. O modelo foi eficaz principalmente em aprender idiomas relacionados entre si, como idiomas “próximos ao hindi, como Awadhi e Marwadi, e crioulos franceses como crioulo seichelense e crioulo mauriciano”, explicou Isaac Caswell, engenheiro de software, num post no blog do Google.

publicidade

Leia mais:

Entre os novos idiomas suportados pelo serviço do Google, está o Cantonês, que “há muito tempo tem sido um dos idiomas mais solicitados para o Google Tradutor”, diz Caswell. “Como o Cantonês muitas vezes se sobrepõe ao Mandarim na escrita, é complicado encontrar dados e treinar modelos [de linguagem].”

publicidade

Expansão do Google Tradutor abrange idiomas falados por 614 milhões de pessoas

Celular com logotipo do Google Tradutor na tela colocado sobre livro aberto
Idiomas que chegam ao Google Tradutor são falados por 8% da população mundial (Imagem: Poetra.RH/Shutterstock)

Caswell também mencionou no post que “cerca de um quarto dos novos idiomas são originários da África”. No total, a expansão abrange idiomas com mais de 614 milhões de falantes, “abrindo traduções para cerca de 8% da população mundial”, afirmou o engenheiro de software.

“Alguns são idiomas mundiais importantes, com mais de 100 milhões de falantes. Outros são falados por pequenas comunidades de povos indígenas, e alguns têm praticamente nenhum falante nativo, mas esforços ativos de revitalização.” – Isaac Caswell, engenheiro de software, num post no blog do Google

publicidade
Celular com o aplicativo Google Tradutor
Entre os novos idiomas entendidos pelo Google Tradutor, estão Cantonês, Punjabi (Shahmukhi) e Tok Pisin (Imagem: Ars/Shutterstock)

Confira abaixo detalhes sobre idiomas que chegam ao Google Tradutor, além do Cantonês:

  • Afar: língua tonal falada no Djibouti, Eritreia e Etiópia. Entre os idiomas incluídos na expansão, o Afar teve a maior contribuição voluntária da comunidade;
  • Manx: idioma celta da Ilha de Man. Quase foi extinto com a morte de seu último falante nativo, em 1974. Mas graças a um movimento de revitalização em toda a ilha, agora há milhares de falantes;
  • N’Ko: forma padronizada das línguas mandingas da África Ocidental, unificando muitos dialetos num idioma comum. Seu alfabeto único foi inventado em 1949 e possui uma comunidade ativa de pesquisa que desenvolve recursos e tecnologia para ele atualmente;
  • Punjabi (Shahmukhi): variação do Punjabi escrito no script Perso-Árabe (Shahmukhi). É o idioma mais falado no Paquistão;
  • Tamazight (Amazigh): idioma berbere falado em toda a África do Norte. Embora haja muitos dialetos, a forma escrita é geralmente mutuamente compreensível. É escrito no alfabeto latino e no alfabeto Tifinagh, ambos suportados pelo Google Tradutor;
  • Tok Pisin: crioulo baseado no inglês e a língua franca da Papua Nova Guiné.