Google investe em IA capaz de “falar” mil idiomas

Modelo se chama Universal Speech Model (USM)
Por Rodrigo Mozelli, editado por Carolina Martins 07/03/2023 00h47, atualizada em 07/03/2023 21h36
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Enquanto chatbots de IA – em especial o ChatGPT – fazem sucesso, esse não é o único uso para aprendizado de máquina e modelos de linguagem.

Com rumores de planos para exibir mais de 20 produtos alimentados por inteligência artificial durante seu evento anual de I/O deste ano, o Google está progredindo em direção ao seu objetivo de construir modelo de linguagem IA que suporte mil idiomas diferentes.

Leia mais:

Em atualização publicada nesta segunda-feira (6), o Google compartilhou mais informações sobre o Universal Speech Model (USM), sistema que a gigante das buscas descreve como um “primeiro passo crítico” para atingir seus objetivos.

Em novembro passado, a empresa anunciou seus planos de criar modelo de idioma compatível com mil dos idiomas mais falados do mundo, além de revelar seu modelo USM. O Google descreve o USM como “família de modelos de fala de última geração” com dois bilhões de parâmetros treinados em 12 milhões de horas de fala e 28 bilhões de sentenças em mais de 300 idiomas.

O USM, que o YouTube já usa para gerar legendas ocultas, também oferece suporte ao reconhecimento automático de fala (ASR). Isso detecta e traduz automaticamente idiomas, incluindo inglês, mandarim, amárico, cebuano, assamês e outros.

No momento, o Google diz que o USM suporta mais de 100 idiomas e servirá como “base” para construir sistema ainda mais amplo. A Meta está trabalhando em ferramenta de tradução de IA semelhante que ainda está nos estágios iniciais.

Um destino para a tecnologia pode estar dentro de óculos de realidade aumentada, como o conceito que o Google exibiu durante seu evento I/O no ano passado, capaz de detectar e fornecer traduções em tempo real que aparecem bem diante de seus olhos.

Essa tecnologia ainda parece um pouco distante, porém, e a deturpação do idioma árabe pelo Google durante o I/O prova como pode ser fácil errar.

Com informações de The Verge

Imagem destacada: Wikimedia Commons

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.

Carolina é Publicitária, pós-graduada em Marketing Digital e integrou times de marketing e criação como Embraer e Tecnoblog. Nas horas vagas faz crossfit, corre, joga e come lanches por aí.

Ícone tagsTags: