O Google lançou um novo filtro que é mais eficaz ao classificar mensagens de spam ou indesejadas. Em comunicado, a empresa revela que seu método foi responsável por melhorar em 38% a detecção de spam no Gmail, e reduzir em 19,4% falsos positivos — quando um e-mail legítimo vai parar na caixa de spam, por exemplo.

A ferramenta utilizada pela empresa foi o vetorizador de texto multilíngue chamado RETVec (Vetorizador de texto resiliente e eficiente, em português) que pode mapear as palavras de vetores. 

Essa ferramenta foi testada “extensivamente” pelo Google no ano passado e é considerada “altamente eficaz para aplicativos de segurança e antiabuso”.

Leia mais:

publicidade

Como explica o PCMag, esse tipo de recurso é muito utilizado por desenvolvedores para vetorizar texto, além de ajudar os computadores a interpretar e classificar a linguagem humana.

Google
RETVec em comparação com outros vetores. (Imagem: Divulgação/Google)

No entanto, com cibercriminosos criando novas formas para contornas ferramentas de classificação como essa, como misturar pontuações de diferentes línguas, o Google precisou otimizar sua ferramenta. 

Uma das melhorias implementadas foi o treinamento da RETCev para detectar e compreender manipulações com os caracteres, como erros de digitação.

De acordo com o Google, a implementação do RETVec, que funciona com mais de 100 idiomas, foi “uma das maiores atualizações de defesa dos últimos anos”.

Devido à sua arquitetura inovadora, o RETVec funciona imediatamente em todos os idiomas e em todos os caracteres UTF-8, sem a necessidade de pré-processamento de texto, tornando-o o candidato ideal para implantações de classificação de texto em dispositivos, na Web e em grande escala.

Google em comunicado.