Pesquisadores estão utilizando a série de livros de Harry Potter para testar como os sistemas de inteligência artificial (IA) generativa aprendem e desaprendem certas informações.

A influência duradoura da saga na cultura popular, juntamente com a ampla variedade de dados linguísticos e jogos de palavras complexos presentes em suas páginas, tem levado número crescente de pesquisadores a experimentar a tecnologia de IA usando os livros de Harry Potter.

Leia mais:

Revisar uma lista de estudos e artigos acadêmicos que citam Harry Potter oferece vislumbre da pesquisa de ponta em IA – e de algumas das questões mais complexas enfrentadas pela tecnologia.

publicidade

Um exemplo recente notável é um artigo intitulado “Who’s Harry Potter?” (“Quem é Harry Potter?”, em português), no qual os personagens Harry, Hermione e Rony são protagonistas. Esse artigo revela nova técnica que ajuda os modelos de linguagem grandes a esquecer informações seletivamente.

Isso é extremamente importante para a indústria, uma vez que os modelos de linguagem grandes, que alimentam os chatbots de IA, são baseados em vastas quantidades de dados online, incluindo material protegido por direitos autorais e outros conteúdos problemáticos. Isso tem levado a processos judiciais e escrutínio público para algumas empresas de IA.

Os pesquisadores da Microsoft, Mark Russinovich e Ronen Eldan, autores do artigo, afirmam que demonstraram que é possível alterar ou editar os modelos de IA para remover qualquer conhecimento sobre a existência das obras de Harry Potter, incluindo personagens e tramas, sem comprometer a capacidade geral de tomada de decisão e análise do sistema de IA.

Acreditávamos que seria mais fácil para as pessoas da comunidade de pesquisa avaliarem o modelo resultante de nossa técnica e confirmarem por si mesmas que o conteúdo foi de fato ‘desaprendido’. Quase qualquer pessoa pode apresentar sugestões para o modelo que investigaria se ele ‘conhece’ ou não os livros. Mesmo as pessoas que não leram os livros estariam cientes dos elementos e personagens da trama.

Mark Russinovich, diretor de tecnologia do Microsoft Azure

Modelo Silo e seus riscos legais

  • Outro estudo envolveu pesquisadores da Universidade de Washington em Seattle, da Universidade da Califórnia em Berkeley e do Instituto Allen de IA, que desenvolveram novo modelo de linguagem chamado Silo, capaz de reduzir riscos legais, removendo dados;
  • No entanto, eles observaram que o desempenho do modelo diminuiu significativamente ao ser treinado apenas com textos de baixo risco, como livros sem direitos autorais ou documentos governamentais;
  • Os pesquisadores estudaram o impacto de trechos individuais dos livros de Harry Potter no desempenho do sistema de IA;
  • Eles criaram duas coleções de dados: uma contendo todos os livros publicados, exceto o primeiro livro (“Harry Potter e a Pedra Filosofal”), e outra contendo todos os livros da série, exceto o segundo (“Harry Potter e a Câmara Secreta”), e assim por diante;
  • Os pesquisadores concluíram que, quando os livros da saga são removidos, a precisão dos modelos de IA diminui.

Embora citar Harry Potter em estudos sobre IA não seja algo novo – pesquisadores têm feito isso há pelo menos uma década – se tornou mais comum à medida que acadêmicos e tecnólogos se concentraram em ferramentas de IA capazes de processar e responder à linguagem natural com respostas relevantes.

Com Harry Potter, “a abundância de cenas, diálogos e momentos emocionais o tornam muito relevante para a área específica do processamento da linguagem natural”, disse Leila Wehbe, pesquisadora da Carnegie Mellon que conduziu uma série de experimentos em 2014, coletando dados de ressonância magnética cerebral de pessoas lendo histórias de Harry Potter para entender melhor os mecanismos da linguagem.

Dessa forma, os momentos emocionantes, diálogos e cenas abundantes nessa saga criada pela autora J.K. Rowling o tornam muito relevante para o campo específico do processamento de linguagem natural.

No arXiv, repositório de acesso aberto de pesquisas científicas, artigos recentes incluem “Aprendizado de máquina para desenvolvimento de poções em Hogwarts”, “Grandes modelos de linguagem encontram Harry Potter” e “Detectando feitiços na literatura de fantasia com uma inteligência artificial baseada em transformador”.

“Harry Potter e a Inteligência dos Chatbots”

A saga Harry Potter também é uma referência literária favorita mesmo quando não é o foco principal da pesquisa.

Segundo a Bloomberg, um estudo, por exemplo, usou as obras de Rowling para testar a inteligência de sistemas de IA, como o ChatGPT. Em artigo, Terrence Sejnowski, diretor do laboratório de neurobiologia computacional do Instituto Salk de Estudos Biológicos, argumentou que os chatbots refletem apenas a inteligência e os preconceitos de seus usuários, assim como o Espelho de Ojesed reflete os desejos de uma pessoa em “Harry Potter e a Pedra Filosofal”.

Sejnowski também destaca que “Harry Potter é popular entre pesquisadores mais jovens, que cresceram lendo a série como crianças ou adolescentes, e, por isso, tendem a escolhê-la como corpus de texto escrito ou falado em suas pesquisas”.