Em julho, a OpenAI um formou uma equipe de “Superalignment“ (“Superalinhamento”) para desenvolver formas de orientar, regular e governar sistemas de IA “superinteligentes”, ou superinteligências artificiais — tecnologias com capacidades superiores a de humanos.

Esses sistemas ainda não existem e alguns especialistas do tema acreditam que essa tecnologia está longe de ser lançada, por outro lado, a OpenAI já trabalha para que esse tipo de ferramenta se torne realidade com seu projeto de inteligência artificial geral (AGI) nomeada de Q*.

Em artigo divulgado recentemente pela empresa, os pesquisadores apresentam um processo de supervisão feito pela própria IA em que o principal LLM (modelo de linguagem ampla) da OpenAI, o GPT-4, foi supervisionado por um modelo mais antigo, o GPT-2.

Leia mais:

publicidade

Conforme explica o MIT Technology, a equipe treinou o GPT-2 para realizar diversas tarefas diferentes, incluindo quebra-cabeças de xadrez e testes de processamento de linguagem natural, análise de sentimento e mais. Então, as respostas do GPT-2 foram utilizadas para treinar GPT-4 para realizar as mesmas tarefas.

Muito do que estamos tentando fazer é dizer a um modelo o que fazer e garantir que ele o fará. Como podemos conseguir um modelo para seguir instruções e um modelo para ajudar apenas com coisas que são verdadeiras e não inventar coisas? Como obtemos um modelo que nos diga se o código gerado é seguro ou tem comportamento flagrante? Esses são os tipos de tarefas que queremos alcançar com nossa pesquisa.

 Collin Burns, membro da equipe de Superalinhamento da OpenAI.

Os resultados mostram que o GPT-4 teve um desempenho de 20% a 70% melhor do que o GPT-2 em tarefas de linguagem, mas teve um desempenho pior em quebra-cabeças sob a supervisão de seu antecessor.

A intenção dessa abordagem é simular um cenário em que já exista uma IA superinteligente, como explica o TechCrunch. Dessa forma, o modelo mais fraco (GPT-2) representa os humanos, enquanto o GPT-4 representa um modelo de IA superavançado, com capacidades superiores às dos humanos.

Pavel Izmailov, membro da equipe de Superalinhamento da OpenAI, faz uma analogia do experimento com estudantes de diferentes níveis:

Digamos que o aluno da sexta série está tentando contar ao universitário sobre uma tarefa que ele sabe como resolver. Mesmo que a supervisão do aluno da sexta série possa ter erros nos detalhes, a expectativa é que o estudante universitário entenda a essência e seja capaz de realizar a tarefa melhor do que o supervisor.

Pavel Izmailov, membro da equipe de Superalinhamento da OpenAI.

Para apoiar esse projeto, a OpenAI está lançando um programa de arrecadação (crowdsourcing) que apoiará pesquisas de alinhamento superinteligente de laboratórios acadêmicos, pesquisadores individuais e pós-graduados.