CriticGPT: OpenAI lança “caçador de erros” do GPT-4

Modelo de pesquisa detecta bugs em código gerado por IA, permitindo uma melhora da supervisão humana da IA
Por Leandro Costa Criscuolo, editado por Bruno Capozzi 03/07/2024 17h33, atualizada em 04/07/2024 20h59
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

A OpenAI anunciou recentemente um novo modelo chamado CriticGPT baseado no GPT-4. Ao contrário de outros modelos da empresa, voltados para o consumidor, o CriticGPT foi projetado para “escrever críticas às respostas do ChatGPT para ajudar os humanos a detectar erros durante o aprendizado por reforço a partir do feedback humano (RLHF)”.

Segundo a OpenAI, o código revisado pelo CriticGPT pode superar o código não revisado em 60%. A empresa está atualmente integrando modelos semelhantes ao CriticGPT no pipeline de rotulagem RLHF para ajudar os treinadores de IA na avaliação dos resultados de sistemas avançados de IA.

A OpenAI afirma que modelos como o CriticGPT podem ajudar a tornar o ChatGPT mais preciso com erros sutis e também detectar erros que os humanos podem não perceber, à medida que os modelos se tornam mais bem informados.

O processo de treinamento do CriticGPT incluiu a edição manual do código gerado pelo ChatGPT e a introdução de novos erros no código, juntamente com feedback de amostra para treinar o modelo que poderá identificar facilmente erros comuns incomuns.

Leia mais:

gpt-4o
Treinamento humano do GPT-4 ganha auxílio de outro modelo de IA (Imagem: Ascannio / Shutterstock.com)

CriticGPT não é à prova de erros

  • Assim como nas sugestões humanas, as sugestões do CriticGPT nem sempre são corretas.
  • No entanto, a combinação da equipe humana com o CriticGPT supera os treinadores humanos não assistidos e também ajuda os treinadores a escrever “críticas abrangentes” enquanto produzem menos alucinações.
  • A OpenAI também afirma que o CriticGPT pode espalhar erros do mundo real em muitas partes da resposta e não pode avaliar uma tarefa ou resposta extremamente complexa.

Este novo modelo de IA, conforme a empresa, ajudará os treinadores humanos a “produzir melhores dados RLHF para GPT-4”, e a OpenAI já revela estar planejando ampliar ainda mais esse trabalho.

Leandro Costa Criscuolo
Colaboração para o Olhar Digital

Leandro Criscuolo é jornalista formado pela Faculdade Cásper Líbero. Já atuou como copywriter, analista de marketing digital e gestor de redes sociais. Atualmente, escreve para o Olhar Digital.

Bruno Capozzi é jornalista formado pela Faculdade Cásper Líbero e mestre em Ciências Sociais pela PUC-SP, tendo como foco a pesquisa de redes sociais e tecnologia.