O que é geração aumentada de recuperação (RAG) em LLM?

Geração aumentada de recuperação (RAG) é uma técnica que melhora a precisão da IA generativa baseada em LLM; entenda melhor
Por Camila Oliveira, editado por Bruno Ignacio de Lima 11/09/2024 04h20
DALL·E-2023-12-02-14.56.08-Creat-1-1920x1080
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Os modelos de linguagem grande (LLMs) que alimentam a IA generativa são peças de engenharia e ciência incríveis, que possuem a capacidade de raciocinar à medida que criam ou geram algo novo.

Ofertas

Notebook Dell Inspiron I15-I1300-A60P 15.6" Full HD 13ª Gen Intel Core i5 16GB 1TB SSD Win 11 Preto Carbono
Vendido por Amazon
Notebook Dell Inspiron I15-I1300-A60P 15.6" Full HD 13ª Gen Intel Core i5 16GB 1TB SSD Win 11 Preto Carbono
Por R$ 3.955,69
Monitor Gamer AOC AGON G4S 25" 310Hz 0.3ms HDR10 IPS Base Ajustável 25G4S/P
Vendido por Amazon
Monitor Gamer AOC AGON G4S 25" 310Hz 0.3ms HDR10 IPS Base Ajustável 25G4S/P
Por R$ 1.479,00
Tilibra - Estojo Minibox Happy Lilás
Vendido por Amazon
Tilibra - Estojo Minibox Happy Lilás
De: R$ 38,12
Por: R$ 36,21
Caneta Gel – CiS Gelyx – Estojo com 6 unidades – Glitter
Vendido por Amazon
Caneta Gel – CiS Gelyx – Estojo com 6 unidades – Glitter
De: R$ 30,90
Por: R$ 24,96
Pentel Caneta Izee 4 Cores 1.0 Corpo Branco Tinta Azul Vermelho Verde e Preto SM/BXC470W
Vendido por Amazon
Pentel Caneta Izee 4 Cores 1.0 Corpo Branco Tinta Azul Vermelho Verde e Preto SM/BXC470W
De: R$ 15,32
Por: R$ 9,90
Tilibra - Caderno Brochura Capa Dura 1/4 D+ Rosa 48 Folhas, 317403
Vendido por Amazon
Tilibra - Caderno Brochura Capa Dura 1/4 D+ Rosa 48 Folhas, 317403
De: R$ 11,85
Por: R$ 5,86
Celular Positivo P26 4G Tela 1,8", Câmera traseira, 48MB RAM 128MB, Bluetooth, Modem Tethering - Preto
Vendido por Amazon
Celular Positivo P26 4G Tela 1,8", Câmera traseira, 48MB RAM 128MB, Bluetooth, Modem Tethering - Preto
Por R$ 139,90
Mochila Grande E Reforçada Impermeável Para Notebook Antifurto Bolsa Executiva Masculina Feminina Trabalho Viagem Escolar Faculdade Cabo De Aço Saída Usb Saída Fone De Ouvido
Vendido por Amazon
Mochila Grande E Reforçada Impermeável Para Notebook Antifurto Bolsa Executiva Masculina Feminina Trabalho Viagem Escolar Faculdade Cabo De Aço Saída Usb Saída Fone De Ouvido
De: R$ 149,79
Por: R$ 113,70
Tilibra D+ - Caderno Brochura Capa Dura, 1/4 Pequeno, 14x20cm, 48 Folhas, Vermelho
Vendido por Amazon
Tilibra D+ - Caderno Brochura Capa Dura, 1/4 Pequeno, 14x20cm, 48 Folhas, Vermelho
De: R$ 11,81
Por: R$ 6,90
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
De: R$ 4.699,00
Por: R$ 3.099,00
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
Vendido por Amazon
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
De: R$ 3.499,00
Por: R$ 3.324,00
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
Vendido por Amazon
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
De: R$ 1.049,00
Por: R$ 799,00
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
Vendido por Amazon
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
De: R$ 299,00
Por: R$ 241,44
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
De: R$ 499,90
Por: R$ 388,78
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
Vendido por Amazon
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
De: R$ 2.399,00
Por: R$ 2.159,00
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 188,99
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
Vendido por Amazon
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
De: R$ 88,00
Por: R$ 45,00
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
Vendido por Amazon
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
De: R$ 399,00
Por: R$ 379,00
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
Vendido por Amazon
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
De: R$ 1.629,90
Por: R$ 1.239,90
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
Vendido por Amazon
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
De: R$ 1.179,00
Por: R$ 943,20
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
Vendido por Amazon
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
De: R$ 999,00
Por: R$ 798,99
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
Vendido por Amazon
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
De: R$ 329,90
Por: R$ 199,00
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
De: R$ 599,90
Por: R$ 476,10
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
Vendido por Amazon
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
De: R$ 1.199,00
Por: R$ 1.139,05
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
Vendido por Amazon
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
De: R$ 1.199,00
Por: R$ 949,00
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
Vendido por Amazon
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
De: R$ 169,90
Por: R$ 155,44
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
De: R$ 149,90
Por: R$ 119,90
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
Vendido por Amazon
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
De: R$ 699,00
Por: R$ 398,99
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
Vendido por Amazon
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
De: R$ 109,90
Por: R$ 79,90
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
Vendido por Amazon
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
De: R$ 299,90
Por: R$ 222,11

Mas, para que um LLM seja útil para um projeto ou aplicação geradora de IA específica, é importante se certificar de que está alimentando-o com seus próprios dados relevantes. Mesmo que os LLMs sejam impressionantes, qualquer pessoa tem acesso a eles.

É por isso que a diferenciação de sua superpotência vem de alimentá-los com seus dados, e é isso que a geração aumentada por recuperação (RAG) permite que seja feito. Conheça mais na matéria abaixo.

O que é geração aumentada por recuperação (RAG)?

O Retrieval-Augmented Generation (RAG), ou geração aumentada por recuperação, é um processo que otimiza a saída de um grande modelo de linguagem, para que ele faça referência a uma base de conhecimento confiável fora das suas fontes de dados de treinamento antes que uma resposta seja gerada.

Os grandes modelos de linguagem (LLMs) são treinados em grandes volumes de dados, usando bilhões de parâmetros para gerar resultados originais para tarefas distintas, como responder a perguntas, traduzir idiomas e concluir frases.

A RAG estende os recursos do LLMs, que já são poderosos, para domínios específicos ou para a base de conhecimento interna de uma organização, sem que seja preciso treinar novamente o modelo. É uma abordagem econômica que melhora a produção do LLM, de forma que ele permaneça relevante, preciso e útil em diversos contextos.

Leia mais:

Então, a geração aumentada por recuperação é uma técnica que aborda as limitações dos LLMs, permitindo que eles acessem dados contextuais e atualizados. As implementações RAG às vezes são chamados de modelos ou padrões RAG, e funcionam combinando um LLM pré-treinado com um sistema de recuperação de informações prontamente acessíveis.

O sistema de recuperação tem a função de encontrar informações relevantes em uma biblioteca de conhecimento, como banco de dados. Os modelos RAG possibilitam que o LLM, ou modelo de fundação, gere uma resposta mais precisa com contexto atualizado e relevante para a tarefa em questão.

Por que a geração aumentada de recuperação é importante?

O LLM é uma tecnologia fundamental usada pela inteligência artificial (IA) que alimenta os chatbots inteligentes e outros aplicativos de processamento de linguagem natural (PLN). O principal objetivo é criar bots que respondam às perguntas dos usuários em vários contextos, usando fontes de conhecimento confiáveis.

Porém, a natureza da tecnologia LLM oferece imprevisibilidade nas respostas geradas, e além disso, os dados usados para treinar os LLMs são fixos, o que resulta na existência de uma data limite ara o conhecimento que podem oferecer.

Alguns desafios que os LLMs enfrentam atualmente:

  • Informações falsas fornecidas quando não há uma resposta adequada;
  • Informações desatualizadas ou genéricas quando os usuários procuram por respostas específicas e atualizadas;
  • Respostas baseadas em fontes não confiáveis;
  • Respostas imprecisas por conta da confusão terminológica, quando diferentes fontes de treinamento usam a mesma terminologia para descrever conceitos distintos.

Com isso, a abordagem RAG por ser usada para solucionar alguns desses desafios, direcionando o LLM a recuperar os dados relevantes, provenientes de fontes de conhecimento confiáveis e previamente definidas.

Dessa forma, as empresas ganham mais controle a respeito do texto gerado, e os usuários entendem melhor sobre o processo de geração de respostas do LLM. Os modelos RAG demonstraram ser eficazes para uma diversidade de tarefas de conhecimento intensivo, incluindo:

  • Tarefas de geração de linguagem, respondendo perguntas de forma abrangente e informativa ou gerando diferentes formatos criativos de conteúdo de texto, como poemas, roteiros, peças musicais, etc.;
  • Tarefas de PNL, fornecendo resumos de conversas, gravações de áudio e chamadas de vídeo;
  • Tarefas que exigem classificação, como segurança cibernética e conformidade, ou raciocínio para coisas como planejamento de negócios.

O RAG também pode ser usado para permitir que uma aplicação alimentada por IA generativa observe um estado de background, adaptando suas gerações de agordo. A capacidade de escrever código com base no código que um usuário está escrevendo é um exemplo disso. Outros exemplos são:

  • Contexto de aplicação: no caso da criação de um assistente de Excel com IA, seria útil se ele soubesse os nomes das planilhas, do arquivo, os intervalos de células selecionados, entre outros. O RAG vai alimentar o prompt com as “informações de atividade no background” para que o LLM possa adaptar a ajuda para a planilha;
  • Dados pessoais, como um agente auxiliar do chatbot. No caso da criação de um bot de suporte ao cliente, ele pode obter o histórico de conversas anteriores e de CRM do cliente específico para ajudar a personalizar a conversa, e não apenas cumprimentar, mas personalizar as opções. Sem o histórico, o LLM não poderá realizar a personalização de forma eficaz, e nem ajudar com os problemas existentes;
  • Números brutos, métricas, dados tabulares (CSV, Parquet, JSON, por exemplo). O RAG não se limita a trabalhar com contexto textual, mas também com informações quantitativas. Um chatbot de business intelligence (BI) provavelmente estaria fazendo RAG em dados tabulares brutos.
Camila Oliveira
Colaboração para o Olhar Digital

Camila Oliveira é jornalista desde 2012. Curiosa e inquieta, já passou por diversas editorias e também trabalhou em outras áreas. Hoje é colaboradora do Olhar Digital e escreve sobre o que mais gosta.

Bruno Ignacio de Lima
Colaboração para o Olhar Digital

Bruno Ignacio é jornalista formado pela Faculdade Cásper Líbero. Com 10 anos de experiência, é especialista na cobertura de tecnologia e conteúdo perene. Atualmente, é colaborador no Olhar Digital.