Dados sintéticos podem salvar a IA, mas há um preço

O uso crescente de dados sintéticos para treinar IAs pode resolver a escassez de dados reais, mas traz riscos
Ana Luiza Figueiredo14/01/2025 16h07
criação de dados sintéticos
(Imagem: Pixel DNA / Shutterstock.com)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Nos últimos dias, Elon Musk, bilionário e proprietário do X, afirmou que o estoque de dados gerados por humanos, usados para treinar modelos de inteligência artificial (IA), como o ChatGPT, chegou ao fim. Embora Musk não tenha apresentado provas concretas para sustentar sua afirmação, outros líderes da indústria de tecnologia têm feito declarações semelhantes nos últimos meses.

Ofertas

Caixa de Som 2.1 14w RMS USB Conexão P2 Controle de Volume Preto - SP172
Vendido por Amazon
Caixa de Som 2.1 14w RMS USB Conexão P2 Controle de Volume Preto - SP172
De: R$ 119,90
Por: R$ 89,90
Cabo de carregamento e cabo de transferência de dados da série Baseus Cafule, USB-A e Lightning 1.5 A, 2 Meter, cinza - preto
Vendido por Amazon
Cabo de carregamento e cabo de transferência de dados da série Baseus Cafule, USB-A e Lightning 1.5 A, 2 Meter, cinza - preto
Por R$ 45,90
Arrow Escape Puzzle Master: Tricky Arrows Maze Challenge Logic Grid Fun & Mind Games
Vendido por Amazon
Arrow Escape Puzzle Master: Tricky Arrows Maze Challenge Logic Grid Fun & Mind Games
Por R$ 38,38
Dominoes Classic Dice Match: Offline Board Game Dice Challenge 2025
Vendido por Amazon
Dominoes Classic Dice Match: Offline Board Game Dice Challenge 2025
Por R$ 38,38
Block Puzzle Master Color Blast Adventure Brain Game
Vendido por Amazon
Block Puzzle Master Color Blast Adventure Brain Game
Por R$ 43,83
Fonte Carregador Para Notebook Acer Aspire 5 A514-54 A515-54 A315-34 19v 3,42A 65W Plug 3.0x1.1mm Pino Fino Bivolt com Cabo de Força
Vendido por Amazon
Fonte Carregador Para Notebook Acer Aspire 5 A514-54 A515-54 A315-34 19v 3,42A 65W Plug 3.0x1.1mm Pino Fino Bivolt com Cabo de Força
De: R$ 55,23
Por: R$ 52,07
Nobreak Interativo XNB 600VA 220V Preto Intelbras
Vendido por Amazon
Nobreak Interativo XNB 600VA 220V Preto Intelbras
De: R$ 536,90
Por: R$ 298,00
Nobreak Interativo ATTIV 700VA Bivolt Preto Intelbras
Vendido por Amazon
Nobreak Interativo ATTIV 700VA Bivolt Preto Intelbras
De: R$ 560,00
Por: R$ 475,87
Adaptador USB-C para HDMI 4K, USB 3.0 e Carga PD - Compatibilidade com MacBook, Thunderbolt 3 e DEX Android - Eleva Sua Experiência Multimídia Oferece Carga Rápida Vende Mais
Vendido por Amazon
Adaptador USB-C para HDMI 4K, USB 3.0 e Carga PD - Compatibilidade com MacBook, Thunderbolt 3 e DEX Android - Eleva Sua Experiência Multimídia Oferece Carga Rápida Vende Mais
Por R$ 24,90
Teclado Magnético Gamer Redragon Kumara PRO K552RGB USB RGB Preto Switch Marrom
Vendido por Amazon
Teclado Magnético Gamer Redragon Kumara PRO K552RGB USB RGB Preto Switch Marrom
De: R$ 330,05
Por: R$ 235,28
Lápis de Cor Ecolápis Triangular Jumbo 12 Cores + 2 Lápis Jumbo 2B, Faber-Castell
Vendido por Amazon
Lápis de Cor Ecolápis Triangular Jumbo 12 Cores + 2 Lápis Jumbo 2B, Faber-Castell
De: R$ 46,00
Por: R$ 36,22
Microsoft Xbox Wireless Controller Storm Breaker Special Edition - Wireless & Bluetooth Connectivity - New Hybrid D-Pad - New Share Button - Featuring Textured Grip
Vendido por Amazon
Microsoft Xbox Wireless Controller Storm Breaker Special Edition - Wireless & Bluetooth Connectivity - New Hybrid D-Pad - New Share Button - Featuring Textured Grip
De: R$ 599,00
Por: R$ 549,00
Carregador Portátil (Power Bank) 20000Mah Turbo 22.5w Carregamento Ultra Rápido PD Visor Led com 2 Saídas Compatível com Android e IOS (Preto)
Vendido por Amazon
Carregador Portátil (Power Bank) 20000Mah Turbo 22.5w Carregamento Ultra Rápido PD Visor Led com 2 Saídas Compatível com Android e IOS (Preto)
Por R$ 89,49
Lata EcoLápis Grip 24 Cores, Faber-Castell, 121024LT, Grafite
Vendido por Amazon
Lata EcoLápis Grip 24 Cores, Faber-Castell, 121024LT, Grafite
De: R$ 63,00
Por: R$ 49,90
Controle sem fio Microsoft Xbox - Edição Especial Heart Breaker [android,ios,windows,xbox_one,xbox_series_s,xbox_series_x]
Vendido por Amazon
Controle sem fio Microsoft Xbox - Edição Especial Heart Breaker [android,ios,windows,xbox_one,xbox_series_s,xbox_series_x]
De: R$ 599,00
Por: R$ 549,00
Havit Mouse Gamer Tri-Mode MS966SE Black, Sem Fio e Com Fio, USB, Bluetooth, Wireless 2.4GHz, RGB, 7 Botões, 800-1600-2400-3200-600-10000 DPI, Preto
Vendido por Amazon
Havit Mouse Gamer Tri-Mode MS966SE Black, Sem Fio e Com Fio, USB, Bluetooth, Wireless 2.4GHz, RGB, 7 Botões, 800-1600-2400-3200-600-10000 DPI, Preto
Por R$ 137,00
Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
Vendido por Amazon
Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)
De: R$ 1.156,80
Por: R$ 727,20
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
Vendido por Amazon
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
De: R$ 30,90
Por: R$ 27,81
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
Vendido por Amazon
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
De: R$ 79,99
Por: R$ 50,10
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Vendido por Amazon
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Por R$ 17.179,99
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
Vendido por Amazon
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
De: R$ 156,00
Por: R$ 140,00
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
Vendido por Amazon
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
De: R$ 199,99
Por: R$ 178,49
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Vendido por Amazon
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
De: R$ 299,99
Por: R$ 204,99
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
Vendido por Amazon
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
De: R$ 259,35
Por: R$ 198,99
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Vendido por Amazon
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Por R$ 2.399,00
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
Vendido por Amazon
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
De: R$ 5.299,00
Por: R$ 4.299,00
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
Vendido por Amazon
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
De: R$ 229,00
Por: R$ 203,92
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
Vendido por Amazon
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
De: R$ 289,90
Por: R$ 179,00
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Vendido por Amazon
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Por R$ 419,99
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
Vendido por Amazon
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
De: R$ 369,00
Por: R$ 209,90
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Vendido por Amazon
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Por R$ 449,00

Pesquisas anteriores indicavam que os dados gerados por humanos poderiam se esgotar dentro de dois a oito anos, o que levanta uma preocupação crescente no setor.

O motivo dessa escassez é simples: a velocidade e a demanda dos modelos de IA crescem em um ritmo que os seres humanos não conseguem acompanhar, gerando texto, imagens e vídeos suficientes. Quando os dados genuínos começarem a se esgotar, isso trará um grande desafio para desenvolvedores e usuários de IA.

elon musk
Elon Musk alertou sobre o esgotamento de dados reais (Imagem: Frederic Legrand – COMEO / Shutterstock.com)

Essa situação forçará as empresas a dependerem mais de dados gerados por IA, chamados de dados sintéticos. Porém, isso pode resultar em sistemas de IA menos precisos e confiáveis, comprometendo sua utilidade.

O que são dados sintéticos e como eles funcionam?

  • Os dados sintéticos são criados artificialmente por algoritmos, como textos gerados pelo ChatGPT ou imagens criadas pelo DALL-E.
  • Essa tecnologia oferece uma solução mais rápida e econômica para o treinamento de modelos de IA, além de ajudar a resolver questões de privacidade e ética, especialmente em relação a dados pessoais sensíveis, como informações de saúde.
  • Diferente dos dados reais, que são limitados, os dados sintéticos são ilimitados e, teoricamente, disponíveis em abundância.
  • Com isso, muitas empresas de tecnologia têm se voltado cada vez mais para o uso de dados sintéticos para treinar suas IAs.
  • A pesquisa da Gartner prevê que, até 2030, os dados sintéticos serão a principal fonte utilizada para alimentar esses sistemas.
  • No entanto, apesar de suas vantagens, esses dados não estão livres de desafios e riscos.
chatgpt da openai
Dados sintéticos são aqueles criados artificialmente por algoritmos, como textos do ChatGPT e imagens criadas por ferramentas de IA (Imagem: One Artist / Shutterstock.com)

Desafios no uso de dados sintéticos

Embora os dados sintéticos apresentem inúmeras vantagens, eles também trazem consigo alguns riscos importantes. Um dos principais problemas é que os modelos de IA podem “colapsar” ao dependerem excessivamente de dados sintéticos. Isso acontece quando os sistemas começam a gerar muitas “alucinações” — respostas com informações falsas — e a qualidade do desempenho dos modelos cai a ponto de se tornarem inutilizáveis.

Além disso, a simplificação excessiva dos dados sintéticos pode resultar em modelos de IA que falham em capturar a complexidade e diversidade dos dados reais. Como exemplo, se um modelo for treinado apenas com dados sintéticos que apresentam erros de ortografia ou inconsistências, ele tenderá a replicar essas falhas, prejudicando a qualidade das respostas geradas.

Como garantir a qualidade dos dados sintéticos?

Para minimizar os riscos e garantir que os dados sintéticos possam realmente complementar os dados reais de forma eficaz, é crucial que organismos internacionais, como a Organização Internacional de Normalização (ISO) ou a União Internacional de Telecomunicações (UIT), implementem sistemas robustos para rastrear e validar os dados usados no treinamento de IA.

Isso permitiria que os sistemas pudessem identificar e garantir a qualidade dos dados durante o treinamento, preservando a transparência e a precisão dos modelos de IA.

Além disso, a supervisão humana continua sendo fundamental para garantir que os dados sintéticos sejam de alta qualidade. Durante o processo de treinamento, é essencial que os dados sintéticos sejam avaliados de forma constante quanto à sua conformidade com padrões éticos e à sua eficácia em melhorar o desempenho do modelo.

Leia mais:

O futuro da IA: sintética, mas confiável?

Embora os dados sintéticos possam se tornar uma peça-chave no desenvolvimento de IA devido à escassez de dados reais, seu uso deve ser cuidadosamente gerido. Se aplicados de maneira adequada, podem melhorar os modelos de IA, reduzindo os erros e preservando a privacidade.

Para que isso aconteça, no entanto, é essencial que sistemas transparentes e auditorias constantes estejam em vigor, garantindo que a IA continue precisa, confiável e útil para todos os usuários.

Em última análise, o futuro da IA depende da qualidade dos dados com os quais é alimentada. Enquanto os dados sintéticos têm o potencial de preencher a lacuna criada pela escassez de dados reais, seu uso deve ser cuidadosamente monitorado para garantir que não comprometam a confiança nos sistemas de inteligência artificial.

Ana Luiza Figueiredo é repórter do Olhar Digital. Formada em Jornalismo pela Universidade Federal de Uberlândia (UFU), foi Roteirista na Blues Content, criando conteúdos para TV e internet.