Precisamos falar sobre big data

O Big Data sem a devida supervisão humana pode resultar em análises cujos resultados são comprometidos de forma catastrófica.
Redação05/11/2018 23h20, atualizada em 05/11/2018 23h45
20131213191815
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

A capacidade de prever o futuro é um desejo que sempre permeou a humanidade. É por isso que a fé em modalidades milenares de divinação persiste até os dias de hoje — astrologia, quiromancia (leitura de mãos) e clarividência são alguns exemplos.

Ofertas

Agenda 2026 Coleção Happy Com Capa Dura Círculos Colors
Vendido por Amazon
Agenda 2026 Coleção Happy Com Capa Dura Círculos Colors
Por R$ 45,90
Suporte para 2 Controles de PlayStation 5 PS5, Apoio de Mesa Gamer, Modelo VN
Vendido por Amazon
Suporte para 2 Controles de PlayStation 5 PS5, Apoio de Mesa Gamer, Modelo VN
De: R$ 39,92
Por: R$ 37,92
Pasta Sanfonada DAC A4 Com 12 Divisões All Black Preto
Vendido por Amazon
Pasta Sanfonada DAC A4 Com 12 Divisões All Black Preto
De: R$ 27,90
Por: R$ 22,59
Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt
Vendido por Amazon
Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt
De: R$ 67,44
Por: R$ 59,95
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
De: R$ 4.699,00
Por: R$ 3.099,00
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
Vendido por Amazon
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
De: R$ 3.499,00
Por: R$ 3.324,00
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
Vendido por Amazon
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
De: R$ 1.049,00
Por: R$ 799,00
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
Vendido por Amazon
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
De: R$ 299,00
Por: R$ 241,44
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
De: R$ 499,90
Por: R$ 349,90
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
Vendido por Amazon
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
De: R$ 2.399,00
Por: R$ 2.159,00
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 188,99
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
Vendido por Amazon
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
De: R$ 88,00
Por: R$ 45,00
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
Vendido por Amazon
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
De: R$ 399,00
Por: R$ 379,00
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
Vendido por Amazon
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
De: R$ 1.629,90
Por: R$ 1.239,90
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
Vendido por Amazon
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
De: R$ 1.179,00
Por: R$ 943,20
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
Vendido por Amazon
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
De: R$ 999,00
Por: R$ 798,99
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
Vendido por Amazon
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
De: R$ 329,90
Por: R$ 205,91
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
De: R$ 599,90
Por: R$ 476,10
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
Vendido por Amazon
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
De: R$ 1.199,00
Por: R$ 1.139,05
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
Vendido por Amazon
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
De: R$ 1.199,00
Por: R$ 949,00
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
Vendido por Amazon
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
De: R$ 169,90
Por: R$ 139,90
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
De: R$ 149,90
Por: R$ 119,90
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
Vendido por Amazon
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
De: R$ 699,00
Por: R$ 398,99
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
Vendido por Amazon
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
De: R$ 109,90
Por: R$ 79,90
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
Vendido por Amazon
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
De: R$ 299,90
Por: R$ 199,90

Na ficção científica, que frequentemente inspira a realidade, meu exemplo favorito é nascido nos anos 40, da imaginação do escritor Isaac Asimov: a “psico-história”. Seria um ramo científico baseado na combinação de história, sociologia e estatística para fazer previsões em larga escala. Em sua trilogia Fundação, a psico-história era aplicada sobre toda a humanidade, prevendo com décadas e até séculos de antecedência os grandes eventos capazes de influenciar o rumo da civilização.

Hoje, mais de 70 anos depois, boa parte das empresas se dedicam a uma proposta muito semelhante, ainda que em escala menor: entender o comportamento de seus clientes. Embora a estatística seja um ponto em comum com a psico-história, no mundo real a sociologia e a história dão lugar ao insumo mais importante dessa ciência: os dados.

Com o advento das redes sociais e a popularização dos celulares, tudo o que fazemos em sociedade é registrado. Desde informações mais óbvias, como amizades, fotos e preferências pessoais que escolhemos compartilhar em redes sociais, até outras menos claras, como nossa navegação pela internet, os lugares por onde passamos com o GPS ativado e as compras que fazemos, tudo é registrado em algum banco de dados. A essa abundância de informações armazenadas e catalogadas se dá o nome de big data.

Munidos de big data e inteligência artificial, cientistas de dados podem entender melhor padrões de comportamento, fazer ofertas personalizadas, prever volume de vendas, identificar fraudes e muito mais. E fazem isso com imenso sucesso: segundo o pesquisador Pedro Domingos, da Universidade de Washington, sugestões de sistemas de recomendação baseados nessas tecnologias são responsáveis por um terço de todas as vendas da Amazon e três quartos das escolhas feitas na Netflix.

Esse poder acompanha um grande risco. Falsos negativos e falsos positivos, por exemplo, são um problema sério de qualquer tipo de teste que separa as pessoas em duas categorias, automatizado ou não. Na área médica, por exemplo, representam respectivamente um paciente doente incorretamente diagnosticado como sadio e vice-versa. Os evidentes problemas que decorrem disso na medicina frequentemente exigem que testes clínicos sejam repetidos mais de uma vez para minimizar a chance de erro.

Porém, quando quem erra são máquinas sem supervisão humana, nem sempre esses casos são corretamente identificados, e algoritmos inflexíveis significam que repetir o teste não mitiga o erro. Em áreas como detecção de fraudes ou concessão de crédito, os resultados podem ser trágicos. No livro Automating Inequality (Automatizando a Desigualdade, em tradução livre), a pesquisadora Virginia Eubanks, da Universidade de Albany, registra diversos casos do tipo nos Estados Unidos, e investiga o impacto de ferramentas da era de big data sobre a população mais pobre.

Outro risco associado a sistemas de inteligência artificial é a expectativa de que sejam “infalíveis”, ou pelo menos “mais imparciais” que seres humanos. Só quem trabalha na área conhece a máxima “garbage in, garbage out” (entra lixo, sai lixo, em tradução livre). Isso essencialmente quer dizer que um algoritmo treinado a partir de dados que têm um viés vão necessariamente repetir esse mesmo viés.

É o caso de algoritmos treinados para calcular a chance de reincidência criminal, aplicados a presos estadunidenses, que apresentam claro viés racial, levando a erros crassos. Isso pode ser atribuído ao encarceramento proporcionalmente muito maior da população negra nos Estados Unidos. Ou seja: o programa sistematicamente conclui que pessoas negras têm maior chance de reincidir simplesmente porque aprende que pessoas negras historicamente são presas com maior frequência. O curioso é que o algoritmo não usa explicitamente a etnia do indivíduo em consideração — mas dada a forte correlação no país entre etnia, poder aquisitivo, acesso à educação etc., ainda é facilmente possível chegar a esses resultados.

Além de todos os riscos da inteligência artificial, muitas vezes um problema ainda maior acontece um passo antes: quando precauções com segurança no armazenamento de grandes volumes de dados não são tomadas. O resultado são os vazamentos de dados que frequentemente têm atraído a atenção da mídia. A companhia de segurança digital Gemalto estima que, desde 2013, mais de 13 bilhões de entradas vazaram de bancos de dados ao redor do mundo. Praticamente um quarto desse número se deve apenas a ocorrências durante a primeira metade de 2018, o que representa mais de 18 milhões de entradas vazadas por dia.

Os riscos desses vazamentos são imensos: indivíduos de moralidade ambígua são capazes de utilizar grandes volumes de dados obtidos ilicitamente até para influenciar o resultado de votações. Isto se tornou abundantemente claro na atuação da empresa Cambridge Analytica nas eleições norte-americanas e no referendo do Brexit. Nas eleições presidenciais do Brasil, um candidato também foi recentemente acusado de se beneficiar de estratégias similares.

As aparentes dificuldades de cientistas de dados com questões éticas e de segurança existem porque este é um campo relativamente novo, que evoluiu muito rapidamente e não tem um suporte tão estruturado de universidades e outras instituições de ensino. Programas nessa área, quando existem, não costumam abordar segurança e ética diretamente. Por exemplo, cursos de bancos de dados sempre ensinam SQL (structured query language), uma linguagem ubíqua para a área, mas poucos abordam injeções de SQL, um dos tipos de ataque mais frequentes a bancos de dados. Quando o fazem, é por via de princípios gerais, desconexos de problemas reais em ciência de dados ou inteligência artificial.

Por todo o mundo, medidas já começaram a ser tomadas para garantir a segurança do público. No Brasil, a principal é a Lei Geral de Proteção aos Dados, feita aos moldes da lei europeia similar (GDPR, na sigla em inglês). Ambas tentam garantir, por exemplo, o direito dos cidadãos de terem seus dados apagados do sistema de qualquer empresa a qualquer momento. Outra questão assegurada é a portabilidade — que daria o direito de exigir, por exemplo, que ao trocar de plano de saúde, o seu histórico médico fosse enviado para a nova empresa e apagado do sistema da primeira.

Do ponto de vista educacional, precisamos criar mais recursos para suprir a demanda de profissionais de dados, e garantir a presença de disciplinas de ética e segurança nas ementas. Empresas podem apoiar seus funcionários, oferecendo cursos e treinamentos. Para quem já atua nessa área, é essencial identificar e suprir essas deficiências rapidamente. Por sorte, esses profissionais já estão habituados a estudar por conta própria, então talvez seja apenas uma questão de conscientização.

É certo que, como em qualquer problema desse porte, a solução não será simples nem rápida. Mas se a enorme onda de vazamentos de dados teve um lado positivo, foi aquecer o debate em todas as esferas. Mesmo que um consenso demore a surgir, as questões mais importantes já começaram a ser levantadas — agora resta esperar que, em meio a tantos dados, consigamos encontrar boas respostas.

Redator(a)

Redação é redator(a) no Olhar Digital