Como a inteligência artificial e os dados não estruturados vão mudar a Big Data

Redação23/10/2017 18h09, atualizada em 23/10/2017 18h25
20171023162542
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Imagine que você recebe dois arquivos. O primeiro deles é uma planilha do Excel que contém, em uma coluna, campos como “Nome”, “Idade” e “Endereço” e, na coluna vizinha, as informações referentes a uma pessoa (João da Silva, por exemplo). O segundo é uma entrevista em vídeo com esse mesmo João da Silva, na qual ele menciona as mesmas informações do que as que estão contidas na planilha.

Ofertas

Material Dourado Com 74 Peças Pais & Filhos Dourado
Vendido por Amazon
Material Dourado Com 74 Peças Pais & Filhos Dourado
De: R$ 11,85
Por: R$ 8,28
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
Vendido por Amazon
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
De: R$ 2.499,00
Por: R$ 1.998,89
Freezer Vertical Consul 231 Litros - CVU26FB 110V
Vendido por Amazon
Freezer Vertical Consul 231 Litros - CVU26FB 110V
De: R$ 3.279,35
Por: R$ 2.498,89
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
Vendido por Amazon
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
De: R$ 599,90
Por: R$ 491,92
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
Vendido por Amazon
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
De: R$ 189,90
Por: R$ 129,90
Climatizador de Ar Digital Midea 127V 60Hz
Vendido por Amazon
Climatizador de Ar Digital Midea 127V 60Hz
De: R$ 529,99
Por: R$ 412,69
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
Vendido por Amazon
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
De: R$ 799,00
Por: R$ 593,00
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
Vendido por Amazon
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
De: R$ 3.799,00
Por: R$ 3.598,94
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
Vendido por Amazon
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
De: R$ 699,00
Por: R$ 499,00
PlayStation DualSense Controle sem fio – Branco
Vendido por Amazon
PlayStation DualSense Controle sem fio – Branco
De: R$ 499,90
Por: R$ 369,00
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
Vendido por Amazon
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
De: R$ 2.489,00
Por: R$ 1.616,02
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
Vendido por Amazon
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
De: R$ 259,90
Por: R$ 179,90
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
Vendido por Amazon
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
De: R$ 3.599,00
Por: R$ 2.759,00
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
Vendido por Amazon
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
De: R$ 299,90
Por: R$ 199,00
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
Vendido por Amazon
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
De: R$ 899,90
Por: R$ 399,00
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
Vendido por Amazon
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
De: R$ 229,90
Por: R$ 132,00
CAMERA INSTAX MINI 12 ROSA GLOSS
Vendido por Amazon
CAMERA INSTAX MINI 12 ROSA GLOSS
De: R$ 649,00
Por: R$ 505,00

Em termos de informação, pode parecer que há pouca diferença entre os dois arquivos. Afinal, todos dados sobre João que estão presentes na planilha são mencionados por ele em algum momento do vídeo. Mas num segundo momento, é fácil entender que o vídeo contém também uma série de outras informações que a planilha não seria capaz de incluir.

Por exemplo: como vemos João falando conosco, percebemos sua expressão facial ao nos dar cada informação. Vemos, aliás, o seu rosto – algo que uma planilha com apenas números e letras jamais poderia mostrar. Notamos também a expressão corporal de João, e disso podemos depreender se ele é tímido ou extrovertido, se ele está à vontade com a entrevista ou receoso por causa dela.

Finalmente, além de João notamos também o local da entrevista, e isso nos dá uma série de informações sobre aquele momento. Se ele aconteceu na casa de João, por exemplo, teremos uma ideia de sua condição social. Uma planilha que incluísse apenas os dados “brutos” de João, por outro lado, jamais seria capaz de nos dar insights desse tipo.

Infelizmente, no entanto, há outra diferença profunda entre os dois arquivos. A planilha pode facilmente ser lida e interpretada por uma máquina, que a partir do arquivo pode organizar todas as informações sobre João. O vídeo, por sua vez, embora contenha ainda mais informações, não seria compreendido pela máquina. Com isso, os dados contido nele acabariam passando em branco – ao menos por enquanto.

Computadores que vêem

De maneira geral, o exemplo acima ilustra a diferença entre “dados estruturados” (a planilha) e “dados não estruturados” (o vídeo). Os dados estruturados são bem organizados, facilmente legíveis por uma máquina e facilmente indexáveis, o que faz com que seja fácil encontrá-los em buscas. Os dados não estruturados, por sua vez, são menos organizados e legíveis por máquinas; por isso, são difíceis de indexar, e acabam não aparecendo mesmo em buscas relevantes.

É fácil perceber que isso representa um grande problema para empresas e serviços que dependem de dados para o seu bom funcionamento. Sem dúvida, a internet está cheia de dados – nunca houve, na história, uma biblioteca tão vasta de informações. Mas quantos desses dados estão organizados de uma maneira que nos permita encontrá-los?

Felizmente, a tecnologia já está em um ponto que nos permite contornar essa situação. Graças a sistemas de inteligência artificial e recursos como aprendizagem de máquina, os computadores estão entrando cada vez mais na “era cognitiva” – um momento em que os dados “não estruturados” serão, para eles, tão claro quanto as tradicionais planilhas do Excel.

Alguns exemplos disso já podem ser observados nas APIs do Watson, o sistema de computação cognitiva da IBM. Por meio delas, é possível criar sistemas capazes de detectar emoções em vídeos (com base em expressões faciais) ou arquivos de áudio (baseando-se no tom de voz), e até mesmo em textos. Demandas mais tradicionais – como compreender as informações que uma pessoa transmite e indexá-la para que ela apareça em buscas futuras – são ainda mais simples de se incorporar.

Vendo mais do que nós

Com essas tecnologias, o problema que os dados não estruturados apresentam hoje para empresas e serviços que dependem de Big Data deve se tornar algo do passado. E por incrível que pareça, isso pode ser apenas o primeiro passo em uma revolução na maneira como lidamos com a informação.

Isso porque treinar um sistema para que ele extraia as mesmas informações de um vídeo que nós extraímos é só o começo. É possível continuar a refinar os algoritmos de aprendizagem da máquina para que ela se torne capaz de perceber ainda mais informações do que nós somos capazes de perceber.

Exemplos disso já existem no mundo real. Empresas como Microsoft, Google e a própria IBM já estão aplicando recursos de inteligência artificial para identificar e tratar doenças com mais precisão, rapidez e eficiência. Tudo isso é feito com a ajuda dos dados: após analisar milhões de exames de pacientes com câncer (que incluem imagens, gravações e outros dados complexos), os sistemas conseguem detectar os padrões que sinalizam a doença em outros pacientes – muitas vezes com precisão superior à de médicos.

Se interessou pelo assunto? A IBM vai promover um evento ao vivo no dia 24 de outubro (terça-feira) sobre esse assunto. Nele, a empresa vai mostrar como as ferramentas de inteligência artificial podem ser usadas criar análises e extrair insights. Trata-se de um evento gratuito que exige apenas inscrição prévia. A inscrição pode ser realizada por meio deste link.

Redator(a)

Redação é redator(a) no Olhar Digital