Olhar Digital Pro

hadoop

Hadoop: os pontos fortes e fracos do "queridinho" do Big Data

Renato Santino 17/12/2014 14h30
Compartilhe com seus seguidores
A A A

Big Data é o termo mais popular dos últimos anos na indústria de tecnologia, prometendo alavancar negócios por meio da análise eficiente de quantidades massivas de dados publicados na internet. Muito disso se deve ao software Hadoop, que vem sido alardeado como uma das melhores soluções em relação a custo-benefício para quem procura entrar nessa área.

O software originalmente foi desenvolvido pelo Yahoo, mas agora é mantido pela Apache Foundation e é distribuído com o código aberto, o que permite seu uso de forma livre e grátis; as empresas também podem modificá-lo e adaptá-lo da forma que preferirem.

O serviço tem a vantagem em relação a concorrentes como a Oracle de se basear em computação distribuída. Isso que significa que, em vez de se basear em grandes e caras estruturas de servidores individuais, o Hadoop divide estas vastas quantidades de dados em redes de milhares de computadores mais baratos e escaláveis.

Com estas vantagens, o serviço tem sido visto como o “hype” do momento no Vale do Silício, e já foi abraçado até mesmo por gigantes como Google, Facebook e Microsoft. Mesmo assim, as experiências com o Hadoop ainda não são totalmente livres de falhas. O Bank of New York Mellon, por exemplo, conseguiu aplicá-lo bem em pequena escala, mas não suportou o peso de vários funcionários tentando acessá-lo ao mesmo tempo, e poucos de seus 13 mil funcionários de TI tinham o conhecimento para resolver a situação.

Na verdade, já se percebe que a tecnologia possui suas limitações, que fazem com que o Hadoop pareça cada vez menos uma solução mágica para tecnologia de Big Data. Como cita o Wall Street Journal, estima-se que a crença no Hadoop já superou a capacidade da ferramenta de trazer resultados para o grande público, já que o recurso, criado originalmente para indexar a web, pode não ser suficiente para grandes tarefas corporativas.

Um dos problemas é que pode ser necessário muito trabalho para combinar os dados armazenados em repositórios antigos com aqueles armazenados no Hadoop. Além disso, apesar de ser mais rápido que bancos de dados comuns para vários propósitos, ele ainda não é muito eficiente para responder a solicitações imediatas ou trabalhar com informações em tempo real.

Isso parece ser um problema sério, já que estas são algumas das áreas que mais interessam as empresas. Por exemplo, a possibilidade de divulgar uma oferta especial para um cliente utilizando a localização do smartphone se torna bastante complicada com o Hadoop.

As limitações, porém, não estão impedindo o “boom” de empresas que colocam a tecnologia como pilar de seu modelo de negócios. É o caso da Hortonworks, que já realizou IPO recentemente e está avaliada em cerca US$ 1 bilhão. Várias outras também concorrem neste espaço, como Cloudera e MapR, também apostam no Hadoop como centro de seus negócios, além de várias outras startups.

O Wall Street Journal cita que também há outras possibilidades para o mercado corporativo, também de código aberto, que podem cobrir buracos deixados pelo Hadoop. Por exemplo o Spark, comercializado pela Databricks, é pensado para ser mais eficiente no manuseio de dados em tempo real. O Metanautix é um projeto nascido no Google pensado para substituir totalmente o Hadoop.

Via Wall Street Journal

big data
Compartilhe com seus seguidores
Compras na Internet? Para aproveitar as melhores ofertas, baixe a nova extensão do Olhar Digital. Além da garantia do melhor preço, você ainda ganha descontos em várias lojas. Clique aqui para instalar.

Recomendados pra você