Glossário da I.A.: Big Data

Juliana Fonseca (120872)

Big Data é o termo utilizado na área da tecnologia da informação que representa a grande quantidade de dados que não seria processada pelas ferramentas tradicionais, por exceder a capacidade de processamento e gestão de dados dessas ferramentas.

O Big Data são dados que contém maior variedade de informação, que são recebidos com maior velocidade e, principalmente, maior volume de dados. Essa definição tem sido conhecida como os 3 V’s.

Mais dois V’s do Big Data

Nos últimos anos, mais dois V’s surgiram na definição dos Big Datas: valor e veracidade. Dados possuem valor, mas mais importante é a veracidade desses dados. Os avanços tecnológicos recentes permitiram o armazenamento e computação de quantidades absurdas de dados por um custo muito mais baixo.

Para as grandes empresas de tecnologia, um volume de Big Data maior, mais barato e mais acessível, as decisões de negócios podem ser tomadas com mais precisão.

A história do Big Data

As grandes quantidades de dados remontam as décadas de 60 e 70, quando os primeiros data centers estavam sendo desenvolvidos. O desenvolvimento de estruturas de código aberto foi essencial para o crescimento do big data. Elas tornaram o trabalho com essa grande quantidade de dados mais fácil e seu armazenamento mais barato.

Nos anos seguintes, o volume de big data disparou. Usuários ainda estão gerando grandes quantidades de dados, mas não são somente humanos que estão fazendo isso. Apesar da evolução do big data, sua utilidade ainda está no começo. A computação em nuvem expandiu ainda mais as possibilidades do Big Data e oferece uma escalabilidade verdadeiramente elástica.

Benefícios do Big Data

  • Com o big data, você obtém respostas mais completas, porque tem mais informações.
  • Respostas mais completas significam mais confiança nos dados, ou seja, uma abordagem completamente diferente para lidar com problemas.

Desafios do Big Data

Como toda promessa de tecnologia, o Big Data também traz seus desafios. Apesar de novas tecnologias terem sido desenvolvidas para o armazenamento de dados, os volumes de dados estão dobrando em tamanho a cada dois anos. As empresas ainda se esforçam para acompanhar a evolução de seus dados e encontrar maneiras de armazená-los com eficiência.

Mas armazenar os dados não é o suficiente. Eles devem ser usados para serem úteis, e isso depende da curadoria. Dados limpos ou relevantes para o cliente e organizados de maneira que permita uma análise significativa exigem muito trabalho. Cientistas de dados gastam de 50 a 80 por cento de seu tempo curando e preparando dados antes de serem usados.

A tecnologia de big data está mudando em ritmo acelerado. Há alguns anos, o Apache Hadoop era a tecnologia popular usada para lidar com big data. Em seguida, o Apache Spark foi introduzido em 2014. Hoje, uma combinação das duas estruturas parece ser a melhor abordagem. Manter-se atualizado com a tecnologia de big data é um desafio contínuo.

Referência: https://www.oracle.com/br/big-data/what-is-big-data/

Write a Comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *