Posts recentes

Série: os “Vs” do Big Data-volume




Em nosso primeiro artigo sobre os “Vs” do Big Data falaremos sobre o volume. O advento da internet e a evolução da computação propiciaram um visível aumento da produção de dados e de informação. A quantidade de dados produzidos somente pelas redes sociais é impressionante.

Para se ter uma ideia sobre os valores, estima-se que no ano de 2020 algo em torno de 45 zettabytes de dados serão produzidos, o que representa em linhas gerais 49 trilhões de gigabytes. São números realmente assustadores. Há pouco mais de algumas décadas, tais cifras seriam quase que inimagináveis.

Obviamente, com ordens de grandeza assim, as tecnologias de armazenamento e de processamento desses dados precisam ser muito poderosas. Para fazer esse trabalho, criaram-se tecnologias como Data Lake e Data Warehouse. Ambos funcionam como enormes repositórios de dados com poderosos sistemas de armazenamento, processamento e segurança de dados. No entanto, há algumas diferenças importantes entre ambos.

O Data Lake costuma receber todos os tipos de dados. Não há um tratamento prévio ou mineração dos dados antes de serem enviados ao repositório. Esse tipo de tecnologia necessita de engenheiros de dados e cientistas de dados para ser acessada, com intuito da obtenção de informações e conhecimentos.

Já o Data Warehouse, via de regra, recebe dados estruturados e que já passaram por certos tratamentos antes de entrar no repositório. Esse tipo de repositório costuma ser mais caro do que um Data Lake e atende a analistas e tomadores de decisões.

Grandes empresas (e mesmo empresas de médio porte) investem pesado em tecnologias de Big Data para dominar esse vasto oceano de dados e com isso conseguir informações lógicas e estruturadas que possam gerar novos conhecimentos e lucros. Há um enorme potencial de geração de empregos para esse setor, o que ocorre é falta mão de obra especializada.

O Big Data figura como grande promessa de investimentos já nesses anos vindouros. Quem sabe você não será o próximo a entrar nesse universo?! Até mais!

Fernando Montini é cientista de dados, pedagogo, químico industrial e mestre em Biologia.

Escreve para o blog sobre tecnologia na área de Ciência de Dados, Business Intelligence e Mercado Financeiro.

121 visualizações0 comentário

Posts recentes

Ver tudo
VEJA TAMBÉM