Big data: Significado e exemplos
As pessoas têm opiniões controversas sobre big data. Enquanto seus defensores destacam as vantagens da coleta de enormes quantidades de dados possibilitada pela digitalização, críticos ganham visibilidade ao levantar questões sobre a proteção de dados pessoais. Depois das denúncias de Edward Snowden e da divulgação de diversas práticas de espionagem e monitoramento, não só empresas, mas também usuários privados, começaram a se preocupar com seus dados pessoais. O que se ouve e se lê por aí sobre big data geralmente é muito negativo. Mas esse é apenas um dos seus múltiplos aspectos.
O que é big data?
O termo big data diz respeito a uma enorme quantidade de dados de uma complexidade tal, que hardwares e softwares tradicionais não são capazes de processá-los. Em si, big data é um termo geral que também pode significar grande quantidade de dados coletados em pesquisas, por exemplo. Mas, quando esse termo é usado para se referir a dados pessoais coletados na internet (como dados sobre comunicação ou comportamentos de consumo), ele frequentemente tem conotação negativa. Os críticos consideram que a coleta e a análise desses dados violam o direito das pessoas à privacidade.
Qual é o tamanho do big data?
Como o próprio nome já diz, a quantidade de dados do big data não é exata. Não há um valor definido a partir do qual se pode ou não chamar um conjunto de dados de big data. Mas, na prática, o termo é geralmente usado como sinônimo de quantidades de dados tão grandes, que já não podem mais ser medidos em gigabytes.
Como o big data é coletado?
O volume de dados existente adquiriu proporções descomunais. Em 2014, foram necessários somente 10 minutos para que todos os dados produzidos pela humanidade até o ano de 2002 fossem coletados. Alguns prognósticos afirmam que essa montanha de dados continuará a aumentar, dobrando a cada dois anos. A imensa quantidade de dados se deve ao aumento da digitalização na vida cotidiana. O big data tem origem na coleta de dados de diversas fontes, como:
- Uso de internet móvel
- Mídias sociais
- Geotargeting (geolocalização de usuários)
- Computação em nuvem
- Medição de dados vitais
- Streaming de mídias
Quando as pessoas falam sobre big data, elas geralmente não se referem somente à coleta de dados, mas também às suas análises e utilizações. O objetivo de se coletar esses dados é identificar padrões e relações para aplicá-los nos contextos certos. O desafio vai além da enorme quantidade de dados, pois eles também são coletados em velocidades altíssimas e contêm informações extremamente diversificadas. É um fluxo contínuo de dados em um reservatório desorganizado. Eles devem ser registrados, armazenados e processados, se possível em tempo real. Para ler corretamente esses dados e estabelecer relações entre eles, é necessário ter uma sofisticada infraestrutura de dados.
Como lidar com o big data?
De acordo com a definição de big data, o volume de dados é tão grande, que a tecnologia dos hardwares e softwares normais não é capaz de processar esses dados de maneira eficiente. Portanto, para lidar com essa enorme quantidade de dados é necessário aumentar os requisitos técnicos dos softwares utilizados. Somente frameworks especiais podem analisar esses dados: só eles são capazes de processar simultaneamente a maior quantidade possível de conjuntos de dados e importá-los com rapidez. Além disso, esses softwares conseguem disponibilizar dados aos usuários em tempo real e, se necessário, responder múltiplas consultas ao banco de dados de uma só vez.
Uma conhecida solução open source é o Apache Hadoop. Mas como sua implementação é muito complexa, geralmente não é possível realizá-la sem a ajuda de especialistas, os chamados cientistas de dados. Mas, para começar a se familiarizar com o big data, você também pode usar soluções em nuvem.
Exemplos de utilização de big data
O big data é utilizado nas mais diversas áreas da vida cotidiana. Até as coisas mais comuns, que todo usuário de internet conhece, são baseadas nele. Um dos exemplos de aplicação do big data está nas compras on-line: quem já comprou pela internet provavelmente se deparou com sugestões de compra semelhantes a: “Os clientes que compraram o produto XY também compraram o produto XZ”. Essas sugestões são geradas a partir da análise de milhões de dados de compras de outros usuários.
Outros exemplos de áreas beneficiadas pelo big data são:
- Pesquisas médicas: A análise de dados em grande escala facilita que profissionais de saúde encontrem os melhores planejamentos e soluções para o tratamento de pacientes.
- Indústria: A utilização dos dados das próprias máquinas pode contribuir para que empresas aumentem a eficiência de sua produção e funcionem de maneira mais sustentável.
- Economia: O big data possibilita que empresas conheçam melhor seus clientes e adaptem suas ofertas com mais eficiência.
- Energia: Para que o consumo de energia seja ideal para as demandas individuais, é preciso saber quais são essas demandas. A coleta de dados de consumo contribui, a longo prazo, para um consumo de energia mais sustentável.
- Marketing: O big data é usado para fins de direcionamento ao público-alvo (targeting). O objetivo dessa utilização é aprimorar o relacionamento com os consumidores e implementar diversas ações de marketing.
- Combate ao crime: Instituições públicas recorrem ao big data para detectar comportamentos suspeitos e prevenir o cometimento de crimes e atos terroristas.
Críticas ao big data
Para muitos críticos do big data, o maior de seus problemas diz respeito à proteção de dados. A imensa quantidade de dados é valiosa para empresas e marcas, que podem aprimorar a eficiência de suas ações de marketing. Dados utilizados para targeting também permitem elaborar perfis de usuário precisos, o que pode ser visto como uma violação ao direito dos usuários à privacidade. Por isso, sempre que se for utilizar big data, é necessário avisar consumidores e usuários de sites, na política de privacidade, sobre a coleta de dados pessoais.
Outro argumento da crítica é o monopólio sobre os dados. “Big players” operam o big data: empresas geram lucro trabalhando com essa imensa quantidade de dados, como o Google e outros mecanismos de busca. Há uma soberania de dados por parte dessas empresas. A monopolização é criticada tão frequentemente quanto o risco da utilização indevida de dados em grande escala. Sem uma regulamentação clara sobre proteção de dados e anonimização, não é possível eliminar o risco do uso indevido dos dados dos usuários.
Uso responsável do big data
Apesar de todas as críticas, a utilização do big data traz grandes benefícios quando a tecnologia é corretamente empregada. Alguns progressos valiosos, como no combate ao câncer, não teriam sido possíveis sem o big data. As áreas de distribuição de energia e de controle de trânsito também são aprimoradas continuamente, graças à análise de grandes quantidades de dados, que oferecem mais segurança ao dia a dia. Mas, apesar das oportunidades de desenvolvimento nas áreas de medicina e economia, é preciso pensar com cuidado sobre questões éticas. Afinal, poder prever determinados eventos, se alguém vai desenvolver uma determinada doença no futuro, por exemplo, é assustador para muitas pessoas. A população tem direito à privacidade e preocupa-se com a segurança dos seus dados.
No site da Serpro, empresa pública responsável pela maior parte das soluções digitais governamentais do Brasil, você encontra informações sobre a Lei Geral de Proteção de Dados Pessoais (LGPD), que entrou em vigor no Brasil em 2018. O site oferece tanto informações direcionadas aos usuários quanto às empresas.
Nosso Digital Guide também detalha a aplicação da LGPD no comércio eletrônico brasileiro.