Big data e privacidade: quais são os riscos de privacidade? | VPNOverview

Nas últimas décadas, o mundo mudou tremendamente em muitos aspectos, especialmente quando se trata de TI. O número de pessoas com quem podemos nos comunicar diariamente cresceu enormemente, assim como a quantidade de informações a que temos acesso. No entanto, o mesmo se aplica à quantidade de informações que as grandes empresas coletam sobre nós. Termos como big data são usados ​​com mais frequência à medida que o tempo passa. Mas o que isso significa exatamente? O que é big data? É perigoso? Como isso afeta nossa privacidade, se é que existe? Essas são algumas das perguntas que abordaremos neste artigo.


O que é big data?

Lista com lupaO termo “big data” descreve as enormes quantidades de dados (pessoais) que são continuamente coletados por diferentes atores. Um exemplo seria todas as informações que o Google coleta sobre as consultas de pesquisa de seus usuários. O fenômeno do big data é um desenvolvimento relativamente recente que começou porque (grandes) empresas e organizações, como Facebook, Google e a maioria dos governos, começaram a reunir cada vez mais dados sobre seus usuários, clientes e cidadãos do que antes. Novas tecnologias, um mundo digitalizado e a Internet ajudaram imensamente esse desenvolvimento.

As coleções de big data geralmente são tão vastas que é impossível analisá-las usando a análise de dados tradicional. No entanto, se alguém analisar big data da maneira correta, padrões e conclusões interessantes poderão ser induzidos. Por exemplo, o big data é frequentemente usado para pesquisas de mercado em larga escala: quais produtos têm maior probabilidade de serem comprados? Que tipo de publicidade é mais eficaz quando você deseja alcançar e convencer os clientes?

Para que um conjunto de dados seja considerado big data, ele geralmente deve atender aos três critérios a seguir, também conhecidos como 3 v:

  • Volume: Big data é tudo menos uma amostra pequena. Envolve vastas coleções de dados, resultantes de observação longa e contínua.
  • Velocidade: Isso tem a ver com as velocidades impressionantes nas quais grandes dados são coletados. Além disso, o big data geralmente é acessível em tempo real (quando está sendo coletado).
  • Variedade: Grandes conjuntos de dados geralmente contêm muitos tipos diferentes de informações. Os dados em grandes conjuntos de dados podem até ser combinados para preencher eventuais lacunas e tornar o conjunto de dados ainda mais completo.

Além desses 3v, o big data tem outras características. Por exemplo, o big data é ótimo para aprendizado de máquina. Isso significa que ele pode ser usado efetivamente para ensinar determinadas tarefas a computadores e máquinas. Além disso, como já mencionamos brevemente, o big data pode ser usado para detectar padrões. Isso acontece principalmente de maneira muito eficaz, por meio de computadores trabalhando nos dados. Por fim, o big data é o reflexo das impressões digitais dos usuários. Isso significa que é um subproduto das atividades digitais e online das pessoas e pode ser usado para criar perfis pessoais individuais.

Diferentes tipos de big data

Existem diferentes maneiras de classificar o big data. A primeira maneira, que é usada com mais freqüência, diferencia big data com base no tipo de dados que está sendo coletado. As três categorias possíveis usadas para esse tipo de classificação são: big data estruturado, big data não estruturado e big data semiestruturado.

  1. Estruturada: Quando o big data é estruturado, ele pode ser salvo e apresentado de forma organizada e lógica, tornando os dados mais acessíveis e fáceis de compreender. Um exemplo seria uma lista de endereços de clientes criados por uma empresa. Nesta lista, é provável que você encontre nomes, endereços e talvez outros detalhes dos clientes, como números de telefone, todos estruturados claramente em, por exemplo, um gráfico ou tabela.
  2. Não estruturado: O big data não estruturado não está organizado. Falta uma apresentação lógica que faria sentido para o ser humano médio. O big data não estruturado não possui a estrutura de, por exemplo, uma tabela que denota uma certa coerência entre os diferentes elementos do conjunto de dados. Portanto, esse tipo de dados é bastante difícil de navegar e compreender. Muitos conjuntos de dados começam inicialmente como big data não estruturado.
  3. Semi-estruturado: Big data semiestruturado, como você deve ter adivinhado, tem características de big data estruturado e não estruturado. A natureza e a representação desse tipo de dados não são completamente arbitrárias. No entanto, também não está estruturado e organizado o suficiente para ser usado para uma análise significativa. Um exemplo seria uma página da web que contém metatags específicas (informações extras que não são diretamente visíveis no texto), por exemplo, porque contém determinadas palavras-chave. Essas tags mostram efetivamente bits específicos de informações, como o autor de uma página ou o momento em que ela foi colocada online. O texto em si é essencialmente não estruturado, mas as palavras-chave e outros metadados que ele contém ajudam a torná-lo uma base adequada para a análise.

Classificação baseada na fonte de big data

Outra maneira comum de distinguir entre diferentes tipos de big data é observando a fonte dos dados. Quem ou o que gerou a informação? Como na versão anterior, esse método de classificação também consiste em 3 categorias diferentes.

  1. Pessoas: Esta categoria diz respeito a big data gerado por pessoas. Exemplos seriam livros, fotos, vídeos, bem como informações e dados (pessoais) em sites e mídias sociais, como Facebook, Twitter, Instagram, etc..
  2. Processo de registro: Essa categoria inclui o tipo mais tradicional de big data, que é coletado e analisado por (grandes) empresas para melhorar certos processos em um negócio.
  3. Máquinas: Esse tipo de big data resulta do número cada vez maior de sensores que são colocados nas máquinas. Um exemplo seria o sensor de calor que geralmente é incorporado aos processadores do computador. Os dados gerados pelas máquinas costumam ser muito complexos, mas pelo menos esse tipo de big data geralmente é bem estruturado e completo.

Para que big data pode ser usado?

Logo do facebookTudo o que foi discutido até agora ainda pode parecer um pouco abstrato. Vamos tornar as coisas um pouco mais concretas e discutir alguns aplicativos da vida real de big data. Afinal, existem muitas, muitas maneiras pelas quais empresas e organizações usam big data. Uma das primeiras coisas que vem à mente é a enorme quantidade de empresas de dados que se reúnem sobre nós. O Facebook coleta dados de todos os seus usuários e analisa isso para decidir o que mostrar na sua linha do tempo. Obviamente, isso é feito para atender aos seus desejos e interesses pessoais. O Facebook espera que isso faça com que você permaneça no site por longos períodos de tempo. Por sua vez, a Amazon reúne informações sobre seus clientes e os produtos que eles compram. Dessa forma, a Amazon pode recomendar produtos nos quais eles acham que você está interessado e aumentar seus ganhos dessa maneira.

No entanto, o big data também é usado de maneiras completamente diferentes das estratégias comerciais descritas acima. Por exemplo, as empresas de transporte público podem coletar dados sobre o quão ocupadas determinadas rotas estão. Posteriormente, eles poderiam analisar esses dados para decidir, por exemplo, quais rotas requerem ônibus ou trens adicionais. Outro caso bem conhecido de uso eficaz de big data refere-se à gigante de entregas internacionais UPS. A UPS utiliza um software especial que foi desenvolvido após a análise de big data. Este software ajuda os drivers da UPS a evitar curvas à esquerda, que são mais caras, mais dispendiosas e mais perigosas que as curvas à direita. Supostamente, esse sistema já economizou milhões de litros de combustível para a UPS, tudo graças ao big data.

Outro exemplo interessante de coleta de big data são testes de DNA e sites como o MyHeritage DNA. Este site afirma que pode ajudá-lo a “descobrir suas origens étnicas e encontrar novos parentes” com um simples teste de DNA. Desnecessário dizer que esse processo envolve muita coleta e referência cruzada de dados, tornando-se outro participante importante na coleta e uso de big data. Os testes de DNA físico “tradicionais” também envolvem uma enorme quantidade de big data, pois as empresas que realizam esses testes obterão conjuntos de dados extremamente grandes sobre muitas e muitas pessoas. Obviamente, é importante estar ciente dos possíveis riscos que acompanham esses processos de coleta de big data. Esses riscos serão destacados na próxima parte deste artigo.

O big data é perigoso?

Como mostrado acima, o big data pode ser incrivelmente útil em muitos casos. Ele nos fornece toneladas de informações que podemos usar para otimizar processos e tornar as empresas mais eficientes e lucrativas. No entanto, isso não significa que a coleta e o uso de big data sejam totalmente isentos de riscos. Existem cinco riscos importantes que acompanham o big data. Vamos discutir todos os cinco aqui.

Hackers e ladrões

Com tudo o que fazemos online, há um risco inerente de que nossos dados e informações pessoais em nossas atividades na Internet possam ser roubados. Todo usuário da internet precisa estar ciente disso. O número de vazamentos e roubos de dados aumentou drasticamente nos últimos anos. Muitas vezes, há notícias nas notícias sobre criminosos que vendem conjuntos de dados contendo senhas e outras informações em locais como a dark web. Freqüentemente, esses conjuntos de dados são roubados de sites, empresas e organizações oficiais. Quanto maiores esses conjuntos de dados, mais interessante se torna para os ladrões tentarem obtê-los. Se eles colocarem as mãos nesses conjuntos de dados, eles podem causar muitos problemas. Escusado será dizer que isso também pode comprometer muito a sua privacidade.

Privacidade

A prática de coletar dados pessoais está se tornando cada vez mais difundida. No entanto, os regulamentos de privacidade atuais não podem acompanhar os rápidos desenvolvimentos em tecnologia que tornam essa prática possível. Isso deixa espaço para áreas cinzentas e incertezas que não podem ser resolvidas observando a lei. Preocupações importantes de privacidade que surgem incluem: Que tipo de dados pode ser coletado? Sobre quem? Quem deve ter acesso a esses dados?

Ao coletar grandes quantidades de dados, as chances de que informações pessoais sensíveis sejam incluídas nesses conjuntos de dados são altas. Isso é problemático, mesmo quando hackers e ladrões não estão brincando. Afinal, os dados sensíveis à privacidade podem ser abusados ​​por qualquer pessoa com más intenções. Isso inclui empresas e organizações (maliciosas).

Má análise de dados

Muitas empresas e organizações coletam big data, porque podem usá-lo para análises interessantes. Isso pode fornecer novas informações importantes sobre o que eles estão pesquisando (como, por exemplo, hábitos do consumidor). Por sua vez, essas idéias e conclusões podem se traduzir em mudanças dentro da empresa que resultam em margens mais altas e mais lucro. No entanto, assim como em qualquer outro conjunto de dados normal, uma análise incorreta de big data pode ter sérias conseqüências. Afinal, uma análise inadequada pode facilmente levar a conclusões erradas. Estes podem, por sua vez, traduzir-se em medidas ineficazes ou mesmo contraproducentes sendo tomadas.

Reunindo os dados “errados”

O big data está se tornando cada vez mais popular e as organizações estão cada vez mais dispostas a coletar todos os tipos de dados. Isso significa que quantidades gigantescas de dados estão sendo coletadas sem que haja uma razão clara para analisá-las. Em outras palavras, ele cria um enorme banco de dados de informações brutas que foram coletadas apenas por precaução. As empresas provavelmente pensam que é fácil o suficiente reunir todos esses dados, para que eles possam fazê-lo. Escusado será dizer que isso não é bom para a privacidade de ninguém. Pode até levar à coleta e análise de dados irrelevantes ou “errados”. Se as conclusões tiradas dessa análise forem usadas na administração, isso poderá levar às mesmas medidas ineficazes mencionadas no parágrafo anterior.

Coletando e salvando big data com más intenções

A coleta de big data é usada cada vez mais frequentemente por empresas, organizações e governos para que eles possam criar perfis individuais precisos das pessoas. Usuários ou cidadãos quase nunca são notificados sobre quais dados pessoais estão sendo registrados, muito menos por que e como. Escusado será dizer que isso tem sérias implicações para a sua privacidade online. Tudo o que eles fazem online pode ser salvo e visualizado mais tarde. Além disso, os grandes coletores de dados podem facilmente influenciar e manipular a tomada de decisão das pessoas, analisando e usando os dados coletados.

Big data e privacidade

Smartphone com foto da orelhaComo você provavelmente já deve entender agora, o big data traz muitas desvantagens e riscos. No entanto, muitas empresas e organizações ainda coletam dados em grande escala, principalmente por causa de como isso pode ajudá-los a crescer e avançar. A coleta de big data é mais fácil do que nunca. Isso tem enormes consequências para a nossa privacidade. Já discutimos brevemente os possíveis perigos de privacidade de partes mal-intencionadas que coletam dados ruins. Como nossa privacidade está tão intimamente ligada à coleta em massa de dados pessoais, queremos usar esta seção para discutir as diferentes preocupações com a privacidade que acompanham o big data.

Coleta de dados em larga escala

Muitas empresas, incluindo Google, Facebook e Twitter, dependem fortemente de anúncios para se sustentar e obter lucro. Para tornar esses anúncios o mais eficaz possível, essas empresas criam perfis detalhados de seus usuários, especialmente levando em consideração seus gostos e interesses. Esta é uma forma de big data. Da mesma forma, governos e serviços secretos também dependem de big data. Eles usam essa vasta quantidade de informações para rastrear e investigar pessoas que consideram suspeitas. Obviamente, isso também significa que há muitos dados importantes para os criminosos cibernéticos colocarem em suas mãos e talvez até manipularem e abusarem. Isso pode criar todos os tipos de problemas de privacidade e de identidade. Um que vem à mente é o roubo de identidade.

Ainda assim, as possibilidades que acompanham a coleção nos bancos de dados são muito mais amplas que isso. Atualmente, a tecnologia tornou-se tão avançada e “inteligente” que pode combinar conjuntos de dados. Isso pode ser feito de uma maneira tão inteligente e esperta, que grandes corporações e organizações provavelmente sabem mais sobre você do que você! Quem você é, onde mora, quais são seus hobbies, quem são seus amigos: nenhuma dessas informações será mais privada. Não é um pensamento muito reconfortante, você pode pensar. Felizmente, existem algumas maneiras de se proteger contra a violação de privacidade em larga escala que o big data pode causar.

Leis sobre privacidade

Cookies na telaAs leis e regulamentos de privacidade podem nos proteger contra a violação de privacidade, mas apenas até um certo ponto. Para tornar as coisas mais complicadas, as leis de privacidade geralmente diferem bastante entre os diferentes países e regiões. Por exemplo, na Europa está em vigor uma lei de privacidade do consumidor relativamente rígida, denominada Regulamento Geral de Proteção de Dados (GDPR). Esta lei se aplica a todos os estados membros da UE, embora os detalhes possam diferir por país. Muitas empresas internacionais decidiram cumprir todos os seus negócios com o GDPR. É por isso que o Google, por exemplo, agora permite que os usuários solicitem uma exclusão de informações pessoais. No entanto, as leis de privacidade nos Estados Unidos diferem de estado para estado e não protegem os consumidores e a UE. Infelizmente, isso é verdade para as leis de privacidade mais severas dos EUA, a Lei de Privacidade do Consumidor da Califórnia.

Em resumo, não existe uma lei de privacidade “global” forte que se aplique a todos os coletores de big data e proteja todos os usuários. Isso significa que nossa privacidade não é prejudicada apenas por grandes coletores de dados de maneira ilegal, mas mesmo de maneiras perfeitamente legais, por mais paradoxal que isso possa parecer. Felizmente, violações de privacidade em larga escala expostas por denunciantes como Edward Snowden e Chelsea Manning aumentaram bastante a conscientização sobre os riscos do big data. Obviamente, este é apenas o primeiro passo para melhorar as leis de privacidade atuais.

Muitos usuários da Internet não estão dispostos a esperar uma melhoria nas leis de privacidade – e com razão. Em vez disso, eles querem agir por conta própria, fazendo o possível para proteger sua privacidade. Deseja evitar fazer parte de inúmeros grandes conjuntos de dados também? Existem várias dicas e truques para ajudá-lo no seu caminho.

Como impedir que seus dados sejam salvos em grandes conjuntos de dados

Grandes conjuntos de dados afetam seriamente sua privacidade e segurança. Esses conjuntos de dados podem conter todos os tipos de informações (pessoais), que podem ser abusadas por grandes empresas ou mesmo criminosos cibernéticos. É por isso que você deve sempre deixar o mínimo de rastreamento on-line possível. As dicas a seguir podem ajudá-lo a fazer isso:

  • Tente minimizar o uso de suas informações pessoais ao criar senhas ou em geral na web. Por exemplo: evite usar seu nome, endereço, número de telefone, data de nascimento etc..
  • Lembre-se sempre do seguinte: tudo o que você publicar na internet estará lá para sempre. Isso pode nem sempre ser completamente verdade, mas esse nível de cautela ajuda a proteger sua privacidade. Você manipulará seus dados privados automaticamente com mais cuidado quando estiver ciente desse fato.
  • Verifique se a sua conexão à Internet é segura e anônima, por exemplo, usando o navegador Tor ou uma VPN, por exemplo.
  • Use um ou vários bloqueadores de anúncios no seu navegador.
  • Use em ou mais plug-ins de navegador que bloqueiam rastreadores e cookies.
  • Limpe regularmente o cache e exclua o histórico de navegação e os cookies.
  • Saia dos sites quando você não os estiver usando ativamente.

Tomar essas medidas é um bom começo para proteger sua privacidade e segurança online. No entanto, lembre-se de que o big data é coletado de várias maneiras diferentes – não apenas online. Em resumo, onde quer que você esteja e o que estiver fazendo, você deve sempre estar vigilante e tentar proteger seus dados (pessoais) de grandes coletores de dados.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me