大数据和隐私:隐私风险是什么? | VPN概述

在过去的几十年中,世界在很多方面都发生了巨大变化,尤其是在IT领域。就像我们可以访问的信息量一样,我们每天可以与之通信的人数已经大大增加。但是,大公司收集的有关我们的信息量也是如此。随着时间的流逝,诸如大数据之类的术语越来越频繁地被使用。但这到底是什么意思?什么是大数据?危险吗?如果有的话,它将如何影响我们的隐私?这些是我们将在本文中介绍的一些问题.


什么是大数据?

放大镜清单术语“大数据”描述了由不同参与者不断收集的大量(个人)数据。一个示例就是Google收集的有关其用户搜索查询的所有信息。大数据现象是相对较新的发展,其开始是因为(大型)公司和组织,例如Facebook,Google和大多数政府,开始收集比以前更多的有关用户,客户和公民的数据。新技术,数字化世界和互联网极大地促进了这一发展.

大数据的集合通常非常庞大,以至于无法使用传统的数据分析来对其进行分析。但是,如果以正确的方式分析大数据,则可以得出有趣的模式和结论。例如,大数据通常用于大规模的市场研究:哪些产品最有可能被购买?当您想吸引并说服客户时,哪种广告最有效?

为了将数据集视为大数据,通常应满足以下三个条件,也称为 3 v

  • 体积: 大数据不过是一个小样本。由于长期不断的观察,它涉及大量的数据收集.
  • 速度: 这与收集大数据的惊人速度有关。此外,大数据通常可以实时访问(因为正在收集).
  • 品种: 大数据集通常包含许多不同类型的信息。大数据集中的数据甚至可以合并以填补任何空白,并使数据集更加完整.

除了这3个v外,大数据还具有其他一些特征。例如,大数据非常适合机器学习。这意味着它可以有效地用于教导计算机和机器某些任务。此外,正如我们已经简要介绍过的那样,大数据可用于检测模式。这主要是通过计算机处理数据来以非常有效的方式发生的。最后,大数据是用户数字指纹的反映。这意味着它是人们的数字和在线活动的副产品,可用于建立个人个人资料.

不同种类的大数据

有多种方法可以对大数据进行分类。最常用的第一种方法是根据要收集的数据类型区分大数据。用于这种类型的分类的三种可能的类别是:结构化大数据,非结构化大数据和半结构化大数据.

  1. 结构化的:构造大数据时,可以按有组织的逻辑方式保存和呈现大数据,从而使数据更易于访问且更易于理解。一个示例是公司创建的客户地址列表。在此列表中,很可能会找到客户的姓名,地址以及其他详细信息(例如电话号码),这些信息都可以清晰地显示在图表或表格中.
  2. 非结构化: 没有结构的大数据根本没有组织。它缺乏对普通人来说有意义的逻辑表示。非结构化大数据没有表的结构,例如,表表示数据集不同元素之间的某种一致性。因此,这种类型的数据很难导航和理解。许多数据集最初都是以非结构化大数据开始的.
  3. 半结构化: 您可能已经猜到,半结构化大数据具有结构化和非结构化大数据的特征。这类数据的性质和表示形式并非完全任意。但是,它的结构和组织也不足以进行有意义的分析。例如,一个网页包含特定的元数据标签(文字中无法直接看到的额外信息),例如,因为其中包含某些关键字。这些标签有效地显示了特定的信息,例如页面的作者或页面的在线时间。文本本身实质上是非结构化的,但是其中包含的关键字和其他元数据有助于使文本成为进行分析的适当基础.

基于大数据来源的分类

区分不同类型的大数据的另一种常用方法是查看数据源。谁或什么产生了信息?与以前的版本一样,此分类方法也包含3个不同的类别.

  1. :此类别涉及人员产生的大数据。例如书籍,图片,视频以及网站和社交媒体(例如Facebook,Twitter,Instagram等)上的信息和(个人)数据。.
  2. 流程注册:此类别包括更传统的大数据类型,这些数据由(大)公司收集和分析以改善业务中的某些流程.
  3. 机器:这种大数据的产生是由于机器中放置的传感器数量不断增加。一个例子就是通常内置在计算机处理器中的热传感器。机器生成的数据通常可能非常复杂,但是至少这种类型的大数据通常结构合理且完整.

大数据可用于什么?

Facebook徽标到目前为止讨论的所有内容听起来似乎还是有些抽象。让我们更具体一些,并讨论大数据的一些实际应用。毕竟,公司和组织使用多种方式来使用大数据。首先想到的一件事是公司收集到的大量数据。 Facebook会收集所有用户的数据并进行分析,以决定在时间轴上向您显示什么。当然,这样做是为了满足您的个人愿望和利益。 Facebook希望这可以使您在他们的网站上停留更长的时间。反过来,亚马逊收集有关其客户及其购买的产品的信息。这样,亚马逊可以推荐他们认为您会感兴趣的产品并以此增加收入.

但是,大数据的使用方式也与上述商业策略完全不同。例如,公共交通公司可以收集有关某些路线繁忙程度的数据。之后,他们可以分析此数据,以决定例如哪些路线需要额外的公共汽车或火车。有效利用大数据的另一个著名案例涉及国际交付巨头UPS。 UPS使用经过大数据分析后开发的特殊软件。该软件可帮助UPS驾驶员避免向左转弯,这比向右转弯更昂贵,更浪费并且更危险。据称,由于大数据,该系统已经为UPS节省了数百万加仑的燃油。.

大数据收集的另一个有趣示例是DNA测试和MyHeritage DNA等网站。该网站声称,它可以通过简单的DNA测试来帮助您“发现您的种族血统并找到新的亲戚”。不用说,此过程涉及大量数据收集和交叉引用,使其成为大数据收集和使用的另一个主要参与者。 “传统的”物理DNA测试还涉及大量的大数据,因为进行这些测试的公司将获得非常多的数据集,涉及许多人。当然,重要的是要意识到这些大数据收集过程可能带来的风险。这些风险将在本文的下一部分中重点介绍.

大数据危险吗?

如上所示,大数据在许多情况下非常有用。它为我们提供了大量信息,可用于简化流程并提高公司的效率和盈利能力。但是,这并不意味着收集和使用大数据是完全没有风险的。大数据有五个重要的风险。我们将在这里讨论所有五个.

黑客和小偷

我们在线上所做的一切,都存在着固有的风险,即我们在互联网活动中的个人数据和信息可能被盗。每个互联网用户都必须意识到这一点。在过去的几年中,数据泄漏和盗窃的数量急剧增加。新闻中经常有关于犯罪分子在暗网等地方出售包含密码和其他信息的数据集的故事。通常,这些数据集是从官方网站,公司和组织中窃取的。这些数据集越大,小偷尝试获取它们的兴趣就越大。如果他们掌握了这些数据集,可能会引起很多问题。不用说,这也可能极大地损害您的隐私.

隐私

收集个人数据的做法越来越普遍。但是,当前的隐私法规无法跟上使这种做法成为可能的技术的飞速发展。这为灰色区域和不确定性留出了空间,而这些区域和不确定性是法律无法解决的。出现的重要隐私问题包括:允许收集哪种数据?关于谁谁应该有权访问此数据?

当收集大量数据时,那些数据集中包含敏感的个人信息的可能性很高。即使没有黑客和小偷在玩,这也是有问题的。毕竟,任何有恶意的人都可能滥用对隐私敏感的数据。包括(恶意)公司和组织.

数据分析不良

许多公司和组织收集大数据,因为他们可以将其用于有趣的分析。这可能会使他们对正在研究的内容(例如,消费者习惯)具有重要的新见解。反过来,这些见解和结论可能会转化为公司内部的变化,从而带来更高的利润和更多的利润。但是,就像其他任何正常数据集一样,对大数据进行不正确的分析可能会导致严重的后果。毕竟,不正确的分析很容易导致错误的结论。这些反过来可能导致采取无效或什至适得其反的措施.

收集“错误”数据

大数据变得越来越流行,组织越来越愿意收集各种数据。这意味着在收集大量数据时没有明确的理由对其进行分析。换句话说,它创建了一个庞大的原始信息数据库,以防万一。公司可能认为收集所有数据非常容易,因此也可以这样做。不用说,这不利于任何人的隐私。甚至可能导致收集和分析不相关或“错误”的数据。如果从分析中得出的结论用于管理,则可能导致前段中提到的同样无效的措施.

恶意收集和保存大数据

公司,组织和政府越来越多地使用大数据的收集,以便他们可以对人员进行准确的个人档案记录。用户或公民几乎从未收到有关其个人数据正在注册的通知,更不用说原因和方式了。不用说,这对他们的在线隐私有严重的影响。他们在线上所做的所有事情都可以保存并在以后查看。此外,大数据收集者可以通过分析和使用收集的数据轻松影响和操纵人们的决策.

大数据和隐私

智能手机与耳朵的图片您可能现在已经知道,大数据带有很多不利因素和风险。尽管如此,许多公司和组织仍在大规模收集数据,主要是因为它可以帮助他们成长和发展。收集大数据比以往任何时候都容易。这对我们的隐私产生了巨大影响。我们已经简要讨论了恶意方收集不良数据可能带来的隐私危险。由于我们的隐私与个人数据的大量收集紧密相关,因此我们希望使用本节来讨论大数据带来的各种隐私问题.

大规模数据收集

许多公司,包括Google,Facebook和Twitter,都严重依赖广告来维持自身并获利。为了使这些广告尽可能有效,这些公司对用户进行了详细的介绍,尤其是考虑了他们的喜好。这是大数据的一种形式。同样,政府和秘密服务部门也依赖大数据。他们使用大量信息来跟踪和调查他们认为可疑的人。当然,这也意味着网络犯罪分子需要掌握大量的大数据,甚至可以操纵和滥用。这会产生各种与隐私和身份相关的问题。想到的一个是身份盗用.

尽管如此,数据库中收集所带来的可能性远不止于此。如今,技术已经变得如此先进和“智能”,可以结合数据集。这可以通过一种巧妙而狡猾的方式来完成,以至于大公司和组织可能比您更了解您!您是谁,住在哪里,爱好是什么,朋友是谁:这些信息将不再是私有的。您可能会想到,这不是一个令人欣慰的想法。幸运的是,有一些方法可以保护自己免受大数据可能导致的大规模隐私侵害。.

隐私法

屏幕上的Cookie隐私法律和法规可以保护我们免受侵犯隐私的侵害,但仅限于一定程度。使事情变得更加复杂的是,不同国家和地区之间的隐私法经常有很大的不同。例如,在欧洲,一部名为《通用数据保护条例》(GDPR)的相对严格的消费者隐私法正在生效。该法律适用于所有欧盟成员国,尽管每个国家/地区的详细信息可能有所不同。许多国际公司已决定将其所有业务都遵守GDPR。例如,这就是为什么Google现在允许用户请求删除个人信息的原因。但是,美国的隐私权法律因州而异,并没有像欧盟那样保护消费者。不幸的是,对于美国最严格的隐私法,即《加利福尼亚消费者隐私法》,这也是如此。.

简而言之,没有适用于所有大数据收集者并保护所有用户的强大的“全球”隐私法。这意味着我们的隐私不仅受到非法的大数据收集者的损害,而且甚至以完全合法的方式受到损害,这听起来可能有些悖论。幸运的是,爱德华·斯诺登和切尔西·曼宁等举报者揭露的大规模隐私侵权行为大大提高了人们对大数据风险的认识。当然,这只是改进当前隐私法的第一步.

许多互联网用户不愿等待隐私法的改善,这是理所当然的。相反,他们希望自己采取行动来保护自己的隐私。您是否还要避免成为无数大数据集的一部分?有一些技巧可以帮助您前进.

如何避免将数据保存在大数据集中

大数据集会严重影响您的隐私和安全性。这些数据集可能包含各种(个人)信息,这些信息可能会被大公司甚至网络罪犯滥用。这就是为什么您应始终确保保留尽可能少的在线跟踪的原因。以下提示可以帮助您完成此操作:

  • 在创建密码或一般在网络上尝试尽量减少对个人信息的使用。例如:避免使用您的姓名,地址,电话号码,出生日期等.
  • 永远记住以下几点:您在Internet上发布的所有内容都将永远存在。这可能并不总是完全正确,但是这种谨慎程度确实有助于保护您的隐私。了解到这一事实后,您将自动谨慎处理自己的私人数据.
  • 确保您的互联网连接安全且匿名,例如通过使用Tor浏览器或VPN.
  • 在浏览器中使用一个或多个广告拦截器.
  • 使用一个或多个阻止跟踪器和Cookie的浏览器插件.
  • 定期清除缓存并删除浏览历史记录和Cookie.
  • 不积极使用网站时退出网站.

当涉及到保护您的在线隐私和安全性时,采取这些步骤是一个好的开始。但是请记住,大数据是以多种不同的方式收集的-不仅仅是在线收集的。简而言之,无论您身在何处,无论做什么,都应该保持警惕,并尝试保护大数据收集者的(个人)数据.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me