Big Data & Datenschutz: Was sind die Datenschutzrisiken? | VPNÜbersicht

In den letzten Jahrzehnten hat sich die Welt in vielerlei Hinsicht enorm verändert, insbesondere in Bezug auf die IT. Die Anzahl der Menschen, mit denen wir täglich kommunizieren können, ist enorm gestiegen, genau wie die Menge an Informationen, auf die wir Zugriff haben. Gleiches gilt jedoch für die Menge an Informationen, die große Unternehmen über uns sammeln. Begriffe wie Big Data werden im Laufe der Zeit immer häufiger verwendet. Aber was bedeutet das genau? Was ist Big Data? Ist es gefährlich? Wie wirkt es sich, wenn überhaupt, auf unsere Privatsphäre aus? Dies sind einige der Fragen, die wir in diesem Artikel behandeln werden.


Was ist Big Data??

Liste mit LupeDer Begriff „Big Data“ beschreibt die enormen Mengen an (persönlichen) Daten, die kontinuierlich von verschiedenen Akteuren gesammelt werden. Ein Beispiel wären alle Informationen, die Google über die Suchanfragen seiner Nutzer sammelt. Das Phänomen Big Data ist eine relativ junge Entwicklung, die begann, weil (große) Unternehmen und Organisationen wie Facebook, Google und die meisten Regierungen immer mehr Daten über ihre Benutzer, Kunden und Bürger sammelten als zuvor. Neue Technologien, eine digitalisierte Welt und das Internet haben diese Entwicklung immens unterstützt.

Big Data-Sammlungen sind oft so umfangreich, dass es unmöglich ist, sie mit herkömmlichen Datenanalysen zu analysieren. Wenn man Big Data jedoch richtig analysiert, können interessante Muster und Schlussfolgerungen gezogen werden. Beispielsweise werden Big Data häufig für groß angelegte Marktforschungen verwendet: Welche Produkte werden am wahrscheinlichsten gekauft? Welche Art von Werbung ist am effektivsten, wenn Sie Kunden erreichen und überzeugen möchten??

Damit ein Datensatz als Big Data betrachtet werden kann, sollte er normalerweise die folgenden drei Kriterien erfüllen, auch bekannt als 3 v::

  • Volumen: Big Data ist alles andere als eine kleine Stichprobe. Es handelt sich um umfangreiche Datensammlungen, die sich aus einer langen, kontinuierlichen Beobachtung ergeben.
  • Geschwindigkeit: Dies hat mit der beeindruckenden Geschwindigkeit zu tun, mit der Big Data gesammelt wird. Darüber hinaus ist Big Data häufig in Echtzeit verfügbar (während es gesammelt wird)..
  • Vielfalt: Große Datenmengen enthalten häufig viele verschiedene Arten von Informationen. Daten in großen Datenmengen können sogar kombiniert werden, um Lücken zu schließen und den Datensatz noch vollständiger zu machen.

Abgesehen von diesen 3 Vs weist Big Data einige andere Merkmale auf. Big Data eignet sich beispielsweise hervorragend für maschinelles Lernen. Dies bedeutet, dass es effektiv verwendet werden kann, um Computern und Maschinen bestimmte Aufgaben beizubringen. Darüber hinaus können Big Data, wie wir bereits kurz angesprochen haben, zur Erkennung von Mustern verwendet werden. Dies geschieht meist sehr effektiv über Computer, die an den Daten arbeiten. Schließlich spiegelt Big Data die digitalen Fingerabdrücke der Benutzer wider. Dies bedeutet, dass es ein Nebenprodukt der digitalen und Online-Aktivitäten von Menschen ist und zur Erstellung individueller persönlicher Profile verwendet werden kann.

Verschiedene Arten von Big Data

Es gibt verschiedene Möglichkeiten, Big Data zu klassifizieren. Der erste Weg, der am häufigsten verwendet wird, unterscheidet Big Data anhand der Art der Daten, die gesammelt werden. Die drei möglichen Kategorien, die für diese Art der Klassifizierung verwendet werden, sind: strukturierte Big Data, unstrukturierte Big Data und halbstrukturierte Big Data.

  1. Strukturiert: Wenn Big Data strukturiert ist, kann es auf organisierte und logische Weise gespeichert und dargestellt werden, wodurch die Daten leichter zugänglich und verständlicher werden. Ein Beispiel wäre eine Liste von Kundenadressen, die von einem Unternehmen erstellt wurden. In dieser Liste finden sich wahrscheinlich die Namen, Adressen und möglicherweise andere Details der Kunden, wie z. B. Telefonnummern, die beispielsweise in einem Diagramm oder einer Tabelle klar strukturiert sind.
  2. Unstrukturiert: Unstrukturierte Big Data sind überhaupt nicht organisiert. Es fehlt eine logische Darstellung, die für den Durchschnittsmenschen sinnvoll wäre. Unstrukturierte Big Data haben beispielsweise nicht die Struktur einer Tabelle, die eine bestimmte Kohärenz zwischen den verschiedenen Elementen des Datensatzes angibt. Daher ist diese Art von Daten ziemlich schwer zu navigieren und zu verstehen. Viele Datensätze beginnen zunächst als unstrukturierte Big Data.
  3. Halbstrukturiert: Halbstrukturierte Big Data weisen, wie Sie vielleicht vermutet haben, Merkmale sowohl strukturierter als auch unstrukturierter Big Data auf. Die Art und Darstellung dieser Art von Daten ist nicht völlig willkürlich. Es ist jedoch nicht strukturiert und organisiert genug, um für eine aussagekräftige Analyse verwendet zu werden. Ein Beispiel wäre eine Webseite, die bestimmte Metadaten-Tags enthält (zusätzliche Informationen, die im Text nicht direkt sichtbar sind), beispielsweise weil sie bestimmte Schlüsselwörter enthält. Diese Tags zeigen effektiv bestimmte Informationen an, z. B. den Autor einer Seite oder den Moment, in dem sie online gestellt wurde. Der Text selbst ist im Wesentlichen unstrukturiert, doch die darin enthaltenen Schlüsselwörter und anderen Metadaten tragen dazu bei, dass er eine geeignete Grundlage für die Analyse darstellt.

Klassifizierung basierend auf der Quelle von Big Data

Eine andere übliche Methode zur Unterscheidung zwischen verschiedenen Arten von Big Data ist die Betrachtung der Datenquelle. Wer oder was hat die Informationen generiert? Wie die vorherige Abteilung besteht auch diese Klassifizierungsmethode aus 3 verschiedenen Kategorien.

  1. Menschen: Diese Kategorie betrifft Big Data, die von Menschen generiert werden. Beispiele wären Bücher, Bilder, Videos sowie Informationen und (persönliche) Daten auf Websites und sozialen Medien wie Facebook, Twitter, Instagram usw..
  2. Registrierung bearbeiten: Diese Kategorie umfasst die traditionellere Art von Big Data, die von (großen) Unternehmen gesammelt und analysiert wird, um bestimmte Prozesse in einem Unternehmen zu verbessern.
  3. Maschinen: Diese Art von Big Data resultiert aus der ständig wachsenden Anzahl von Sensoren, die in Maschinen installiert sind. Ein Beispiel wäre der Wärmesensor, der häufig in Computerprozessoren eingebaut wird. Die von Maschinen generierten Daten können oft sehr komplex sein, aber zumindest diese Art von Big Data ist im Allgemeinen gut strukturiert und vollständig.

Wofür kann Big Data verwendet werden??

Facebook LogoAlles, was bisher besprochen wurde, mag noch etwas abstrakt klingen. Lassen Sie uns die Dinge etwas konkreter gestalten und einige reale Anwendungen von Big Data diskutieren. Schließlich gibt es viele, viele Möglichkeiten, wie Unternehmen und Organisationen Big Data nutzen. Eines der ersten Dinge, die mir in den Sinn kommen, ist die enorme Menge an Daten, die Unternehmen über uns sammeln. Facebook sammelt Daten über alle seine Benutzer und analysiert diese, um zu entscheiden, was Sie auf Ihrer Timeline anzeigen möchten. Dies geschieht natürlich, um Ihren persönlichen Wünschen und Interessen gerecht zu werden. Facebook hofft, dass Sie dadurch länger auf der Website bleiben. Im Gegenzug sammelt Amazon Informationen über seine Kunden und die von ihnen gekauften Produkte. Auf diese Weise kann Amazon Produkte empfehlen, an denen Sie interessiert sein könnten, und auf diese Weise ihre Einnahmen steigern.

Big Data wird jedoch auch auf eine Weise verwendet, die sich von den oben beschriebenen kommerziellen Strategien völlig unterscheidet. Beispielsweise können öffentliche Verkehrsunternehmen Daten darüber sammeln, wie stark bestimmte Strecken ausgelastet sind. Anschließend könnten sie diese Daten analysieren, um beispielsweise zu entscheiden, für welche Strecken zusätzliche Busse oder Züge erforderlich sind. Ein weiterer bekannter Fall der effektiven Nutzung von Big Data betrifft den internationalen Liefergiganten UPS. UPS verwendet eine spezielle Software, die nach einer Big-Data-Analyse entwickelt wurde. Diese Software hilft USV-Fahrern, Linkskurven zu vermeiden, die teurer, verschwenderischer und gefährlicher sind als Rechtskurven. Angeblich hat dieses System UPS dank Big Data bereits Millionen Gallonen Kraftstoff eingespart.

Ein weiteres interessantes Beispiel für das Sammeln von Big Data sind DNA-Tests und Websites wie MyHeritage DNA. Diese Website behauptet, sie könne Ihnen helfen, mit einem einfachen DNA-Test „Ihre ethnische Herkunft aufzudecken und neue Verwandte zu finden“. Es ist unnötig zu erwähnen, dass dieser Prozess eine Menge Datenerfassung und Querverweise umfasst, was ihn zu einem weiteren wichtigen Akteur bei der Erfassung und Nutzung von Big Data macht. “Traditionelle” physikalische DNA-Tests beinhalten auch eine große Menge an Big Data, da Unternehmen, die diese Tests durchführen, extrem große Datenmengen über viele, viele Menschen erhalten. Natürlich ist es wichtig, sich der möglichen Risiken bewusst zu sein, die mit diesen Big-Data-Erfassungsprozessen verbunden sind. Diese Risiken werden im nächsten Teil dieses Artikels hervorgehoben.

Ist Big Data gefährlich??

Wie oben gezeigt, können Big Data in vielen Fällen unglaublich nützlich sein. Es liefert uns unzählige Informationen, mit denen wir Prozesse rationalisieren und Unternehmen effizienter und profitabler machen können. Dies bedeutet jedoch nicht, dass das Sammeln und Verwenden von Big Data völlig risikofrei ist. Big Data birgt fünf wichtige Risiken. Wir werden alle fünf hier diskutieren.

Hacker und Diebe

Bei allem, was wir online tun, besteht das Risiko, dass unsere persönlichen Daten und Informationen zu unseren Internetaktivitäten gestohlen werden. Jeder Internetnutzer muss sich dessen bewusst sein. Die Anzahl der Datenlecks und Diebstähle hat in den letzten Jahren drastisch zugenommen. In den Nachrichten gibt es oft Geschichten über Kriminelle, die Datensätze mit Passwörtern und anderen Informationen an Orten wie dem dunklen Internet verkaufen. Oft werden diese Datensätze von offiziellen Websites, Unternehmen und Organisationen gestohlen. Je größer diese Datensätze sind, desto interessanter wird es für Diebe, zu versuchen, sie zu erhalten. Wenn sie diese Datensätze in die Hände bekommen, können sie viele Probleme verursachen. Dies kann natürlich auch Ihre Privatsphäre erheblich beeinträchtigen.

Privatsphäre

Die Praxis der Erhebung personenbezogener Daten wird immer weiter verbreitet. Die aktuellen Datenschutzbestimmungen können jedoch nicht mit den rasanten technologischen Entwicklungen Schritt halten, die diese Praxis ermöglichen. Dies lässt Raum für Grauzonen und Unsicherheiten, die durch einen Blick auf das Gesetz nicht gelöst werden können. Wichtige Datenschutzbedenken, die auftreten, sind: Welche Art von Daten dürfen gesammelt werden? Über wen? Wer sollte Zugriff auf diese Daten haben?

Bei der Erfassung großer Datenmengen ist die Wahrscheinlichkeit hoch, dass vertrauliche persönliche Informationen in diesen Datensätzen enthalten sind. Dies ist problematisch, selbst wenn Hacker und Diebe nicht im Spiel sind. Schließlich könnten datenschutzrelevante Daten von Personen mit schlechten Absichten missbraucht werden. Dies schließt (böswillige) Unternehmen und Organisationen ein.

Schlechte Datenanalyse

Viele Unternehmen und Organisationen sammeln Big Data, weil sie diese für interessante Analysen verwenden können. Dies könnte ihnen wichtige neue Einblicke in das geben, was sie erforschen (wie zum Beispiel Verbrauchergewohnheiten). Diese Erkenntnisse und Schlussfolgerungen könnten sich wiederum in Veränderungen innerhalb des Unternehmens niederschlagen, die zu höheren Margen und mehr Gewinn führen. Wie bei jedem anderen normalen Datensatz kann eine falsche Analyse von Big Data jedoch schwerwiegende Folgen haben. Schließlich kann eine falsche Analyse leicht zu falschen Schlussfolgerungen führen. Dies kann wiederum zu ineffektiven oder sogar kontraproduktiven Maßnahmen führen.

Sammeln der “falschen” Daten

Big Data wird immer beliebter und Unternehmen sind immer mehr bereit, alle Arten von Daten zu sammeln. Dies bedeutet, dass gigantische Datenmengen gesammelt werden, ohne dass ein klarer Grund für deren Analyse vorliegt. Mit anderen Worten, es wird eine riesige Datenbank mit Rohdaten erstellt, die für alle Fälle gesammelt wurden. Unternehmen denken wahrscheinlich, dass es einfach genug ist, all diese Daten zu sammeln, also können sie es genauso gut tun. Dies ist natürlich nicht gut für die Privatsphäre von Personen. Dies kann sogar dazu führen, dass irrelevante oder „falsche“ Daten gesammelt und analysiert werden. Wenn die aus dieser Analyse gezogenen Schlussfolgerungen im Management verwendet werden, kann dies zu denselben unwirksamen Maßnahmen führen, die im vorherigen Absatz erwähnt wurden.

Sammeln und Speichern von Big Data mit schlechten Absichten

Die Erfassung von Big Data wird immer häufiger von Unternehmen, Organisationen und Regierungen verwendet, um genaue individuelle Profile von Personen zu erstellen. Benutzer oder Bürger werden kaum darüber informiert, welche ihrer persönlichen Daten registriert werden, geschweige denn warum und wie. Dies hat natürlich schwerwiegende Auswirkungen auf die Online-Privatsphäre. Alles, was sie online tun, kann gespeichert und später angezeigt werden. Darüber hinaus könnten Big-Data-Sammler die Entscheidungsfindung von Personen leicht beeinflussen und manipulieren, indem sie die gesammelten Daten analysieren und verwenden.

Big Data und Datenschutz

Smartphone mit OhrbildWie Sie wahrscheinlich inzwischen verstehen werden, birgt Big Data viele Nachteile und Risiken. Trotzdem sammeln viele Unternehmen und Organisationen immer noch Daten in großem Umfang, vor allem, weil dies ihnen helfen kann, zu wachsen und voranzukommen. Das Sammeln von Big Data ist einfacher als je zuvor. Dies hat enorme Konsequenzen für unsere Privatsphäre. Wir haben bereits kurz auf die möglichen Gefahren für die Privatsphäre von böswilligen Parteien eingegangen, die schlechte Daten sammeln. Da unser Datenschutz so eng mit der Massenerfassung personenbezogener Daten verbunden ist, möchten wir diesen Abschnitt verwenden, um die verschiedenen Datenschutzbedenken zu erörtern, die mit Big Data verbunden sind.

Datenerfassung in großem Maßstab

Viele Unternehmen, darunter Google, Facebook und Twitter, sind stark von Werbung abhängig, um sich selbst zu erhalten und Gewinne zu erzielen. Um diese Anzeigen so effektiv wie möglich zu gestalten, erstellen diese Unternehmen detaillierte Profile für ihre Nutzer, insbesondere unter Berücksichtigung ihrer Vorlieben und Interessen. Dies ist eine Form von Big Data. Ebenso sind Regierungen und Geheimdienste auf Big Data angewiesen. Sie verwenden diese riesige Menge an Informationen, um Personen zu verfolgen und zu untersuchen, die sie für verdächtig halten. Dies bedeutet natürlich auch, dass Cyberkriminelle eine Menge Big Data in die Hände bekommen und möglicherweise sogar manipulieren und missbrauchen können. Dies kann zu allen möglichen Datenschutz- und Identitätsproblemen führen. Eines, das mir in den Sinn kommt, ist Identitätsdiebstahl.

Die Möglichkeiten, die mit der Sammlung in Datenbanken verbunden sind, sind jedoch viel breiter. Heutzutage ist die Technologie so fortschrittlich und „intelligent“ geworden, dass sie Datensätze kombinieren kann. Dies kann auf solch clevere und listige Weise geschehen, dass große Unternehmen und Organisationen wahrscheinlich mehr über Sie wissen als Sie! Wer du bist, wo du lebst, was deine Hobbys sind, wer deine Freunde sind: Keine dieser Informationen wird mehr privat sein. Kein sehr beruhigender Gedanke, könnte man meinen. Glücklicherweise gibt es einige Möglichkeiten, sich vor den großen Datenschutzverletzungen zu schützen, die Big Data verursachen kann.

Gesetze zum Datenschutz

Cookies auf dem BildschirmDatenschutzgesetze und -bestimmungen können uns vor Datenschutzverletzungen schützen, jedoch nur bis zu einem gewissen Grad. Um die Sache noch komplizierter zu machen, unterscheiden sich die Datenschutzgesetze häufig stark zwischen verschiedenen Ländern und Regionen. In Europa ist beispielsweise ein relativ strenges Verbraucherschutzgesetz in Kraft, das als Allgemeine Datenschutzverordnung (DSGVO) bezeichnet wird. Dieses Gesetz gilt für alle EU-Mitgliedstaaten, obwohl die Details von Land zu Land unterschiedlich sein können. Viele internationale Unternehmen haben beschlossen, ihr gesamtes Geschäft der DSGVO zu überlassen. Aus diesem Grund ermöglicht Google beispielsweise Nutzern jetzt, das Löschen persönlicher Informationen anzufordern. Die Datenschutzgesetze in den USA unterscheiden sich jedoch von Bundesstaat zu Bundesstaat und schützen weder die Verbraucher noch die EU. Leider gilt dies sogar für das strengste Datenschutzgesetz in den USA, den California Consumer Privacy Act.

Kurz gesagt, es gibt kein starkes “globales” Datenschutzgesetz, das für alle Big Data-Sammler gilt und alle Benutzer schützt. Dies bedeutet, dass unsere Privatsphäre nicht nur von Big-Data-Sammlern auf illegale, sondern auch auf vollkommen legale Weise geschädigt wird, so paradox dies auch klingen mag. Glücklicherweise haben groß angelegte Datenschutzverletzungen durch Whistleblower wie Edward Snowden und Chelsea Manning das Bewusstsein für die Risiken von Big Data erheblich geschärft. Dies ist natürlich nur ein erster Schritt zur Verbesserung der aktuellen Datenschutzgesetze.

Viele Internetnutzer sind nicht bereit, auf eine Verbesserung der Datenschutzgesetze zu warten – und das zu Recht. Sie möchten vielmehr selbst Maßnahmen ergreifen, indem sie alles tun, um ihre Privatsphäre zu schützen. Möchten Sie vermeiden, auch Teil unzähliger großer Datenmengen zu werden? Es gibt verschiedene Tipps und Tricks, die Ihnen auf Ihrem Weg helfen.

So verhindern Sie, dass Ihre Daten in großen Datenmengen gespeichert werden

Große Datenmengen beeinträchtigen Ihre Privatsphäre und Sicherheit erheblich. Diese Datensätze können alle Arten von (persönlichen) Informationen enthalten, die von großen Unternehmen oder sogar Cyberkriminellen missbraucht werden können. Deshalb sollten Sie immer darauf achten, möglichst wenig Online-Spuren zu hinterlassen. Die folgenden Tipps können Ihnen dabei helfen:

  • Versuchen Sie, die Verwendung Ihrer persönlichen Daten beim Erstellen von Passwörtern oder allgemein im Internet zu minimieren. Zum Beispiel: Vermeiden Sie die Verwendung Ihres Namens, Ihrer Adresse, Telefonnummer, Ihres Geburtsdatums usw..
  • Denken Sie immer an Folgendes: Alles, was Sie im Internet veröffentlichen, wird für immer dort sein. Dies ist möglicherweise nicht immer vollständig der Fall, aber diese Vorsicht trägt zum Schutz Ihrer Privatsphäre bei. Sobald Sie sich dieser Tatsache bewusst sind, werden Sie Ihre privaten Daten automatisch mit größerer Sorgfalt behandeln.
  • Stellen Sie sicher, dass Ihre Internetverbindung sicher und anonymisiert ist, indem Sie beispielsweise den Tor-Browser oder ein VPN verwenden.
  • Verwenden Sie einen oder mehrere Werbeblocker in Ihrem Browser.
  • Verwenden Sie ein oder mehrere Browser-Plug-Ins, die Tracker und Cookies blockieren.
  • Leeren Sie regelmäßig Ihren Cache und löschen Sie Ihren Browserverlauf und Ihre Cookies.
  • Melden Sie sich von Websites ab, wenn Sie diese nicht aktiv nutzen.

Diese Schritte sind ein guter Anfang, um Ihre Online-Privatsphäre und -Sicherheit zu schützen. Beachten Sie jedoch, dass Big Data auf viele verschiedene Arten erfasst wird – nicht nur online. Kurz gesagt, wo immer Sie sind und was auch immer Sie tun, sollten Sie immer wachsam sein und versuchen, Ihre (persönlichen) Daten vor großen Datensammlern zu schützen.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me