Big data i prywatność: jakie są zagrożenia dla prywatności? | VPNOverview

W ciągu ostatnich kilku dekad świat zmienił się ogromnie pod wieloma względami, zwłaszcza jeśli chodzi o IT. Liczba ludzi, z którymi możemy się komunikować na co dzień, ogromnie wzrosła, podobnie jak ilość informacji, do których mamy dostęp. To samo dotyczy ilości informacji, które duże firmy gromadzą o nas. Terminy takie jak duże zbiory danych są używane coraz częściej w miarę upływu czasu. Ale co to dokładnie znaczy? Co to jest Big Data? Czy to jest niebezpieczne? Jak to w ogóle wpływa na naszą prywatność? Oto niektóre z pytań, które omówimy w tym artykule.


Co to jest big data?

Lista z lupąTermin „duże zbiory danych” opisuje ogromne ilości danych (osobowych), które są stale gromadzone przez różne podmioty. Przykładem mogą być wszystkie informacje gromadzone przez Google na temat zapytań użytkowników. Zjawisko dużych zbiorów danych jest stosunkowo nowym zjawiskiem, które rozpoczęło się, ponieważ (duże) firmy i organizacje, takie jak Facebook, Google i większość rządów, zaczęły gromadzić coraz więcej danych o swoich użytkownikach, klientach i obywatelach niż wcześniej. Nowe technologie, zdigitalizowany świat i Internet ogromnie pomogły w tym rozwoju.

Kolekcje dużych zbiorów danych są często tak ogromne, że ich analiza przy użyciu tradycyjnej analizy danych jest niemożliwa. Jeśli jednak przeanalizuje się duże zbiory danych we właściwy sposób, można uzyskać interesujące wzorce i wnioski. Na przykład duże zbiory danych są często wykorzystywane do badań rynkowych na dużą skalę: które produkty będą najprawdopodobniej zakupione? Jaki rodzaj reklamy jest najbardziej skuteczny, gdy chcesz dotrzeć do klientów i przekonać ich?

Aby zestaw danych można było uznać za duże zbiory danych, powinien on zazwyczaj spełniać następujące trzy kryteria, znane również jako 3 v:

  • Tom: Big data to tylko mała próbka. Obejmuje ogromne zbiory danych, wynikające z długich, ciągłych obserwacji.
  • Prędkość: Ma to związek z imponującą prędkością, z jaką gromadzone są duże zbiory danych. Ponadto duże zbiory danych są często dostępne w czasie rzeczywistym (podczas ich gromadzenia).
  • Różnorodność: Duże zestawy danych często zawierają wiele różnych rodzajów informacji. Dane w dużych zestawach danych można nawet łączyć, aby uzupełnić wszelkie luki i uczynić zestaw danych jeszcze bardziej kompletnym.

Oprócz tych 3 v, big data ma także inne cechy. Na przykład duże zbiory danych świetnie nadają się do uczenia maszynowego. Oznacza to, że można go skutecznie wykorzystać do uczenia komputerów i maszyn określonych zadań. Ponadto, jak już krótko omówiliśmy, duże zbiory danych mogą być wykorzystywane do wykrywania wzorców. Dzieje się tak głównie w bardzo skuteczny sposób, za pomocą komputerów pracujących na danych. Wreszcie, duże zbiory danych są odzwierciedleniem cyfrowych odcisków palców użytkowników. Oznacza to, że jest produktem ubocznym działań cyfrowych i internetowych ludzi i może być wykorzystywany do tworzenia indywidualnych profili osobistych.

Różne rodzaje dużych zbiorów danych

Istnieją różne sposoby klasyfikowania dużych zbiorów danych. Pierwszy sposób, który jest najczęściej używany, różnicuje duże zbiory danych na podstawie rodzaju gromadzonych danych. Trzy możliwe kategorie stosowane do tego rodzaju klasyfikacji to: ustrukturyzowane duże zbiory danych, nieustrukturyzowane duże zbiory danych i częściowo ustrukturyzowane duże zbiory danych.

  1. Zbudowany: Struktura danych big data może być zapisywana i prezentowana w uporządkowany i logiczny sposób, dzięki czemu dane są bardziej dostępne i łatwiejsze do zrozumienia. Przykładem może być lista adresów klientów utworzona przez firmę. Na tej liście najprawdopodobniej znajdziemy nazwiska klientów, adresy i może inne szczegóły, takie jak numery telefonów, wszystkie ułożone w przejrzysty sposób, na przykład na wykresie lub w tabeli.
  2. Nieustrukturyzowany: Nieustrukturyzowane duże zbiory danych w ogóle nie są zorganizowane. Brakuje logicznej prezentacji, która byłaby sensowna dla przeciętnego człowieka. Nieustrukturyzowane duże zbiory danych nie mają na przykład struktury tabeli, która oznacza pewną spójność między różnymi elementami zestawu danych. Dlatego tego rodzaju dane są dość trudne w nawigacji i zrozumieniu. Wiele zbiorów danych początkowo zaczyna się jako nieustrukturyzowane duże zbiory danych.
  3. Częściowo ustrukturyzowany: Częściowo ustrukturyzowane duże zbiory danych, jak można się domyślać, mają cechy zarówno ustrukturyzowanych, jak i nieustrukturyzowanych dużych zbiorów danych. Charakter i reprezentacja tego rodzaju danych nie są całkowicie arbitralne. Jednak nie jest wystarczająco zorganizowany i zorganizowany, aby można go było wykorzystać do sensownej analizy. Przykładem może być strona internetowa, która zawiera określone metatagi (dodatkowe informacje, które nie są bezpośrednio widoczne w tekście), na przykład ponieważ zawiera określone słowa kluczowe. Tagi te skutecznie pokazują określone fragmenty informacji, takie jak autor strony lub moment, w którym została umieszczona w Internecie. Sam tekst jest zasadniczo nieuporządkowany, ale zawarte w nim słowa kluczowe i inne metadane pomagają uczynić z niego odpowiednią podstawę do analizy.

Klasyfikacja na podstawie źródła dużych zbiorów danych

Innym powszechnym sposobem rozróżniania różnych rodzajów dużych zbiorów danych jest spojrzenie na źródło danych. Kto lub co wygenerowało informacje? Podobnie jak poprzedni podział, ta metoda klasyfikacji obejmuje również 3 różne kategorie.

  1. Ludzie: Ta kategoria dotyczy dużych zbiorów danych generowanych przez ludzi. Przykładami mogą być książki, zdjęcia, filmy, a także informacje i (osobiste) dane na stronach internetowych i w mediach społecznościowych, takich jak Facebook, Twitter, Instagram i tak dalej.
  2. Rejestracja procesu: Ta kategoria obejmuje bardziej tradycyjny rodzaj dużych zbiorów danych, który jest gromadzony i analizowany przez (duże) firmy w celu usprawnienia niektórych procesów w firmie.
  3. Maszyny: Ten rodzaj dużych zbiorów danych wynika z coraz większej liczby czujników umieszczanych w maszynach. Przykładem może być czujnik ciepła, który często jest wbudowany w procesory komputerowe. Dane generowane przez maszyny często mogą być bardzo złożone, ale przynajmniej ten typ dużych danych jest ogólnie dobrze skonstruowany i kompletny.

Do czego można wykorzystać duże zbiory danych?

logo FacebookaWszystko, co do tej pory omówione, może nadal brzmieć nieco abstrakcyjnie. Uczyńmy to bardziej konkretnym i omówmy niektóre rzeczywiste zastosowania dużych zbiorów danych. W końcu istnieje wiele, wiele sposobów, w jakie firmy i organizacje korzystają z dużych zbiorów danych. Jedną z pierwszych rzeczy, które przychodzą mi na myśl, jest ogromna ilość danych gromadzonych przez firmy na nasz temat. Facebook zbiera dane dotyczące wszystkich użytkowników i analizuje je, aby zdecydować, co pokazać na osi czasu. Oczywiście ma to na celu zaspokojenie osobistych życzeń i zainteresowań. Facebook ma nadzieję, że dzięki temu pozostaniesz na ich stronie przez dłuższy czas. Z kolei Amazon gromadzi informacje o swoich klientach i kupowanych produktach. W ten sposób Amazon może polecić produkty, które ich zdaniem będą zainteresowane, i w ten sposób zwiększyć ich zarobki.

Jednak duże zbiory danych są również wykorzystywane w sposób całkowicie odmienny od opisanych powyżej strategii handlowych. Na przykład firmy transportu publicznego mogą gromadzić dane na temat natężenia ruchu na niektórych trasach. Następnie mogą przeanalizować te dane, aby na przykład zdecydować, które trasy wymagają dodatkowych autobusów lub pociągów. Kolejny znany przypadek efektywnego wykorzystania dużych zbiorów danych dotyczy gigantycznej firmy UPS dostarczającej przesyłki międzynarodowe. UPS korzysta ze specjalnego oprogramowania opracowanego po analizie dużych zbiorów danych. To oprogramowanie pomaga kierowcom UPS unikać skrętów w lewo, które są droższe, bardziej marnotrawione i bardziej niebezpieczne niż skręty w prawo. Podobno ten system już zaoszczędził UPS miliony galonów paliwa, a wszystko to dzięki big data.

Innym ciekawym przykładem gromadzenia dużych zbiorów danych są testy DNA i strony internetowe, takie jak MyHeritage DNA. Ta strona twierdzi, że może pomóc „odkryć pochodzenie etniczne i znaleźć nowych krewnych” za pomocą prostego testu DNA. Nie trzeba dodawać, że proces ten wymaga dużej ilości gromadzenia danych i odsyłaczy, co czyni go kolejnym ważnym graczem w gromadzeniu i wykorzystywaniu dużych zbiorów danych. „Tradycyjne” fizyczne testy DNA obejmują także ogromną ilość dużych danych, ponieważ firmy, które przeprowadzają te testy, uzyskają niezwykle duże zbiory danych o wielu, wielu ludziach. Oczywiście ważne jest, aby zdawać sobie sprawę z możliwego ryzyka związanego z tymi procesami gromadzenia dużych zbiorów danych. Zagrożenia te zostaną wyróżnione w następnej części tego artykułu.

Czy duże zbiory danych są niebezpieczne?

Jak pokazano powyżej, duże zbiory danych mogą być niezwykle przydatne w wielu przypadkach. Dostarcza nam mnóstwo informacji, które możemy wykorzystać do usprawnienia procesów i zwiększenia wydajności i rentowności firm. Nie oznacza to jednak, że gromadzenie i wykorzystywanie dużych zbiorów danych jest całkowicie wolne od ryzyka. Istnieje pięć ważnych zagrożeń związanych z dużymi zbiorami danych. Omówimy tutaj wszystkie pięć.

Hakerzy i złodzieje

Ze wszystkim, co robimy online, istnieje nieodłączne ryzyko, że nasze dane osobowe i informacje dotyczące naszej działalności internetowej mogą zostać skradzione. Każdy użytkownik Internetu musi być tego świadomy. Liczba wycieków i kradzieży danych drastycznie wzrosła w ciągu ostatnich kilku lat. W wiadomościach często pojawiają się historie o przestępcach sprzedających zestawy danych zawierające hasła i inne informacje w miejscach takich jak ciemna sieć. Często te zestawy danych są kradzione z oficjalnych stron internetowych, firm i organizacji. Im większe są te zbiory danych, tym bardziej interesująca staje się próba ich uzyskania przez złodziei. Jeśli zdobędą te zestawy danych, mogą powodować wiele problemów. Nie trzeba dodawać, że może to znacznie zagrozić Twojej prywatności.

Prywatność

Praktyka gromadzenia danych osobowych staje się coraz bardziej rozpowszechniona. Jednak obecne przepisy dotyczące prywatności nie nadążają za szybkim rozwojem technologii, który umożliwia tę praktykę. To pozostawia miejsce na szare obszary i niepewności, których nie można rozwiązać, patrząc na prawo. Ważne problemy dotyczące prywatności, które się pojawiają, to: Jakie dane mogą być gromadzone? O kim? Kto powinien mieć dostęp do tych danych?

Podczas gromadzenia dużych ilości danych szanse na włączenie poufnych danych osobowych do tych zbiorów danych są wysokie. Jest to problematyczne, nawet gdy hakerzy i złodzieje nie są w grze. W końcu dane wrażliwe na prywatność mogą być nadużywane przez każdego, kto ma złe zamiary. Dotyczy to (złośliwych) firm i organizacji.

Słaba analiza danych

Wiele firm i organizacji gromadzi duże dane, ponieważ mogą je wykorzystać do ciekawych analiz. Może to dać im ważne nowe informacje na temat tego, co badają (na przykład nawyków konsumenckich). Te spostrzeżenia i wnioski z kolei mogą przełożyć się na zmiany w firmie, które skutkują wyższymi marżami i większym zyskiem. Jednak, podobnie jak w przypadku każdego innego normalnego zestawu danych, niepoprawna analiza dużych zbiorów danych może mieć poważne konsekwencje. W końcu niewłaściwa analiza może łatwo prowadzić do błędnych wniosków. To z kolei może przełożyć się na podejmowanie nieskutecznych lub wręcz przeciwnych do zamierzonych działań.

Zbieranie „złych” danych

Duże zbiory danych stają się coraz bardziej popularne, a organizacje coraz chętniej gromadzą wszelkiego rodzaju dane. Oznacza to, że gromadzone są gigantyczne ilości danych bez wyraźnego powodu do ich analizy. Innymi słowy, tworzy ogromną bazę surowych informacji, które zostały zebrane na wszelki wypadek. Firmy prawdopodobnie uważają, że zebranie wszystkich tych danych jest wystarczająco łatwe, więc równie dobrze mogą to zrobić. Nie trzeba dodawać, że nie wpływa to na prywatność użytkowników. Może to nawet prowadzić do gromadzenia i analizowania nieistotnych lub „niewłaściwych” danych. Jeżeli wnioski wyciągnięte z tej analizy zostaną wykorzystane w zarządzaniu, może to prowadzić do tych samych nieskutecznych środków, o których mowa w poprzednim akapicie.

Zbieranie i zapisywanie dużych zbiorów danych w złych intencjach

Gromadzenie dużych zbiorów danych jest coraz częściej wykorzystywane przez firmy, organizacje i rządy, aby mogły tworzyć dokładne indywidualne profile na ludziach. Użytkownicy lub obywatele prawie nigdy nie są powiadamiani o tym, które z ich danych osobowych są rejestrowane, nie mówiąc już o tym, dlaczego i jak. Nie trzeba dodawać, że ma to poważne konsekwencje dla ich prywatności w Internecie. Wszystko, co robią online, można zapisać i wyświetlić później. Ponadto podmioty gromadzące duże zbiory danych mogą łatwo wpływać na podejmowane decyzje i manipulować nimi, analizując i wykorzystując zgromadzone dane.

Big data i prywatność

Smartfon ze zdjęciem uchaJak zapewne zapewne już zrozumiesz, duże zbiory danych mają wiele wad i zagrożeń. Niemniej jednak wiele firm i organizacji nadal gromadzi dane na ogromną skalę, głównie ze względu na to, w jaki sposób mogą one pomóc im się rozwijać i rozwijać. Zbieranie dużych zbiorów danych jest łatwiejsze niż kiedykolwiek wcześniej. Ma to ogromne konsekwencje dla naszej prywatności. Omówiliśmy już pokrótce możliwe zagrożenia prywatności ze strony złośliwych stron gromadzących złe dane. Ponieważ nasza prywatność jest tak ściśle związana z masowym gromadzeniem danych osobowych, chcemy skorzystać z tego rozdziału, aby omówić różne obawy dotyczące prywatności związane z dużymi zbiorami danych.

Gromadzenie danych na dużą skalę

Wiele firm, w tym Google, Facebook i Twitter, jest silnie uzależnionych od reklam, aby utrzymać się i osiągnąć zysk. Aby reklamy te były jak najbardziej skuteczne, firmy te tworzą szczegółowe profile użytkowników, szczególnie biorąc pod uwagę ich upodobania i zainteresowania. Jest to forma dużych zbiorów danych. Podobnie rządy i tajne służby są również zależne od dużych zbiorów danych. Używają tak dużej ilości informacji, aby śledzić i badać osoby, które uznają za podejrzane. Oczywiście oznacza to również, że cyberprzestępcy mają do dyspozycji wiele dużych danych, a może nawet manipulują nimi i wykorzystują je. Może to powodować różnego rodzaju problemy związane z prywatnością i tożsamością. Przychodzi mi na myśl kradzież tożsamości.

Mimo to możliwości związane z kolekcją w bazach danych są znacznie szersze. Obecnie technologia stała się tak zaawansowana i „inteligentna”, że może łączyć zbiory danych. Można to zrobić w tak sprytny i sprytny sposób, że duże korporacje i organizacje prawdopodobnie wiedzą o tobie więcej niż ty! Kim jesteś, gdzie mieszkasz, jakie są twoje hobby, kim są twoi przyjaciele: żadna z tych informacji nie będzie już prywatna. Może to niezbyt pocieszająca myśl. Na szczęście istnieje kilka sposobów ochrony przed naruszeniem prywatności na dużą skalę, które mogą powodować duże zbiory danych.

Przepisy dotyczące prywatności

Pliki cookie na ekraniePrzepisy i regulacje dotyczące prywatności mogą chronić nas przed naruszeniem prywatności, ale tylko w pewnym zakresie. Aby skomplikować sprawę, przepisy dotyczące prywatności często różnią się znacznie między poszczególnymi krajami i regionami. Na przykład w Europie obowiązuje stosunkowo surowe prawo ochrony prywatności konsumentów zwane ogólnym rozporządzeniem o ochronie danych (RODO). To prawo dotyczy wszystkich państw członkowskich UE, chociaż szczegóły mogą się różnić w zależności od kraju. Wiele międzynarodowych firm postanowiło przestrzegać wszystkich przepisów dotyczących RODO. Właśnie dlatego Google na przykład pozwala teraz użytkownikom prosić o usunięcie danych osobowych. Jednak przepisy dotyczące prywatności w Stanach Zjednoczonych różnią się w zależności od stanu i nie chronią konsumentów ani UE. Niestety dotyczy to nawet najsurowszego prawa o ochronie prywatności w USA, California Consumer Privacy Act.

Krótko mówiąc, nie istnieje coś takiego jak silne „globalne” prawo do prywatności, które ma zastosowanie do wszystkich podmiotów zbierających duże zbiory danych i chroni wszystkich użytkowników. Oznacza to, że nasza prywatność jest nie tylko naruszana przez podmioty gromadzące duże dane w sposób niezgodny z prawem, ale nawet w całkowicie legalny sposób, choć może to brzmieć paradoksalnie. Na szczęście naruszenia prywatności na dużą skalę ujawnione przez demaskatorów, takich jak Edward Snowden i Chelsea Manning, znacznie zwiększyły świadomość ryzyka związanego z dużymi zbiorami danych. Oczywiście jest to tylko pierwszy krok do poprawy obecnych przepisów dotyczących prywatności.

Wielu internautów nie chce oczekiwać poprawy przepisów dotyczących prywatności – i słusznie. Zamiast tego chcą sami podjąć działania, robiąc wszystko, co w ich mocy, aby chronić swoją prywatność. Czy chcesz uniknąć włączenia się w niezliczone zbiory dużych zbiorów danych? Istnieje kilka porad i wskazówek, które pomogą Ci w drodze.

Jak zapobiec zapisywaniu danych w dużych zestawach danych

Duże zbiory danych poważnie wpływają na twoją prywatność i bezpieczeństwo. Te zestawy danych mogą zawierać wszelkiego rodzaju (osobiste) informacje, które mogą być nadużywane przez duże firmy, a nawet cyberprzestępców. Dlatego zawsze powinieneś pamiętać o pozostawieniu jak najmniejszego śladu online. Poniższe wskazówki mogą ci w tym pomóc:

  • Staraj się minimalizować wykorzystanie danych osobowych podczas tworzenia haseł lub ogólnie w Internecie. Na przykład: unikaj używania imienia i nazwiska, adresu, numeru telefonu, daty urodzenia itd.
  • Zawsze pamiętaj o następujących rzeczach: wszystko, co publikujesz w Internecie, będzie tam na zawsze. Nie zawsze może to być do końca prawda, ale ten poziom ostrożności pomaga chronić Twoją prywatność. Gdy będziesz świadomy tego faktu, automatycznie będziesz przetwarzać swoje prywatne dane z większą ostrożnością.
  • Upewnij się, że twoje połączenie internetowe jest bezpieczne i anonimowe, na przykład za pomocą przeglądarki Tor lub VPN.
  • Użyj jednego lub kilku blokerów reklam w swojej przeglądarce.
  • Użyj wtyczek przeglądarki lub więcej, które blokują moduły śledzące i pliki cookie.
  • Regularnie wyczyść pamięć podręczną i usuń historię przeglądania oraz pliki cookie.
  • Wyloguj się ze stron internetowych, gdy nie korzystasz z nich aktywnie.

Podjęcie tych kroków to dobry początek, jeśli chodzi o ochronę prywatności i bezpieczeństwa w Internecie. Pamiętaj jednak, że duże zbiory danych są gromadzone na wiele różnych sposobów – nie tylko online. Krótko mówiąc, gdziekolwiek jesteś i cokolwiek robisz, zawsze powinieneś być czujny i starać się chronić swoje (osobiste) dane przed dużymi zbieraczami danych.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me