Veliki podatki in zasebnost: Kakšna so tveganja za zasebnost? | VPNO pregled

V zadnjih nekaj desetletjih se je svet v mnogih pogledih zelo spremenil, zlasti kar zadeva IT. Število ljudi, s katerimi lahko vsakodnevno komuniciramo, se je močno povečalo, tako kot količina informacij, do katerih imamo dostop. Vendar pa enako velja za količino informacij, ki jih velika podjetja zbirajo o nas. Izrazi, kot so veliki podatki, se uporabljajo vse pogosteje, ko čas mineva. Toda kaj to točno pomeni? Kaj so veliki podatki? Je nevarno? Kako to vpliva na našo zasebnost, če sploh? To je nekaj vprašanj, ki jih bomo obravnavali v tem članku.


Kaj so veliki podatki?

Seznam s povečevalnim steklomIzraz “veliki podatki” opisuje ogromno količino (osebnih) podatkov, ki jih različni akterji nenehno zbirajo. Primer bi bile vse informacije, ki jih Google zbira o iskalnih poizvedbah svojih uporabnikov. Pojav velikih podatkov je razmeroma nedavno razvoj, ki se je začel, ker so (velika) podjetja in organizacije, kot so Facebook, Google in večina vlad, začeli zbirati vedno več podatkov o svojih uporabnikih, kupcih in državljanih kot prej. Nove tehnologije, digitaliziran svet in internet so ogromno pripomogli k temu razvoju.

Zbirke velikih podatkov so pogosto tako obsežne, da jih ni mogoče analizirati s tradicionalno analizo podatkov. Če pa analiziramo velike podatke na pravi način, lahko pride do zanimivih vzorcev in zaključkov. Na primer, veliki podatki se pogosto uporabljajo za obsežne tržne raziskave: katere izdelke je najverjetneje kupiti? Kakšno oglaševanje je najučinkovitejše, če želite doseči in prepričati stranke?

Da bi nabor podatkov veljal za velike podatke, bi moral običajno izpolnjevati naslednja tri merila, znana tudi kot 3 v:

  • Obseg: Veliki podatki so vse prej kot majhen vzorec. Vključuje veliko zbirk podatkov, ki izhajajo iz dolgega, neprekinjenega opazovanja.
  • Hitrost: To je povezano z impresivno hitrostjo, s katero se zbirajo veliki podatki. Poleg tega so veliki podatki pogosto dostopni v realnem času (ko se zbirajo).
  • Raznolikost: Velike zbirke podatkov pogosto vsebujejo veliko različnih vrst informacij. Podatke znotraj velikih nizov podatkov bi lahko celo združili, da bi zapolnili kakršne koli vrzeli in naredili nabor podatkov še popolnejši.

Veliki podatki imajo poleg teh treh v še nekaj drugih lastnosti. Na primer, veliki podatki so odlični za strojno učenje. To pomeni, da se lahko učinkovito uporablja za poučevanje računalnikov in strojev o določenih nalogah. Poleg tega, kot smo se že na kratko dotaknili, lahko za zaznavanje vzorcev uporabimo velike podatke. To se večinoma dogaja na zelo učinkovit način s pomočjo računalnikov, ki delajo podatke. Končno so veliki podatki odraz digitalnih prstnih odtisov uporabnikov. To pomeni, da je stranski produkt digitalnih in spletnih dejavnosti ljudi in se lahko uporablja za izdelavo posameznih osebnih profilov.

Različne vrste velikih podatkov

Obstajajo različni načini za razvrščanje velikih podatkov. Prvi način, ki se najpogosteje uporablja, razlikuje velike podatke glede na vrsto podatkov, ki se zbirajo. Tri vrste možnih kategorij, ki se uporabljajo za to vrsto klasifikacije, so: strukturirani veliki podatki, nestrukturirani veliki podatki in polstrukturirani veliki podatki.

  1. Strukturiran: Ko so veliki podatki strukturirani, jih je mogoče shraniti in predstaviti na organiziran in logičen način, s čimer bodo podatki bolj dostopni in lažji za razumevanje. Primer bi bil seznam naslovov strank, ki jih ustvari podjetje. Na tem seznamu bi verjetno našli imena, naslove strank in morda druge podrobnosti, kot so telefonske številke, vse jasno razvrščene na primer v tabeli ali tabeli.
  2. Nestrukturiran: Nestrukturirani veliki podatki sploh niso organizirani. Manjka mu logična predstavitev, ki bi bila smiselna za povprečnega človeka. Nestrukturirani veliki podatki nimajo strukture na primer tabele, ki označuje določeno skladnost med različnimi elementi podatkovnega niza. Zato je te vrste podatkov precej težko poiskati in razumeti. Veliko podatkovnih nizov se na začetku začne kot nestrukturirani veliki podatki.
  3. Polstrukturiran: Polstrukturirani veliki podatki imajo, kot ste uganili, značilnosti tako strukturiranih kot nestrukturiranih velikih podatkov. Narava in zastopanost te vrste podatkov nista povsem poljubna. Kljub temu pa ni dovolj strukturiran in organiziran, da bi ga lahko uporabili tudi za smiselno analizo. Primer je spletna stran, ki vsebuje posebne metapodatkovne oznake (dodatne informacije, ki niso neposredno vidne v besedilu), na primer, ker vsebuje določene ključne besede. Te oznake učinkovito prikazujejo posebne bite informacij, na primer avtor strani ali trenutek, ko je bila dana na spletu. Besedilo samo po sebi je v bistvu nestrukturirano, vendar ključne besede in drugi metapodatki, ki jih vsebuje, pomagajo, da je nekoliko primerna osnova za analizo.

Razvrstitev glede na vir velikih podatkov

Drug pogost način za razlikovanje med različnimi vrstami velikih podatkov je pogled na vir podatkov. Kdo ali kaj je ustvaril informacije? Tako kot prejšnja razprava tudi ta metoda razvrščanja obsega tri različne kategorije.

  1. Ljudje: Ta kategorija zadeva velike podatke, ki jih ustvarijo ljudje. Primeri so knjige, slike, videoposnetki, pa tudi informacije in (osebni) podatki na spletnih straneh in družbenih medijih, kot so Facebook, Twitter, Instagram itd..
  2. Registracija procesa: V to kategorijo spadajo bolj tradicionalne vrste velikih podatkov, ki jih zbirajo in analizirajo (velika) podjetja za izboljšanje določenih procesov v poslu.
  3. Stroji: Ta vrsta velikih podatkov je posledica vedno večjega števila senzorjev, ki so nameščeni v strojih. Primer je senzor toplote, ki je pogosto vgrajen v računalniške procesorje. Podatki, ki jih ustvarjajo stroji, so pogosto lahko zelo zapleteni, vendar je vsaj ta vrsta velikih podatkov na splošno dobro strukturirana in popolna.

Za kaj se lahko uporabljajo veliki podatki?

Facebook logotipVse, o čemer smo se do zdaj pogovarjali, morda še zveni nekoliko abstraktno. Naredimo stvari nekoliko bolj konkretne in razpravljajmo o nekaterih resničnih aplikacijah velikih podatkov. Navsezadnje obstaja veliko, veliko načinov, kako podjetja in organizacije uporabljajo velike podatke. Ena prvih stvari, ki pride na misel, so ogromne količine podatkov, ki jih podjetja zbirajo o nas. Facebook zbira podatke o vseh svojih uporabnikih in jih analizira, da se odloči, kaj naj prikazuje na svoji časovnici. Seveda to storimo, da poskrbimo za vaše osebne želje in interese. Facebook upa, da boste zaradi tega ostali na njihovi spletni strani dlje časa. Amazon namreč zbira podatke o svojih strankah in izdelkih, ki jih kupujejo. Tako lahko Amazon priporoči izdelke, za katere meni, da vas bodo zanimali in na ta način povečuje njihov zaslužek.

Vendar se veliki podatki uporabljajo tudi na načine, ki se popolnoma razlikujejo od zgoraj opisanih komercialnih strategij. Na primer, podjetja za javni prevoz lahko zbirajo podatke o zasedenosti določenih poti. Nato bi lahko analizirali te podatke in se na primer odločili, katere proge potrebujejo dodatne avtobuse ali vlake. Drug dobro znan primer učinkovite uporabe velikih podatkov se nanaša na mednarodni UPS velikanski dostavnik. UPS uporablja posebno programsko opremo, ki je bila razvita po analizi velikih podatkov. Ta programska oprema pomaga voznikom UPS-a, da se izognejo zavojem na levi strani, ki so dražji, bolj potratni in nevarnejši od zavojev na desni. Menda je ta sistem že prihranil UPS milijonov galonov goriva, vse zahvaljujoč velikim podatkom.

Drug zanimiv primer zbiranja velikih podatkov so DNK testi in spletna mesta, kot je MyHeritage DNA. To spletno mesto trdi, da vam lahko pomaga »razkriti svoj etnični izvor in najti nove sorodnike« s preprostim DNK testom. Ni treba posebej poudarjati, da ta postopek vključuje veliko zbiranja podatkov in navzkrižne reference, zaradi česar je drugi pomemben akter pri zbiranju in uporabi velikih podatkov. “Tradicionalni” fizični testi DNK vključujejo tudi ogromno velikih podatkov, saj bodo podjetja, ki izvajajo te teste, pridobila izredno veliko podatkovnih nizov za veliko, veliko ljudi. Seveda se je treba zavedati možnih tveganj, ki izhajajo iz teh procesov zbiranja velikih podatkov. Ta tveganja bodo izpostavljena v naslednjem delu tega članka.

Ali so veliki podatki nevarni?

Kot je prikazano zgoraj, so lahko veliki podatki v mnogih primerih neverjetno uporabni. Ponuja nam na tone informacij, ki jih lahko uporabimo za racionalizacijo procesov in za povečanje učinkovitosti in donosnosti podjetij. Vendar to ne pomeni, da je zbiranje in uporaba velikih podatkov popolnoma brez tveganja. Obstaja pet pomembnih tveganj, ki so povezana z velikimi podatki. Tu bomo razpravljali o vseh petih.

Hekerji in tatovi

Pri vsem, kar počnemo na spletu, obstaja lastno tveganje, da bi lahko ukradli naše osebne podatke in informacije o naših internetnih dejavnostih. Tega se mora zavedati vsak uporabnik interneta. Število puščanja in kraje podatkov se je v zadnjih nekaj letih močno povečalo. V novicah se pogosto pojavljajo zgodbe o zločincih, ki prodajajo nabore podatkov, ki vsebujejo gesla in druge informacije na mestih, kot je temni splet. Ti nabori podatkov so pogosto ukradeni iz uradnih spletnih strani, podjetij in organizacij. Večji kot so ti nabori podatkov, tatovi so bolj zanimivi, da jih poskušajo pridobiti. Če se bodo lotili teh nizov podatkov, bi lahko povzročili veliko težav. Ni treba posebej poudarjati, da bi to lahko tudi močno ogrozilo vašo zasebnost.

Zasebnost

Praksa zbiranja osebnih podatkov postaja vse bolj razširjena. Vendar sedanji predpisi o zasebnosti ne morejo slediti hitrem razvoju tehnologije, ki to prakso omogoča. To pušča prostor za sive površine in negotovosti, ki jih ni mogoče rešiti s pregledom zakona. Pomembni problemi glede zasebnosti, ki se pojavljajo, vključujejo: Kakšne podatke je dovoljeno zbirati? O kom? Kdo bi moral imeti dostop do teh podatkov?

Pri zbiranju velikih količin podatkov so možnosti, da so občutljivi osebni podatki vključeni v te naloge, velike. To je problematično, tudi ko hekerji in tatovi niso v igri. Navsezadnje lahko podatke, ki so občutljivi na zasebnost, zlorabljajo vsi, ki imajo slabe namene. To vključuje (zlonamerna) podjetja in organizacije.

Slaba analiza podatkov

Mnoga podjetja in organizacije zbirajo velike podatke, saj jih lahko uporabijo za zanimive analize. To bi jim lahko prineslo pomemben nov vpogled v raziskave (kot so na primer potrošniške navade). Ta vpogled in zaključki bi lahko pomenili spremembe v podjetju, ki bi prinesle višje marže in večji dobiček. Vendar pa lahko, tako kot pri drugih običajnih zbirkah podatkov, tudi napačna analiza velikih podatkov povzroči resne posledice. Navsezadnje lahko nepravilna analiza zlahka privede do napačnih zaključkov. To lahko pomeni neučinkovite ali celo kontraproduktivne ukrepe.

Zbiranje “napačnih” podatkov

Veliki podatki postajajo vse bolj priljubljeni in organizacije so vedno bolj pripravljene zbirati vse vrste podatkov. To pomeni, da se zbirajo velikanske količine podatkov, ne da bi obstajal jasen razlog za njihovo analizo. Z drugimi besedami, ustvarja ogromno bazo surovih informacij, ki je bila zbrana za vsak primer. Podjetja verjetno mislijo, da je dovolj enostavno zbrati vse te podatke, da bi to lahko tudi storili. Ni treba posebej poudarjati, da to ni dobro za zasebnost nikogar. Lahko bi celo pripeljalo do zbiranja in analize nepomembnih ali »napačnih« podatkov. Če se sklepi iz te analize uporabijo pri upravljanju, bi lahko privedli do enakih neučinkovitih ukrepov iz prejšnjega odstavka.

Zbiranje in shranjevanje velikih podatkov z grdimi nameni

Zbiranje velikih podatkov vse pogosteje uporabljajo podjetja, organizacije in vlade, da lahko naredijo natančne individualne profile ljudi. Uporabniki ali državljani skoraj nikoli niso obveščeni o tem, kateri njihovi osebni podatki so registrirani, kaj šele, zakaj in kako. Ni treba posebej poudarjati, da ima to resne posledice za njihovo spletno zasebnost. Vse, kar počnejo prek spleta, je mogoče shraniti in si ogledati pozneje. Poleg tega lahko veliki zbiralci podatkov z analizo in uporabo zbranih podatkov zlahka vplivajo in manipulirajo pri odločanju ljudi.

Veliki podatki in zasebnost

Pametni telefon s sliko ušesaKot boste verjetno razumeli do zdaj, veliki podatki prihajajo z veliko pomanjkljivostmi in tveganji. Kljub temu veliko podjetij in organizacij še vedno zbira podatke v velikem obsegu, predvsem zaradi tega, kako jim lahko pomagajo rasti in napredovanju. Zbiranje velikih podatkov je lažje kot doslej. To ima ogromne posledice za našo zasebnost. Na kratko smo že razpravljali o možnih nevarnostih zasebnosti zlonamernih strank, ki zbirajo slabe podatke. Ker je naša zasebnost tako tesno povezana z množičnim zbiranjem osebnih podatkov, želimo v tem razdelku razpravljati o različnih težavah z zasebnostjo, ki so povezane z velikimi podatki.

Zbiranje podatkov velikega obsega

Številna podjetja, vključno z Googlom, Facebookom in Twitterjem, so močno odvisna od oglasov, s katerimi se bodo ohranili in prinašali dobiček. Da bi bili ti oglasi čim bolj učinkoviti, ta podjetja naredijo podrobne profile svojih uporabnikov, zlasti ob upoštevanju njihovih všečkov in interesov. To je oblika velikih podatkov. Prav tako so vlade in tajne službe odvisne tudi od velikih podatkov. To ogromno informacij uporabljajo za sledenje in preiskovanje ljudi, za katere menijo, da so sumljivi. Seveda to pomeni tudi, da obstaja veliko velikih podatkov, ki jih imajo kibernetski kriminalci, da bi se prijeli na roke in morda celo manipulirali in zlorabljali. To lahko ustvari vse vrste težav z zasebnostjo in identiteto. Kar pride na misel, je kraja identitete.

Kljub temu so možnosti, ki jih prinaša zbiranje v zbirkah podatkov, veliko širše od tega. V teh dneh je tehnologija postala tako napredna in “pametna”, da lahko kombinira nabore podatkov. To je mogoče storiti na tako spreten in spreten način, da velike korporacije in organizacije verjetno vedo več o vas kot vi! Kdo ste, kje živite, kakšni so vaši hobiji, kdo so vaši prijatelji: nobena od teh podatkov ne bo več zasebna. Ni zelo tolažba misel, si lahko mislite. Na srečo obstaja nekaj načinov, kako se zaščititi pred obsežnimi kršitvami zasebnosti, ki jih lahko povzročijo veliki podatki.

Zakoni o zasebnosti

Piškotki na zaslonuZakoni in predpisi o zasebnosti nas lahko zaščitijo pred kršitvami zasebnosti, vendar le do določene mere. Da bi se zadeve še bolj zapletene, se zakoni o zasebnosti pogosto močno razlikujejo med različnimi državami in regijami. Na primer, v Evropi velja razmeroma strog zakon o zasebnosti potrošnikov, imenovan Splošna uredba o varstvu podatkov (GDPR). Ta zakon velja za vse države članice EU, čeprav se lahko podrobnosti razlikujejo po državah. Mnogo mednarodnih podjetij se je odločilo, da bodo vse svoje dejavnosti upoštevale GDPR. Zato na primer Google zdaj uporabnikom dovoljuje, da zahtevajo izbris osebnih podatkov. Vendar se zakoni o zasebnosti v Združenih državah razlikujejo od države do države in ne ščitijo potrošnikov kot tudi EU. Žal to velja celo za najstrožji zakon o zasebnosti v ZDA, kalifornijski zakon o zasebnosti potrošnikov.

Skratka, ne obstaja močan „globalni“ zakon o zasebnosti, ki bi veljal za vse velike zbiralce podatkov in ščitil vse uporabnike. To pomeni, da veliki zbiralci podatkov naši zasebnosti ne škodijo samo na nezakonit način, ampak celo na povsem zakonit način, tako paradoksalno, kot se lahko sliši. Na srečo so obsežne kršitve zasebnosti, ki so jih izpostavili piščalci, kot sta Edward Snowden in Chelsea Manning, močno povečali ozaveščenost o nevarnosti velikih podatkov. Seveda je to le prvi korak k izboljšanju trenutnih zakonov o zasebnosti.

Mnogi uporabniki interneta niso pripravljeni čakati na izboljšanje zakonov o zasebnosti – in to upravičeno. Namesto tega želijo sami ukrepati tako, da storijo vse, kar lahko, da zaščitijo svojo zasebnost. Ali se želite izogniti, da bi postali tudi del neštetih velikih nizov podatkov? Obstaja več nasvetov in trikov, ki vam bodo pomagali na poti.

Kako preprečiti shranjevanje svojih podatkov v velikih zbirkah podatkov

Veliki nabori podatkov resno vplivajo na vašo zasebnost in varnost. Ti nabori podatkov lahko vsebujejo vse vrste (osebnih) podatkov, ki bi jih lahko zlorabila velika podjetja ali celo kibernetski kriminalci. Zato morate vedno poskrbeti, da pustite čim manj spletne sledi. Naslednji nasveti vam lahko pomagajo doseči:

  • Poskusite čim bolj zmanjšati uporabo svojih osebnih podatkov pri ustvarjanju gesel ali na splošno na spletu. Na primer: izogibajte se uporabi svojega imena, naslova, telefonske številke, datuma rojstva itd.
  • Vedno si zapomnite naslednje: vse, kar objavite na internetu, bo tam večno. To morda ni vedno povsem res, vendar ta raven previdnosti pomaga varovati vašo zasebnost. Ko boste seznanili s tem dejstvom, boste z zasebnimi podatki samodejno ravnali bolj previdno.
  • Prepričajte se, da je vaša internetna povezava varna in anonimizirana, na primer z uporabo brskalnika Tor ali VPN, na primer.
  • V brskalniku uporabite enega ali več zaviralcev oglasov.
  • Uporabite v ali več vtičnikov brskalnika, ki blokirajo sledilce in piškotke.
  • Redno počistite predpomnilnik in izbrišite zgodovino brskanja in piškotke.
  • Odjavite se s spletnih mest, ko jih ne uporabljate aktivno.

Ta korak je dober začetek, ko gre za varovanje spletne zasebnosti in varnosti. Upoštevajte pa, da se veliki podatki zbirajo na več različnih načinov – ne samo prek spleta. Skratka, ne glede na to, kje ste in kaj počnete, morate biti vedno pozorni in poskušati zaščititi svoje (osebne) podatke pred velikimi zbiralci podatkov..

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me