Veľké údaje a súkromie: Aké sú riziká pre súkromie? | VPNOverview

Za posledných niekoľko desaťročí sa svet v mnohých ohľadoch výrazne zmenil, najmä pokiaľ ide o IT. Počet ľudí, s ktorými sme schopní denne komunikovať, sa výrazne zvýšil, rovnako ako množstvo informácií, ku ktorým máme prístup. To isté však platí pre množstvo informácií, ktoré o nás zhromažďujú veľké spoločnosti. Výrazy, ako sú veľké údaje, sa používajú stále častejšie. Čo to však presne znamená? Čo sú veľké údaje? Je to nebezpečné? Ako to ovplyvňuje naše súkromie, ak vôbec? Toto sú niektoré z otázok, ktorými sa budeme zaoberať v tomto článku.


Čo sú veľké dáta?

Zoznam s lupouPojem „veľké údaje“ opisuje obrovské množstvo (osobných) údajov, ktoré neustále zhromažďujú rôzni aktéri. Príkladom by mohli byť všetky informácie, ktoré spoločnosť Google zhromažďuje o vyhľadávacích dopytoch svojich používateľov. Fenomén veľkých údajov je relatívne nedávny vývoj, ktorý sa začal, pretože (veľké) spoločnosti a organizácie, ako napríklad Facebook, Google a väčšina vlád, začali zhromažďovať stále viac údajov o svojich používateľoch, zákazníkoch a občanoch ako predtým. Tento vývoj nesmierne pomohli nové technológie, digitalizovaný svet a internet.

Zbierky veľkých údajov sú často také veľké, že je nemožné ich analyzovať pomocou tradičnej analýzy údajov. Ak však niekto analyzuje veľké údaje správnym spôsobom, je možné vyvolať zaujímavé vzorce a závery. Napríklad veľké údaje sa často používajú na prieskum trhu vo veľkom meradle: ktoré produkty sa najpravdepodobnejšie kúpia? Aký druh reklamy je najúčinnejší, keď chcete osloviť a presvedčiť zákazníkov?

Aby sa súbor údajov považoval za veľké údaje, mal by zvyčajne spĺňať nasledujúce tri kritériá, známe tiež ako 3 v:

 • objem: Veľké dáta sú nič iné ako malá vzorka. Zahŕňa rozsiahle zbierky údajov, ktoré sú výsledkom dlhodobého a nepretržitého pozorovania.
 • rýchlosť: Súvisí to s pôsobivými rýchlosťami zhromažďovania veľkých údajov. Veľké údaje sú navyše často prístupné v reálnom čase (keď sa zhromažďujú).
 • variety: Veľké súbory údajov často obsahujú veľa rôznych druhov informácií. Údaje v rámci veľkých množín údajov by sa mohli dokonca skombinovať, aby vyplnili medzery a ešte viac skompletizovali množinu údajov.

Okrem týchto 3 v majú veľké údaje aj ďalšie vlastnosti. Napríklad veľké dáta sú vynikajúce pre strojové učenie. To znamená, že môže byť efektívne použitý na výučbu počítačov a strojov na vykonávanie určitých úloh. Navyše, ako sme sa už krátko dotkli, veľké údaje možno použiť na detekciu vzorov. Toto sa väčšinou deje veľmi efektívne, pomocou počítačov pracujúcich na údajoch. A nakoniec, veľké dáta sú odrazom digitálnych odtlačkov prstov používateľov. To znamená, že je vedľajším produktom digitálnych a online aktivít ľudí a dá sa použiť na vytvorenie individuálnych osobných profilov.

Rôzne druhy veľkých dát

Existujú rôzne spôsoby klasifikácie veľkých údajov. Prvý spôsob, ktorý sa používa najčastejšie, rozlišuje veľké údaje na základe druhu údajov, ktoré sa zbierajú. Tri možné kategórie použité pre tento typ klasifikácie sú: štruktúrované veľké údaje, nestrukturované veľké údaje a pološtrukturované veľké údaje.

 1. štruktúrované: Ak sú veľké údaje štruktúrované, je možné ich usporiadať a prezentovať organizovaným a logickým spôsobom, čím sa údaje sprístupnia a ľahšie pochopia. Príkladom by mohol byť zoznam zákazníckych adries vytvorených spoločnosťou. V tomto zozname by sa pravdepodobne našli mená, adresy a prípadne ďalšie podrobnosti o zákazníkoch, ako sú telefónne čísla, ktoré sú jasne štruktúrované napríklad v grafe alebo tabuľke..
 2. neštruktúrované: Neštruktúrované veľké údaje nie sú vôbec usporiadané. Chýba mu logická prezentácia, ktorá by mala zmysel pre priemerného človeka. Neštruktúrované veľké údaje nemajú štruktúru napríklad tabuľky, ktorá označuje určitú súvislosť medzi rôznymi prvkami súboru údajov. Preto je pomerne ťažké orientovať a porozumieť tomuto typu údajov. Mnohé množiny údajov sa spočiatku začínajú ako neštruktúrované veľké údaje.
 3. Semi-štruktúrované: Polo-štruktúrované veľké dáta, ako ste si možno mysleli, majú charakteristiky štruktúrovaných aj neštruktúrovaných veľkých dát. Povaha a zobrazenie tohto typu údajov nie sú úplne svojvoľné. Nie je však dostatočne štruktúrovaná a usporiadaná, aby sa mohla použiť na zmysluplnú analýzu. Príkladom by mohla byť webová stránka, ktorá obsahuje konkrétne značky metaúdajov (ďalšie informácie, ktoré nie sú priamo viditeľné v texte), napríklad preto, že obsahuje určité kľúčové slová. Tieto značky účinne zobrazujú konkrétne kúsky informácií, ako napríklad autor stránky alebo okamih, keď bola umiestnená online. Samotný text je v podstate neštruktúrovaný, ale kľúčové slová a ďalšie meta údaje, ktoré obsahuje, pomáhajú urobiť z neho trochu vhodný základ pre analýzu.

Klasifikácia na základe zdroja veľkých údajov

Ďalším bežným spôsobom, ako rozlišovať medzi rôznymi druhmi veľkých údajov, je pohľad na zdroj údajov. Kto alebo čo tieto informácie vygenerovalo? Tak ako predchádzajúca odchýlka, aj táto klasifikačná metóda pozostáva z 3 rôznych kategórií.

 1. ľudia: Táto kategória sa týka veľkých údajov generovaných ľuďmi. Príkladmi sú knihy, obrázky, videá, ako aj informácie a (osobné) údaje na webových stránkach a sociálnych médiách, ako sú Facebook, Twitter, Instagram atď..
 2. Postup registrácie: Táto kategória zahŕňa tradičnejší druh veľkých údajov, ktoré zhromažďujú a analyzujú (veľké) spoločnosti s cieľom zlepšiť určité procesy v podnikaní..
 3. stroje: Tento typ veľkých údajov je výsledkom stále rastúceho počtu senzorov umiestnených v strojoch. Príkladom by mohol byť tepelný senzor, ktorý je často zabudovaný do počítačových procesorov. Údaje generované strojmi môžu byť často veľmi zložité, ale aspoň tento typ veľkých údajov je všeobecne dobre štruktúrovaný a úplný.

Na čo sa dajú veľké údaje použiť?

Logo spoločnosti FacebookVšetko, o čom sa diskutovalo, môže znieť trochu abstraktne. Urobme veci trochu konkrétnejšie a diskutujeme o niektorých aplikáciách veľkých dát v reálnom živote. Koniec koncov, existuje veľa spôsobov, ako spoločnosti a organizácie používajú veľké dáta. Jednou z prvých vecí, ktorá ma napadne, je obrovské množstvo údajov, ktoré o nás zhromažďujú spoločnosti. Facebook zhromažďuje údaje o všetkých jeho používateľoch a analyzuje ich, aby sa rozhodol, čo sa vám na vašej časovej osi zobrazí. Samozrejme, je to tak, aby sa vyhovelo vašim osobným želaniam a záujmom. Facebook dúfa, že vám to umožní zostať na svojich webových stránkach dlhší čas. Amazon zase zhromažďuje informácie o svojich klientoch a produktoch, ktoré kupujú. Týmto spôsobom môže Amazon odporučiť produkty, o ktorých si myslíte, že vás budú zaujímať, a týmto spôsobom zvýšiť svoje zárobky.

Veľké údaje sa však používajú aj spôsobmi úplne odlišnými od komerčných stratégií opísaných vyššie. Napríklad spoločnosti verejnej dopravy môžu zhromažďovať údaje o tom, aké rušné sú určité trasy. Potom by mohli tieto údaje analyzovať a rozhodnúť napríklad o tom, ktoré trasy si vyžadujú ďalšie autobusy alebo vlaky. Ďalší dobre známy prípad efektívneho využívania veľkých dát sa týka gigantu UPS pre medzinárodné dodávky. UPS používa špeciálny softvér, ktorý bol vyvinutý po analýze veľkých dát. Tento softvér pomáha vodičom UPS vyhnúť sa ľavotočivým zatáčkam, ktoré sú nákladnejšie, zbytočnejšie a nebezpečnejšie ako zákruty doprava. Tento systém údajne už ušetril milióny galónov paliva v palive, a to všetko vďaka veľkým údajom.

Ďalším zaujímavým príkladom zhromažďovania veľkých údajov sú testy DNA a webové stránky, ako je napríklad MyHeritage DNA. Táto webová stránka tvrdí, že vám môže pomôcť „odhaliť etnický pôvod a nájsť nových príbuzných“ pomocou jednoduchého testu DNA. Netreba dodávať, že tento proces zahŕňa veľa zhromažďovania údajov a krížových odkazov, čo z neho robí ďalší významný hráč v oblasti zhromažďovania a využívania veľkých údajov. „Tradičné“ testy fyzickej DNA zahŕňajú aj veľké množstvo veľkých údajov, pretože spoločnosti, ktoré tieto testy vykonávajú, získajú mimoriadne veľké súbory údajov o mnohých a mnohých ľuďoch. Samozrejme je dôležité poznať možné riziká, ktoré s týmito procesmi zhromažďovania veľkých dát súvisia. Tieto riziká budú zdôraznené v ďalšej časti tohto článku.

Je veľké množstvo údajov nebezpečné?

Ako je uvedené vyššie, veľké údaje môžu byť v mnohých prípadoch neuveriteľne užitočné. Poskytuje nám množstvo informácií, ktoré môžeme použiť na zefektívnenie procesov a zvýšenie efektívnosti a ziskovosti spoločností. Neznamená to však, že zhromažďovanie a používanie veľkých údajov je úplne bezpečné. Pri veľkých údajoch existuje päť dôležitých rizík. Diskutujeme tu o všetkých piatich.

Hackeri a zlodeji

So všetkým, čo robíme online, existuje základné riziko, že naše osobné údaje a informácie o našich internetových aktivitách môžu byť ukradnuté. Každý užívateľ internetu si to musí byť vedomý. Počet únikov údajov a krádeží údajov sa v posledných rokoch drasticky zvýšil. V správach sa často objavujú správy o zločincoch, ktorí predávajú súbory údajov obsahujúce heslá a ďalšie informácie o miestach, ako napríklad temný web. Tieto súbory údajov sa často odcudzia z oficiálnych webových stránok, spoločností a organizácií. Čím sú tieto súbory údajov väčšie, tým zaujímavejšie je pre zlodejov pokus o ich získanie. Ak sa tieto súbory údajov dostanú do rúk, mohli by spôsobiť veľa problémov. Netreba dodávať, že to môže tiež výrazne ohroziť vaše súkromie.

súkromia

Postup zhromažďovania osobných údajov je čoraz rozšírenejší. Súčasné nariadenia o ochrane súkromia však nedokážu držať krok s rýchlym vývojom technológií, ktorý túto prax umožňuje. Zostáva tak priestor pre šedé oblasti a neistoty, ktoré sa nedajú vyriešiť pri pohľade na zákon. Medzi dôležité obavy týkajúce sa ochrany osobných údajov patria: Aký druh údajov sa môže zhromažďovať? O kom? Kto by mal mať prístup k týmto údajom?

Pri zhromažďovaní veľkého množstva údajov je vysoká pravdepodobnosť, že citlivé osobné informácie sú súčasťou týchto súborov údajov. Je to problematické, aj keď hackeri a zlodeji nie sú v hre. Koniec koncov, údaje citlivé na súkromie môže zneužívať niekto, kto má zlé úmysly. Patria sem (škodlivé) spoločnosti a organizácie.

Slabá analýza údajov

Mnoho spoločností a organizácií zhromažďuje veľké údaje, pretože ich môžu použiť na zaujímavé analýzy. To by im mohlo poskytnúť dôležité nové informácie o všetkom, čo skúmajú (napríklad zvyky spotrebiteľov). Tieto postrehy a závery môžu zasa viesť k zmenám v spoločnosti, ktoré vedú k vyšším maržiam a vyššiemu zisku. Avšak, rovnako ako pri iných normálnych súboroch údajov, aj nesprávna analýza veľkých údajov môže mať vážne následky. Nesprávna analýza môže koniec koncov ľahko viesť k nesprávnym záverom. Tieto môžu zasa znamenať, že sa prijímajú neúčinné alebo dokonca kontraproduktívne opatrenia.

Zhromažďovanie „nesprávnych“ údajov

Veľké dáta sú čoraz populárnejšie a organizácie sú stále viac ochotné zhromažďovať najrôznejšie údaje. To znamená, že sa zbiera obrovské množstvo údajov bez toho, aby existoval jasný dôvod na ich analýzu. Inými slovami, vytvára obrovskú databázu nespracovaných informácií, ktoré boli zhromaždené len pre prípad. Spoločnosti si pravdepodobne myslia, že je dosť ľahké zhromaždiť všetky tieto údaje, aby to mohli tiež urobiť. Netreba dodávať, že to nie je dobré pre súkromie nikoho. Mohlo by to dokonca viesť k zhromažďovaniu a analýze irelevantných alebo „nesprávnych“ údajov. Ak sa závery vyvodené z tejto analýzy použijú pri riadení, mohlo by to viesť k rovnakým neefektívnym opatreniam uvedeným v predchádzajúcom odseku.

Zhromažďovanie a ukladanie veľkých údajov so zlými úmyslami

Zhromažďovanie veľkých údajov využívajú spoločnosti, organizácie a vlády čoraz častejšie, aby mohli presným spôsobom vytvárať individuálne profily ľudí. Užívatelia alebo občania sú sotva informovaní o tom, ktoré osobné údaje sa registrujú, nehovoriac o tom, prečo a ako. Netreba dodávať, že to má vážne dôsledky na ich súkromie online. Všetko, čo robia online, je možné uložiť a zobraziť neskôr. Veľké zberače údajov by navyše mohli ľahko ovplyvňovať a manipulovať pri rozhodovaní ľudí analýzou a využívaním zhromaždených údajov.

Veľké dáta a súkromie

Smartphone s obrázkom uchaAko pravdepodobne už teraz rozumiete, veľké dáta prichádzajú s mnohými nevýhodami a rizikami. Mnoho spoločností a organizácií však stále zhromažďuje údaje vo veľkom rozsahu, väčšinou kvôli tomu, ako im môže pomôcť rásť a napredovať. Zhromažďovanie veľkých údajov je jednoduchšie ako kedykoľvek predtým. To má obrovské dôsledky pre naše súkromie. Už sme krátko diskutovali o možných nebezpečenstvách ochrany súkromia škodlivých strán zhromažďujúcich zlé údaje. Keďže naše súkromie je tak úzko spojené s hromadným zberom osobných údajov, chceme v tejto časti použiť na prediskutovanie rôznych obáv týkajúcich sa súkromia, ktoré sa vyskytujú pri veľkých údajoch.

Zhromažďovanie rozsiahlych údajov

Mnoho spoločností, vrátane spoločností Google, Facebook a Twitter, sú do veľkej miery závislé od reklamy, aby sa udržali a dosiahli zisk. Aby boli tieto reklamy čo najefektívnejšie, robia tieto spoločnosti podrobný profil svojich používateľov, najmä berúc do úvahy ich záujmy a záujmy. Je to forma veľkých údajov. Rovnako vlády a tajné služby závisia aj od veľkých údajov. Tieto obrovské množstvo informácií používajú na sledovanie a vyšetrovanie osôb, ktoré považujú za podozrivé. Samozrejme to tiež znamená, že existuje veľa veľkých údajov pre kybernetických zločincov, aby sa dostali do rúk a možno dokonca manipulovali a zneužívali. To môže spôsobiť najrôznejšie problémy spojené s ochranou súkromia a identity. Jeden, ktorý príde na myseľ, je krádež identity.

Možnosti, ktoré so zbierkou v databázach prichádzajú, sú však oveľa širšie. V súčasnosti je technológia taká vyspelá a „inteligentná“, že dokáže kombinovať súbory údajov. Dá sa to urobiť tak chytrým a zdvorilým spôsobom, že veľké korporácie a organizácie o vás pravdepodobne vedia viac ako vy! Kto ste, kde žijete, aké sú vaše záľuby, kto sú vaši priatelia: žiadna z týchto informácií už nebude súkromná. Nie príliš ukľudňujúca myšlienka. Našťastie existuje niekoľko spôsobov, ako sa chrániť pred rozsiahlym porušovaním súkromia, ktoré môžu spôsobiť veľké údaje.

Zákony o ochrane súkromia

Súbory cookie na obrazovkeZákony a nariadenia o ochrane súkromia nás môžu chrániť pred porušením ochrany osobných údajov, ale iba do určitej miery. Aby sa veci skomplikovali, zákony o ochrane súkromia sa medzi jednotlivými krajinami a regiónmi často veľmi líšia. Napríklad v Európe je v platnosti relatívne prísne právo na ochranu súkromia spotrebiteľov s názvom Všeobecné nariadenie o ochrane údajov (GDPR). Tento zákon sa vzťahuje na všetky členské štáty EÚ, hoci podrobnosti sa môžu v jednotlivých krajinách líšiť. Mnoho medzinárodných spoločností sa rozhodlo zachovať všetky svoje činnosti v rámci GDPR. Preto napríklad spoločnosť Google teraz umožňuje používateľom požiadať o vymazanie osobných údajov. Zákony o ochrane súkromia v Spojených štátoch sa však v jednotlivých štátoch líšia a nechránia spotrebiteľov, ako aj EÚ. Bohužiaľ to platí dokonca aj pre najprísnejšie zákony o ochrane osobných údajov v USA, kalifornský zákon o ochrane spotrebiteľa.

Stručne povedané, neexistuje nič také ako silný „globálny“ zákon o ochrane súkromia, ktorý sa vzťahuje na všetkých veľkých zberateľov údajov a chráni všetkých používateľov. To znamená, že naše súkromie nie je poškodené iba veľkými zberateľmi údajov nezákonnými, ale dokonca úplne legálnymi spôsobmi, rovnako paradoxnými, ako to môže znieť. Našťastie rozsiahle porušenia ochrany osobných údajov, ktoré boli odhalené informátormi ako Edward Snowden a Chelsea Manning, značne zvýšili povedomie o rizikách veľkých údajov. Toto je, samozrejme, iba prvý krok k zlepšeniu súčasných zákonov o ochrane súkromia.

Mnoho používateľov internetu nechce čakať na zlepšenie zákonov o ochrane osobných údajov – a to právom. Skôr chcú sami konať, aby urobili všetko, čo je v ich silách, aby chránili svoje súkromie. Chcete sa vyhnúť tomu, aby ste sa stali súčasťou nespočetných veľkých množín údajov? Existuje niekoľko tipov a trikov, ktoré vám pomôžu na vašej ceste.

Ako zabrániť uloženiu vašich údajov do veľkých množín údajov

Veľké súbory údajov vážne ovplyvňujú vaše súkromie a bezpečnosť. Tieto súbory údajov môžu obsahovať najrôznejšie (osobné) informácie, ktoré by mohli zneužívať veľké spoločnosti alebo dokonca počítačoví zločinci. Preto by ste sa mali vždy uistiť, že necháte čo najmenšiu časť online stopy. Nasledujúce tipy vám môžu pomôcť dosiahnuť tento cieľ:

 • Pri vytváraní hesiel alebo všeobecne na webe sa pokúste minimalizovať použitie vašich osobných údajov. Napríklad: nepoužívajte svoje meno, adresu, telefónne číslo, dátum narodenia atď.
 • Vždy pamätajte na nasledujúce: všetko, čo zverejníte na internete, tam bude navždy. To nemusí byť vždy úplne pravda, ale táto úroveň opatrnosti pomáha chrániť vaše súkromie. Keď sa dozviete o tejto skutočnosti, budete so svojimi súkromnými údajmi automaticky zaobchádzať opatrnejšie.
 • Uistite sa, že vaše internetové pripojenie je bezpečné a anonymizované, napríklad pomocou Tor-browser alebo VPN.
 • Vo svojom prehliadači použite jeden alebo niekoľko blokátorov reklamy.
 • Použite viac alebo viac doplnkov prehliadača, ktoré blokujú sledovače a súbory cookie.
 • Pravidelne vymažte vyrovnávaciu pamäť a vymažte históriu prehliadania a súbory cookie.
 • Ak ich aktívne nepoužívate, odhláste sa.

Vykonanie týchto krokov je dobrým začiatkom, pokiaľ ide o ochranu vášho súkromia a bezpečnosti online. Pamätajte však, že veľké údaje sa zhromažďujú mnohými rôznymi spôsobmi – nielen online. Stručne povedané, nech ste kdekoľvek a nech robíte čokoľvek, mali by ste byť vždy ostražití a snažiť sa chrániť svoje (osobné) údaje pred veľkými zberateľmi údajov..

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me