Velká data a soukromí: Jaká jsou rizika ochrany osobních údajů? | VPNOpřehled

V posledních několika desetiletích se svět v mnoha ohledech nesmírně změnil, zejména pokud jde o IT. Počet lidí, se kterými jsme schopni denně komunikovat, rostl nesmírně stejně jako množství informací, ke kterým máme přístup. Totéž platí pro množství informací, které o nás shromažďují velké společnosti. Termíny, jako jsou velká data, se s časem používají stále častěji. Ale co to přesně znamená? Co jsou velká data? Je to nebezpečné? Jak to ovlivňuje naše soukromí, pokud vůbec? To jsou některé z otázek, které se budeme zabývat v tomto článku.


Co jsou velká data?

Seznam s lupouPojem „velká data“ popisuje obrovské množství (osobních) údajů, které neustále shromažďují různí aktéři. Příkladem by mohly být všechny informace, které Google shromažďuje o vyhledávacích dotazech svých uživatelů. Fenomén velkých dat je relativně nedávný vývoj, který začal, protože (velké) společnosti a organizace, jako je Facebook, Google a většina vlád, začaly shromažďovat stále více údajů o svých uživatelích, zákaznících a občanech než dříve. Tomuto vývoji nesmírně pomohly nové technologie, digitalizovaný svět a internet.

Sběr velkých dat je často tak obrovský, že je nemožné je analyzovat pomocí tradiční analýzy dat. Pokud však člověk analyzuje velká data správným způsobem, lze vyvolat zajímavé vzorce a závěry. Například velká data se často používají pro průzkum trhu ve velkém měřítku: které produkty se pravděpodobně kupují? Jaký druh reklamy je nejúčinnější, když chcete oslovit a přesvědčit zákazníky?

Aby byl datový soubor považován za velký, měl by obvykle splňovat následující tři kritéria, známá také jako 3 v:

  • Hlasitost: Velká data jsou nic jiného než malý vzorek. Zahrnuje rozsáhlé sbírky dat, které jsou výsledkem dlouhého a nepřetržitého pozorování.
  • Rychlost: To souvisí s působivými rychlostmi, se kterými se shromažďují velká data. Velká data jsou navíc často přístupná v reálném čase (jak se shromažďují).
  • Odrůda: Velké datové sady často obsahují mnoho různých typů informací. Data ve velkých sadách dat lze dokonce kombinovat, aby vyplnily všechny mezery a ještě více doplnily datovou sadu.

Kromě těchto 3 v má velká data i další vlastnosti. Například velká data jsou skvělá pro strojové učení. To znamená, že může být efektivně použito k výuce počítačů a strojů určitých úkolů. Navíc, jak jsme se již krátce dotkli, velká data lze použít k detekci vzorců. K tomu většinou dochází velmi efektivním způsobem, pomocí počítačů pracujících na datech. A konečně, velká data jsou odrazem digitálních otisků prstů uživatelů. To znamená, že jde o vedlejší produkt digitálních a online aktivit lidí a lze jej použít k vytváření individuálních osobních profilů.

Různé druhy velkých dat

Existují různé způsoby klasifikace velkých dat. První způsob, který se používá nejčastěji, rozlišuje velká data podle druhu shromažďovaných dat. Tři možné kategorie použité pro tento typ klasifikace jsou: strukturovaná velká data, nestrukturovaná velká data a polostrukturovaná velká data.

  1. Strukturované: Když jsou velká data strukturována, lze je ukládat a prezentovat organizovaným a logickým způsobem, aby byla data přístupnější a snáze srozumitelná. Příkladem by mohl být seznam zákaznických adres vytvořených společností. V tomto seznamu by člověk pravděpodobně našel jména, adresy a možná i další podrobnosti, jako jsou telefonní čísla, a to vše jasně strukturované například v grafu nebo tabulce..
  2. Nestrukturované: Nestrukturovaná velká data nejsou vůbec organizována. Postrádá logickou prezentaci, která by dávala průměrné lidské bytosti smysl. Nestrukturovaná velká data nemají strukturu například tabulky, která označuje určitou souvislost mezi různými prvky sady dat. Z tohoto důvodu je poměrně obtížné navigovat a porozumět tomuto typu dat. Mnoho datových sad zpočátku začíná jako nestrukturovaná velká data.
  3. Polostrukturované: Polostrukturovaná velká data, jak jste možná uhodli, mají vlastnosti strukturovaných i nestrukturovaných velkých dat. Povaha a reprezentace tohoto typu dat nejsou zcela svévolné. Přesto není dostatečně strukturovaná a organizovaná, aby mohla být použita pro smysluplnou analýzu. Příkladem by mohla být webová stránka, která obsahuje konkrétní značky metadat (další informace, které nejsou v textu přímo viditelné), například proto, že obsahují určitá klíčová slova. Tyto značky efektivně zobrazují konkrétní kousky informací, jako je autor stránky nebo okamžik, kdy byla umístěna online. Samotný text je v podstatě nestrukturovaný, avšak klíčová slova a další metadata, která obsahuje, pomáhají učinit z něj poněkud vhodný základ pro analýzu.

Klasifikace na základě zdroje velkých dat

Dalším běžným způsobem, jak rozlišit mezi různými druhy velkých dat, je pohled na zdroj dat. Kdo nebo co tyto informace vygenerovalo? Stejně jako předchozí odchylka se i tato klasifikační metoda skládá ze 3 různých kategorií.

  1. Lidé: Tato kategorie se týká velkých dat generovaných lidmi. Příkladem by mohly být knihy, obrázky, videa, informace a (osobní) údaje na webových stránkách a sociálních médiích, jako je Facebook, Twitter, Instagram atd..
  2. Proces registrace: Tato kategorie zahrnuje tradičnější druh velkých dat, která jsou shromažďována a analyzována (velkými) společnostmi za účelem zlepšení určitých procesů v podnikání..
  3. Stroje: Tento typ velkých dat je výsledkem stále rostoucího počtu senzorů umístěných ve strojích. Příkladem by mohl být teplotní senzor, který je často zabudován do počítačových procesorů. Data generovaná stroji mohou být často velmi složitá, ale alespoň tento typ velkých dat je obecně dobře strukturovaný a úplný.

K čemu lze použít velká data?

Logo společnosti FacebookVšechno, o čem jsme diskutovali, by mohlo znít poněkud abstraktně. Udělejme věci trochu konkrétnějšími a prodiskutujeme některé aplikace velkých dat v reálném životě. Koneckonců, existuje mnoho, mnoho způsobů, jak společnosti a organizace používají velká data. Jednou z prvních věcí, která mě napadne, je obrovské množství dat, které o nás shromažďují společnosti. Facebook shromažďuje údaje o všech svých uživatelích a analyzuje to, aby se rozhodl, co se na vaší časové ose zobrazí. Samozřejmě se tak děje s ohledem na vaše osobní přání a zájmy. Facebook doufá, že vám to umožní zůstat na svých webových stránkách delší dobu. Amazon zase shromažďuje informace o svých klientech a produktech, které kupují. Tímto způsobem může Amazon doporučit produkty, o kterých si myslí, že vás budou zajímat, a tímto způsobem zvýšit své výdělky.

Velká data se však používají také zcela odlišně od komerčních strategií popsaných výše. Například společnosti veřejné dopravy mohou shromažďovat údaje o tom, jak zaneprázdněné jsou určité trasy. Poté mohli analyzovat tato data a rozhodnout se například, které trasy vyžadují další autobusy nebo vlaky. Další známý případ efektivního využití velkých dat se týká gigantu UPS pro mezinárodní dodávky. UPS používá speciální software, který byl vyvinut po analýze velkých dat. Tento software pomáhá řidičům UPS vyhnout se levotočivým zatáčkám, které jsou nákladnější, plýtvavější a nebezpečnější než zatáčky vpravo. Tento systém údajně již ušetřil miliony galonů v palivu, a to vše díky velkým datům.

Dalším zajímavým příkladem sběru velkých dat jsou testy DNA a webové stránky, jako je například MyHeritage DNA. Tato webová stránka tvrdí, že vám může pomoci „odhalit svůj etnický původ a najít nové příbuzné“ pomocí jednoduchého testu DNA. Netřeba dodávat, že tento proces zahrnuje spoustu sběru dat a křížových odkazů, díky čemuž je dalším významným hráčem v oblasti shromažďování a používání velkých dat. „Tradiční“ fyzikální testy DNA zahrnují také velké množství velkých dat, protože společnosti, které tyto testy provádějí, získají extrémně velké soubory údajů o mnoha, mnoha lidech. Samozřejmě je důležité uvědomit si možná rizika, která s těmito procesy sběru velkých dat přicházejí. Tato rizika budou zdůrazněna v další části tohoto článku.

Je velká data nebezpečná?

Jak je uvedeno výše, velká data mohou být v mnoha případech neuvěřitelně užitečná. Poskytuje nám spoustu informací, které můžeme použít k zefektivnění procesů a zvýšení efektivnosti a ziskovosti společností. Neznamená to však, že shromažďování a používání velkých dat je zcela bez rizika. S velkými daty přichází pět důležitých rizik. Diskutujeme zde všech pět.

Hackeři a zloději

Se vším, co děláme online, existuje inherentní riziko, že naše osobní údaje a informace o našich internetových aktivitách mohou být ukradeny. Každý uživatel internetu si to musí být vědom. Počet úniků a krádeží dat v posledních několika letech výrazně vzrostl. Ve zprávách se často objevují příběhy o zločincích, kteří prodávají soubory dat obsahující hesla a další informace o místech, jako je temný web. Tyto soubory dat jsou často ukradeny z oficiálních webových stránek, společností a organizací. Čím větší jsou tyto soubory dat, tím zajímavější je pro zloděje snažit je získat. Pokud se těchto datových sad dostanou do rukou, mohou způsobit mnoho problémů. Netřeba dodávat, že by to také mohlo výrazně ohrozit vaše soukromí.

Soukromí

Postup shromažďování osobních údajů je stále rozšířenější. Současné předpisy o ochraně soukromí však nemohou držet krok s rychlým vývojem v technologii, která tuto praxi umožňuje. To ponechává prostor pro šedé oblasti a nejistoty, které nelze vyřešit při pohledu na zákon. Mezi důležité obavy týkající se ochrany soukromí patří: Jaké druhy údajů lze shromažďovat? O kom? Kdo by měl mít přístup k těmto údajům?

Při shromažďování velkého množství dat jsou šance, že citlivé osobní informace jsou zahrnuty do těchto datových sad, vysoké. To je problematické, i když hackeři a zloději nejsou ve hře. Koneckonců, data citlivá na soukromí mohla zneužít kdokoli se špatnými úmysly. To zahrnuje (škodlivé) společnosti a organizace.

Špatná analýza dat

Mnoho společností a organizací shromažďuje velká data, protože je mohou použít pro zajímavé analýzy. To by jim mohlo poskytnout důležité nové poznatky o tom, co zkoumají (například zvyky spotřebitelů). Tyto postřehy a závěry by se pak mohly promítnout do změn v rámci společnosti, které vedou k vyšším maržím a vyššímu zisku. Stejně jako u jiných běžných datových souborů však může mít nesprávná analýza velkých dat vážné důsledky. Nesprávná analýza může nakonec snadno vést k nesprávným závěrům. Ty se pak mohou promítat do neúčinných nebo dokonce kontraproduktivních opatření.

Shromažďování „nesprávných“ dat

Velká data jsou stále populárnější a organizace jsou stále více ochotny shromažďovat nejrůznější údaje. To znamená, že se shromažďuje obrovské množství dat, aniž by existoval jasný důvod pro jejich analýzu. Jinými slovy, vytváří obrovskou databázi nezpracovaných informací, které byly shromážděny pro případ. Společnosti si pravděpodobně myslí, že je snadné shromáždit všechna tato data, aby to mohli také udělat. Netřeba dodávat, že to není dobré pro soukromí nikoho. Mohlo by to dokonce vést k tomu, že budou shromažďovány a analyzovány irelevantní nebo „nesprávné“ údaje. Pokud se závěry z této analýzy použijí v řízení, mohlo by to vést ke stejným neúčinným opatřením uvedeným v předchozím odstavci.

Shromažďování a ukládání velkých dat se špatnými úmysly

Shromažďování velkých dat je čím dál častěji využíváno společnostmi, organizacemi a vládami, aby mohli na lidech přesně vytvářet individuální profily. Uživatelé nebo občané jsou stěží informováni o tom, které z jejich osobních údajů jsou registrovány, natož proč a jak. Netřeba dodávat, že to má závažné důsledky pro jejich soukromí na internetu. Vše, co dělají online, lze později uložit a zobrazit. Velké sběratele dat by navíc mohly snadno ovlivňovat a manipulovat při rozhodování lidí analýzou a používáním shromážděných dat.

Velká data a soukromí

Smartphone s obrázkem uchaJak již pravděpodobně pravděpodobně pochopíte, velká data přicházejí s mnoha nevýhodami a riziky. Mnoho společností a organizací však stále shromažďuje data ve velkém měřítku, hlavně kvůli tomu, jak jim může pomoci růst a postupovat. Sběr velkých dat je snadnější než kdykoli předtím. To má obrovské důsledky pro naše soukromí. Již jsme krátce diskutovali o možném ohrožení soukromí škodlivých stran shromažďujících špatná data. Vzhledem k tomu, že naše soukromí je tak úzce spjato s hromadným shromažďováním osobních údajů, chceme tuto část použít k diskuzi o různých obavách týkajících se soukromí, které přicházejí s velkými daty.

Sběr dat ve velkém měřítku

Mnoho společností, včetně společností Google, Facebook a Twitter, jsou silně závislé na reklamách, aby se udržely a dosáhly zisku. Aby byly tyto reklamy co nejefektivnější, vytvářejí tyto společnosti podrobné profily svých uživatelů, zejména s ohledem na jejich oblíbenost a zájmy. Jedná se o formu velkých dat. Stejně tak vlády a tajné služby jsou závislé také na velkých datech. Používají toto obrovské množství informací ke sledování a vyšetřování lidí, které považují za podezřelé. Samozřejmě to také znamená, že pro kybernetické zločince existuje spousta velkých dat, aby se dostali do rukou a možná dokonce manipulovali a zneužívali. To může vytvářet nejrůznější problémy související s ochranou soukromí a identity. Jeden, který přijde na mysl, je krádež identity.

Možnosti, které přicházejí se sbírkou v databázích, jsou však stále mnohem širší. V dnešní době se technologie stala tak vyspělou a „chytrou“, že dokáže kombinovat datové sady. To lze provést tak chytrým a zdvořilým způsobem, že velké korporace a organizace o vás pravděpodobně vědí více než vy! Kdo jste, kde žijete, jaké jsou vaše koníčky, kdo jsou vaši přátelé: žádná z těchto informací již nebude soukromá. Není to moc uklidňující myšlenka. Naštěstí existuje několik způsobů, jak se chránit před rozsáhlým porušováním ochrany osobních údajů, které mohou způsobit velká data.

Zákony o soukromí

Soubory cookie na obrazovceZákony a předpisy o ochraně osobních údajů nás mohou chránit před porušením ochrany osobních údajů, ale pouze do určité míry. Aby se věci komplikovaly, zákony na ochranu soukromí se mezi různými zeměmi a regiony často velmi liší. Například v Evropě je v platnosti relativně přísný zákon o ochraně soukromí spotřebitelů nazvaný Obecné nařízení o ochraně údajů (GDPR). Tento zákon se vztahuje na všechny členské státy EU, i když se podrobnosti mohou v jednotlivých zemích lišit. Mnoho mezinárodních společností se rozhodlo dodržovat veškeré své podnikání vůči GDPR. Proto například Google nyní uživatelům umožňuje požádat o vymazání osobních údajů. Zákony o ochraně soukromí ve Spojených státech se však v jednotlivých státech liší a nechrání jak spotřebitele, tak EU. Bohužel to platí i pro nejnáročnější zákon o ochraně osobních údajů v USA, kalifornský zákon o ochraně spotřebitele.

Stručně řečeno, neexistuje nic takového jako „globální“ zákon o ochraně soukromí, který se vztahuje na všechny velké sběratele dat a chrání všechny uživatele. To znamená, že naše soukromí není poškozeno pouze velkými sběrateli dat nezákonnými, ale dokonce dokonale legálními způsoby, jak paradoxní, jak to může znít. Naštěstí velká porušení ochrany osobních údajů vystavená píšťalkovým dmychadlům, jako jsou Edward Snowden a Chelsea Manning, značně zvýšila povědomí o rizicích velkých dat. Je to samozřejmě pouze první krok ke zlepšení současných zákonů o ochraně osobních údajů.

Mnoho uživatelů internetu nechce čekat na zlepšení zákonů o ochraně osobních údajů – a to právem. Spíše chtějí sami jednat tím, že dělají, co mohou, aby chránili své soukromí. Chcete se vyhnout i tomu, že se stanete součástí nespočetných velkých datových sad? Existuje několik tipů a triků, které vám pomohou na vaší cestě.

Jak zabránit tomu, aby se vaše data ukládala do velkých souborů dat

Velké datové sady vážně ovlivňují vaše soukromí a bezpečnost. Tyto soubory dat mohou obsahovat nejrůznější (osobní) informace, které by mohly zneužít velké společnosti nebo dokonce počítačoví zločinci. Proto byste se měli vždy ujistit, že necháte co nejméně stopy online. K dosažení tohoto cíle vám mohou pomoci následující tipy:

  • Při vytváření hesel nebo obecně na webu se pokuste minimalizovat použití vašich osobních údajů. Například: nepoužívejte své jméno, adresu, telefonní číslo, datum narození atd.
  • Vždy pamatujte na následující: vše, co zveřejníte na internetu, tam bude navždy. To nemusí být vždy úplně pravda, ale tato úroveň opatrnosti pomáhá chránit vaše soukromí. Jakmile si tuto skutečnost uvědomíte, budete se svými soukromými údaji automaticky zacházet s větší péčí.
  • Ujistěte se, že vaše internetové připojení je zabezpečené a anonymizované, například pomocí prohlížeče Tor nebo VPN.
  • V prohlížeči použijte jeden nebo několik blokátorů reklam.
  • Používejte více nebo více doplňků prohlížeče, které blokují sledovače a soubory cookie.
  • Pravidelně vymažte mezipaměť a odstraňte historii prohlížení a soubory cookie.
  • Pokud je aktivně nepoužíváte, odhlaste se z webových stránek.

Přijetí těchto kroků je dobrým začátkem, pokud jde o ochranu vašeho soukromí a zabezpečení online. Mějte však na paměti, že velká data se shromažďují mnoha různými způsoby – nejen online. Stručně řečeno, ať jste kdekoli a cokoli děláte, měli byste být vždy ostražití a pokusit se chránit svá (osobní) data před velkými sběrateli dat.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me