Big data & privacy: Hverjar eru persónuverndaráhætturnar? | VPNOverview

Síðustu áratugi hefur heimurinn breyst gríðarlega að mörgu leyti, sérstaklega þegar kemur að upplýsingatækni. Fjöldi fólks sem við erum fær um að eiga samskipti við daglega hefur aukist gríðarlega, rétt eins og upplýsingamagnið sem við höfum aðgang að. Það sama á við um magn upplýsinga sem stór fyrirtæki safna um okkur. Hugtök eins og stór gögn eru notuð allt oftar eftir því sem tíminn líður. En hvað þýðir þetta nákvæmlega? Hvað eru stór gögn? Er það hættulegt? Hvaða áhrif hefur það á friðhelgi okkar, ef yfirleitt? Þetta eru nokkrar af þeim spurningum sem við munum fjalla um í þessari grein.


Hvað eru stór gögn?

Listi með stækkunarglerHugtakið „stór gögn“ lýsir gríðarlegu magni (persónulegra) gagna sem stöðugt er safnað af mismunandi aðilum. Dæmi um það væri allar upplýsingar sem Google safnar um leitarfyrirspurnir notenda sinna. Fyrirbæri stórgagna er tiltölulega nýleg þróun sem hófst vegna þess að (stór) fyrirtæki og stofnanir, svo sem Facebook, Google og flestar ríkisstjórnir, fóru að safna sífellt fleiri gögnum um notendur sína, viðskiptavini og borgara en áður. Ný tækni, stafræn heimur og internetið hafa hjálpað þessari þróun gríðarlega.

Söfn stórra gagna eru oft svo mikil að ómögulegt er að greina þau með hefðbundinni gagnagreiningu. Hins vegar, ef maður greinir stór gögn á réttan hátt, er hægt að framkalla áhugavert mynstur og ályktanir. Til dæmis eru stór gögn oft notuð við markaðsrannsóknir í stórum stíl: hvaða vörur eru líklegastar til að kaupa? Hvers konar auglýsingar eru áhrifaríkastar þegar þú vilt ná til viðskiptavina og sannfæra hann?

Til þess að gagnapakkinn geti talist stór gögn, ætti það venjulega að uppfylla eftirfarandi þrjú skilyrði, einnig þekkt sem 3 v:

 • Bindi: Stór gögn eru allt annað en lítið sýnishorn. Það felur í sér mikla söfnun gagna, sem stafar af löngum, stöðugri athugun.
 • Hraði: Þetta hefur að gera með þeim glæsilegu hraða sem stórum gögnum er safnað. Ennfremur eru stór gögn oft aðgengileg í rauntíma (þegar þeim er safnað saman).
 • Fjölbreytni: Stór gagnapakkar innihalda oft margar mismunandi gerðir af upplýsingum. Jafnvel mætti ​​sameina gögn innan stóru gagnasettanna til að fylla út öll eyður og gera gagnapakkann enn fullkomnari.

Burtséð frá þessum 3 vídeóum hafa stór gögn nokkur önnur einkenni. Til dæmis eru stór gögn frábær til að læra vél. Þetta þýðir að það er hægt að nota það á áhrifaríkan hátt til að kenna tölvum og vélum ákveðin verkefni. Þar að auki, eins og við höfum þegar verið stutt í, er hægt að nota stór gögn til að greina munstur. Þetta gerist aðallega á mjög áhrifaríkan hátt með tölvum sem vinna að gögnunum. Að lokum eru stór gögn endurspeglun á stafrænum fingraförum notenda. Þetta þýðir að það er aukaafurð af stafrænum og netaðgerðum fólks og hægt að nota til að byggja upp einstök persónuleg snið.

Mismunandi tegundir stórra gagna

Það eru mismunandi leiðir til að flokka stór gögn. Fyrsta leiðin, sem er notuð oftast, aðgreinir stór gögn út frá hvers konar gögnum sem er verið að safna. Þrír mögulegir flokkar sem notaðir eru við þessa tegund flokkunar eru: skipulögð stór gögn, ómótað stór gögn og hálfskipulögð stór gögn.

 1. Skipulögð: Þegar stór gögn eru uppbyggð er hægt að vista þau og setja þau fram á skipulagðan og rökréttan hátt, svo að gögnin séu aðgengilegri og auðveldari að skilja. Dæmi um það væri listi yfir heimilisföng viðskiptavina sem stofnuð voru af fyrirtæki. Á þessum lista má líklega finna nöfn viðskiptavina, heimilisföng og kannski aðrar upplýsingar, svo sem símanúmer, allt uppbyggt á td töflu eða töflu.
 2. Ómótað: Ómótað stór gögn eru alls ekki skipulögð. Það vantar rökrétta framsetningu sem væri skynsamleg fyrir meðalmennsku. Ómótað stór gögn eru ekki með uppbyggingu td töflu sem gefur til kynna ákveðna samræmi milli mismunandi þátta gagnasafnsins. Þess vegna er þessi tegund gagna mjög erfitt að sigla og skilja. Margir gagnapakkar byrja upphaflega sem ómótaðir stór gögn.
 3. Hálfbundið: Semi-skipulögð stór gögn, eins og þú gætir hafa giskað, hafa einkenni bæði skipulögð og ómótað stór gögn. Eðli og framsetning þessarar tegundar gagna eru ekki alveg handahófskennd. Samt er það ekki skipulagt og skipulagt nóg til að vera notað til þýðingarmikils greiningar. Dæmi um það væri vefsíða sem inniheldur sérstök metagagnamerki (auka upplýsingar sem eru ekki beint sýnilegar í textanum), til dæmis vegna þess að hún inniheldur ákveðin leitarorð. Þessi merki sýna í raun ákveðna bita af upplýsingum, svo sem höfundi síðunnar eða augnablikinu þegar hún var sett á netinu. Textinn sjálfur er í meginatriðum ómótaður, en lykilorð og önnur metagögn sem hann inniheldur er til þess að gera það að nokkuð viðeigandi grunni til greiningar.

Flokkun byggð á uppruna stóru gagna

Önnur algeng leið til að greina á milli mismunandi tegundir stórra gagna er með því að skoða upprunann. Hver eða hvað hefur skilað upplýsingunum? Eins og fyrri hugsunin samanstendur þessi flokkunaraðferð einnig af 3 mismunandi flokkum.

 1. Fólk: Þessi flokkur varðar stór gögn sem eru búin til af fólki. Dæmi um það væru bækur, myndir, myndbönd sem og upplýsingar og (persónuleg) gögn á vefsíðum og samfélagsmiðlum, svo sem Facebook, Twitter, Instagram og svo framvegis.
 2. Ferlið skráning: Þessi flokkur inniheldur hefðbundnari tegund stórra gagna, sem (stórum) fyrirtækjum er safnað og greint til að bæta ákveðna ferla í fyrirtæki.
 3. Vélar: Þessi tegund af stórum gögnum kemur frá sívaxandi fjölda skynjara sem eru settir í vélar. Dæmi um það væri hitaskynjarinn sem er oft innbyggður í tölvuvinnsluaðila. Gögnin sem eru búin til af vélum geta oft verið mjög flókin, en að minnsta kosti er þessi tegund af stórum gögnum yfirleitt vel uppbyggð og heill.

Við hverju er hægt að nota stór gögn?

Facebook merkiAllt sem rætt hefur verið hingað til gæti samt hljómað nokkuð abstrakt. Við skulum gera hlutina aðeins meira áþreifanleg og ræða nokkur raunveruleg forrit stóru gagna. Þegar öllu er á botninn hvolft eru margar og margar leiðir sem fyrirtæki og stofnanir nota stór gögn. Eitt af því fyrsta sem kemur upp í hugann er gríðarlegt magn gagna sem fyrirtæki safna um okkur. Facebook safnar gögnum um alla notendur sína og greinir þetta til að ákveða hvað eigi að sýna þér á tímalínunni þinni. Auðvitað er þetta gert til að koma til móts við persónulegar óskir þínar og áhugamál. Facebook vonar að þetta fái þig til að vera áfram á vefsíðu sinni í lengri tíma. Aftur á móti safnar Amazon upplýsingum um viðskiptavini sína og vörurnar sem þeir kaupa. Þannig getur Amazon mælt með vörum sem þeir telja að þú hafir áhuga á og aukið tekjur þeirra með þessum hætti.

Samt sem áður eru stór gögn notuð á annan hátt en þær viðskiptaáætlanir sem lýst er hér að ofan. Sem dæmi má nefna að almenningssamgöngufyrirtæki geta aflað gagna um hversu uppteknar leiðir eru. Síðan gætu þeir greint þessi gögn til að ákveða til dæmis hvaða leiðir þurfa rútur eða lestir til viðbótar. Annað vel þekkt tilfelli um árangursríka notkun stórra gagna varðar alþjóðlega afhendisrisann UPS. UPS notar sérstakan hugbúnað sem var þróaður eftir stórgagnagreiningu. Þessi hugbúnaður hjálpar ökumönnum UPS að forðast vinstri beygju, sem eru dýrari, eyðslusamari og hættulegri en hægri beygjur. Talið er að þetta kerfi hafi þegar sparað UPS milljónir lítra af eldsneyti, allt þökk sé stórum gögnum.

Annað áhugavert dæmi um stóra gagnaöflun eru DNA próf og vefsíður eins og MyHeritage DNA. Þessi vefsíða fullyrðir að það geti hjálpað þér að „afhjúpa þjóðernisuppruna þína og finna nýja ættingja“ með einföldu DNA-prófi. Óþarfur að segja, þetta ferli felur í sér mikla gagnaöflun og víxlvísanir, sem gerir það að aðaleikara að stórgagnaöflun og notkun. „Hefðbundin“, eðlisfræðileg DNA-próf ​​felur einnig í sér mikið magn af stórum gögnum þar sem fyrirtæki sem framkvæma þessar prófanir munu fá ákaflega stór gögn um marga, marga. Auðvitað er mikilvægt að vera meðvitaður um hugsanlega áhættu sem fylgir þessum stóru gagnaöflunarferlum. Þessar áhættur verða dregnar fram í næsta hluta þessarar greinar.

Er stór gögn hættuleg?

Eins og sýnt er hér að ofan geta stór gögn verið ótrúlega gagnleg í mörgum tilvikum. Það veitir okkur fjöldann allan af upplýsingum sem við getum notað til að hagræða ferlum og gera fyrirtæki skilvirkari og arðbærari. En það þýðir ekki að safna og nota stór gögn er fullkomlega áhættulaust. Það eru fimm mikilvægar áhættur sem fylgja stórum gögnum. Við munum ræða öll fimm hérna.

Tölvusnápur og þjófar

Með öllu sem við gerum á netinu er felst hætta í því að persónulegum gögnum okkar og upplýsingum um internetstarfsemi okkar gæti verið stolið. Sérhver internetnotandi verður að vera meðvitaður um þetta. Gagn leka og þjófnaði hefur aukist verulega á undanförnum árum. Það eru oft sögur í fréttinni um glæpamenn sem selja gagnapakka sem innihalda lykilorð og aðrar upplýsingar um staði eins og myrka vefinn. Oft er þessum gagnasöfnum stolið af opinberum vefsíðum, fyrirtækjum og stofnunum. Því stærri sem þessi gagnasett eru, því áhugaverðara verður það fyrir þjófa að reyna að fá þau. Ef þeir komast í þessi gagnagrunna gætu þau valdið miklum vandræðum. Óþarfur að segja, þetta gæti líka haft mjög í bága við friðhelgi þína.

Persónuvernd

Að venja er að safna persónulegum gögnum verður stöðugt útbreiddari. Núverandi reglugerðir um friðhelgi einkalífs geta ekki fylgst með hraðri þróun tækni sem gerir þessa framkvæmd mögulega. Þetta skilur eftir pláss fyrir grá svæði og óvissu sem ekki er hægt að leysa með því að skoða lögin. Mikilvægar áhyggjur af persónuvernd sem koma upp eru meðal annars: Hvers konar gögn er heimilt að safna? Um hvern? Hver ætti að hafa aðgang að þessum gögnum?

Þegar miklu magni af gögnum er safnað eru líkurnar á að viðkvæmar persónulegar upplýsingar séu með í þessum gagnapökkum miklar. Þetta er vandasamt, jafnvel þegar tölvusnápur og þjófar eru ekki að spila. Þegar öllu er á botninn hvolft gætu misnotuð gögn misnotuð af neinum með slæmar fyrirætlanir. Þetta felur í sér (illgjarn) fyrirtæki og stofnanir.

Léleg gagnagreining

Mörg fyrirtæki og stofnanir safna stórum gögnum vegna þess að þau geta notað þau fyrir áhugaverðar greiningar. Þetta gæti veitt þeim mikilvægar nýjar innsýn í hvað sem þeir eru að rannsaka (eins og til dæmis neysluvenjur). Aftur á móti gæti þessi innsýn og ályktanir þýtt breytingar innan fyrirtækisins sem hafa í för með sér meiri framlegð og meiri hagnað. Hins vegar, rétt eins og með öll önnur venjuleg gagnasafn, getur röng greining á stórum gögnum haft alvarlegar afleiðingar. Þegar öllu er á botninn hvolft getur óviðeigandi greining auðveldlega leitt til rangra ályktana. Þetta getur síðan þýtt árangurslausar eða jafnvel mótvægisaðgerðir sem gripið er til.

Að safna „röngum“ gögnum

Stór gögn verða sífellt vinsælli og stofnanir eru sífellt tilbúnari til að safna alls kyns gögnum. Þetta þýðir að gígantískum gögnum er safnað án þess að það sé skýr ástæða til að greina þau. Með öðrum orðum, það býr til gríðarstóran gagnagrunn með hráum upplýsingum sem hefur verið safnað bara fyrir tilfelli. Fyrirtæki telja líklegt að það sé nógu auðvelt að safna öllum þessum gögnum, svo þau gætu eins gert það. Óþarfur að segja að þetta er ekki gott fyrir friðhelgi einkalífs neins. Það gæti jafnvel leitt til þess að óviðeigandi eða „röng“ gögnum hafi verið safnað saman og verið greind. Ef ályktanir sem dregnar eru af þessari greiningu eru notaðar við stjórnun gæti það leitt til sömu árangurslausu ráðstafana og getið er í fyrri málsgrein.

Að safna og vista stór gögn með slæmum ásetningi

Söfnun stóru gagna er notuð æ oftar af fyrirtækjum, stofnunum og stjórnvöldum svo þau geti búið til nákvæmar einstök snið á fólk. Notendum eða borgurum er varla tilkynnt um hver persónuleg gögn þeirra eru skráð, hvað þá hvers vegna og hvernig. Óþarfur að segja að þetta hefur alvarlegar afleiðingar fyrir einkalíf þeirra á netinu. Allt sem þeir gera á netinu er hægt að vista og skoða síðar. Þar að auki gætu stór gagnasafnarar auðveldlega haft áhrif á og meðhöndlað ákvarðanatöku fólks með því að greina og nota safnað gögnin.

Stór gögn og næði

Snjallsími með mynd af eyraEins og þú munt sennilega skilja núna, þá koma stór gögn með mörgum göllum og áhættu. Engu að síður, mörg fyrirtæki og stofnanir safna enn gögnum í miklum mæli, aðallega vegna þess hvernig það getur hjálpað þeim að vaxa og þróast. Að safna stórum gögnum er auðveldara en nokkru sinni fyrr. Þetta hefur gríðarlegar afleiðingar fyrir friðhelgi okkar. Við höfum þegar fjallað í stuttu máli um hugsanlegar friðhelgi einkalífsins vegna þess að illgjarn aðilar safna slæmum gögnum. Þar sem friðhelgi einkalífs okkar er svo náið bundið við fjöldasöfnun persónulegra gagna, viljum við nota þennan kafla til að ræða mismunandi einkamál varðandi stór gögn.

Gagnasöfnun í stórum stíl

Fullt af fyrirtækjum, þar á meðal Google, Facebook og Twitter, eru mjög háð auglýsingum til að halda uppi sjálfum sér og græða. Til að gera þessar auglýsingar eins árangursríkar og mögulegt er, gera þessi fyrirtæki nákvæmar upplýsingar um notendur sína, sérstaklega með hliðsjón af áhuga sínum og áhugamálum. Þetta er mynd af stórum gögnum. Sömuleiðis eru stjórnvöld og leyniþjónusta einnig háð stórum gögnum. Þeir nota þessa miklu upplýsingar til að rekja og rannsaka fólk sem þeir telja tortryggilegt. Auðvitað þýðir þetta líka að það eru mikið af stórgögnum fyrir netbrotamenn að ná í sínar hendur og jafnvel vinna með og misnota. Þetta getur skapað alls kyns einkalíf og persónuleg vandamál. Það sem kemur upp í hugann er persónuþjófnaður.

Ennþá eru möguleikarnir sem fylgja safninu í gagnagrunnum miklu víðtækari en þetta. Þessa dagana er tæknin orðin svo háþróuð og „snjöll“ að hún getur sameinað gagnasöfn. Þetta er hægt að gera á svo snjallan og slægur hátt, að stór fyrirtæki og stofnanir vita líklega meira um þig en þú! Hver þú ert, hvar þú býrð, hver áhugamál þín eru, hverjir vinir þínir eru: Engar af þessum upplýsingum verða lengur persónulegar. Þú gætir ekki haft mjög huggun. Sem betur fer eru nokkrar leiðir til að verja þig fyrir stórfelldum brotum á persónuvernd sem stór gögn geta valdið.

Lög um friðhelgi einkalífs

Fótspor á skjánumPersónuverndarlög og reglugerðir geta verndað okkur gegn broti á persónuvernd, en aðeins upp að vissu marki. Til að gera málin flóknari eru persónuverndarlög oft mjög mismunandi milli landa og svæða. Til dæmis eru í Evrópu tiltölulega ströng lög um neytendavernd sem kallast General Data Protection reglugerðin (GDPR). Þessi lög eiga við um öll aðildarríki ESB, þó að upplýsingarnar gætu verið mismunandi eftir löndum. Mörg alþjóðleg fyrirtæki hafa ákveðið að fylgja öllum viðskiptum sínum við GDPR. Þess vegna leyfir Google til dæmis notendum að biðja um að eyða persónulegum upplýsingum. Persónuverndarlög í Bandaríkjunum eru þó frábrugðin ríki til ríkis og vernda ekki neytendur jafnt sem ESB. Því miður á þetta jafnvel við um hörðustu persónuverndarlög í Bandaríkjunum, lög um neytendavernd í Kaliforníu.

Í stuttu máli, það er ekkert sem heitir sterk „alþjóðleg“ persónuverndarlög sem eiga við um alla stóru gagnaöflunina og vernda alla notendur. Þetta þýðir að friðhelgi okkar er ekki bara skaðað af stórum gagnaöflum á ólöglegum hætti, heldur jafnvel á fullkomlega löglega vegu, eins þversagnakennt og þetta kann að hljóma. Sem betur fer hafa stórfelld brot á friðhelgi einkalífsins, sem flautublásarar eins og Edward Snowden og Chelsea Manning hafa orðið vör við, aukin meðvitund um áhættuna af stórum gögnum. Auðvitað er þetta aðeins fyrsta skrefið í að bæta núverandi persónuverndarlög.

Margir netnotendur eru ekki tilbúnir til að bíða eftir endurbótum á persónuverndarlögum – og það með réttu. Frekar vilja þeir grípa til aðgerða sjálfir með því að gera hvað sem þeir geta til að vernda friðhelgi einkalífsins. Viltu forðast að verða hluti af óteljandi stórum gagnasettum líka? Það eru nokkur ráð og brellur til að hjálpa þér á leiðinni.

Hvernig á að forðast að gögnin þín séu vistuð í stórum gagnasettum

Stór gagnasett hafa alvarleg áhrif á friðhelgi þína og öryggi. Þessi gagnapakkar gætu innihaldið alls kyns (persónulegar) upplýsingar, sem stór fyrirtæki eða jafnvel netglæpamenn gætu misnotað. Þess vegna ættir þú alltaf að gæta þess að skilja eftir eins lítið af netsporum og mögulegt er. Eftirfarandi ráð geta hjálpað þér að ná þessu:

 • Reyndu að lágmarka notkun persónuupplýsinga þinna þegar þú býrð til lykilorð eða almennt á vefnum. Til dæmis: forðastu að nota nafn þitt, heimilisfang, símanúmer, fæðingardag og svo framvegis.
 • Mundu alltaf eftir eftirfarandi: allt sem þú birtir á internetinu, verður til staðar að eilífu. Þetta gæti ekki alltaf verið alveg satt, en þetta varfærnisstig hjálpar til við að vernda friðhelgi þína. Þú munt sjálfkrafa meðhöndla einkagögn þín með meiri umhyggju þegar þú ert meðvitaður um þessa staðreynd.
 • Gakktu úr skugga um að internettengingin þín sé örugg og nafnlaus, til dæmis með því að nota Tor-vafrann eða VPN til dæmis.
 • Notaðu einn eða fleiri auglýsingablokka í vafranum þínum.
 • Notaðu í eða fleiri viðbætur í vafranum sem hindra rekja spor einhvers og smákökur.
 • Hreinsaðu skyndiminnið reglulega og eytt vafraferlinum og fótsporum.
 • Skráðu þig út af vefsíðum þegar þú ert ekki að nota þær virkar.

Að stíga þessi skref er góð byrjun þegar kemur að því að vernda friðhelgi þína og öryggi á netinu. Hafðu samt í huga að stórum gögnum er safnað á marga mismunandi vegu – ekki bara á netinu. Í stuttu máli, hvar sem þú ert og hvað sem þú ert að gera, ættir þú alltaf að vera vakandi og reyna að vernda (persónuleg) gögn þín frá stórum gagnaöflum.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
  Like this post? Please share to your friends:
  Adblock
  detector
  map