Pagrindiniai duomenys ir privatumas: kokia yra privatumo rizika? | „VPNOverview“

Per pastaruosius kelis dešimtmečius pasaulis labai pasikeitė daugeliu aspektų, ypač kalbant apie IT. Žmonių, su kuriais galime bendrauti kasdien, skaičius nepaprastai išaugo, kaip ir turimos informacijos kiekis. Tačiau tas pats pasakytina ir apie informacijos, kurią didžiosios įmonės surenka apie mus, kiekį. Tokie terminai kaip dideli duomenys yra naudojami vis dažniau, laikui bėgant. Bet ką tai tiksliai reiškia? Kas yra dideli duomenys? Ar tai pavojinga? Kaip tai daro įtaką mūsų privatumui? Tai yra keletas klausimų, kuriuos aptarsime šiame straipsnyje.


Kas yra dideli duomenys?

Sąrašas su padidinamuoju stikluSąvoka „dideli duomenys“ apibūdina didžiulį kiekį (asmeninių) duomenų, kuriuos nuolat renka skirtingi subjektai. Pavyzdys galėtų būti visa informacija, kurią „Google“ renka apie savo vartotojų užklausas. Didžiųjų duomenų reiškinys yra palyginti nesenas įvykis, kuris prasidėjo todėl, kad (didelės) įmonės ir organizacijos, tokios kaip „Facebook“, „Google“ ir dauguma vyriausybių, pradėjo rinkti vis daugiau duomenų apie jos vartotojus, klientus ir piliečius nei anksčiau. Naujosios technologijos, suskaitmenintas pasaulis ir internetas nepaprastai padėjo šiam vystymuisi.

Didelių duomenų rinkiniai dažnai būna tokie dideli, kad neįmanoma jų išanalizuoti naudojant tradicinę duomenų analizę. Tačiau jei teisingai analizuojami stambūs duomenys, gali būti sudominti įdomūs modeliai ir išvados. Pavyzdžiui, dideli duomenys dažnai naudojami didelio masto rinkos tyrimams: kuriuos produktus dažniausiai perkate? Kokia reklama yra efektyviausia, kai norima pasiekti ir įtikinti klientus?

Kad duomenų rinkinys būtų laikomas dideliais duomenimis, jis paprastai turėtų atitikti šiuos tris kriterijus, dar žinomus kaip 3 v:

  • Tūris: Dideli duomenys yra ne kas kita, o mažas pavyzdys. Tai apima didelius duomenų rinkinius, gautus ilgai, nuolat stebint.
  • Greitis: Tai turi būti susiję su įspūdingu greičiu, kuriuo renkami dideli duomenys. Be to, dideli duomenys dažnai prieinami realiuoju laiku (nes jie renkami).
  • Įvairovė: Dideliuose duomenų rinkiniuose dažnai būna įvairių tipų informacijos. Didelių duomenų rinkinių duomenis būtų galima net sujungti, kad būtų užpildytos spragos ir duomenų rinkinys būtų dar išsamesnis.

Be šių 3 v, dideli duomenys turi dar keletą savybių. Pavyzdžiui, dideli duomenys yra puikūs norint mokytis mašinų. Tai reiškia, kad jis gali būti veiksmingai naudojamas mokant kompiuterių ir mašinų tam tikras užduotis. Be to, kaip jau trumpai kalbėjome, dideli duomenys gali būti naudojami aptikti modelius. Dažniausiai tai vyksta labai veiksmingai, naudojant kompiuterius, kurie dirba su duomenimis. Galiausiai dideli duomenys atspindi vartotojų skaitmeninius pirštų atspaudus. Tai reiškia, kad tai yra žmonių skaitmeninės ir internetinės veiklos šalutinis produktas ir gali būti naudojamas kuriant individualius asmeninius profilius.

Įvairių rūšių dideli duomenys

Yra įvairių būdų, kaip klasifikuoti didelius duomenis. Pirmasis dažniausiai naudojamas būdas išskiria didelius duomenis pagal tai, kokie duomenys yra renkami. Trys galimos kategorijos, naudojamos tokio tipo klasifikacijai, yra: struktūruoti dideli duomenys, nestruktūruoti dideli duomenys ir pusiau struktūruoti dideli duomenys..

  1. Struktūrizuotas: Kai dideli duomenys yra struktūrizuojami, juos galima išsaugoti ir pateikti organizuotai ir logiškai, todėl duomenys tampa lengviau prieinami ir lengviau suprantami. Pavyzdys galėtų būti įmonės sukurtas klientų adresų sąrašas. Šiame sąraše greičiausiai rasite klientų vardus, adresus ir galbūt kitą informaciją, pavyzdžiui, telefonų numerius, kurie aiškiai išdėstyti, pavyzdžiui, diagramoje ar lentelėje..
  2. Nestruktūruota: Nestruktūrizuoti dideli duomenys iš viso neorganizuojami. Jam trūksta logiško pateikimo, kuris būtų prasmingas paprastam žmogui. Nestruktūrizuotų didžiųjų duomenų struktūra, pavyzdžiui, nėra lentelės, nurodančios tam tikrą suderinamumą tarp skirtingų duomenų rinkinio elementų, struktūros. Taigi šio tipo duomenis yra gana sunku naršyti ir suprasti. Daugelis duomenų rinkinių iš pradžių yra nestruktūrizuoti dideli duomenys.
  3. Pusiau struktūruota: Pusiau struktūruoti stambūs duomenys, kaip jau galėjote atspėti, turi tiek struktūrizuotų, tiek nestruktūruotų didžiųjų duomenų ypatybes. Šio tipo duomenų pobūdis ir pateikimas nėra visiškai savavališki. Tačiau jis taip pat nėra pakankamai struktūruotas ir organizuotas, kad jį būtų galima naudoti prasmingai analizei. Pavyzdys galėtų būti internetinis puslapis, kuriame yra konkrečios meta duomenų žymės (papildoma informacija, kurios tiesiogiai nematote tekste), pavyzdžiui, nes joje yra tam tikrų raktinių žodžių. Šios žymės veiksmingai parodo konkrečius informacijos elementus, tokius kaip puslapio autorius arba momentas, kai jis buvo patalpintas internete. Pats tekstas iš esmės nestruktūrizuotas, tačiau jame esantys raktiniai žodžiai ir kiti meta duomenys padeda jį padaryti šiek tiek tinkamu analizės pagrindu..

Klasifikacija pagrįsta didelių duomenų šaltiniu

Kitas įprastas būdas atskirti įvairius stambiuosius duomenis yra žiūrėti į duomenų šaltinį. Kas ar kas sukūrė informaciją? Kaip ir ankstesnį modelį, šį klasifikavimo metodą taip pat sudaro 3 skirtingos kategorijos.

  1. Žmonės: Ši kategorija susijusi su dideliais žmonių sukurtais duomenimis. Pavyzdžiai galėtų būti knygos, paveikslėliai, vaizdo įrašai, taip pat informacija ir (asmeniniai) duomenys interneto svetainėse ir socialinėje žiniasklaidoje, tokiose kaip „Facebook“, „Twitter“, „Instagram“ ir kt..
  2. Proceso registracija: Į šią kategoriją įeina labiau tradicinis stambiųjų duomenų tipas, kurį renka ir analizuoja (didžiosios) įmonės tam, kad patobulintų tam tikrus verslo procesus.
  3. Mašinos: Šio tipo didelius duomenis lemia vis didėjantis jutiklių, įdėtų į mašinas, skaičius. Pavyzdys galėtų būti šilumos jutiklis, dažnai įmontuojamas į kompiuterio procesorius. Mašinų generuojami duomenys dažnai gali būti labai sudėtingi, tačiau bent jau tokio tipo dideli duomenys paprastai yra gerai struktūruoti ir išsamūs.

Kam gali būti naudojami dideli duomenys?

„Facebook“ logotipasViskas, kas buvo aptarta iki šiol, vis tiek gali atrodyti šiek tiek abstrakčiai. Padarykime dalykus šiek tiek konkretesnius ir aptarkime keletą realių didelių duomenų taikymo programų. Galų gale, yra daugybė būdų, kuriais įmonės ir organizacijos naudoja didelius duomenis. Vienas iš pirmųjų dalykų, kurie ateina į galvą, yra milžiniškas duomenų kiekis, kurį įmonės surenka apie mus. „Facebook“ renka duomenis apie visus savo vartotojus ir analizuoja tai, kad nuspręstų, ką jums parodyti jūsų laiko juostoje. Žinoma, tai daroma atsižvelgiant į jūsų asmeninius norus ir pomėgius. „Facebook“ tikisi, kad tai privers jus ilgesnį laiką likti jų tinklalapyje. Savo ruožtu „Amazon“ renka informaciją apie savo klientus ir jų perkamus produktus. Tokiu būdu „Amazon“ gali rekomenduoti produktus, kurie, jų manymu, jus sudomins, ir tokiu būdu padidinti jų pajamas.

Tačiau dideli duomenys taip pat naudojami būdais, kurie visiškai skiriasi nuo aukščiau aprašytų komercinių strategijų. Pavyzdžiui, viešojo transporto įmonės gali rinkti duomenis apie tai, kaip užimti tam tikri maršrutai. Vėliau jie galėtų išanalizuoti šiuos duomenis, kad galėtų nuspręsti, pavyzdžiui, kuriems maršrutams reikia papildomų autobusų ar traukinių. Kitas gerai žinomas efektyvaus didelių duomenų panaudojimo atvejis susijęs su tarptautinio pristatymo milžine UPS. UPS naudoja specialią programinę įrangą, kuri buvo sukurta atlikus didelių duomenų analizę. Ši programinė įranga padeda UPS vairuotojams išvengti posūkių kairėje pusėje, kurie yra brangesni, švaresni ir pavojingesni nei posūkiai dešinėje. Manoma, kad ši sistema jau sutaupė UPS milijonus galonų degalų – visa tai dėka didelių duomenų.

Kitas įdomus didelių duomenų rinkimo pavyzdys yra DNR testai ir tokios svetainės kaip „MyHeritage DNA“. Ši svetainė teigia, kad ji gali padėti „atskleisti savo etninę kilmę ir susirasti naujų giminaičių“ atliekant paprastą DNR testą. Nereikia nė sakyti, kad šis procesas apima daugybę duomenų rinkimo ir kryžminių nuorodų sudarymo, todėl jis tampa dar vienu svarbiu didelių duomenų rinkimo ir naudojimo žaidėju. „Tradiciniai“ fiziniai DNR tyrimai taip pat apima didžiulį kiekį didelių duomenų, nes šiuos testus atliekančios įmonės gaus ypač daug duomenų apie daugybę žmonių. Be abejo, svarbu žinoti apie galimą riziką, kylančią dėl šių didelių duomenų rinkimo procesų. Ši rizika bus išryškinta kitoje šio straipsnio dalyje.

Ar dideli duomenys yra pavojingi?

Kaip parodyta aukščiau, dideli duomenys daugeliu atvejų gali būti neįtikėtinai naudingi. Tai suteikia mums daugybę informacijos, kurią galime naudoti norėdami supaprastinti procesus ir padaryti įmones veiksmingesnes ir pelningesnes. Tačiau tai nereiškia, kad didelių duomenų rinkimas ir naudojimas yra visiškai nerizikingas. Yra penki svarbūs pavojai, kuriuos patiria dideli duomenys. Čia aptarsime visus penkis.

Piratai ir vagys

Viską, ką darome internete, yra neatsiejama rizika, kad gali būti pavogti mūsų asmeniniai duomenys ir informacija apie mūsų veiklą internete. Kiekvienas interneto vartotojas turi tai žinoti. Duomenų nutekėjimo ir vagysčių skaičius per pastaruosius kelerius metus drastiškai išaugo. Naujienose dažnai pasitaiko pasakojimų apie nusikaltėlius, pardavinėjančius duomenų rinkinius, kuriuose yra slaptažodžiai ir kita informacija apie tokias vietas, kaip, pavyzdžiui, internetas. Dažnai šie duomenų rinkiniai yra pavogti iš oficialių svetainių, įmonių ir organizacijų. Kuo didesni šie duomenų rinkiniai, tuo įdomiau vagims bandyti juos gauti. Jei jie susitvarkys šiuos duomenų rinkinius, jie gali sukelti daug problemų. Nereikia nė sakyti, kad tai taip pat gali smarkiai pakenkti jūsų privatumui.

Privatumas

Asmeninių duomenų rinkimo praktika tampa vis labiau paplitusi. Tačiau dabartiniai privatumo nuostatai negali neatsilikti nuo greitų technologijų pokyčių, kurie leidžia šią praktiką įgyvendinti. Tai palieka vietos pilkosioms sritims ir netikrumui, kurio neįmanoma išspręsti žiūrint į įstatymus. Svarbios kylančios privatumo problemos yra šios: Kokius duomenis leidžiama rinkti? Apie ką? Kas turėtų turėti prieigą prie šių duomenų?

Renkant didelius duomenų kiekius, didelė tikimybė, kad į tuos duomenų rinkinius bus įtraukta neskelbtini asmeniniai duomenys. Tai sudėtinga, net jei įsilaužėliai ir vagys nėra žaidžiami. Galų gale su slaptu privatumu susijusiais duomenimis galėjo piktnaudžiauti visi, turintys blogų ketinimų. Tai apima (kenkėjiškas) įmones ir organizacijas.

Prasta duomenų analizė

Daugelis kompanijų ir organizacijų renka didelius duomenis, nes gali juos naudoti įdomioms analizėms. Tai gali suteikti jiems svarbių naujų įžvalgų apie tai, ką jie tyrinėja (pavyzdžiui, pavyzdžiui, apie vartotojų įpročius). Savo ruožtu šios įžvalgos ir išvados gali virsti pokyčiais įmonėje, kurie lemia didesnes maržas ir didesnį pelną. Tačiau, kaip ir bet kuris kitas įprastas duomenų rinkinys, neteisinga didelių duomenų analizė gali sukelti rimtų pasekmių. Galų gale, netinkama analizė gali lengvai sukelti klaidingas išvadas. Tai gali paversti neveiksmingomis ar net priešingomis priemonėmis.

„Neteisingų“ duomenų rinkimas

Didieji duomenys tampa vis populiaresni, o organizacijos vis labiau nori rinkti įvairius duomenis. Tai reiškia, kad renkamas milžiniškas duomenų kiekis, neturint aiškios priežasties juos analizuoti. Kitaip tariant, ji sukuria didžiulę neapdorotos informacijos duomenų bazę, kuri buvo surinkta kiekvienam atvejui. Tikėtina, kad įmonės mano, jog surinkti visus tuos duomenis yra pakankamai lengva, todėl jie taip pat gali tai padaryti. Nereikia nė sakyti, kad tai nėra naudinga niekam. Tai netgi gali sukelti nereikšmingų ar „neteisingų“ duomenų rinkimą ir analizę. Jei šios analizės išvados būtų panaudotos valdyme, tai galėtų sukelti tas pačias neveiksmingas priemones, paminėtas ankstesnėje pastraipoje.

Didelių duomenų rinkimas ir išsaugojimas turint blogų ketinimų

Didelių duomenų rinkimą įmonės ir organizacijos bei vyriausybės naudoja vis dažniau, todėl jos gali sudaryti tikslius individualius žmonių profilius. Vartotojams ar piliečiams niekada nebūna pranešama apie tai, kurie jų asmens duomenys yra registruojami, jau nekalbant apie kodėl ir kaip. Nereikia nė sakyti, kad tai turi rimtų padarinių jų internetiniam privatumui. Viską, ką jie daro internete, galima išsaugoti ir peržiūrėti vėliau. Be to, analizuodami ir naudodami surinktus duomenis dideli duomenų rinkėjai gali lengvai paveikti ir manipuliuoti žmonių sprendimų priėmimu.

Dideli duomenys ir privatumas

Išmanusis telefonas su ausies nuotraukaKaip jau tikriausiai suprasite, dideli duomenys turi daug trūkumų ir rizikos. Nepaisant to, daugelis įmonių ir organizacijų vis dar renka duomenis didžiuliu mastu, daugiausia dėl to, kaip tai gali padėti joms augti ir tobulėti. Surinkti didelius duomenis yra lengviau nei bet kada anksčiau. Tai daro didžiulį poveikį mūsų privatumui. Jau trumpai aptarėme galimą kenksmingų šalių, renkančių blogus duomenis, privatumo pavojų. Kadangi mūsų privatumas yra taip glaudžiai susijęs su masiniu asmens duomenų rinkimu, norime šiame skyriuje aptarti įvairius privatumo klausimus, susijusius su dideliais duomenimis..

Didelio masto duomenų rinkimas

Daugelis kompanijų, įskaitant „Google“, „Facebook“ ir „Twitter“, yra labai priklausomos nuo reklamų, kad galėtų išsilaikyti ir užsidirbti. Kad šios reklamos būtų kuo efektyvesnės, šios įmonės sukuria išsamius profilius apie savo vartotojus, ypač atsižvelgiant į jų pomėgius ir pomėgius. Tai yra didelių duomenų forma. Vyriausybės ir slaptosios tarnybos taip pat priklauso nuo didelių duomenų. Jie naudoja šį didžiulį kiekį informacijos, kad galėtų sekti ir ištirti žmones, kurie, jų manymu, yra įtartini. Be abejo, tai taip pat reiškia, kad yra daug didelių duomenų, kad kibernetiniai nusikaltėliai galėtų atsidurti rankose, o gal net manipuliuoti ir piktnaudžiauti. Tai gali sukelti įvairių su privatumu ir tapatybe susijusių problemų. Tai, kas ateina į galvą, yra tapatybės vagystė.

Vis tik galimybės rinkti duomenų bazėse yra daug platesnės. Šiomis dienomis technologija tapo tokia pažangi ir „intelektuali“, kad gali sujungti duomenų rinkinius. Tai gali būti padaryta tokiu sumaniu ir meistrišku būdu, kad tikėtina, kad didžiosios korporacijos ir organizacijos žino daugiau apie jus nei jūs! Kas jūs esate, kur gyvenate, kokie yra jūsų pomėgiai, kas yra jūsų draugai: ši informacija nebebus privati. Nelabai jaudinanti mintis, galite pagalvoti. Laimei, yra keletas būdų, kaip apsisaugoti nuo didelio masto privatumo pažeidimo, kurį gali sukelti dideli duomenys.

Privatumo įstatymai

Slapukai ekranePrivatumo įstatymai ir kiti teisės aktai gali mus apsaugoti nuo privatumo pažeidimo, tačiau tik tam tikru mastu. Kad būtų sudėtingesni, privatumo įstatymai įvairiose šalyse ir regionuose dažnai skiriasi. Pavyzdžiui, Europoje galioja gana griežtas vartotojų privatumo įstatymas, vadinamas Bendruoju duomenų apsaugos reglamentu (GDPR). Šis įstatymas galioja visoms ES valstybėms narėms, nors kiekvienoje šalyje informacija gali skirtis. Daugelis tarptautinių kompanijų nusprendė visą savo verslą laikytis GDPR. Štai kodėl, pavyzdžiui, „Google“ dabar vartotojams leidžia prašyti ištrinti asmeninę informaciją. Tačiau JAV privatumo įstatymai įvairiose valstijose skiriasi ir neapsaugo vartotojų, kaip ir ES. Deja, tai galioja net griežčiausiam JAV privatumo įstatymui, Kalifornijos vartotojų privatumo įstatymui.

Trumpai tariant, nėra tokio dalyko kaip griežtas „visuotinis“ privatumo įstatymas, kuris būtų taikomas visiems dideliems duomenų kaupėjams ir apsaugotų visus vartotojus. Tai reiškia, kad mūsų privatumui ne tik kenkia dideli duomenų rinkėjai neteisėtais, bet ir net visiškai teisėtais būdais, nes tai gali atrodyti paradoksalu. Laimei, dėl informatorių, tokių kaip Edwardas Snowdenas ir „Chelsea Manning“, padarytų didelio masto privatumo pažeidimų labai padidėjo supratimas apie didelių duomenų riziką. Žinoma, tai tik pirmas žingsnis tobulinant galiojančius privatumo įstatymus.

Daugelis interneto vartotojų nenori laukti privatumo įstatymų patobulinimo – ir teisingai. Greičiau jie nori patys imtis veiksmų, kad padarytų viską, ką gali, kad apsaugotų savo privatumą. Ar norite taip pat netapti daugybės didelių duomenų rinkinių dalimi? Yra keli patarimai ir gudrybės, kurie padės jums pakeliui.

Kaip apsaugoti savo duomenis nuo didelių duomenų rinkinių

Dideli duomenų rinkiniai daro didelę įtaką jūsų privatumui ir saugumui. Šiuose duomenų rinkiniuose gali būti visų rūšių (asmeninės) informacijos, kuria gali piktnaudžiauti didžiosios įmonės ar net elektroniniai nusikaltėliai. Štai kodėl visada turėtumėte palikti kuo mažiau internetinių pėdsakų. Šie patarimai gali padėti tai padaryti:

  • Kurdami slaptažodžius ar apskritai internete, stenkitės kuo mažiau naudoti savo asmeninę informaciją. Pavyzdžiui: venkite naudoti savo vardą, adresą, telefono numerį, gimimo datą ir pan.
  • Visada atsiminkite šiuos dalykus: viskas, ką skelbiate internete, bus ten amžinai. Tai ne visada gali būti tiesa, tačiau toks atsargumo lygis padeda apsaugoti jūsų privatumą. Sužinoję apie šį faktą, privatūs duomenys bus tvarkomi atsargiai.
  • Įsitikinkite, kad jūsų interneto ryšys yra saugus ir anonimiškas, pavyzdžiui, naudodamiesi „Tor“ naršykle arba VPN.
  • Naršyklėje naudokite vieną ar kelis skelbimų blokatorius.
  • Naudokite naršyklės papildinius, kurie blokuoja stebėjimo priemones ir slapukus.
  • Reguliariai išvalykite talpyklą ir ištrinkite naršymo istoriją bei slapukus.
  • Atsisakykite svetainių, kai jomis aktyviai nesinaudojate.

Šių veiksmų atlikimas yra gera pradžia, kai reikia apsaugoti jūsų internetinį privatumą ir saugumą. Tačiau atminkite, kad dideli duomenys renkami įvairiais būdais – ne tik internetu. Trumpai tariant, kad ir kur bebūtumėte, visada turėtumėte būti budrūs ir stengtis apsaugoti savo (asmeninius) duomenis nuo didelių duomenų rinkėjų..

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me