Lieli dati un privātums: kādi ir privātuma riski? | VPNOverview

Pēdējās desmitgadēs pasaule daudzos aspektos ir ārkārtīgi mainījusies, it īpaši attiecībā uz IT. Cilvēku skaits, ar kuriem mēs varam sazināties ikdienā, ir ārkārtīgi pieaudzis, tāpat kā informācijas daudzums, kurai mēs varam piekļūt. Tomēr tas pats attiecas uz informācijas daudzumu, ko lielie uzņēmumi vāc par mums. Tādi termini kā lieli dati tiek izmantoti biežāk, jo laika gaitā. Bet ko tieši tas nozīmē? Kas ir lielie dati? Vai tas ir bīstami? Kā tas vispār ietekmē mūsu privātumu? Šie ir daži no jautājumiem, kurus apskatīsim šajā rakstā.


Kas ir lieli dati?

Saraksts ar palielināmo stikluTermins “lieli dati” raksturo milzīgu (personas) datu daudzumu, ko nepārtraukti vāc dažādi dalībnieki. Kā piemēru var minēt visu informāciju, ko Google apkopo par savu lietotāju meklēšanas vaicājumiem. Lielo datu parādība ir salīdzinoši nesena attīstība, kas sākās tāpēc, ka (lielie) uzņēmumi un organizācijas, piemēram, Facebook, Google un lielākā daļa valdību, nekā līdz šim sāka vākt arvien vairāk datu par tā lietotājiem, klientiem un pilsoņiem. Jaunās tehnoloģijas, digitalizētā pasaule un internets ir ārkārtīgi sekmējuši šo attīstību.

Lielo datu kolekcijas bieži ir tik plašas, ka nav iespējams tos analizēt, izmantojot tradicionālo datu analīzi. Tomēr, ja lielos datus analizē pareizi, var radīt interesantus modeļus un secinājumus. Piemēram, lielus datus bieži izmanto liela mēroga tirgus izpētei: kurus produktus visticamāk iegādājas? Kāda veida reklāma ir visefektīvākā, ja vēlaties sasniegt un pārliecināt klientus?

Lai datu kopu uzskatītu par lieliem datiem, tai parasti jāatbilst šādiem trim kritērijiem, kas pazīstami arī kā 3 v’s:

  • Apjoms: Lieli dati ir nekas cits kā mazs paraugs. Tas ietver plašu datu kolekciju, kas iegūta ilgstošas, nepārtrauktas novērošanas rezultātā.
  • Ātrums: Tas ir saistīts ar iespaidīgo ātrumu, ar kādu tiek vākti lieli dati. Turklāt lielie dati bieži ir pieejami reālajā laikā (jo tie tiek apkopoti).
  • Šķirne: Lielas datu kopas bieži satur daudz dažādu veidu informāciju. Datus lielās datu kopās varētu pat apvienot, lai aizpildītu visas nepilnības un padarītu datu kopu vēl pilnīgāku.

Papildus šiem 3 v, lielajiem datiem ir arī dažas citas īpašības. Piemēram, lieli dati ir lieliski mašīnu apguvei. Tas nozīmē, ka to var efektīvi izmantot, lai iemācītu datoriem un mašīnām noteiktus uzdevumus. Turklāt, kā mēs jau esam īsi apskatījuši, lielus datus var izmantot, lai noteiktu modeļus. Tas lielākoties notiek ļoti efektīvā veidā, izmantojot datorus, kas strādā ar datiem. Visbeidzot, lieli dati ir lietotāju digitālo pirkstu nospiedumu atspoguļojums. Tas nozīmē, ka tas ir cilvēku digitālo un tiešsaistes darbību blakusprodukts, un to var izmantot individuālu personisko profilu veidošanai.

Dažāda veida lieli dati

Ir dažādi veidi, kā klasificēt lielos datus. Pirmais veids, kas tiek izmantots visbiežāk, diferencē lielos datus, pamatojoties uz to, kāda veida dati tiek savākti. Trīs iespējamās kategorijas, kas tiek izmantotas šāda veida klasifikācijā, ir: strukturēti lielie dati, nestrukturētie lielie dati un daļēji strukturētie lielie dati.

  1. Strukturēts: Kad lielie dati ir strukturēti, tos var saglabāt un noformēt organizētā un loģiskā veidā, padarot datus pieejamākus un vieglāk saprotamus. Kā piemēru var minēt uzņēmuma izveidoto klientu adrešu sarakstu. Šajā sarakstā, visticamāk, tiks atrasti klientu vārdi, adreses un varbūt cita informācija, piemēram, tālruņu numuri, kas skaidri sakārtoti, piemēram, diagrammā vai tabulā.
  2. Nestrukturēts: Nestrukturēti lielie dati vispār netiek organizēti. Tam trūkst loģiskas izklāsta, kam būtu jēga vidusmēra cilvēkam. Nestrukturētiem lieliem datiem nav, piemēram, tabulas struktūras, kas apzīmē noteiktu saskaņotību starp dažādiem datu kopas elementiem. Tādēļ šāda veida datus ir diezgan grūti orientēties un saprast. Daudzas datu kopas sākotnēji tiek izmantotas kā nestrukturēti lieli dati.
  3. Daļēji strukturēts: Daļēji strukturētiem lieliem datiem, kā jūs jau varējāt uzminēt, ir gan strukturētu, gan nestrukturētu lielo datu īpašības. Šāda veida datu raksturs un attēlojums nav pilnīgi patvaļīgs. Tomēr arī tā nav pietiekami strukturēta un organizēta, lai to izmantotu arī jēgpilnai analīzei. Kā piemēru var minēt tīmekļa lapu, kurā ir īpaši meta datu tagi (papildu informācija, kas tekstā nav tieši redzama), piemēram, tāpēc, ka tajā ir noteikti atslēgvārdi. Šie tagi efektīvi parāda konkrētus informācijas bitus, piemēram, lapas autoru vai brīdi, kad tā tika ievietota tiešsaistē. Pats teksts būtībā nav strukturēts, taču tajā esošie atslēgvārdi un citi meta dati palīdz to padarīt par nedaudz piemērotu analīzes pamatam..

Klasifikācija balstīta uz lielo datu avotu

Vēl viens izplatīts veids, kā atšķirt dažādu veidu lielos datus, ir datu avots. Kas vai kas ir ģenerējis informāciju? Tāpat kā iepriekšējā versija, arī šī klasifikācijas metode sastāv no 3 dažādām kategorijām.

  1. Cilvēki: Šī kategorija attiecas uz lieliem datiem, ko izveidojuši cilvēki. Kā piemērus var minēt grāmatas, attēlus, video, kā arī informāciju un (personiskos) datus vietnēs un sociālajos plašsaziņas līdzekļos, piemēram, Facebook, Twitter, Instagram utt..
  2. Procesa reģistrācija: Šajā kategorijā ietilpst tradicionālāks lielo datu veids, kuru apkopo un analizē (lielie) uzņēmumi, lai uzlabotu noteiktus procesus biznesā.
  3. Mašīnas: Šāda veida lieli dati rodas no aizvien pieaugošā sensoru skaita, kas tiek ievietoti mašīnās. Piemērs varētu būt siltuma sensors, kas bieži tiek iebūvēts datoru procesoros. Mašīnu ģenerētie dati bieži var būt ļoti sarežģīti, taču vismaz šāda veida lielie dati parasti ir labi strukturēti un pilnīgi.

Kam var izmantot lielos datus?

Facebook logotipsViss līdz šim apspriestais joprojām varētu šķist nedaudz abstrakts. Padarīsim lietas mazliet konkrētākas un apspriedīsim dažus lielo datu reālās dzīves lietojumus. Galu galā ir daudz, daudz veidu, kā uzņēmumi un organizācijas izmanto lielos datus. Viena no pirmajām lietām, kas ienāk prātā, ir milzīgais datu apjoms, ko par mums apkopo uzņēmumi. Facebook apkopo datus par visiem saviem lietotājiem un analizē tos, lai izlemtu, ko jums parādīt jūsu laika skalā. Protams, tas tiek darīts, lai ņemtu vērā jūsu personīgās vēlmes un intereses. Facebook cer, ka tas ļaus jums palikt viņu vietnē ilgāku laika periodu. Savukārt Amazon apkopo informāciju par saviem klientiem un pirktiem produktiem. Tādā veidā Amazon var ieteikt produktus, kas, viņuprāt, jūs interesēs, un tādējādi palielināt viņu ienākumus.

Tomēr lielos datus izmanto arī pilnīgi atšķirīgos veidos nekā iepriekš aprakstītās tirdzniecības stratēģijas. Piemēram, sabiedriskā transporta uzņēmumi var apkopot datus par to, cik noslogoti ir daži maršruti. Pēc tam viņi varētu analizēt šos datus, lai izlemtu, piemēram, kādiem maršrutiem nepieciešami papildu autobusi vai vilcieni. Vēl viens labi zināms lielo datu efektīvas izmantošanas gadījums attiecas uz starptautiskā piegādes giganta UPS. UPS izmanto īpašu programmatūru, kas tika izstrādāta pēc lielu datu analīzes. Šī programmatūra palīdz UPS vadītājiem izvairīties no pagriezieniem pa kreiso pusi, kas ir dārgāki, izšķērdīgāki un bīstamāki nekā pagriezieni pa labo pusi. Domājams, ka šī sistēma jau ir ietaupījusi UPS miljoniem galonu degvielā, pateicoties lielajiem datiem.

Vēl viens interesants lielo datu apkopošanas piemērs ir DNS testi un vietnes, piemēram, MyHeritage DNA. Šī vietne apgalvo, ka tā var palīdzēt “atklāt jūsu etnisko izcelsmi un atrast jaunus radiniekus” ar vienkāršu DNS testu. Lieki piebilst, ka šis process ir saistīts ar daudz datu vākšanu un savstarpēju norāžu izdarīšanu, padarot to par vēl vienu nozīmīgu dalībnieku lielu datu apkopošanā un izmantošanā. “Tradicionālie” fiziskie DNS testi ietver arī milzīgu daudzumu lielu datu, jo uzņēmumi, kas veic šos testus, iegūs ārkārtīgi lielas datu kopas par daudziem, daudziem cilvēkiem. Protams, ir svarīgi apzināties iespējamos riskus, kas saistīti ar šiem lielo datu apkopošanas procesiem. Šie riski tiks uzsvērti nākamajā šī raksta daļā.

Vai lieli dati ir bīstami?

Kā parādīts iepriekš, lieli dati daudzos gadījumos var būt neticami noderīgi. Tas sniedz mums daudz informācijas, ko mēs varam izmantot, lai pilnveidotu procesus un padarītu uzņēmumus efektīvākus un rentablākus. Tomēr tas nenozīmē, ka lielo datu apkopošana un izmantošana ir pilnīgi bezriska. Ir pieci svarīgi riski, kas saistīti ar lieliem datiem. Mēs šeit apspriedīsim visus piecus.

Hakeri un zagļi

Tā kā viss, ko mēs darām tiešsaistē, pastāv raksturīgs risks, ka var tikt nozagti mūsu personas dati un informācija par mūsu darbībām internetā. Katram interneta lietotājam tas jāzina. Dažu noplūžu un zādzību skaits pēdējos gados ir krasi pieaudzis. Ziņās bieži ir stāsti par noziedzniekiem, kas pārdod datu kopas, kurās ir paroles un cita informācija par vietām, piemēram, tumšajā tīmeklī. Bieži vien šīs datu kopas tiek nozagtas no oficiālajām vietnēm, uzņēmumiem un organizācijām. Jo lielākas ir šīs datu kopas, jo interesantāk zagļiem ir mēģināt tos iegūt. Ja viņi ķersies pie šīm datu kopām, tie varētu radīt daudz problēmu. Lieki piebilst, ka tas varētu arī nopietni apdraudēt jūsu privātumu.

Privātums

Personas datu vākšanas prakse kļūst arvien izplatītāka. Tomēr pašreizējie privātuma noteikumi nevar sekot līdzi straujajai tehnoloģiju attīstībai, kas šo praksi padara iespējamu. Tas atstāj vietu pelēkajām zonām un neskaidrībām, kuras nevar atrisināt, aplūkojot likumu. Svarīgas bažas par privātumu ir šādas: kāda veida datus ir atļauts vākt? Par kuru? Kam vajadzētu būt piekļuvei šiem datiem?

Apkopojot lielu datu daudzumu, pastāv liela varbūtība, ka šajās datu kopās tiek iekļauta slepena personiskā informācija. Tas ir problemātiski pat tad, ja hakeri un zagļi netiek spēlēti. Galu galā konfidenciālus datus varēja ļaunprātīgi izmantot ikviens, kam ir slikti nodomi. Tas ietver (ļaunprātīgus) uzņēmumus un organizācijas.

Slikta datu analīze

Daudzi uzņēmumi un organizācijas vāc lielus datus, jo tos var izmantot interesantām analīzēm. Tas viņiem varētu dot svarīgu jaunu ieskatu par visu, ko viņi pēta (piemēram, piemēram, par patērētāju ieradumiem). Šīs atziņas un secinājumi savukārt varētu būt saistīti ar izmaiņām uzņēmumā, kas rada lielākas peļņas un lielāku peļņu. Tomēr, tāpat kā ar jebkuru citu parastu datu kopu, nepareiza lielo datu analīze var izraisīt nopietnas sekas. Galu galā nepareiza analīze var viegli novest pie nepareiziem secinājumiem. Tie savukārt var nozīmēt neefektīvus vai pat neproduktīvus pasākumus.

“Nepareizu” datu apkopošana

Liela apjoma dati kļūst arvien populārāki, un organizācijas arvien vairāk vēlas apkopot visa veida datus. Tas nozīmē, ka tiek savākts gigantisks datu apjoms, bez skaidra iemesla to analīzei. Citiem vārdiem sakot, tas rada milzīgu neapstrādātas informācijas datu bāzi, kas ir savākta tikai gadījumā. Iespējams, ka uzņēmumi domā, ka ir pietiekami vienkārši apkopot visus šos datus, tāpēc viņi to arī varētu darīt. Lieki piebilst, ka tas nav par labu neviena privātumam. Tas pat varētu izraisīt neatbilstošu vai “nepareizu” datu apkopošanu un analīzi. Ja šīs analīzes secinājumus izmantos pārvaldībā, tas varētu izraisīt tos pašus neefektīvos pasākumus, kas minēti iepriekšējā rindkopā.

Lielu datu apkopošana un saglabāšana ar sliktiem nodomiem

Lielu datu vākšanu arvien biežāk izmanto uzņēmumi, organizācijas un valdības, lai viņi varētu izveidot precīzus individuālus cilvēku profilus. Diez vai lietotājiem vai pilsoņiem tiek paziņots par to, kuri viņu personas dati tiek reģistrēti, nemaz nerunājot par to, kāpēc un kā. Lieki piebilst, ka tas nopietni ietekmē viņu privātumu tiešsaistē. Visu, ko viņi dara tiešsaistē, var saglabāt un apskatīt vēlāk. Turklāt lielie datu apkopotāji varētu viegli ietekmēt un manipulēt ar cilvēku lēmumu pieņemšanu, analizējot un izmantojot apkopotos datus.

Lieli dati un privātums

Viedtālrunis ar auss attēluKā jūs droši vien jau tagad sapratīsit, lielajiem datiem ir daudz trūkumu un risku. Neskatoties uz to, daudzi uzņēmumi un organizācijas joprojām vāc datus milzīgā mērogā, galvenokārt tāpēc, ka tas var palīdzēt viņiem augt un progresēt. Lielu datu apkopošana ir vienkāršāka nekā jebkad agrāk. Tam ir milzīgas sekas uz mūsu privātumu. Mēs jau īsi esam apsprieduši iespējamos draudus privātumam, ko ļaunprātīgas puses vāc sliktos datus. Tā kā mūsu privātums ir tik cieši saistīts ar masveida personas datu vākšanu, mēs vēlamies izmantot šo sadaļu, lai apspriestu dažādas privātuma problēmas, kas saistītas ar lielajiem datiem.

Liela mēroga datu vākšana

Daudzi uzņēmumi, tostarp Google, Facebook un Twitter, ir ļoti atkarīgi no reklāmām, lai sevi uzturētu un gūtu peļņu. Lai šīs reklāmas būtu pēc iespējas efektīvākas, šie uzņēmumi izveido detalizētus profilus saviem lietotājiem, īpaši ņemot vērā viņu vēlmes un intereses. Šī ir liela datu forma. Tāpat valdības un slepenie dienesti ir atkarīgi arī no lielajiem datiem. Viņi izmanto šo milzīgo informācijas daudzumu, lai izsekotu un izmeklētu cilvēkus, kurus viņi uzskata par aizdomīgiem. Protams, tas nozīmē arī to, ka kibernoziedzniekiem ir daudz lielu datu, lai viņi varētu nokļūt rokās un, iespējams, pat manipulēt un ļaunprātīgi izmantot. Tas var radīt visa veida ar privātumu un identitāti saistītas problēmas. Kas nāk prātā, ir identitātes zādzība.

Tomēr datu bāzēs kolekcijas sniegtās iespējas ir daudz plašākas. Mūsdienās tehnoloģija ir kļuvusi tik moderna un “gudra”, ka tā var apvienot datu kopas. To var izdarīt tik gudri un veikli, ka lielās korporācijas un organizācijas, iespējams, zina par jums vairāk nekā jūs! Kas jūs esat, kur dzīvojat, kādi ir jūsu hobiji, kas ir jūsu draugi: šī informācija vairs nebūs privāta. Ne pārāk mierinoša doma, jūs varētu domāt. Par laimi, ir daži veidi, kā pasargāt sevi no liela mēroga privātuma pārkāpumiem, ko var izraisīt lieli dati.

Likumi par privātumu

Sīkdatnes uz ekrānaPrivātuma likumi un noteikumi var mūs aizsargāt pret privātuma pārkāpumiem, bet tikai līdz zināmai robežai. Lai padarītu jautājumus sarežģītākus, privātuma likumi dažādās valstīs un reģionos bieži ir ļoti atšķirīgi. Piemēram, Eiropā ir spēkā samērā stingri patērētāju privātuma likumi, ko sauc par Vispārīgo datu aizsardzības regulu (GDPR). Šis likums attiecas uz visām ES dalībvalstīm, kaut arī sīkāka informācija dažādās valstīs var atšķirties. Daudzi starptautiski uzņēmumi ir nolēmuši visu savu biznesu ievērot GDPR. Tāpēc, piemēram, Google tagad lietotājiem ļauj pieprasīt personiskās informācijas dzēšanu. Tomēr privātuma likumi Amerikas Savienotajās Valstīs ir atšķirīgi un neaizsargā patērētājus, kā arī ES. Diemžēl tas attiecas pat uz visstingrāko ASV privātuma likumu, Kalifornijas patērētāju privātuma likumu.

Īsāk sakot, nav tādas lietas kā spēcīgs “globāls” privātuma likums, kas attiecas uz visiem lielajiem datu apkopotājiem un aizsargā visus lietotājus. Tas nozīmē, ka mūsu privātumu ne tikai nelikumīgi, bet arī pilnīgi likumīgā veidā kaitē lieliem datu vācējiem, bet arī paradoksāli, jo tas var šķist. Par laimi, liela mēroga privātuma pārkāpumi, kurus atklājuši tādi trauksmes cēlāji kā Edvards Snowdens un Chelsea Manning, ir ievērojami palielinājuši izpratni par lielo datu riskiem. Protams, tas ir tikai pirmais solis pašreizējo privātuma likumu uzlabošanā.

Daudzi interneta lietotāji nevēlas gaidīt privātuma likumu uzlabojumus – un tas ir pamatoti. Viņi drīzāk vēlas rīkoties paši, darot visu iespējamo, lai aizsargātu viņu privātumu. Vai vēlaties izvairīties no kļūšanas arī par neskaitāmām lielajām datu kopām? Ir vairāki padomi un triki, kas jums palīdzēs.

Kā neļaut jūsu datus saglabāt lielās datu kopās

Lielas datu kopas nopietni ietekmē jūsu privātumu un drošību. Šajās datu kopās varētu būt visa veida (personiskā) informācija, kuru var ļaunprātīgi izmantot lielie uzņēmumi vai pat kibernoziedznieki. Tāpēc vienmēr pārliecinieties, ka atstājat pēc iespējas mazāk tiešsaistes izsekošanas. Šie padomi var jums palīdzēt to paveikt:

  • Mēģiniet pēc iespējas mazāk izmantot savu personīgo informāciju, veidojot paroles vai parasti tīklā. Piemēram: nelietojiet savu vārdu, adresi, tālruņa numuru, dzimšanas datumu utt.
  • Vienmēr atcerieties sekojošo: viss, ko jūs publicējat internetā, būs pieejams mūžīgi. Tas ne vienmēr var būt taisnība, taču šāda piesardzības pakāpe palīdz aizsargāt jūsu privātumu. Tiklīdz jūs uzzināsit par šo faktu, jūs automātiski izturēsities ar saviem privātajiem datiem.
  • Pārliecinieties, vai interneta savienojums ir drošs un anonīms, piemēram, izmantojot Tor-pārlūku vai VPN.
  • Izmantojiet vienu vai vairākus reklāmu bloķētājus savā pārlūkprogrammā.
  • Izmantojiet vairākos pārlūka spraudņos, kas bloķē izsekotājus un sīkfailus.
  • Regulāri notīriet kešatmiņu un izdzēsiet pārlūkošanas vēsturi un sīkfailus.
  • Atteikties no vietnēm, kad jūs tās aktīvi neizmantojat.

Šo darbību veikšana ir labs sākums, lai aizsargātu jūsu tiešsaistes privātumu un drošību. Tomēr ņemiet vērā, ka lieli dati tiek vākti dažādos veidos – ne tikai tiešsaistē. Īsāk sakot, lai kur jūs atrastos un neatkarīgi no tā, ko darāt, jums vienmēr jābūt modram un jācenšas pasargāt savus (personiskos) datus no lielajiem datu apkopotājiem..

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me