Suuret tiedot ja yksityisyys: Mitkä ovat yksityisyyden riskit? | VPNOverview

Viime vuosikymmeninä maailma on muuttunut valtavasti monessa suhteessa, etenkin kun kyse on tietotekniikasta. Ihmisten lukumäärä, joiden kanssa voimme kommunikoida päivittäin, on kasvanut valtavasti, samoin kuin käytettävissämme olevan tiedon määrä. Sama koskee kuitenkin sitä määrää tietoa, jota suuret yritykset keräävät meistä. Termejä kuten iso data käytetään yhä useammin ajan myötä. Mutta mitä tämä tarkoittaa tarkalleen? Mikä on suuria tietoja? Onko se vaarallista? Kuinka se vaikuttaa yksityisyyteemme, jos ollenkaan? Nämä ovat joitain kysymyksistä, joita käsittelemme tässä artikkelissa.


Mikä on iso data?

Lista suurennuslasillaTermi ”big data” kuvaa valtavia määriä (henkilökohtaisia) tietoja, joita eri toimijat keräävät jatkuvasti. Esimerkki olisi kaikki tiedot, joita Google kerää käyttäjiensä hakukyselyistä. Suurdatan ilmiö on suhteellisen uusi kehitys, joka alkoi, koska (suuret) yritykset ja organisaatiot, kuten Facebook, Google ja useimmat hallitukset, alkoivat kerätä entistä enemmän tietoja käyttäjistään, asiakkaistaan ​​ja kansalaisistaan. Uudet tekniikat, digitalisoitu maailma ja Internet ovat auttaneet tätä kehitystä valtavasti.

Suurtietojen kokoelmat ovat usein niin laajoja, että on mahdotonta analysoida niitä perinteisen tietoanalyysin avulla. Kuitenkin, jos iso data analysoidaan oikealla tavalla, voidaan saada aikaan mielenkiintoisia malleja ja johtopäätöksiä. Esimerkiksi suuria tietoja käytetään usein laajamittaiseen markkinatutkimukseen: mitkä tuotteet todennäköisesti ostetaan? Millainen mainonta on tehokkainta, kun haluat tavoittaa ja vakuuttaa asiakkaita?

Jotta tietojoukkoa voidaan pitää suurena datana, sen on yleensä täytettävä seuraavat kolme kriteeriä, joka tunnetaan myös nimellä 3 v:

 • Volume: Big data on kaikkea muuta kuin pieni otos. Siihen sisältyy laaja tietokokoelma, joka syntyy pitkästä, jatkuvasta tarkkailusta.
 • Nopeus: Tämä liittyy vaikuttavaan nopeuteen, jolla iso data kerätään. Lisäksi suuriin tietoihin pääsee usein reaaliajassa (koska niitä kerätään).
 • Variety: Suuret aineistot sisältävät usein monen tyyppistä tietoa. Suurten tietojoukkojen tiedot voitaisiin jopa yhdistää aukkojen täyttämiseksi ja tehdä tietojoukosta entistä täydellisempi.

Näiden 3 v: n lisäksi suurilla tiedoilla on joitain muita ominaisuuksia. Esimerkiksi iso tieto on hienoa koneoppimiseen. Tämä tarkoittaa, että sitä voidaan tehokkaasti käyttää opettamaan tietokoneita ja koneita tiettyjä tehtäviä. Lisäksi, kuten olemme jo lyhyesti käsitellyt, suuria tietoja voidaan käyttää kuvioiden havaitsemiseen. Tämä tapahtuu useimmiten erittäin tehokkaalla tavalla tietojen avulla työskentelevien tietokoneiden avulla. Viimeinkin, iso tieto heijastaa käyttäjien digitaalisia sormenjälkiä. Tämä tarkoittaa, että se on ihmisten digitaalisen ja online-toiminnan sivutuote, ja sitä voidaan käyttää yksittäisten henkilökohtaisten profiilien luomiseen.

Erilaisia ​​suuria tietoja

Suuret tiedot voidaan luokitella eri tavoin. Ensimmäinen tapa, jota käytetään yleisimmin, erottaa ison datan kerättävän tiedon perusteella. Tämän tyyppiseen luokitukseen käytetyt kolme mahdollista luokkaa ovat: jäsennelty big data, jäsentämätön big data ja osittain jäsennelty big data.

 1. Strukturoidut: Kun iso data on jäsennelty, se voidaan tallentaa ja esittää organisoidulla ja loogisella tavalla, jolloin tiedot ovat helpommin saatavissa ja ymmärrettäviä. Esimerkki olisi luettelo yrityksen luomista asiakasosoitteista. Tästä luettelosta löytyy todennäköisesti asiakkaiden nimet, osoitteet ja ehkä muut yksityiskohdat, kuten puhelinnumerot, jotka kaikki on rakennettu selvästi esimerkiksi kaavioon tai taulukkoon.
 2. jäsentymätön: Strukturoimatonta suurta dataa ei järjestetä ollenkaan. Siltä puuttuu looginen esitys, jolla olisi järkeä keskivertoihmiselle. Strukturoimattomalla suurilla tiedoilla ei ole esimerkiksi taulukon rakennetta, joka osoittaa tietyn johdonmukaisuuden tietojoukon eri elementtien välillä. Siksi tämän tyyppisiä tietoja on melko vaikea navigoida ja ymmärtää. Monet tietoaineistot alkavat aluksi rakenteettomina isoina tiedoina.
 3. Puolistrukturoitu: Osittain strukturoidulla suurilla tiedoilla, kuten olet ehkä arvata, on ominaisuuksia sekä jäsennellylle että jäsentämättömälle suurille tiedoille. Tämän tyyppisten tietojen luonne ja esitys eivät ole täysin mielivaltaisia. Se ei kuitenkaan ole riittävän jäsennelty ja järjestetty, jotta sitä voidaan käyttää myös tarkoituksenmukaiseen analyysiin. Esimerkki olisi verkkosivu, joka sisältää erityisiä metatietotunnisteita (lisätietoja, joita ei suoraan näy tekstissä), esimerkiksi koska se sisältää tiettyjä avainsanoja. Nämä tunnisteet näyttävät tehokkaasti tietyt tietyt bitit, kuten sivun tekijä tai hetki, jolloin se sijoitettiin verkkoon. Itse teksti on pääosin jäsentämätön, mutta sen sisältämät avainsanat ja muut metatiedot auttavat tekemään siitä jonkin verran sopivan perustan analyysille..

Luokittelu suurten tietojen lähteen perusteella

Toinen yleinen tapa erottaa erilaisia ​​suuria tietoja on tarkastelemalla tietolähdettä. Kuka tai mikä on luonut tiedot? Kuten aikaisempi visio, myös tämä luokitusmenetelmä koostuu kolmesta eri kategoriasta.

 1. Ihmiset: Tämä luokka koskee ihmisten tuottamaa suurta dataa. Esimerkkejä ovat kirjat, kuvat, videot sekä tiedot ja (henkilökohtaiset) tiedot verkkosivuilla ja sosiaalisessa mediassa, kuten Facebook, Twitter, Instagram ja niin edelleen.
 2. Prosessin rekisteröinti: Tämä luokka sisältää perinteisemmän tyyppisen iso datan, jonka (suuret) yritykset keräävät ja analysoivat parantaakseen tiettyjä liiketoiminnan prosesseja.
 3. koneet: Tämän tyyppinen iso data johtuu jatkuvasti kasvavasta antureiden määrästä, jotka asetetaan koneisiin. Esimerkki olisi lämpöanturi, joka on usein sisäänrakennettu tietokoneprosessoreihin. Koneiden tuottama data voi usein olla hyvin monimutkaista, mutta ainakin tämäntyyppinen iso data on yleensä hyvin jäsennelty ja täydellinen.

Mihin suuria tietoja voidaan käyttää?

Facebook-logoKaikki tähän mennessä keskusteltu saattaa silti kuulostaa hieman abstraktilta. Tehdään asiat hieman konkreettisemmiksi ja keskustellaan isojen tietojen tosielämän sovelluksista. Loppujen lopuksi on olemassa monia, monia tapoja, joilla yritykset ja organisaatiot käyttävät suurta dataa. Yksi ensimmäisistä mieleen tulevista asioista on valtava määrä yrityksiä, jotka keräävät meistä. Facebook kerää tietoja kaikista käyttäjistään ja analysoi tätä päättääkseen, mitä näyttää sinulle aikajanallasi. Tietysti tämä tehdään henkilökohtaisten toiveidesi ja kiinnostuksesi huomioimiseksi. Facebook toivoo tämän saavan sinut pysymään heidän verkkosivustollaan pidempään. Amazon puolestaan ​​kerää tietoja asiakkaistaan ​​ja ostamistaan ​​tuotteista. Tällä tavalla Amazon voi suositella tuotteita, jotka luulevat sinun kiinnostavan, ja kasvattaa heidän tulojaan tällä tavoin.

Suuria tietoja käytetään kuitenkin myös tavalla, joka on täysin erilainen kuin edellä kuvatut kaupalliset strategiat. Esimerkiksi julkisen liikenteen yritykset voivat kerätä tietoja siitä, kuinka kiireiset tietyt reitit ovat. Jälkeenpäin he voisivat analysoida näitä tietoja päättääkseen esimerkiksi, mitkä reitit vaativat ylimääräisiä linja-autoja tai junia. Toinen tunnettu tapa tosiasiallisesti käyttää suurten tietojen tehokasta käyttöä koskee kansainvälisen toimitus jättiläisen UPS: ää. UPS käyttää erityisiä ohjelmistoja, jotka on kehitetty isojen tietojen analysoinnin jälkeen. Tämä ohjelmisto auttaa UPS-kuljettajia välttämään vasemmanpuoleisia käännöksiä, jotka ovat kalliimpia, tuhlaavampia ja vaarallisempia kuin oikeanpuoleiset käännökset. Oletettavasti tämä järjestelmä on jo säästänyt UPS miljoonia galloneita polttoainetta, kaikki suuren datan ansiosta.

Toinen mielenkiintoinen esimerkki suurten tietojen keruusta ovat DNA-testit ja verkkosivustot, kuten MyHeritage DNA. Tämä verkkosivusto väittää, että se voi auttaa sinua “paljastamaan etnisen alkuperäsi ja löytämään uusia sukulaisia” yksinkertaisella DNA-testillä. Sanomattakin on selvää, että tämä prosessi sisältää paljon tiedonkeruua ja ristiviittauksia, joten siitä on toinen tärkeä toimija suurten tietojen keruussa ja käytössä. “Perinteisiin” fyysisiin DNA-testeihin sisältyy myös valtava määrä suuria tietoja, koska näitä testejä suorittavat yritykset saavat erittäin suuria tietojoukkoja monista, monista ihmisistä. Tietysti on tärkeää olla tietoinen mahdollisista riskeistä, joita nämä suuret tiedonkeruuprosessit aiheuttavat. Näitä riskejä korostetaan tämän artikkelin seuraavassa osassa.

Onko iso data vaarallinen?

Kuten yllä on osoitettu, iso data voi olla uskomattoman hyödyllinen monissa tapauksissa. Se tarjoaa meille tonnia tietoa, jota voimme käyttää prosessien virtaviivaistamiseen ja yritysten tehostamiseen ja kannattavuuteen. Tämä ei kuitenkaan tarkoita, että isojen tietojen kerääminen ja käyttö on täysin riskitöntä. Suuret tiedot sisältävät viisi tärkeää riskiä. Keskustelemme täällä kaikista viidestä.

Hakkerit ja varkaat

Kaikessa, jota teemme verkossa, on luontainen riski, että henkilötietomme ja Internet-toimintojamme koskevat tiedot voidaan varastaa. Jokaisen Internetin käyttäjän on oltava tietoinen tästä. Tietovuotojen ja varkausten määrä on lisääntynyt voimakkaasti viime vuosina. Uutisissa on usein tarinoita rikollisista, jotka myyvät salasanoja ja muuta tietoa sisältävistä tietokokonaisuuksista esimerkiksi pimeässä verkossa. Usein nämä tietojoukot varastetaan virallisilta verkkosivustoilta, yrityksiltä ja organisaatioilta. Mitä suurempia nämä tietojoukot ovat, sitä mielenkiintoisempi varkaiden on yrittää hankkia ne. Jos he saavat käsiinsä nämä tietokokonaisuudet, ne voivat aiheuttaa paljon ongelmia. Sanomattakin on selvää, että tämä saattaa myös vaarantaa suuresti yksityisyytesi.

yksityisyys

Henkilötietojen keräämiskäytäntö on yleistymässä. Nykyiset tietosuojamääräykset eivät kuitenkaan voi pysyä mukana tekniikan nopeassa kehityksessä, joka mahdollistaa tämän käytännön. Tämä jättää tilaa harmaalle alueelle ja epävarmuustekijöille, joita ei voida ratkaista lailla tarkastelemalla. Tärkeitä esiin nousevia yksityisyyden suojaan liittyviä huolenaiheita ovat: Millaisia ​​tietoja saa kerätä? Kenestä? Kenellä pitäisi olla pääsy näihin tietoihin?

Kun kerätään suuria määriä tietoja, todennäköisyys, että arkaluontoiset henkilötiedot sisällytetään kyseisiin tietojoukkoihin, on suuri. Tämä on ongelmallista, vaikka hakkereita ja varkaita ei olisi pelattu. Loppujen lopuksi kaikki, joilla on huono aikomus, voivat käyttää yksityisyyden suojaan liittyviä tietoja. Tähän sisältyy (vahingollisia) yrityksiä ja organisaatioita.

Huono tietojen analyysi

Monet yritykset ja organisaatiot keräävät suuria tietoja, koska ne voivat käyttää sitä mielenkiintoisiin analyyseihin. Tämä saattaa antaa heille tärkeitä uusia näkemyksiä tutkimuksestaan ​​(kuten esimerkiksi kuluttajien tottumukset). Nämä näkemykset ja johtopäätökset voivat puolestaan ​​johtaa muutoksiin yrityksessä, jotka johtavat korkeampaan katteeseen ja suurempaan voittoon. Kuten minkä tahansa muun normaalin tietojoukon tapauksessa, suurien tietojen virheellisellä analyysillä voi kuitenkin olla vakavia seurauksia. Loppujen lopuksi väärä analyysi voi helposti johtaa väärään johtopäätökseen. Ne voivat puolestaan ​​johtaa tehottomiin tai jopa haitallisiin toimenpiteisiin.

“Väärien” tietojen kerääminen

Suuret tiedot ovat yhä suosittuja, ja organisaatiot ovat yhä halukkaita keräämään kaikenlaista tietoa. Tämä tarkoittaa sitä, että jättiläismäisiä määriä tietoja kerätään ilman selkeää syytä niiden analysointiin. Toisin sanoen se luo valtavan tietokannan raakaa tietoa, joka on koottu joka tapauksessa. Yritykset todennäköisesti ajattelevat, että kaiken tiedon kerääminen on riittävän helppoa, joten ne voivat myös tehdä sen. Sanomattakin on selvää, että tämä ei ole hyvä kenenkään tietosuojalle. Se voi johtaa jopa merkityksettömien tai “väärien” tietojen keräämiseen ja analysointiin. Jos tämän analyysin johtopäätöksiä käytetään johtamisessa, se voi johtaa samoihin tehottomiin toimenpiteisiin, jotka mainittiin edellisessä kappaleessa.

Kerätä ja tallentaa suuria tietoja pahoilla aikomuksilla

Yritykset, organisaatiot ja hallitukset käyttävät yhä useammin isojen tietojen keräämistä, jotta he voivat tehdä tarkkoja henkilökohtaisia ​​profiileja. Käyttäjille tai kansalaisille ei tuskin koskaan ilmoiteta, mitkä heidän henkilökohtaisista tiedoistaan ​​rekisteröidään, puhumattakaan siitä, miksi ja miten. Sanomattakin on selvää, että tällä on vakavia vaikutuksia heidän online-tietosuojaan. Kaikki he tekevät verkossa, voidaan tallentaa ja katsella myöhemmin. Lisäksi suuret tiedon kerääjät voivat helposti vaikuttaa ja manipuloida ihmisten päätöksentekoa analysoimalla ja käyttämällä kerättyjä tietoja.

Suuret tiedot ja yksityisyys

Älypuhelin, jossa kuva korvastaKuten todennäköisesti jo nyt ymmärrät, isoihin tietoihin liittyy paljon haittoja ja riskejä. Siitä huolimatta, monet yritykset ja organisaatiot keräävät edelleen tietoja valtavassa mittakaavassa lähinnä siitä syystä, kuinka se voi auttaa yrityksiä kasvamaan ja etenemään. Suurien tietojen kerääminen on helpompaa kuin koskaan ennen. Tällä on valtavia seurauksia yksityisyytellemme. Olemme jo keskustelleet lyhyesti pahoja tietoja keräävien pahantahtoisten osapuolten mahdollisista yksityisyyden vaaroista. Koska yksityisyytemme on niin tiiviisti sidottu henkilötietojen joukkoon keräämiseen, haluamme käyttää tätä kohtaa keskustelemaan isojen tietojen mukana olevista yksityisyyden suojaan liittyvistä huolenaiheista..

Laajamittainen tiedonkeruu

Monet yritykset, kuten Google, Facebook ja Twitter, ovat suuresti riippuvaisia ​​mainoksista, jotta ylläpitäisivät itseään ja ansaitsisivat voittoa. Jotta nämä mainokset olisivat mahdollisimman tehokkaita, nämä yritykset tekevät yksityiskohtaisia ​​profiileja käyttäjilleen ottaen erityisesti huomioon heidän tykkään ja kiinnostuksen kohteet. Tämä on erä iso tieto. Samoin hallitukset ja salaiset palvelut ovat riippuvaisia ​​suurista tiedoista. He käyttävät tätä suurta määrää tietoa epäilyttävien ihmisten seuraamiseen ja tutkimiseen. Tämä tarkoittaa tietysti myös sitä, että tietoverkkorikollisilla on paljon suuria tietoja saadakseen käsiinsä ja ehkä jopa manipuloida ja väärinkäyttää. Tämä voi luoda kaikenlaisia ​​yksityisyyteen ja identiteettiin liittyviä ongelmia. Se, mikä mieleen tulee, on henkilöllisyysvarkaus.

Tietokantojen kokoelman mukanaan tuomat mahdollisuudet ovat kuitenkin paljon laajemmat. Nykyään tekniikasta on tullut niin edistyksellistä ja ”älykästä”, että se voi yhdistää tietojoukkoja. Tämä voidaan tehdä niin fiksulla ja taitavalla tavalla, että suuret yritykset ja organisaatiot tietävät todennäköisesti enemmän sinusta kuin sinä! Kuka olet, missä asut, mitä harrastuksesi ovat, keitä ystäväsi ovat: mikään näistä tiedoista ei ole enää yksityisiä. Ei kovin lohduttava ajatus, saatat ajatella. Onneksi on olemassa joitakin tapoja suojata itsesi laajoilta yksityisyyden loukkauksilta, joita iso data voi aiheuttaa.

Laki yksityisyydestä

Evästeet näytölläTietosuojalakit voivat suojata meitä yksityisyyden loukkauksilta, mutta vain tietyssä määrin. Asioiden monimutkaistamiseksi yksityisyyden suojalakit eroavat usein suuresti maiden ja alueiden välillä. Esimerkiksi Euroopassa on voimassa suhteellisen tiukka kuluttajansuojalaki, nimeltään yleinen tietosuoja-asetus (GDPR). Tätä lakia sovelletaan kaikkiin EU: n jäsenvaltioihin, vaikka yksityiskohdat voivat vaihdella maittain. Monet kansainväliset yritykset ovat päättäneet noudattaa koko liiketoimintaansa GDPR: n mukaisesti. Siksi esimerkiksi Google antaa nyt käyttäjille mahdollisuuden pyytää henkilökohtaisten tietojen poistamista. Yhdysvaltojen tietosuojalakit eroavat kuitenkin osavaltioista, eivätkä ne suojaa kuluttajia eikä EU: ta. Valitettavasti tämä pätee jopa Yhdysvaltojen tiukimpaan yksityisyyslakiin, Kalifornian kuluttajansuojalakiin.

Lyhyesti sanottuna, ei ole sellaista vahvaa ”globaalia” yksityisyyttä koskevaa lakia, jota sovelletaan kaikkiin isoihin tiedonkeruujärjestelmiin ja joka suojaa kaikkia käyttäjiä. Tämä tarkoittaa sitä, että suuret tiedonkeruijat eivät vain vahingoita yksityisyyttämme laittomasti, mutta jopa täysin laillisilla tavoilla, niin paradoksaaliselta kuin tämä saattaa kuulostaa. Onneksi Edward Snowdenin ja Chelsea Manningin, kuten ilmiantajien, paljastamat laajamittaiset yksityisyyden loukkaukset ovat lisänneet tietoisuutta suuria tietoja koskevista riskeistä. Tämä on tietysti vasta ensimmäinen askel nykyisten tietosuojalakien parantamisessa.

Monet Internet-käyttäjät eivät ole halukkaita odottamaan tietosuojalakien parantamista – ja perustellusti. Pikemminkin he haluavat ryhtyä toimiin itse tekemällä kaikkensa yksityisyyden suojaamiseksi. Haluatko välttää tulemasta osaksi myös lukemattomia suuria tietojoukkoja? On olemassa useita vinkkejä ja temppuja, jotka auttavat sinua matkallasi.

Kuinka estää tietosi tallentamisen isoihin tietojoukkoihin

Suuret tietoaineistot vaikuttavat vakavasti yksityisyyteen ja tietoturvaan. Nämä aineistot voivat sisältää kaikenlaisia ​​(henkilökohtaisia) tietoja, joita suuret yritykset tai jopa tietoverkkorikolliset voivat käyttää väärin. Siksi sinun tulee aina varmistaa, että jätät mahdollisimman vähän online-jäljitystä. Seuraavat vinkit voivat auttaa sinua saavuttamaan tämän:

 • Yritä minimoida henkilökohtaisten tietojesi käyttö salasanoja luotaessa tai yleensä verkossa. Esimerkiksi: Älä käytä nimesi, osoitteesi, puhelinnumerosi, syntymäaikaasi ja niin edelleen.
 • Muista aina seuraava: kaikki mitä julkaiset Internetissä, on siellä ikuisesti. Tämä ei välttämättä aina ole täysin totta, mutta tämä varovaisuustaso auttaa suojaamaan yksityisyyttäsi. Käsität automaattisesti yksityisiä tietojasi huolellisemmin, kun olet tietoinen tästä tosiasiasta.
 • Varmista, että Internet-yhteytesi on suojattu ja nimettömät, esimerkiksi Tor-selaimen tai VPN: n avulla.
 • Käytä yhtä tai useampaa mainosten estoa selaimessa.
 • Käytä vähintään yhtä selainlaajennusta, joka estää jäljittäjät ja evästeet.
 • Tyhjennä välimuisti säännöllisesti ja poista selaushistoria ja evästeet.
 • Kirjaudu ulos verkkosivustoista, kun et käytä niitä aktiivisesti.

Näiden vaiheiden toteuttaminen on hyvä aloitus, kun on kyse online-tietosuojan ja tietoturvan turvaamisesta. Muista kuitenkin, että suuria tietoja kerätään monella eri tavalla – ei vain verkossa. Lyhyesti sanottuna, missä tahansa oletkin ja mitä tahansa teetkin, sinun tulee aina olla valppaana ja yrittää suojata (henkilökohtaisia) tietosi suurilta tiedonkeruijoilta.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me