Big data & privacy: Hva er personvernrisikoen? | VPNOverview

I løpet av de siste tiårene har verden endret seg enormt i mange henseender, spesielt når det gjelder IT. Antallet mennesker vi er i stand til å kommunisere med på daglig basis har vokst enormt, akkurat som mengden informasjon vi har tilgang til. Det samme er imidlertid for mengden informasjon store selskaper samler om oss. Begrep som big data blir brukt oftere etter hvert som tiden går. Men hva betyr dette, nøyaktig? Hva er big data? Er det farlig? Hvordan påvirker det personvernet vårt, om i det hele tatt? Dette er noen av spørsmålene vi vil dekke i denne artikkelen.


Hva er big data?

Liste med forstørrelsesglassBegrepet “big data” beskriver de enorme mengder (personlige) data som kontinuerlig blir samlet inn av forskjellige aktører. Et eksempel er all informasjonen Google samler om brukernes søk. Fenomenet big data er en relativt ny utvikling som startet fordi (store) selskaper og organisasjoner, som Facebook, Google og de fleste regjeringer, begynte å samle stadig mer data om brukerne, kundene og innbyggerne enn før. Nye teknologier, en digitalisert verden og internett har hjulpet denne utviklingen enormt.

Samlinger av big data er ofte så store at det er umulig å analysere dem ved bruk av tradisjonell dataanalyse. Imidlertid, hvis man analyserer big data på riktig måte, kan interessante mønstre og konklusjoner induseres. For eksempel brukes ofte store data til storskala markedsundersøkelser: hvilke produkter er det mest sannsynlig å bli kjøpt? Hva slags annonsering er mest effektiv når du vil nå og overtale kunder?

For at et datasett skal regnes som big data, bør det vanligvis oppfylle følgende tre kriterier, også kjent som 3 v:

  • Volum: Big data er alt annet enn en liten prøve. Det innebærer enorme datasamlinger, som er et resultat av lang, kontinuerlig observasjon.
  • Hastighet: Dette har å gjøre med de imponerende hastighetene som store data blir samlet inn. Dessuten er big data ofte tilgjengelig i sanntid (når de samles).
  • Variasjon: Store datasett inneholder ofte mange forskjellige typer informasjon. Data i store datasett kan til og med kombineres for å fylle ut eventuelle hull og gjøre datasettet enda mer komplett.

Bortsett fra disse tre versjonene, har big data noen andre egenskaper. For eksempel er big data bra for maskinlæring. Dette betyr at den effektivt kan brukes til å lære datamaskiner og maskiner visse oppgaver. Som vi allerede har berørt kort, kan store data brukes til å oppdage mønstre. Dette skjer stort sett på en veldig effektiv måte, ved hjelp av datamaskiner som jobber med dataene. Endelig er big data gjenspeiling av brukernes digitale fingeravtrykk. Dette betyr at det er et biprodukt av menneskers digitale og online aktiviteter og kan brukes til å lage individuelle personlige profiler.

Ulike typer big data

Det er forskjellige måter å klassifisere big data. Den første måten, som brukes hyppigst, skiller store data ut fra typen data som blir samlet inn. De tre mulige kategoriene som brukes for denne typen klassifisering er: strukturert big data, ustrukturert big data og semistrukturert big data.

  1. Strukturert: Når big data er strukturert, kan de lagres og presenteres på en organisert og logisk måte, noe som gjør dataene mer tilgjengelige og enklere å forstå. Et eksempel er en liste over kundeadresser opprettet av et selskap. I denne listen vil man sannsynligvis finne kundenes navn, adresser og kanskje andre detaljer som telefonnumre, alt sammen strukturert i for eksempel et diagram eller en tabell.
  2. ustrukturert: Ustrukturerte big data er ikke organisert i det hele tatt. Det mangler en logisk presentasjon som ville være fornuftig for det gjennomsnittlige mennesket. Ustrukturerte big data har ikke strukturen til for eksempel en tabell som angir en viss sammenheng mellom de forskjellige elementene i datasettet. Derfor er denne typen data ganske vanskelig å navigere og forstå. Mange datasett begynner i utgangspunktet som ustrukturerte big data.
  3. Semi-strukturerte: Semistrukturert big data har, som du kanskje har gjettet, kjennetegn på både strukturerte og ustrukturerte big data. Arten og representasjonen av denne typen data er ikke helt vilkårlig. Likevel er den ikke strukturert og organisert nok til å brukes til en meningsfull analyse. Et eksempel kan være en webside som inneholder spesifikke metadatatagger (ekstra informasjon som ikke er direkte synlig i teksten), for eksempel fordi den inneholder bestemte nøkkelord. Disse kodene viser effektive spesifikke informasjonsbiter, for eksempel forfatteren av en side eller øyeblikket den ble plassert på nettet. Selve teksten er i det vesentlige ustrukturert, men likevel er nøkkelordene og andre metadata som den hjelper til å gjøre den til et noe egnet grunnlag for analyse.

Klassifisering basert på kilden til big data

En annen vanlig måte å skille mellom forskjellige typer big data er ved å se på datakilden. Hvem eller hva har generert informasjonen? I likhet med forrige utarbeidelse, består denne klassifiseringsmetoden også av 3 forskjellige kategorier.

  1. Mennesker: Denne kategorien gjelder store data generert av mennesker. Eksempler kan være bøker, bilder, videoer så vel som informasjon og (personlige) data på nettsteder og sosiale medier, for eksempel Facebook, Twitter, Instagram, og så videre.
  2. Prosessregistrering: Denne kategorien inkluderer den mer tradisjonelle typen big data, som er samlet og analysert av (store) selskaper for å forbedre visse prosesser i en virksomhet..
  3. maskiner: Denne typen big data er et resultat av det stadig økende antallet sensorer som er plassert i maskiner. Et eksempel er varmesensoren som ofte er innebygd i dataprosessorer. Dataene som genereres av maskiner kan ofte være veldig kompliserte, men i det minste er denne typen big data generelt godt strukturert og fullstendig.

Hva kan big data brukes til?

Facebook-logoAlt diskutert så langt kan fremdeles høres noe abstrakt ut. La oss gjøre ting litt mer konkrete og diskutere noen virkelige applikasjoner av big data. Det er tross alt mange, mange måter selskaper og organisasjoner bruker big data på. Noe av det første som kommer opp i tankene er de enorme datamengdene selskaper samler om oss. Facebook samler inn data om alle brukerne sine og analyserer dette for å bestemme hva du vil vise deg på tidslinjen din. Dette gjøres selvfølgelig for å imøtekomme dine personlige ønsker og interesser. Facebook håper dette vil få deg til å bo på nettstedet deres i lengre perioder. På sin side samler Amazon informasjon om kundene og produktene de kjøper. På den måten kan Amazon anbefale produkter de tror du vil være interessert i og øke inntektene deres på denne måten.

Imidlertid brukes big data også på forskjellige måter enn de kommersielle strategiene beskrevet ovenfor. For eksempel kan kollektivselskaper samle inn data om hvor travle ruter det er. Etterpå kunne de analysere disse dataene for å bestemme for eksempel hvilke ruter som krever ekstra busser eller tog. Et annet kjent tilfelle av effektiv bruk av big data gjelder internasjonal leveringsgigant UPS. UPS bruker spesiell programvare som ble utviklet etter big data-analyse. Denne programvaren hjelper UPS-drivere med å unngå venstresving, som er dyrere, mer sløsing og farligere enn høyresving. Visstnok har dette systemet allerede spart UPS millioner av liter drivstoff, alt takket være big data.

Et annet interessant eksempel på innsamling av big data er DNA-tester og nettsteder som MyHeritage DNA. Dette nettstedet hevder det kan hjelpe deg med å “avdekke din etniske opprinnelse og finne nye slektninger” med en enkel DNA-test. Unødvendig å si innebærer denne prosessen mye datainnsamling og krysshenvisning, noe som gjør den til en annen stor aktør innen innsamling og bruk av big data. “Tradisjonelle” fysiske DNA-tester involverer også en enorm mengde big data, siden selskaper som utfører disse testene vil få ekstremt store datasett om mange, mange mennesker. Selvfølgelig er det viktig å være klar over de mulige risikoene som følger med disse prosessene for innsamling av data. Disse risikoene vil bli fremhevet i neste del av denne artikkelen.

Er big data farlig?

Som vist over, kan store data være utrolig nyttige i mange tilfeller. Det gir oss masse informasjon vi kan bruke for å effektivisere prosesser og gjøre selskaper mer effektive og lønnsomme. Dette betyr imidlertid ikke at det er helt risikofritt å samle og bruke big data. Det er fem viktige risikoer som følger med big data. Vi skal diskutere alle fem her.

Hackere og tyver

Med alt vi gjør på nettet, er det en iboende risiko for at våre personlige data og informasjon om våre internettaktiviteter kan bli stjålet. Hver internettbruker må være klar over dette. Antall datalekkasjer og tyverier har økt drastisk de siste årene. Det er ofte historier i nyhetene om kriminelle som selger datasett som inneholder passord og annen informasjon om steder som det mørke nettet. Ofte blir disse datasettene stjålet fra offisielle nettsteder, selskaper og organisasjoner. Jo større disse datasettene er, jo mer interessant blir det for tyvene å prøve å få tak i dem. Hvis de får tak i disse datasettene, kan de forårsake mange problemer. Unødvendig å si, dette kan også redusere personvernet ditt veldig.

Personvern

Praksisen med å samle inn personopplysninger blir mer og mer utbredt. Imidlertid kan ikke gjeldende personvernforskrifter følge med den raske utviklingen innen teknologi som gjør denne praksisen mulig. Dette gir rom for gråsoner og usikkerheter som ikke kan løses ved å se på loven. Viktige personvernhensyn som oppstår inkluderer: Hva slags data tillates samlet inn? Om hvem? Hvem skal ha tilgang til disse dataene?

Når du samler inn store mengder data, er sjansen for at sensitiv personlig informasjon er inkludert i disse datasettene stor. Dette er problematisk, selv når hackere og tyver ikke er i spill. Tross alt kan personvernsensitive data misbrukes av alle med dårlige intensjoner. Dette inkluderer (ondsinnede) selskaper og organisasjoner.

Dårlig dataanalyse

Mange selskaper og organisasjoner samler inn big data, fordi de kan bruke dem til interessante analyser. Dette kan gi dem viktig ny innsikt i hva de forsker på (som for eksempel forbrukervaner). Denne innsikten og konklusjonene kan igjen føre til endringer i selskapet som resulterer i høyere marginer og mer overskudd. Imidlertid, akkurat som med alle andre normale datasett, kan en uriktig analyse av big data få alvorlige konsekvenser. Tross alt kan en feil analyse lett føre til gale konklusjoner. Disse kan igjen oversette til ineffektive eller til og med kontraproduktive tiltak.

Innsamling av “gale” data

Big data blir stadig mer populært og organisasjoner er mer og mer villige til å samle inn alle slags data. Dette betyr at det samles inn gigantiske datamengder uten at det er en klar grunn til å analysere dem. Med andre ord, det skaper en enorm database med rå informasjon som har blitt samlet bare for tilfeller. Bedrifter tenker sannsynligvis at det er enkelt nok å samle alle dataene, så de kan like godt gjøre det. Unødvendig å si, dette er ikke bra for noens personvern. Det kan til og med føre til at irrelevante eller “gale” data blir samlet og analysert. Hvis konklusjonene trukket fra denne analysen blir brukt i ledelsen, kan det føre til de samme ineffektive tiltakene nevnt i forrige avsnitt.

Innsamling og lagring av store data med dårlige intensjoner

Innsamlingen av big data brukes oftere og oftere av selskaper, organisasjoner og myndigheter, slik at de kan lage nøyaktige individuelle profiler på mennesker. Brukere eller borgere blir nesten aldri varslet om hvilke av personopplysningene deres som blir registrert, enn si hvorfor og hvordan. Unødvendig å si, dette har alvorlige konsekvenser for deres online personvern. Alt de gjør på nettet, kan lagres og vises senere. Dessuten kan store datainnsamlere lett påvirke og manipulere folks beslutninger ved å analysere og bruke de innsamlede dataene.

Big data og personvern

Smarttelefon med bilde av øretSom du sikkert vil forstå nå, kommer store data med mange ulemper og risikoer. Likevel samler fortsatt mange bedrifter og organisasjoner data i stor skala, mest på grunn av hvordan det kan hjelpe dem å vokse og avansere. Det er enklere enn noen gang å samle inn store data. Dette har enorme konsekvenser for personvernet vårt. Vi har allerede kort diskutert de personlige farene ved ondsinnede parter som samler inn dårlige data. Siden personvernet vårt er så tett knyttet til masseinnsamlingen av personopplysninger, ønsker vi å bruke denne delen til å diskutere de forskjellige personvernhensynene som følger med big data.

Storskala datainnsamling

Mange selskaper, inkludert Google, Facebook og Twitter, er sterkt avhengige av annonser for å opprettholde seg selv og tjene penger. For å gjøre disse annonsene så effektive som mulig, lager disse selskapene detaljerte profiler på brukerne sine, spesielt med hensyn til deres likes og interesser. Dette er en form for big data. På samme måte er regjeringer og hemmelige tjenester også avhengige av big data. De bruker denne enorme mengden informasjon for å spore og undersøke mennesker de anser som mistenkelige. Selvfølgelig betyr dette også at det er mye big data for cyberkriminelle å få tak i og kanskje til og med manipulere og misbruke. Dette kan skape alle slags personvern og identitetsrelaterte problemer. En som kommer til hjernen, er identitetstyveri.

Likevel er mulighetene som følger med samlingen i databaser mye bredere enn dette. I disse dager har teknologien blitt så avansert og “smart” at den kan kombinere datasett. Dette kan gjøres på en så smart og listig måte at store selskaper og organisasjoner sannsynligvis vet mer om deg enn du gjør! Hvem du er, hvor du bor, hva hobbyene dine er, hvem vennene dine er: ingen av disse opplysningene vil være private lenger. Ikke en veldig trøstende tanke, tenker du kanskje. Heldigvis er det noen måter å beskytte seg mot storskala personvernkrenkelse store data kan føre til.

Lov om personvern

Informasjonskapsler på skjermenLovgivning og regler for personvern kan beskytte oss mot brudd på personvern, men bare i en viss grad. For å gjøre saken mer komplisert, skiller ofte personvernlovene seg veldig mellom forskjellige land og regioner. For eksempel er det i Europa en relativt streng forbrukerlovgivning som kalles den generelle databeskyttelsesforordningen (GDPR). Denne loven gjelder for alle EUs medlemsland, selv om detaljene kan variere per land. Mange internasjonale selskaper har bestemt seg for å overholde all sin virksomhet til GDPR. Dette er grunnen til at Google for eksempel nå lar brukere be om å slette personlig informasjon. Imidlertid er personvernlovgivningen i USA forskjellig fra stat til stat og beskytter ikke forbrukere så vel som EU. Dessverre gjelder dette til og med for den tøffeste personvernloven i USA, California Consumer Privacy Act.

Kort sagt er det ikke noe som heter en sterk “global” personvernlov som gjelder for alle store datainnsamlere og beskytter alle brukere. Dette betyr at personvernet vårt ikke bare blir skadet av store datainnsamlere på ulovlig vis, men også på helt lovlige måter, så paradoksale som dette kan høres ut. Heldigvis har overtredelser i stor grad av personvern utsatt av varslere som Edward Snowden og Chelsea Manning økt bevisstheten om risikoen ved big data. Dette er selvfølgelig bare et første skritt i å forbedre gjeldende personvernlovgivning.

Mange internettbrukere er ikke villige til å avvente en forbedring av personvernloven – og med rette. Snarere ønsker de å ta grep selv ved å gjøre hva de kan for å beskytte deres privatliv. Vil du unngå å bli en del av utallige store datasett også? Det er flere tips og triks for å hjelpe deg på vei.

Hvordan forhindre at dataene dine blir lagret i store datasett

Store datasett påvirker ditt personvern og sikkerhet på alvor. Disse datasettene kan inneholde alle slags (personlig) informasjon, som kan misbrukes av store selskaper eller nettbaserte kriminelle. Derfor bør du alltid sørge for å legge igjen så lite online spor som mulig. Følgende tips kan hjelpe deg med å oppnå dette:

  • Forsøk å minimere bruken av din personlige informasjon når du oppretter passord eller generelt på nettet. For eksempel: unngå å bruke navn, adresse, telefonnummer, fødselsdato og så videre.
  • Husk alltid følgende: alt du publiserer på internett, vil være der for alltid. Dette er kanskje ikke alltid helt sant, men dette varsomhetsnivået hjelper med å ivareta personvernet ditt. Du håndterer dine private data automatisk med større omhu når du er klar over dette.
  • Forsikre deg om at internettforbindelsen din er sikker og anonymisert, for eksempel ved å bruke Tor-nettleseren eller et VPN for eksempel.
  • Bruk en eller flere annonseblokkere i nettleseren din.
  • Bruk på eller flere nettleser-plugins som blokkerer trackere og informasjonskapsler.
  • Tøm hurtigbufferen regelmessig og slett nettleserloggen og informasjonskapslene.
  • Logg ut av nettsteder når du ikke bruker dem aktivt.

Å ta disse trinnene er en god start når det gjelder å ivareta ditt personvern og sikkerhet på nettet. Husk imidlertid at big data blir samlet på mange forskjellige måter – ikke bare online. Kort sagt, uansett hvor du er og hva du gjør, bør du alltid være årvåken og prøve å beskytte dine (personlige) data fra store datainnsamlere.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map