Big data en privaatheid: Wat is die privaatheidsrisiko’s? | VPNOverview

Die afgelope paar dekades het die wêreld in baie opsigte geweldig verander, veral wat IT betref. Die aantal mense met wie ons daagliks kan kommunikeer, het geweldig gegroei, net soos die hoeveelheid inligting waartoe ons toegang het. Dieselfde is egter waar vir die hoeveelheid inligting wat groot ondernemings oor ons versamel. Terme soos groot data word al hoe meer gereeld gebruik soos wat die tyd aanstap. Maar wat beteken dit presies? Wat is big data? Is dit gevaarlik? Hoe beïnvloed dit ons privaatheid, indien enigsins? Dit is ‘n paar van die vrae wat ons in hierdie artikel sal bespreek.


Wat is big data?

Lys met vergrootglasDie term “groot data” beskryf die enorme hoeveelhede (persoonlike) gegewens wat deurlopend deur verskillende akteurs versamel word. ‘N Voorbeeld hiervan is al die inligting wat Google versamel oor die soeknavrae van gebruikers. Die verskynsel van groot data is ‘n relatiewe onlangse ontwikkeling wat begin het omdat (groot) ondernemings en organisasies, soos Facebook, Google en die meeste regerings, al hoe meer inligting oor sy gebruikers, kliënte en burgers begin versamel het as voorheen. Nuwe tegnologieë, ‘n gedigitaliseerde wêreld en die internet het hierdie ontwikkeling geweldig gehelp.

Versamelings van groot data is dikwels so groot dat dit onmoontlik is om dit met behulp van tradisionele data-ontleding te ontleed. As mens egter big data op die regte manier ontleed, kan interessante patrone en gevolgtrekkings geïnduseer word. Groot data word byvoorbeeld gereeld gebruik vir grootskaalse marknavorsing: watter produkte sal waarskynlik gekoop word? Watter soort advertering is die doeltreffendste as u kliënte wil bereik en oorreed??

Om ‘n datastel as groot data te beskou, moet dit gewoonlik aan die volgende drie kriteria voldoen, ook bekend as die 3 v’s:

  • Deel: Groot data is alles behalwe ‘n klein steekproef. Dit behels omvangryke versamelings van data, voortspruitend uit lang, deurlopende waarneming.
  • snelheid: Dit het te doen met die indrukwekkende snelhede waarteen groot data versamel word. Boonop is groot data dikwels in reële tyd toeganklik (soos dit versamel word).
  • verskeidenheid: Groot datastelle bevat baie verskillende soorte inligting. Data in groot datastelle kan selfs gekombineer word om enige leemtes in te vul en die datastel nog vollediger te maak.

Afgesien van hierdie 3 v’s, het groot data ‘n paar ander kenmerke. Groot data is byvoorbeeld ideaal vir masjienleer. Dit beteken dat dit effektief gebruik kan word om rekenaars en masjiene sekere take aan te leer. Soos ons reeds kortliks aangeraak het, kan groot data gebruik word om patrone op te spoor. Dit gebeur meestal op ‘n baie effektiewe manier deur middel van rekenaars wat aan die data werk. Laastens is groot data die weerspieëling van die digitale vingerafdrukke van gebruikers. Dit beteken dat dit ‘n neweproduk is van mense se digitale en aanlynaktiwiteite en kan gebruik word om individuele persoonlike profiele op te stel.

Verskillende soorte big data

Daar is verskillende maniere om groot data te klassifiseer. Die eerste manier, wat die meeste gebruik word, onderskei groot data op grond van die soort data wat ingesamel word. Die drie moontlike kategorieë wat vir hierdie tipe indeling gebruik word, is: gestruktureerde big data, ongestruktureerde big data en semi gestruktureerde big data.

  1. gestruktureer: Wanneer big data gestruktureer is, kan dit op ‘n georganiseerde en logiese manier gestoor en aangebied word, wat die data meer toeganklik en makliker maak om te verstaan. ‘N Voorbeeld hiervan is ‘n lys klante-adresse wat deur ‘n onderneming geskep is. In hierdie lys sal ‘n mens waarskynlik name van kliënte, adresse en miskien ander besonderhede soos telefoonnommers vind, wat alles duidelik gestruktureer is in byvoorbeeld ‘n kaart of tabel.
  2. ongestruktureerde: Ongestruktureerde big data is glad nie georganiseer nie. Dit ontbreek aan ‘n logiese voorstelling wat sinvol is vir die gemiddelde mens. Ongestruktureerde groot data het nie die struktuur van byvoorbeeld ‘n tabel wat ‘n sekere samehang tussen die verskillende elemente van die datastel aandui nie. Daarom is hierdie tipe data redelik moeilik om te navigeer en te begryp. Baie datastelle begin aanvanklik as ongestruktureerde big data.
  3. Semi-gestruktureerde: Semi-gestruktureerde big data, soos u al kon dink, het kenmerke van sowel gestruktureerde as ongestruktureerde big data. Die aard en voorstelling van hierdie tipe data is nie heeltemal arbitrêr nie. Tog is dit ook nie so gestruktureerd en georganiseerd dat dit vir ‘n betekenisvolle ontleding gebruik kan word nie. ‘N Voorbeeld hiervan is ‘n webblad wat spesifieke meta-datatags bevat (ekstra inligting wat nie direk in die teks sigbaar is nie), byvoorbeeld omdat dit sekere sleutelwoorde bevat. Hierdie etikette wys effektiewe spesifieke stukkies inligting, soos die outeur van ‘n bladsy of die oomblik waarop dit aanlyn geplaas is. Die teks self is in wese ongestruktureerd, maar tog help die sleutelwoorde en ander meta-data om dit ‘n ietwat geskikte basis vir ontleding te maak.

Klassifikasie gebaseer op die bron van groot data

‘N Ander algemene manier om tussen verskillende soorte groot data te onderskei, is deur na die bron van die data te kyk. Wie of wat het die inligting gegenereer? Soos die vorige plan, bestaan ​​hierdie klassifikasiemetode ook uit 3 verskillende kategorieë.

  1. mense: Hierdie kategorie handel oor groot data wat deur mense gegenereer word. Voorbeelde hiervan is boeke, prente, video’s, sowel as inligting en (persoonlike) gegewens op webwerwe en sosiale media, soos Facebook, Twitter, Instagram, ensovoorts..
  2. Prosesregistrasie: Hierdie kategorie bevat die meer tradisionele soort big data wat deur (groot) ondernemings versamel en ontleed word om sekere prosesse in ‘n onderneming te verbeter..
  3. masjiene: Hierdie tipe groot data is die resultaat van die steeds groeiende aantal sensors wat in masjiene geplaas word. ‘N Voorbeeld hiervan is die hittesensor wat dikwels in rekenaarverwerkers ingebou is. Die data wat deur masjiene gegenereer word, kan dikwels baie ingewikkeld wees, maar ten minste is hierdie tipe groot data oor die algemeen goed gestruktureerd en volledig.

Waarvoor kan groot data gebruik word?

Facebook logoAlles wat tot dusver bespreek is, klink dalk nog effens abstrak. Kom ons maak dinge ‘n bietjie meer konkreet en bespreek die toepassings van groot data in die werklike lewe. Daar is immers baie, baie maniere waarop ondernemings en organisasies groot data gebruik. Een van die eerste dinge wat na vore kom, is die enorme hoeveelhede data wat maatskappye oor ons versamel. Facebook versamel inligting oor al sy gebruikers en ontleed dit om te besluit wat u op u tydlyn moet wys. Dit word natuurlik gedoen om aan u persoonlike wense en belangstellings te voldoen. Facebook hoop dat u langer vir ‘n tydperk op hul webwerf kan bly. Op sy beurt versamel Amazon inligting oor sy kliënte en die produkte wat hulle koop. Op hierdie manier kan Amazon produkte aanbeveel waarin hulle dink dat u sou belangstel en hul verdienste op hierdie manier verhoog.

Groot data word egter ook op verskillende maniere gebruik as die kommersiële strategieë hierbo beskryf. Openbare vervoermaatskappye kan byvoorbeeld inligting insamel oor hoe besig sekere roetes is. Daarna kon hulle hierdie gegewens ontleed om byvoorbeeld te besluit watter roetes ekstra busse of treine benodig. Nog ‘n bekende geval van die effektiewe gebruik van groot data is die internasionale afleweringsreus UPS. UPS gebruik spesiale sagteware wat ontwikkel is na big data-ontleding. Hierdie sagteware help UPS-bestuurders om linksdraaie te vermy, wat duurder, morsiger en gevaarliker is as regsdraaie. Sogenaamd het hierdie stelsel UPS al miljoene liter brandstof bespaar, alles danksy groot data.

‘N Verdere interessante voorbeeld van groot data-insameling is DNA-toetse en webwerwe soos MyHeritage DNA. Volgens hierdie webwerf kan dit u help om ‘n etniese oorsprong te ontdek en nuwe familielede te vind “met ‘n eenvoudige DNA-toets. Nodeloos om te sê, hierdie proses behels baie data-insameling en kruisverwysing, wat dit ‘n ander belangrike speler in die versameling en gebruik van groot data maak. ‘Tradisionele’, fisiese DNA-toetse behels ook ‘n groot hoeveelheid groot data, want ondernemings wat hierdie toetse doen, sal baie groot datastelle oor baie, baie mense kry. Dit is natuurlik belangrik om bewus te wees van die moontlike risiko’s verbonde aan hierdie groot data-insamelingsprosesse. Hierdie risiko’s sal in die volgende deel van hierdie artikel uitgelig word.

Is groot data gevaarlik?

Soos hierbo getoon, kan groot data in baie gevalle ongelooflik nuttig wees. Dit bied ons tonne inligting wat ons kan gebruik om prosesse te stroomlyn en om ondernemings doeltreffender en winsgewender te maak. Dit beteken egter nie dat die versameling en gebruik van groot data heeltemal risikovry is nie. Daar is vyf belangrike risiko’s wat met groot data gepaard gaan. Ons sal al vyf hier bespreek.

Hackers en diewe

Met alles wat ons aanlyn doen, bestaan ​​die risiko dat ons persoonlike inligting en inligting oor ons internetaktiwiteite gesteel kan word. Elke internetgebruiker moet hiervan bewus wees. Die aantal datalekkasies en diefstalle het die afgelope paar jaar drasties toegeneem. Daar is gereeld verhale in die nuus oor misdadigers wat datastelle verkoop met wagwoorde en ander inligting op plekke soos die donker web. Dikwels word hierdie datastelle van amptelike webwerwe, maatskappye en organisasies gesteel. Hoe groter hierdie datastelle is, hoe interessanter word dit vir diewe om dit te probeer verkry. As hulle hierdie datastelle in die hande kry, kan dit baie probleme veroorsaak. Nodeloos om te sê, dit kan ook u privaatheid in die gedrang bring.

privaatheid

Die praktyk van die insameling van persoonlike gegewens word al hoe groter. Die huidige privaatheidsregulasies kan egter nie tred hou met die vinnige ontwikkelinge in tegnologie wat hierdie praktyk moontlik maak nie. Dit laat ruimte vir grys gebiede en onsekerhede wat nie opgelos kan word deur na die wet te kyk nie. Belangrike probleme rakende privaatheid wat opduik, sluit die volgende in: Watter soort data mag versamel word? Oor wie? Wie moet toegang tot hierdie data hê??

As u groot hoeveelhede data versamel, is die kans groot dat sensitiewe persoonlike inligting by die datastelle ingesluit is. Dit is problematies, selfs as hackers en diewe nie speel nie. Immers, privaatheidsensitiewe data kan misbruik word deur enigiemand met slegte bedoelings. Dit sluit (kwaadwillige) ondernemings en organisasies in.

Swak data-analise

Baie maatskappye en organisasies versamel groot data, omdat hulle dit vir interessante ontledings kan gebruik. Dit kan hulle belangrike nuwe insigte gee oor alles wat hulle ondersoek (soos byvoorbeeld verbruikersgewoontes). Op hul beurt kan hierdie insigte en gevolgtrekkings lei tot veranderinge binne die onderneming wat hoër marges en meer wins tot gevolg het. Net soos met enige ander normale datastel, kan ‘n foutiewe ontleding van groot data egter ernstige gevolge hê. Per slot van rekening kan ‘n onbehoorlike ontleding maklik tot verkeerde gevolgtrekkings lei. Dit kan op sy beurt lei tot ondoeltreffende of selfs teenproduktiewe maatreëls wat getref word.

Versamel die “verkeerde” data

Groot data raak al hoe gewilder en organisasies is meer en meer bereid om allerlei data in te samel. Dit beteken dat reuse hoeveelhede data ingesamel word sonder dat daar ‘n duidelike rede bestaan ​​om dit te ontleed. Met ander woorde, dit skep ‘n groot databasis van rou inligting wat versamel is, net vir ingeval. Maatskappye dink waarskynlik dat dit maklik genoeg is om al die data in te samel, sodat hulle dit net so kan doen. Nodeloos om te sê, dit is nie goed vir iemand se privaatheid nie. Dit kan selfs daartoe lei dat irrelevante of ‘verkeerde’ data versamel en ontleed word. As die gevolgtrekkings wat uit hierdie analise gemaak word, in die bestuur gebruik word, kan dit lei tot dieselfde oneffektiewe maatreëls wat in die vorige paragraaf genoem is.

Versamel en stoor groot data met slegte bedoelings

Die versameling van groot data word meer en meer gereeld deur ondernemings, organisasies en regerings gebruik om akkurate individuele profiele vir mense te maak. Gebruikers of burgers word amper nooit in kennis gestel van watter van hul persoonlike data geregistreer word nie, laat staan ​​nog en waarom. Nodeloos om te sê, dit het ernstige gevolge vir hul aanlyn privaatheid. Alles wat hulle aanlyn doen, kan later gestoor word en besigtig word. Boonop kan groot dataversamelaars die besluitneming van mense maklik beïnvloed en manipuleer deur die versamelde data te ontleed en te gebruik.

Big data en privaatheid

Slimfoon met prentjie van oorSoos u waarskynlik nou sal verstaan, hou groot data baie nadele en risiko’s in. Nietemin, baie ondernemings en organisasies versamel steeds data op groot skaal, meestal as gevolg van hoe dit hulle kan help groei en vooruitgaan. Versameling van groot data is makliker as ooit tevore. Dit het geweldige gevolge vir ons privaatheid. Ons het reeds kortliks die moontlike gevare van privaatheid bespreek wat kwaadwillige partye met slegte data versamel. Aangesien ons privaatheid so nou gekoppel is aan die massa versameling van persoonlike data, wil ons hierdie afdeling gebruik om die verskillende privaatheidsprobleme wat met groot data gepaard gaan, te bespreek.

Groot skaal data-insameling

Baie maatskappye, insluitend Google, Facebook en Twitter, is baie afhanklik van advertensies om hulself te onderhou en wins te maak. Om hierdie advertensies so effektief moontlik te maak, maak hierdie ondernemings gedetailleerde profiele vir hul gebruikers, veral met inagneming van hul voorkeure en belangstellings. Dit is ‘n vorm van groot data. Net so is regerings en geheime dienste ook van groot data afhanklik. Hulle gebruik hierdie groot hoeveelheid inligting om mense wat hulle as verdag beskou, op te spoor en te ondersoek. Dit beteken natuurlik ook dat daar baie groot data vir kubermisdadigers is om hul hande te kry en selfs te manipuleer en te misbruik. Dit kan allerlei probleme met privaatheid en identiteit veroorsaak. Een wat na vore kom, is identiteitsdiefstal.

Die moontlikhede wat met die versameling in databasisse gepaard gaan, is nogtans baie breër as dit. Tans is tegnologie so gevorderd en “slim” geword dat dit datastelle kan kombineer. Dit kan op so ‘n slim en listige manier gedoen word dat groot maatskappye en organisasies waarskynlik meer van u weet as wat u doen! Wie jy is, waar jy woon, wat jou stokperdjies is, wie jou vriende is: geeneen van hierdie inligting sal langer privaat wees nie. Dink jy miskien nie ‘n baie gerusstellende gedagte nie. Gelukkig is daar ‘n paar maniere om uself te beskerm teen die grootskaalse inbreuk op privaatheid wat groot data kan veroorsaak.

Wette op privaatheid

Koekies op die skermWette en regulasies op privaatheid kan ons beskerm teen privaatheidskending, maar slegs tot ‘n sekere mate. Om sake meer ingewikkeld te maak, verskil privaatheidswette dikwels baie tussen verskillende lande en streke. In Europa is daar byvoorbeeld ‘n betreklik streng wetgewing oor die beskerming van verbruikers, die Algemene Verordening op die Beskerming van Data (GDPR), van krag. Hierdie wet is van toepassing op alle EU-lidlande, hoewel die besonderhede per land kan verskil. Baie internasionale ondernemings het besluit om al hul sake na die BBP te hou. Dit is waarom Google byvoorbeeld gebruikers nou toelaat om persoonlike inligting te verwyder. Privaatheidswette in die Verenigde State verskil egter van staat tot staat en beskerm nie die verbruiker sowel as die EU nie. Ongelukkig geld dit selfs vir die strengste privaatheidswetgewing in die VSA, die Wet op Verbruikers privaatheid in Kalifornië.

Kortom, daar bestaan ​​nie ‘n sterk ‘globale’ privaatheidswet wat op alle versamelaars van groot data van toepassing is en alle gebruikers beskerm nie. Dit beteken dat ons privaatheid nie net onwettig deur groot data-versamelaars benadeel word nie, maar selfs op volkome wettige maniere, so paradoksaal soos dit mag klink. Gelukkig het grootskaalse privaatheidskendings wat deur fluitjieblasers soos Edward Snowden en Chelsea Manning blootgestel is, die bewustheid vir die risiko’s van groot data grootliks verhoog. Dit is natuurlik slegs ‘n eerste stap in die verbetering van die huidige privaatheidswette.

Baie internetgebruikers is nie bereid om te wag vir ‘n verbetering in privaatheidswette nie – en met reg. Inteendeel, hulle wil self optree deur alles in hul vermoë te doen om hul privaatheid te beskerm. Wil u ook vermy om deel te word van ontelbare groot datastelle? Daar is verskillende wenke en truuks om u op pad te help.

Hoe u kan voorkom dat u data in groot datastelle gestoor word

Groot datastelle beïnvloed u privaatheid en veiligheid. Hierdie datasets bevat moontlik allerhande (persoonlike) inligting wat deur groot ondernemings of selfs kubermisdadigers misbruik kan word. Daarom moet u altyd sorg dat u so min as moontlik van die aanlyn spoor agterbly. Die volgende wenke kan u help om dit te bereik:

  • Probeer om u persoonlike inligting te minimaliseer as u wagwoorde of in die algemeen op die web skep. Byvoorbeeld: vermy die gebruik van u naam, adres, telefoonnommer, geboortedatum, ensovoorts.
  • Onthou altyd die volgende: alles wat u op die internet publiseer, sal vir ewig daar wees. Dit is moontlik nie altyd heeltemal waar nie, maar hierdie vlak van versigtigheid help om u privaatheid te beskerm. U sal u privaat data outomaties met groter omsigtigheid hanteer sodra u daarvan bewus is.
  • Sorg dat u internetverbinding veilig en anoniem is, byvoorbeeld deur byvoorbeeld die Tor-blaaier of ‘n VPN te gebruik.
  • Gebruik een of meer advertensieblokkeerders in u blaaier.
  • Gebruik op of meer blaaierinvoegprogramme wat spoorsnyers en koekies blokkeer.
  • Maak u kas gereeld skoon en vee u blaaigeskiedenis en koekies uit.
  • Meld by webwerwe af as u hulle nie aktief gebruik nie.

Hierdie stappe is ‘n goeie begin as dit kom by die beskerming van u aanlyn privaatheid en sekuriteit. Hou egter in gedagte dat groot data op baie verskillende maniere versamel word – nie net aanlyn nie. Kortom, waar jy ook al is en wat jy ook al doen, moet jy altyd waaksaam wees en probeer om jou (persoonlike) data teen groot data-versamelaars te beskerm.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me