Big data & privacy: Wat zijn de privacyrisico’s? | VPNOverzicht

De afgelopen decennia is de wereld in veel opzichten enorm veranderd, vooral als het gaat om IT. Het aantal mensen waarmee we dagelijks kunnen communiceren is enorm gegroeid, net als de hoeveelheid informatie waartoe we toegang hebben. Hetzelfde geldt echter voor de hoeveelheid informatie die grote bedrijven over ons verzamelen. Termen als big data worden mettertijd steeds vaker gebruikt. Maar wat betekent dit precies? Wat is big data? Is het gevaarlijk? Hoe beïnvloedt het onze privacy, of helemaal niet? Dit zijn enkele van de vragen die we in dit artikel behandelen.


Wat is big data?

Lijst met vergrootglasDe term ‘big data’ beschrijft de enorme hoeveelheden (persoons) data die continu door verschillende actoren worden verzameld. Een voorbeeld is alle informatie die Google verzamelt over de zoekopdrachten van gebruikers. Het fenomeen big data is een relatief recente ontwikkeling die begon omdat (grote) bedrijven en organisaties, zoals Facebook, Google en de meeste overheden, steeds meer gegevens over haar gebruikers, klanten en burgers begonnen te verzamelen dan voorheen. Nieuwe technologieën, een gedigitaliseerde wereld en internet hebben deze ontwikkeling enorm ondersteund.

Verzamelingen van big data zijn vaak zo groot dat het onmogelijk is om ze te analyseren met traditionele data-analyse. Als men big data echter op de juiste manier analyseert, kunnen interessante patronen en conclusies worden opgewekt. Zo wordt big data vaak gebruikt voor grootschalig marktonderzoek: welke producten worden het meest waarschijnlijk gekocht? Wat voor soort reclame is het meest effectief als u klanten wilt bereiken en overtuigen?

Om een ​​dataset als big data te beschouwen, moet deze gewoonlijk voldoen aan de volgende drie criteria, ook wel de 3 v’s:

  • Volume: Big data is allesbehalve een kleine steekproef. Het gaat om enorme gegevensverzamelingen die het resultaat zijn van lange, continue observatie.
  • Snelheid: Dit heeft te maken met de indrukwekkende snelheid waarmee big data wordt verzameld. Bovendien is big data vaak in realtime toegankelijk (zoals het wordt verzameld).
  • Verscheidenheid: Grote datasets bevatten vaak veel verschillende soorten informatie. Gegevens binnen big data-sets kunnen zelfs worden gecombineerd om hiaten op te vullen en de dataset nog completer te maken.

Afgezien van deze 3 v’s heeft big data nog enkele andere kenmerken. Big data is bijvoorbeeld geweldig voor machine learning. Dit betekent dat het effectief kan worden gebruikt om computers en machines bepaalde taken te leren. Bovendien, zoals we al kort hebben besproken, kunnen big data worden gebruikt om patronen te detecteren. Dit gebeurt meestal op een zeer effectieve manier, door middel van computers die aan de data werken. Ten slotte is big data de weerspiegeling van de digitale vingerafdrukken van gebruikers. Dit betekent dat het een bijproduct is van de digitale en online activiteiten van mensen en kan worden gebruikt om individuele persoonlijke profielen op te bouwen.

Verschillende soorten big data

Er zijn verschillende manieren om big data te classificeren. De eerste manier, die het meest wordt gebruikt, maakt onderscheid tussen big data op basis van het soort gegevens dat wordt verzameld. De drie mogelijke categorieën die voor dit type classificatie worden gebruikt, zijn: gestructureerde big data, ongestructureerde big data en semi-gestructureerde big data.

  1. Gestructureerd: Wanneer big data is gestructureerd, kan deze worden opgeslagen en gepresenteerd op een georganiseerde en logische manier, waardoor de data toegankelijker en begrijpelijker worden. Een voorbeeld is een lijst met klantadressen die door een bedrijf zijn gemaakt. In deze lijst vindt u waarschijnlijk de namen, adressen en misschien andere details van klanten, zoals telefoonnummers, allemaal duidelijk gestructureerd in bijvoorbeeld een diagram of tabel.
  2. Ongestructureerd: Ongestructureerde big data is helemaal niet georganiseerd. Het mist een logische presentatie die logisch zou zijn voor de gemiddelde mens. Ongestructureerde big data heeft bijvoorbeeld niet de structuur van een tabel die een zekere samenhang tussen de verschillende elementen van de dataset aangeeft. Daarom is dit type gegevens vrij moeilijk te navigeren en te begrijpen. Veel datasets beginnen aanvankelijk als ongestructureerde big data.
  3. Semi-gestructureerd: Semi-gestructureerde big data heeft, zoals je misschien al geraden had, kenmerken van zowel gestructureerde als ongestructureerde big data. De aard en weergave van dit type gegevens is niet helemaal willekeurig. Toch is het niet gestructureerd en georganiseerd genoeg om ook voor een zinvolle analyse te worden gebruikt. Een voorbeeld is een webpagina die specifieke metagegevenstags bevat (extra informatie die niet direct zichtbaar is in de tekst), bijvoorbeeld omdat deze bepaalde zoekwoorden bevat. Deze tags tonen effectief specifieke stukjes informatie, zoals de auteur van een pagina of het moment waarop deze online is geplaatst. De tekst zelf is in wezen ongestructureerd, maar de trefwoorden en andere metagegevens die het bevat, helpen om het een enigszins geschikte basis voor analyse te maken.

Classificatie op basis van de bron van big data

Een andere veel voorkomende manier om onderscheid te maken tussen verschillende soorten big data is door naar de bron van de data te kijken. Wie of wat heeft de informatie gegenereerd? Net als de vorige versie bestaat ook deze classificatiemethode uit 3 verschillende categorieën.

  1. Mensen: Deze categorie betreft big data gegenereerd door mensen. Voorbeelden zijn boeken, foto’s, video’s en informatie en (persoons) gegevens op websites en sociale media, zoals Facebook, Twitter, Instagram enzovoort.
  2. Procesregistratie: Deze categorie bevat de meer traditionele vorm van big data, die wordt verzameld en geanalyseerd door (grote) bedrijven om bepaalde processen in een bedrijf te verbeteren.
  3. Machines: Dit type big data is het resultaat van het steeds groter wordende aantal sensoren dat in machines wordt geplaatst. Een voorbeeld is de warmtesensor die vaak is ingebouwd in computerprocessors. De door machines gegenereerde data kunnen vaak erg complex zijn, maar in ieder geval is dit type big data over het algemeen goed gestructureerd en compleet.

Waar kan big data voor worden gebruikt?

Facebook-logoAlles wat tot nu toe is besproken, klinkt misschien nog wat abstract. Laten we de zaken wat concreter maken en enkele real-life toepassingen van big data bespreken. Er zijn immers heel veel manieren waarop bedrijven en organisaties big data gebruiken. Een van de eerste dingen die in je opkomt zijn de enorme hoeveelheden gegevens die bedrijven over ons verzamelen. Facebook verzamelt gegevens over al zijn gebruikers en analyseert dit om te beslissen wat je op je tijdlijn wilt zien. Dit wordt uiteraard gedaan om aan uw persoonlijke wensen en interesses tegemoet te komen. Facebook hoopt dat je hierdoor langer op hun website blijft. Amazon verzamelt op zijn beurt informatie over zijn klanten en de producten die ze kopen. Op die manier kan Amazon producten aanbevelen waarvan zij denken dat u hierin geïnteresseerd zult zijn en hun inkomsten op deze manier verhogen.

Big data wordt echter ook gebruikt op een totaal andere manier dan de hierboven beschreven commerciële strategieën. OV-bedrijven kunnen bijvoorbeeld gegevens verzamelen over hoe druk bepaalde routes zijn. Daarna konden ze deze gegevens analyseren om bijvoorbeeld te beslissen voor welke routes extra bussen of treinen nodig zijn. Een ander bekend geval van effectief gebruik van big data betreft de internationale bezorggigant UPS. UPS gebruikt speciale software die is ontwikkeld na big data-analyse. Deze software helpt UPS-chauffeurs bochten naar links te vermijden, wat duurder, verkwistend en gevaarlijker is dan bochten naar rechts. Dit systeem zou UPS al miljoenen liters brandstof hebben bespaard, allemaal dankzij big data.

Een ander interessant voorbeeld van het verzamelen van big data zijn DNA-tests en websites zoals MyHeritage DNA. Deze website beweert dat het u kan helpen “uw etnische afkomst te ontdekken en nieuwe familieleden te vinden” met een eenvoudige DNA-test. Onnodig te zeggen dat dit proces veel gegevensverzameling en kruisverwijzing vereist, waardoor het een andere belangrijke speler is in het verzamelen en gebruiken van big data. “Traditionele”, fysieke DNA-tests omvatten ook een enorme hoeveelheid big data, aangezien bedrijven die deze tests uitvoeren, extreem grote datasets over heel veel mensen zullen krijgen. Het is natuurlijk belangrijk om op de hoogte te zijn van de mogelijke risico’s die gepaard gaan met deze big data-verzamelprocessen. Deze risico’s worden in het volgende deel van dit artikel belicht.

Is big data gevaarlijk?

Zoals hierboven is weergegeven, kunnen big data in veel gevallen ongelooflijk nuttig zijn. Het biedt ons tonnen informatie die we kunnen gebruiken om processen te stroomlijnen en bedrijven efficiënter en winstgevender te maken. Dit betekent echter niet dat het verzamelen en gebruiken van big data volledig zonder risico is. Big data brengt vijf belangrijke risico’s met zich mee. We bespreken ze hier alle vijf.

Hackers en dieven

Bij alles wat we online doen, bestaat het inherente risico dat onze persoonlijke gegevens en informatie over onze internetactiviteiten worden gestolen. Elke internetgebruiker moet hiervan op de hoogte zijn. Het aantal datalekken en diefstallen is de afgelopen jaren drastisch toegenomen. Er zijn vaak verhalen in het nieuws over criminelen die datasets verkopen die wachtwoorden en andere informatie bevatten over plaatsen zoals het dark web. Vaak worden deze datasets gestolen van officiële websites, bedrijven en organisaties. Hoe groter deze datasets zijn, hoe interessanter het wordt voor dieven om ze te proberen te verkrijgen. Als ze deze datasets in handen krijgen, kunnen ze voor veel problemen zorgen. Onnodig te zeggen dat dit ook uw privacy ernstig in gevaar kan brengen.

Privacy

Het verzamelen van persoonsgegevens wordt steeds wijdverbreider. De huidige privacyregelgeving kan de snelle technologische ontwikkelingen die deze praktijk mogelijk maken echter niet bijhouden. Hierdoor blijft er ruimte over voor grijze gebieden en onzekerheden die niet kunnen worden opgelost door naar de wet te kijken. Belangrijke privacykwesties die zich voordoen zijn onder meer: ​​Wat voor soort gegevens mogen worden verzameld? Over wie? Wie moet toegang hebben tot deze gegevens?

Bij het verzamelen van grote hoeveelheden gegevens is de kans groot dat gevoelige persoonlijke informatie in die datasets wordt opgenomen. Dit is problematisch, zelfs als hackers en dieven niet spelen. Privacygevoelige gegevens kunnen immers worden misbruikt door iedereen met slechte bedoelingen. Hieronder vallen (kwaadaardige) bedrijven en organisaties.

Slechte data-analyse

Veel bedrijven en organisaties verzamelen big data, omdat ze die kunnen gebruiken voor interessante analyses. Dit kan hen belangrijke nieuwe inzichten geven in wat ze onderzoeken (zoals bijvoorbeeld consumentengewoonten). Deze inzichten en conclusies kunnen zich op hun beurt vertalen in veranderingen binnen het bedrijf die resulteren in hogere marges en meer winst. Maar net als bij elke andere normale dataset kan een verkeerde analyse van big data ernstige gevolgen hebben. Een verkeerde analyse kan immers gemakkelijk tot verkeerde conclusies leiden. Deze kunnen zich op hun beurt vertalen in ineffectieve of zelfs contraproductieve maatregelen.

De “verkeerde” gegevens verzamelen

Big data wordt steeds populairder en organisaties zijn steeds meer bereid om allerlei soorten data te verzamelen. Dit betekent dat er gigantische hoeveelheden data worden verzameld zonder dat er een duidelijke reden is om ze te analyseren. Met andere woorden, het creëert een enorme database met onbewerkte informatie die voor het geval is verzameld. Bedrijven denken waarschijnlijk dat het eenvoudig genoeg is om al die gegevens te verzamelen, dus kunnen ze het net zo goed doen. Onnodig te zeggen dat dit niet goed is voor iemands privacy. Het kan er zelfs toe leiden dat irrelevante of “verkeerde” gegevens worden verzameld en geanalyseerd. Als de conclusies uit deze analyse worden gebruikt bij het beheer, kan dit leiden tot dezelfde ineffectieve maatregelen als vermeld in de vorige paragraaf.

Big data verzamelen en opslaan met slechte bedoelingen

Het verzamelen van big data wordt steeds vaker gebruikt door bedrijven, organisaties en overheden zodat zij nauwkeurige individuele profielen van mensen kunnen maken. Gebruikers of burgers worden bijna nooit op de hoogte gebracht van welke van hun persoonsgegevens worden geregistreerd, laat staan ​​waarom en hoe. Onnodig te zeggen dat dit ernstige gevolgen heeft voor hun online privacy. Alles wat ze online doen, kan worden opgeslagen en later worden bekeken. Bovendien kunnen verzamelaars van big data gemakkelijk de besluitvorming van mensen beïnvloeden en manipuleren door de verzamelde gegevens te analyseren en te gebruiken.

Big data en privacy

Smartphone met afbeelding van oorZoals u waarschijnlijk wel begrijpt, heeft big data veel nadelen en risico’s. Desalniettemin verzamelen veel bedrijven en organisaties nog steeds op grote schaal gegevens, vooral vanwege de manier waarop het hen kan helpen groeien en vooruitgaan. Big data verzamelen is eenvoudiger dan ooit. Dit heeft grote gevolgen voor onze privacy. We hebben al kort de mogelijke privacygevaren besproken van kwaadwillende partijen die slechte gegevens verzamelen. Omdat onze privacy zo nauw verbonden is met de massale verzameling van persoonlijke gegevens, willen we dit gedeelte gebruiken om de verschillende privacykwesties te bespreken die bij big data horen.

Grootschalige gegevensverzameling

Veel bedrijven, waaronder Google, Facebook en Twitter, zijn sterk afhankelijk van advertenties om zichzelf te onderhouden en winst te maken. Om deze advertenties zo effectief mogelijk te maken, maken deze bedrijven gedetailleerde profielen van hun gebruikers, vooral rekening houdend met hun voorkeuren en interesses. Dit is een vorm van big data. Evenzo zijn overheden en geheime diensten ook afhankelijk van big data. Ze gebruiken deze enorme hoeveelheid informatie om mensen te volgen en te onderzoeken die ze verdacht achten. Dit betekent natuurlijk ook dat er veel big data zijn voor cybercriminelen om in handen te krijgen en misschien zelfs te manipuleren en te misbruiken. Dit kan allerlei privacy- en identiteitsgerelateerde problemen veroorzaken. Een die in je opkomt, is identiteitsdiefstal.

Toch zijn de mogelijkheden die de collectie in databases biedt veel breder dan dit. Tegenwoordig is technologie zo geavanceerd en ‘slim’ geworden dat het datasets kan combineren. Dit kan op zo’n slimme en slimme manier worden gedaan dat grote bedrijven en organisaties waarschijnlijk meer van u weten dan u! Wie je bent, waar je woont, wat je hobby’s zijn, wie je vrienden zijn: geen van deze informatie zal privé meer zijn. Geen erg geruststellende gedachte, zou je denken. Gelukkig zijn er enkele manieren om jezelf te beschermen tegen de grootschalige privacyschending die big data kunnen veroorzaken.

Wetten op privacy

Cookies op het schermPrivacywet- en regelgeving kan ons beschermen tegen privacyschending, maar slechts tot op zekere hoogte. Om de zaken ingewikkelder te maken, verschillen de privacywetten vaak sterk per land en regio. In Europa is bijvoorbeeld een relatief strikte privacywet voor consumenten, de Algemene Verordening Gegevensbescherming (AVG), van kracht. Deze wet is van toepassing op alle EU-lidstaten, hoewel de details per land kunnen verschillen. Veel internationale bedrijven hebben besloten al hun zaken aan de AVG te houden. Dit is de reden waarom Google bijvoorbeeld gebruikers nu toestaat om verwijdering van persoonlijke informatie aan te vragen. De privacywetten in de Verenigde Staten verschillen echter van staat tot staat en beschermen niet zowel de consument als de EU. Helaas geldt dit zelfs voor de strengste privacywet in de VS, de California Consumer Privacy Act.

Kortom, er bestaat niet zoiets als een sterke ‘wereldwijde’ privacywet die van toepassing is op alle big data-verzamelaars en die alle gebruikers beschermt. Dit betekent dat onze privacy niet alleen wordt geschaad door big data-verzamelaars op illegale, maar zelfs op volkomen legale manieren, hoe paradoxaal dit ook mag klinken. Gelukkig hebben grootschalige privacyschendingen die door klokkenluiders als Edward Snowden en Chelsea Manning aan het licht zijn gebracht, het bewustzijn voor de risico’s van big data enorm vergroot. Dit is natuurlijk slechts een eerste stap in het verbeteren van de huidige privacywetgeving.

Veel internetgebruikers zijn niet bereid om te wachten op een verbetering van de privacywetgeving – en terecht. Ze willen liever zelf actie ondernemen door er alles aan te doen om hun privacy te beschermen. Wilt u voorkomen dat u ook deel gaat uitmaken van talloze big data-sets? Er zijn verschillende tips en trucs om je op weg te helpen.

Hoe u kunt voorkomen dat uw gegevens worden opgeslagen in big data-sets

Grote datasets zijn van grote invloed op uw privacy en veiligheid. Deze datasets kunnen allerlei (persoonlijke) informatie bevatten die misbruikt kan worden door grote bedrijven of zelfs cybercriminelen. Daarom moet u er altijd voor zorgen dat u zo min mogelijk online sporen achterlaat. De volgende tips kunnen u hierbij helpen:

  • Probeer het gebruik van uw persoonlijke gegevens te minimaliseren bij het maken van wachtwoorden of in het algemeen op internet. Bijvoorbeeld: vermijd het gebruik van uw naam, adres, telefoonnummer, geboortedatum, enzovoort.
  • Onthoud altijd het volgende: alles wat u op internet publiceert, staat daar voor altijd. Dit is misschien niet altijd helemaal waar, maar dit niveau van voorzichtigheid helpt wel om uw privacy te beschermen. Zodra u zich hiervan bewust bent, gaat u automatisch met meer zorg om met uw privégegevens.
  • Zorg ervoor dat je internetverbinding veilig en geanonimiseerd is, bijvoorbeeld door gebruik te maken van de Tor-browser of een VPN.
  • Gebruik een of meer adblockers in je browser.
  • Gebruik op of meer browser plug-ins die trackers en cookies blokkeren.
  • Wis regelmatig uw cache en verwijder uw browsegeschiedenis en cookies.
  • Meld u af bij websites wanneer u ze niet actief gebruikt.

Het nemen van deze stappen is een goed begin als het gaat om het beschermen van uw online privacy en veiligheid. Houd er echter rekening mee dat big data op veel verschillende manieren wordt verzameld – niet alleen online. Kortom, waar u ook bent en wat u ook doet, u moet altijd waakzaam zijn en proberen uw (persoonlijke) gegevens te beschermen tegen big data-verzamelaars.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me