Big Data Verbindingen

Big Data en privacy

Laatst bijgewerkt: 27 februari 2019
Leestijd: 10 minuten, 25 seconden

Er is de afgelopen decennia ontzettend veel veranderd in de wereld. Met de komst van het internet hebben we op een hele andere manier naar het leven leren kijken. Deuren gingen voor ons open en er poppen ook nu nog constant nieuwe mogelijkheden op. Woorden als ‘big data’ horen we steeds vaker. Wat bekent dat nu eigenlijk? Wat is big data? Is het gevaarlijk? En wat voor effect heeft het op onze privacy? Dat zijn de vragen die we in dit artikel bespreken.


Wat is big data?

Smartphone met locatiemarkerMet big data bedoelen we de gigantische collecties gegevens die constant verzameld worden. Denk bijvoorbeeld aan alle informatie die Google heeft over de zoekopdrachten van zijn gebruikers. Deze verzamelingen zijn zo groot en complex dat ze lastig op de traditionele manier te analyseren zijn. Big data bestaat omdat er steeds meer informatie over ons wordt vastgelegd. Nieuwe technologieën, digitalisering en met name het internet maken dit mogelijk. Als je big data-gegevens op de juiste manier analyseert, kun je bepaalde patronen en statistieken ontdekken. Zo wordt big data vaak gebruikt om voorspellend marktonderzoek te doen: welke producten zullen klanten sneller kopen? Wat voor advertenties zijn het effectiefst?

Big data voldoet meestal aan de volgende eigenschappen, ook wel de drie v’s genoemd:

  • Volume: Big data is geen steekproef. Het is een kwestie van (ogenschijnlijk eindeloze) observatie en registratie.
  • Velocity: Dit gaat over de snelheid waarmee de informatie wordt verzameld. Big data is vaak direct en in real-time beschikbaar.
  • Variety: Big data komt voort uit verschillende soorten gegevens en lost vaak missende informatie op door data te combineren.

Naast de drie v’s heeft big data nog een aantal kenmerken. Zo is het perfect voor machinaal leren: dit betekent dat computers en andere vormen van kunstmatige intelligentie van de data kunnen leren. Vanwege de grote datasets kun je met big data erg goed patronen detecteren, wat door computers gedaan wordt. Ook komt big data vaak voort uit een digitale vingerafdruk. Dit betekent dat het een bijproduct van digitale activiteit is.


Welke soorten big data zijn er?

Big data kan op verschillende manieren ingedeeld worden. De eerste en meest gebruikte verdeelt big data afhankelijk van het soort informatie dat verzameld wordt. De drie mogelijke categorieën hiervoor zijn gestructureerde big data, ongestructureerde big data en semi-gestructureerde big data.

  1. Gestructureerd: Wanneer big data gestructureerd is, kan het in een vaste vorm worden opgeslagen. De informatie is georganiseerd. Hierdoor is het toegankelijker en makkelijker om in te zien. Een voorbeeld is een adressenlijst die op de database van een bedrijf staat. Hier staan namen, telefoonnummers en woonplaatsen van alle werknemers op een geordende manier opgesomd.
  2. Ongestructureerd: Ongestructureerde big data is niet logisch of georganiseerd. Er ontbreekt vorm die betekenis aan de gegevens geeft. Omdat het geen logica heeft, is het een stuk moeilijker te navigeren en begrijpen dan gestructureerde data. Over het algemeen is een groot deel van verzamelde big data in eerste instantie ongestructureerd.
  3. Semi-gestructureerd: Semi-gestructureerde data is gestructureerde data die deels ongestructureerd is. Het is dus een combinatie van de twee eerdergenoemde vormen. Het is niet volledig willekeurig, maar ook niet netjes gerangschikt in een database voor goede analyse. Een voorbeeld is een Word-document dat speciale metadata tags heeft, bijvoorbeeld omdat er bepaalde trefwoorden in voorkomen. Het document zelf is in principe ongestructureerd, terwijl de trefwoorden en andere metadata het toch enigszins gemakkelijk te analyseren maken.

Een tweede indeling die soms wordt gemaakt is afhankelijk van wie de big data heeft geleverd. Hoe is de data verzameld? Ook dit kan op drie verschillende manieren:

  1. Door mensen: Denk hierbij aan boeken, foto’s, video’s en informatie op websites en sociale media zoals Facebook, Twitter, Linkedin, Instagram, enzovoort.
  2. Door registratie van processen: Dit zijn de meer traditionele vormen van big data die in de bedrijfswereld worden vergaard om bijvoorbeeld werkprocessen te optimaliseren.
  3. Door machines: Dit type big data komt voort uit de groeiende hoeveelheid sensoren in machines. De output van deze data is door machines gegenereerd en kan erg simpel of ontzettend complex zijn. Deze gegevens zijn vaak goed gestructureerd en vormen een compleet plaatje.

Wat kun je met big data doen?

Facebook LogoAl deze informatie klinkt vast nogal cryptisch. Laten we het eens naar de praktijk brengen. Er zijn heel veel verschillende manieren waarop big data gebruikt kan worden. Wellicht denk je als eerste aan de massa’s informatie die grote internetbedrijven zoals Google, Facebook, Spotify en Amazon verzamelen. Facebook houdt data bij over al zijn gebruikers en bepaalt daarmee wat jij op je tijdlijn te zien krijgt, in de hoop dat dat aansluit op jouw interesses en je dus langer op de website blijft. Amazon verzamelt informatie over de pagina’s die klanten bezoeken en de producten die ze kopen. Daarmee kan Amazon suggesties geven, in de hoop zo meer geld te verdienen.

Big data wordt echter ook op andere manieren gebruikt. Zo verzamelt de NS informatie over de drukte op verschillende treinen en trajecten. Met deze data besluiten ze vervolgens waar ze extra treinen in willen zetten en hoe de nieuwe dienstregeling eruit komt te zien. Een ander bekend voorbeeld komt van UPS. De wereldwijde koeriersdienst gebruikt al een tijdje speciale software die voortgekomen is uit big data. Daarmee worden bochten naar links op hun route vermeden, omdat die gevaarlijker en duurder zijn. Met dit systeem bespaart UPS per jaar zo’n $300 tot $400 aan benzine.


Is big data gevaarlijk?

Big data is dus in veel gevallen ontzettend handig. Het geeft ons boordevol informatie. Deze informatie kunnen we gebruiken om processen te verbeteren, onze aanpak te veranderen of zelfs een bedrijf beter te laten lopen. Dit betekent niet dat het vergaren en gebruiken van big data geen nadelen heeft.

De belangrijkste vijf risico’s die big data met zich meebrengt zijn:

  • Hackers en dieven: Bij alles wat we online doen, moeten we stilstaan bij de mogelijkheid dat die informatie gestolen wordt. Het aantal datalekken en digitale inbraken of diefstallen is over de jaren fors toegenomen. Er zijn regelmatig berichten over nieuwe datasets met wachtwoorden die online verkocht worden. Deze zijn meestal gestolen van de databases van officiële instanties, websites en bedrijven. Hoe “bigger” de data, hoe interessanter het voor potentiële dieven is om hier achteraan te gaan. Met deze data kunnen ze grote problemen veroorzaken en een flinke inbreuk op je privacy maken.
  • Privacy: Het verzamelen van gegevens gebeurt steeds vaker. Hoewel de technologie steeds verder vooruit gaat, zijn er niet altijd duidelijk regels over hoe dit in verband staat met privacy. Welke informatie mag er verzameld worden? Over wie? En wie heeft er toegang tot die data? Bij het creëren van grote databestanden is de kans groot dat er ook privacygevoelige informatie verzameld wordt. Dit is gevaarlijk, zelfs al is er geen sprake van hackers of dieven. Privacygevoelige datasets kunnen immers door iedereen misbruikt worden, ook door bedrijven en organisaties.
  • Slechte data-analyse: De reden dat verschillende bedrijven en organisaties big data verzamelen is omdat ze er interessante analyses op los kunnen laten. Hierdoor krijgen ze nieuwe inzichten die ze in de toekomst slim kunnen gebruiken. Maar net als bij het analyseren en onderzoeken van normale datasets, brengt een verkeerde interpretatie en analyse van big datasets grote potentiële risico’s met zich mee. Een foute analyse of interpretatie van grote datasets kan namelijk tot verkeerde conclusies leiden. Met de verkeerde conclusies worden waarschijnlijk ook verkeerde plannen voor de toekomst gemaakt, wat slechte resultaten kan veroorzaken.
  • Slechte data: Big data is erg populair en er is steeds meer wens voor het registreren van informatie. Hierdoor wordt er steeds meer data verzameld waarbij later pas wordt nagedacht over eventuele analyse. Je loopt vervolgens het risico dat je verkeerde of irrelevante data verzamelt en analyseert. Dit leidt weer tot het uitblijven van resultaten of het trekken van verkeerde conclusies.
  • Registratie big data met verkeerde intenties: Het verzamelen van big data wordt ook steeds meer door bedrijven, instanties en overheden gedaan om profielen van personen aan te maken. Hierbij krijgen de gebruikers of burgers in vrijwel alle gevallen te weinig informatie over wat, hoe en waarom hun persoonsgegevens en privédata worden geregistreerd. Dit heeft grote negatieve gevolgen voor hun privacy. Alles wat ze doen, kan opgeslagen worden. Bovendien kunnen de diensten met wat onderzoek en analyse gemakkelijk de beslissingen van mensen beïnvloeden en manipuleren.

Big data en privacy

Smartphone met OorEr zitten flink wat nadelen en risico’s aan het verzamelen van big data. Toch wordt het alsnog op grote schaal gedaan, vooral vanwege de voordelen van big data. Informatie wordt steeds gemakkelijker en in grotere hoeveelheden geregistreerd. Vaak gebeurt dat zelfs in het geheim. Dit heeft grote gevolgen voor onze privacy. We hebben het al even kort gehad over de mogelijke gevaren voor privacy wanneer partijen big data registreren met verkeerde intenties. Omdat privacy zoveel raakvlakken met de verzameling van gegevens heeft, willen we hier echter nog even dieper op ingaan.

Massa dataverzameling

Veel bedrijven, zoals Google, Facebook en Twitter, zijn voor een groot deel afhankelijk van advertenties. Om deze zo effectief mogelijk te gebruiken, maken ze persoonsprofielen aan. Overheden en geheime diensten gebruiken informatie over individuen om burgers te volgen en controleren. Dit soort praktijken zijn voor deze partijen erg belangrijk geworden en maken de kans op manipulatie een stuk groter. Doordat we te maken hebben met steeds meer digitalisering, wordt het verzamelen van gegevens ook steeds gemakkelijker.

Datacollectie gebeurt vaak op manieren waarbij de bezoeker of burger dit zelf niet door heeft. Hierdoor zijn we steeds minder op de hoogte van de gegevens die bedrijven en instellingen van ons hebben, terwijl de hoeveelheid data toe blijft nemen. Door het samenvoegen van datasets en verdere analyse komen er vaak nog meer privacygevoelige gegevens en informatie naar boven. Zo weten bedrijven al snel meer over je dan je mogelijk over jezelf weet. Wie je bent, waar je woont, wat je hobby’s zijn, wie je vrienden zijn: al deze informatie is niet langer privé. Geen fijn idee, zul je vast denken. Gelukkig staan we er niet helemáál alleen voor.

Privacywetgeving

Cookies op beeldschermDe impact van big datasets op je privacy is erg groot. Door middel van officiële wetgeving worden we hier deels tegen beschermd. De AVG (of ‘General Data Protection Regulation’) die in 2018 in de Europese Unie is ingevoerd, is hier een belangrijk onderdeel van. Deze nieuwe privacywet geeft ons meer rechten die bovendien beter worden beschermd. Hierdoor kun je nu bijvoorbeeld een verzoek indienen bij Google om gegevens uit de zoekresultaten te laten verwijderen. Ook worden bedrijven zoals Facebook flink voor het blok gezet met betrekking tot de informatie die ze over hun gebruikers verzamelen.

De huidige (privacy-)wetgeving is helaas nog niet perfect. Vooral bij het verzamelen van big data schiet het vaak tekort, waardoor er zelfs legaal privacy-schendende activiteiten plaatsvinden. Naast deze legale activiteiten hebben de lekken van onder andere Edward Snowden en Chelsea Manning grote illegale gevallen van big data-registratie aan het licht gebracht. Er is dus steeds meer aandacht voor de privacyrisico’s van big data. Dit is de eerste stap in een lang proces naar verbeterde privacywetgeving die past bij deze tijd.

Als het om je privacy gaat, wil je waarschijnlijk niet jaren wachten tot de wet is aangepast. Veel mensen zullen zich dan ook afvragen: wat kan ik zelf doen tegen deze massale dataverzameling?


Hoe word je niet opgenomen in online big datasets?

Big data sets kunnen in veel gevallen problematisch zijn voor je privacy en veiligheid. Er wordt informatie over jou en je (internet)gedrag verzameld. Dit kan tegen je worden gebruikt. Je doet er dus goed aan ervoor te zorgen dat er zo min mogelijk data over je wordt opgeslagen. Er zijn een aantal manieren waarop je dat kunt doen:

  • Gebruik je echte gegevens zo min mogelijk online (zoals je naam, adres, telefoonnummer of e-mailadres).
  • Houdt de volgende gedachte in je achterhoofd: alles wat je op het internet zet, blijft er voor altijd op staan. Dit is misschien niet in alle gevallen volledig waar, maar het helpt wel. Als je hier constant rekening mee houdt, beperk je de hoeveelheid privégegevens die je deelt automatisch.
  • Zorg ervoor dat je internetverbinding beveiligd en geanonimiseerd is, bijvoorbeeld door gebruik te maken van de Tor-browser of een VPN.
  • Gebruik één (of meerdere) advertentie-blokkerende browser plug-ins.
  • Gebruik één (of meerdere) browser plug-ins die trackers en cookies blokkeren.
  • Wis regelmatig je tijdelijke internetbestanden en cookies.
  • Log uit op sites als je ze even niet meer gebruikt.

Deze stappen zijn een goed begin om jouw privégegevens te beschermen. Big data wordt echter op veel meer plekken dan alleen het internet verzameld, dus houd daar rekening mee.

Hoofdauteur:

Meer artikelen uit het ‘Anoniem Browsen’ dossier

Reacties
Plaats een reactie
Een reactie plaatsen

Op zoek naar een VPN?

Bekijk ons overzicht met de meest betrouwbare, snelle en veilige VPN-services.
Uitgebreid getest door experts.

Bekijk welke VPN het beste bij je past