Home - Pagina - Wat is big-data (en hoe schaadt het je privacy)?

Wat is big-data (en hoe schaadt het je privacy)?

Wat is big data?

Wat is big data?

Big data staat voor zeer grote verzamelingen van gegevens, die door hun omvang (na analyse) patronen en statistieken achter de ruwe data kunnen opleveren. Big data voldoet meestal aan de volgende eigenschappen (de 3 v’s):

  • Volume: big data is geen steekproef, het is een kwestie van (ogenschijnlijk eindeloze) observatie en registratie.
  • Velocity: snelheid, big data is vaak direct beschikbaar (in real-time).
  • Variety: big data komt voort uit allerlei soorten gegevens en lost vaak missende gegevens op door middel van fusie van data.
  • Machine learning: big data is perfect om patronen mee te detecteren vanwege de grote van de datasets.
  • Digitale vingerafdruk: big data komt vaak voort als bijproduct van digitale activiteit.

Wat zijn de soorten big data?

Momenteel bestaat er geen duidelijke classificatie van typen big data. Een indeling die soms wordt gemaakt is naar herkomst van de big data:

  1. Door mensen gegenereerd, zoals boeken, foto’s, video’s en in deze tijd met name informatie op websites en sociale media (Facebook, Twitter, Linkedin, Instagram etc.)
  2. Door registratie van processen vergaarde data. Dit zijn de meer traditionele vormen van big data die in de bedrijfswereld worden vergaard om bijvoorbeeld processen te optimaliseren.
  3. Machine-gegenereerde big data. Dit type big data komt voort uit de exponentieel groeiende hoeveelheid sensoren in machines. De output van deze data is door machines gegenereerd en kan zeer simpel tot erg complex zijn. Deze gegevens zijn vaak goed gestructureerd en compleet.

Is big data gevaarlijk?

Big data kent diverse (potentiële) risico’s. De belangrijkste vijf risico’s van big data zijn:

  • Veiligheid van data: datalekken en digitale inbraken / diefstallen nemen fors toe. Hoe “bigger de data”, hoe interessanter deze data is voor potentiële dieven.
  • Privacy van data: bij het aanleggen van grote databestanden is de kans groot dat er privacygevoelige informatie tussen zit. Deze privacygevoelige data vormt niet alleen een risico als het gestolen wordt, maar ook als het misbruikt wordt door de eigenaar van de big dataset.
  • Slechte data-analyse: big data sets bieden de mogelijkheid om er interessante analyses op los te laten en nieuwe inzichten te vergaren. Maar net als bij analyse en onderzoek van normale datasets, brengt verkeerde interpretatie en analyse van big datasets grote potentiële risico’s met zich mee. Analyse van grote datasets kan namelijk tot verkeerde conclusies leiden, indien de data verkeerd wordt geanalyseerd of de resultaten verkeerd geïnterpreteerd worden.
  • Slechte data: met de sterk toenemende registratiedrift is er een tendens ontstaan waarin men graag zoveel mogelijk registreert en later pas nadenkt over eventuele analyses. Hierdoor loop je het reële risico dat verkeerde of irrelevante data wordt verzameld en geanalyseerd. Dit leidt weer tot het uitblijven van resultaten of het trekken van verkeerde conclusies.
  • Registratie big data met verkeerde intenties: het verzamelen van big data wordt ook steeds meer door bedrijven, instanties en overheden gedaan met het oog op het aanleggen van profielen van personen. Hierbij wordt er in vrijwel alle gevallen te weinig naar de gebruikers / burgers gecommuniceerd wat, hoe en waarom persoonsgegevens en privédata wordt geregistreerd. Dit heeft op grote schaal grote en negatieve gevolgen voor de privacy van particulieren.

Big data en privacy

Het verzamelen van big data neemt sterk toe. Big data kan vele voordelen bieden, maar het feit dat er steeds meer en makkelijk, vaak in het geheim, geregistreerd wordt heeft ook grote implicaties op privacyniveau. Het aanleggen van persoonsprofielen voor advertentiedoeleinden (denk aan Google, Facebook, Twitter en andere advertentienetwerken) en het volgen van burgers (denk aan overheden en geheime diensten) is voor steeds meer bedrijven en instellingen hun corebusiness geworden. Door de digitalisering van de samenleving wordt dit ook steeds makkelijker. Daarnaast zijn deze registratieactiviteiten steeds makkelijker in het geheim te doen.

Deze bijzonder sterk toenemende registratiedrift leidt ertoe dat men steeds minder goed op de hoogte is van de gegevens die verschillende bedrijven en instellingen van ze hebben. De hoeveelheid en soort data die bedrijven en instellingen van je hebben neemt steeds meer toe. Door samenvoegen van deze datasets en verdere analyse komen er nog meer privacygevoelige gegevens en informatie naar boven.

De impact van deze big datasets op je privacy is dus groot. De huidige (privacy-)wetgeving is ook nog niet goed aangepast aan dergelijke grote datasets waardoor er vaak zelfs legaal privacy-schendende activiteiten plaatsvinden. Naast deze legale activiteiten hebben de recente lekken van onder andere Edward Snowden en Chelsea Manning grote illegale big dataregistratie aan het licht gebracht.

Hoe voorkom je online opgenomen te worden in big data sets?

Big data sets kunnen in veel gevallen dus problematisch voor je privacy en veiligheid zijn. Het beste kun je zoveel mogelijk voorkomen dat er data van je wordt opgeslagen. Hiervoor zijn een aantal algemene adviezen van kracht:

  • Gebruik online zo min mogelijk je echte gegevens (naam, adres, telefoonnummer, e-mailadres etc).
  • Onthoud de volgende stelregel: “alles wat je op het internet zet, blijft er voor altijd op staan”. Houd deze gedachte in je achterhoofd, dan beperk je automatisch de hoeveelheid privégegevens die je deelt.
  • Zorg ervoor dat je internetverbinding beveiligd en geanonimiseerd is, bijvoorbeeld door middel van de Tor browser of een VPN.
  • Gebruik één (of enkele) advertentie-blokkerende browser plug-ins.
  • Gebruik één (of enkele) browser plug-ins die trackers en cookies blokkeren.
  • Wis regelmatig je tijdelijke internetbestanden en cookies.
  • Log uit op sites als je ze even niet meer gebruikt.
in Privacy

Related Articles

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *