Detail

Big Data en wetgeving: wat mag wel en niet?

8-jan-2015

Privacy en dataveiligheid spelen een belangrijke rol bij Big Data

Tegen deze achtergrond gaan oplossingen voor mobiele locatie-analyse gepaard met allerlei uitdagingen, die steeds vaker de aandacht krijgen van de media. Aan de ene kant is er de vraag naar de wettelijke basis van Big Data als geheel en aan de andere kant moeten we definiëren hoe we gegevens kunnen beschermen die door het rechtssysteem als extra gevoelig worden beschouwd. Hierbij gaat het onder meer om locatie- en gezondheidsgegevens. Voor al deze zaken moet een adequate aanpak worden gevonden die ervoor zorgt uw Big Data oplossing niet in strijd is met de wet. 
Het is niet mogelijk om alle Big Data op dezelfde manier te behandelen omdat voor verschillende soorten data verschillende eisen gelden. Deze zijn afhankelijk van het doel waarvoor u de data gebruikt: wilt u algemene, statistische relaties identificeren voor onderzoeksdoeleinden of om uw zakelijke processen te verbeteren? Of hebt u concrete informatie over personen nodig om gerichte aanbiedingen, reclame of services mogelijk te maken? In het laatste geval krijgt u beslist te maken met beperkingen en moet u zich houden aan de privacywetgeving. In het eerste geval is er sprake van een grijs gebied. Als u alleen informatie over het gedrag van een zo groot mogelijke groep mensen nodig heeft, dan is er meer toegestaan dan wanneer u gaat werken met persoonlijke gegevens. In het laatste geval hebt u te maken met de hoge eisen van de privacywetgeving. U mag alleen persoonlijke gegevens verwerken voor een concreet doel dat wettelijk is toegestaan en na toestemming van de betreffende persoon. Bij Big Data-applicaties is dit moeilijk te controleren. Bij Big Data worden enorme hoeveelheden informatie gebruikt – doorgaans om patronen te herkennen – waarvan de details vooraf niet bekend of kenbaar zijn. Daardoor is het moeilijk om het doel van het gebruik van de informatie in Big Data-applicaties te definiëren of de noodzaak ervan aan te tonen. 
Motionlogic, een dochter van Deutsche Telekom, is een organisatie die zich bezig houdt met het detecteren en analyseren van overkoepelende, statistische patronen binnen bevolkingsgroepen. De privacywetgeving impliceert dat in dit geval het gebruik van data zoveel mogelijk moet worden vermeden of beperkt en dat de privacy voorop moet staan door geen gedetailleerde persoonlijke gegevens te gebruiken of te verwerken. Dat is precies wat de oplossing die Motionlogic gebruikt doet. Het is niet mogelijk om individuele personen te identificeren op basis van de ruwe data die de Big Data-applicaties gebruiken. De gegevens worden niet opgeslagen of bewaard voor toekomstig gebruik. Ze worden slechts eenmaal real-time geanalyseerd om geaggregeerde statistische inzichten te genereren. Deze maatregelen voorkomen dat er op enig moment inzicht in persoonlijke gegevens kan worden verkregen, zelfs niet met technische middelen en met grote inspanning. 

Anoniem genoeg?

Zodra uw data voldoende is geanonimiseerd, hoeft u zich geen zorgen meer te maken over gegevensbeveiliging. Maar op welk moment is informatie voldoende geanonimiseerd? Hierbij gaat het niet alleen om de wetgeving, maar ook om de technologie. De overheidsorganisaties in de EU-landen die verantwoordelijk zijn voor gegevensbescherming hebben een werkgroep gevormd om te evalueren welke anonimiseringstechnieken goed werken en waar problemen kunnen optreden. Uit hun rapport blijkt duidelijk dat voor betrouwbare anonimisering meerdere stappen nodig zijn. Wij zijn van mening dat Motionlogic veel van deze technieken gebruikt. Er wordt slechts een beperkte hoeveelheid van de algemene informatie uit de ruwe data vastgelegd, zoals de leeftijdsgroep en het geslacht van een persoon en de regio waarin hij of zij woont – verder niets. Aggregatie van de data tijdens analyse in een grotere datapool verhoogt de anonimiteit. Bovendien – en dit is van groot belang – zijn de ruwe data slechts tijdelijk beschikbaar; Motionlogic slaat ze niet op. Daardoor is er slechts een korte periode waarin het mogelijk zou zijn om individuele personen met behulp van technische middelen te identificeren. 

Onafhankelijke toetsing

Uit juridisch oogpunt blijft de vraag echter bestaan of het theoretisch mogelijk is om tijdens analyse ruwe data te herleiden naar een individueel persoon. Om deze reden wordt de oplossing van Motionlogic op dit moment geëvalueerd door overheidsinstellingen en door een onafhankelijke test- en certificeringsorganisatie. Dit proces – en het uiteindelijke resultaat – kan resulteren in een blauwdruk die andere bedrijven kunnen gebruiken als model voor goedgekeurde geanonimiseerde gegevensanalyse.
Een tweede aspect waarmee bij analyse van data rekening moet worden gehouden, vooral als het om mobiele telefoons gaat, is privacy gevoelige informatie over de locatie en verplaatsing van personen. Hiervoor gelden in de wet speciale bepalingen. De basisregel voor telecombedrijven is dat ze de informatie waarover ze beschikken uitsluitend mogen gebruiken voor technische dienstverlening aan de klant en voor factureringsdoeleinden. We hebben het hier niet over een locatie-gebaseerde service die de consument heeft aangevraagd. Wanneer de ruwe data zijn geaggregeerd en geanonimiseerd, hoeft u zich geen zorgen te maken over de privacywetgeving. 

Ga voor transparantie en acceptatie door de klant

Een punt dat blijft bestaan, ongeacht de uitkomst van de externe tests door onafhankelijke instellingen en overheidsorganisaties, is transparantie en acceptatie door de klant. Zelfs wanneer een bedrijf de data zover anonimiseert dat er wettelijk geen verplichting bestaat om de consument te informeren of diens toestemming te vragen, blijft het wenselijk om de klanten te betrekken in een open en eerlijke discussie. Zo krijgt de klant een stem in de ontwikkeling van innovatieve services en is het duidelijk dat het bedrijf veel waarde hecht aan gegevensbeveiliging.