Politie las EncroChat-berichten met deeplearningmodel van NFI

Close-up van een CPU op een moederbord

Het Nederlands Forensisch Instituut (NFI) heeft een belangrijke rol gespeeld bij het lezen van de miljoenen EncroChat-berichten die de Nationale Politie afgelopen jaar buitmaakte. Het onderzoeksinstituut ontwikkelde hiervoor een deeplearningmodel, waarmee specifieke informatie uit grote hoeveelheden data gefilterd kon worden. Hiermee kon de politie bepalen welke berichten een serieuze bedreiging bevatten, en welke berichten niet of minder relevant waren.

Dat schrijft het NFI in een persbericht.

Politie vergaart miljoenen berichten via EncroChat

In juli 2020 slaagde de politie er samen met haar Franse collega’s in om de versleutelde berichtendienst EncroChat te kraken. Agenten konden tussen april en juni live meeluisteren met criminelen. “Het was alsof we bij de criminelen aan de vergadertafel zaten”, zo vertelde Jannine van den Berg, politiechef van de Landelijke Eenheid, destijds. In totaal wist de politie meer dan twintig miljoen vertrouwelijke berichten buit te maken voordat ze versleuteld werden door de berichtendienst.

De politie verzamelde namen, foto’s en berichten van verdachten. Door de boodschappen van criminelen door te nemen, leerde de politie meer over de werkwijze van de boeven. Verder wisten agenten de hand te leggen op versleutelde databases en wachtwoorden, en de financiële administratie van EncroChat. Andy Kraag, hoofd van de Dienst Landelijke Recherche, noemde het onderscheppen van de berichten een “gamechanger voor de opsporing”.

Politie arresteert honderd verdachten na afluisteren EncroChat

In de daarop volgende weken arresteerde de politie honderd verdachten van zware delicten. Verder ontmantelden agenten negentien drugslaboratoria, haalden ze tientallen vuurwapens van straat en legden ze beslag op achtduizend kilo cocaïne, twaalfhonderd kilo crystal meth en bijna twintig miljoen euro aan contant geld.

Over de rechtmatigheid van de EncroChat-actie wordt volop gediscussieerd. Volgens de Britse National Crime Agency (NCA) het had Joint Investigation Team (JIT), dat geleid werd door Nederlandse en Franse agenten, in het grootste geheim software laten bouwen om EncroChat-berichten stiekem af te luisteren. Via een server van EncroChat werd deze stiekem op de telefoons van 50.000 klanten geïnstalleerd, werd data gekopieerd en doorgestuurd naar een server in Frankrijk. Hierover is het laatste woord nog niet gezegd.

NFI ontwikkelde deeplearningmodel om EncroChat-berichten te analyseren

Het Nederlands Forensisch Instituut (NFI) speelde een prominente rol in het analyseren van de tientallen miljoenen EncroChat-berichten. Deze handmatig doorzoeken en lezen is monnikenwerk. Of zoals het NFI het uitdrukt: “Het is zoeken naar een speld in een hooiberg”. Bij mogelijke moord- en terroristische aanslagen en andere gewelddadigheden is echter haast geboden.

Het team voor Forensisch Big Data Analyse (FBDA) van het NFI bouwde een deeplearningmodel om drugs gerelateerde berichten te herkennen in de berg aan berichten die verdachten aan elkaar stuurden. Vergelijkbare technieken werden vervolgens toegepast om doodsbedreigingen, martelpraktijken en andere levensbedreigende situaties te herkennen. Dit model was op 1 april gereed, de datum dat de eerste EncroChat-berichten bij de politie binnenstroomden.

Zo werkt deeplearning

Deeplearning is simpel gezegd een verzameling van technieken om computers de Nederlandse taal te leren herkennen. Dergelijke complexe structuren, die gebaseerd zijn op het menselijke brein, worden ook wel neurale netwerken genoemd. Door computers genoeg voorbeelden voor te schotelen en deze van een context te voorzien, leren ze de semantiek van het Nederlands.

De computers werden eerst geleerd om krantenartikelen en lemma’s op Wikipedia te lezen. De manier waarop daar geschreven wordt, verschilt uiteraard hoe criminelen met elkaar communiceren. Om deze kloof te overbruggen hebben medewerkers van het NFI samen met de politie woordenlijsten gemaakt met signaalwoorden: woorden die boeven kunnen gebruiken om mishandeling, ontvoering of moordaanslagen aan te duiden. Dan kun je denken aan woorden als ‘dood’, ‘slapen’, ‘poppen’, ‘afknallen’ of ‘verdwijnen’.

Vervolgens deed het NFI hetzelfde voor het Engels en het Frans. Daarbij kreeg ze hulp van Europol. De Europese inlichtingenorganisatie vervult veelal een coördinerende taak als politie-eenheden uit meerdere EU-lidstaten aan dezelfde zaak werken.

Politie waarschuwt tientallen mensen

Met de samengestelde woordenlijsten verrichtte de politie een eerste trainingsronde in de miljoenen EncroChat-berichten. De gevonden resultaten kregen vervolgens het label ‘dreigend’ of ‘niet-dreigend’. Vervolgens voerden medewerkers van het NFI tienduizenden van deze geclassificeerde zinnen toe aan het deeplearningmodel. De politie zette daarna het model in om levensbedreigende inhout te herkennen. Deze resultaten werden gecheckt, nogmaals gelabeld en opnieuw ingevoerd in het model. Zo werd de computer die de politie helpt bij het ontcijferen en analyseren van de EncroChat-berichten steeds slimmer.

Het NFI benadrukt dat hoe intelligent het deeplearningmodel ook is, het onmogelijk is om honderd procent garantie te geven dat hij altijd zijn werk doet. Een algoritme kan dingen over het hoofd zien. Dit zijn zogeheten ‘blind spots’. Daarom geeft het model bij ieder bericht een cijfer tussen de nul en één mee. Hoe dichter bij de één, hoe groter de kans is dat het om een bericht met levensbedreigende inhoud gaat.

Nadat het deeplearningmodel was ontwikkeld, nam de politie het in gebruik. Daarvoor richtte ze een speciale taskforce op: het Threat To Life of TTL-team. Agenten die deel uitmaakten van dit team doorzochten de buitgemaakte EncroChat-berichten. Met behulp van dit model waarschuwde de politie tientallen mensen voor zware mishandeling, ontvoering of liquidatie.

Of de politie het door het NFI ontwikkelde deeplearningmodel in de toekomst gaat gebruiken voor andere zaken, is onbekend.

Privacy en security redacteur
Techliefhebber pur sang: Anton is gek op alles wat met technologie en internet te maken heeft. Cybersecurity, privacy en internetcensuur hebben dan ook zijn volle aandacht. 
Plaats een reactie
Een reactie plaatsen