Dé drie thema’s voor ondermijning in 2020

Na maanden zonder evenementen, groepen mensen of überhaupt maar fysieke meetings was er eindelijk weer ruimte voor een heus congres. Op 16 september jl. organiseerde het Studiecentrum voor Bedrijf en Overheid de 5e editie van het Congres Ondermijning en Georganiseerde Criminaliteit. Strakke handhaving van de 1,5 meterregel kunnen we aan veiligheidsexperts natuurlijk goed overlaten, maar (net)werkt dat ook een beetje? En nog belangrijker: wat zijn de grote thema’s die aan bod kwamen?

Als voormalig promovenda ben ik een behoorlijk doorgewinterde conferentieganger. De conferenties waar ik kwam waren vaak behoorlijk breed van onderwerp (‘evolutionary economics’) en trokken figuren van allerlei pluimage aan. Dat maakt de praatjes fascinerend, maar niet per se relevant. Dit was mijn eerste conferentie die gericht is op professionals in plaats van academici, en waar mensen hun praktijkervaringen delen in plaats van hun papers. Waar ik dus vooral nieuwsgierig naar was: kan ik mijn inzichten tijdens dit congres nu echt toepassen op mijn werk. Daarnaast was ik benieuwd naar wat op dit moment de belangrijkste thema’s rondom ondermijning zijn, en vroeg ik me af hoeveel mensen ik nou echt zou kunnen ontmoeten tijdens een congres op 1,5m afstand.

De ondermijningsthema’s van 2020

Natuurlijk zijn er veel verschillende thema’s aan bod gekomen. Zo is daar altijd de roep om samenwerking en een integrale aanpak. De burgemeesters van Antwerpen en Turnhout zeiden overigens dat ze jaloers waren op de Nederlandse aanpak. Die opmerking illustreert de complexiteit van ondermijning, want des te beter wij het in Nederland doen, des te meer zij last hebben van het resulterende waterbedeffect. Ook wetgeving en het veilig en verantwoord omgaan met privacygevoelige informatie werden veel besproken. Drie thema’s wil ik er specifiek uitlichten: de onzichtbaarheid van ondermijnende criminaliteit, de kanarie in de kolenmijn, en a problem well stated is a problem half solved.

1. Onzichtbaarheid van ondermijnende criminaliteit

Hoewel dit congres eigenlijk voor een Nederlands èn Vlaams publiek bedoeld is, moesten de meeste Vlamingen het in verband met het Coronavirus jammer genoeg laten afweten. Het publiek van dit congres bestond voornamelijk uit medewerkers van (Nederlandse) gemeentes en mensen van de politie. Op de vraag wat volgens de deelnemers nou het meest ondermijnende effect van georganiseerde criminaliteit is, vond ik de antwoorden opvallend eenduidig. Een groot deel van het publiek noemde onzichtbaarheid als meest ondermijnende factor, wijzend op de subtiele manier waarop boven- en onderwereld verstrengeld raken zonder dat we het merken. Veel vormen van ondermijnende criminaliteit gebeuren voor je neus zonder dat je het doorhebt, of vinden plaats achter de voordeur. En, zo merkten verschillende mensen in het publiek op, zelfs als de effecten van ondermijning in sommige gevallen toch zichtbaar worden, blijven de echte daders buiten beeld. Ik kan mij voorstellen dat dit de handhavers en de beleidsmakers in de zaal enorm frustreert. Naast onzichtbaarheid werd ook normvervaging veel genoemd: het langzaamaan normaal worden van abnormaal gedrag.

Zoals ik eerder al zei, heb ik geprobeerd mij af te vragen wat onze rol als data scientists hier kan zijn. Hoewel ik het lastig vind om een thema als normvervaging te duiden, is de onzichtbaarheid van ondermijning natuurlijk iets wat wij ons erg aantrekken. Het op een veilige, betrouwbare en slimme manier verzamelen, analyseren en visualiseren van data kan namelijk een belangrijk instrument zijn, daar waar onze eigen zintuigen te kort schieten!

2. De kanarie in de kolenmijn

De eerste spreker, de Zweedse criminoloog dr. Amir Rostami, wees er al op: let op de vroege signalen, en neem die signalen serieus, ook als ze niet alarmerend zijn of onbetrouwbaar lijken. Rostami noemde dat de aanwezigheid van motorclubs vaak een vroeg signaal van straatbendes zijn. Dat vond ik in eerste instantie moeilijk te geloven, omdat motorclubs een heel andere doelgroep hebben dan straatbendes. Zou het iets te maken hebben met een onderliggende maatschappelijke structuur die criminele subculturen faciliteert? Volgens Rostami niet – volgens zijn onderzoek is er een veel directere link tussen motorbendes en andere groepen lawbreakers zoals voetbalhooligans, gangs, en politieke of religieuze extremisten. Hij analyseerde een ecology of lawbreakers (wat mij als evolutionair econoom slash netwerkanalist bijzonder aanspreekt): een netwerk van personen die samen een misdaad plegen (co-offending), gegroepeerd op de verschillende criminele organisaties die ze aanhangen, en vond iets opvallends: motorbendes hebben een brugfunctie tussen de andere groepen lawbreakers. Motorclubs hebben dus wel degelijk iets te maken met straatbendes: ze vormen een voedingsbodem. Geen wonder dus dat ook Cedric Stuyck, sectiehoofd Georganiseerde Misdaad van Belgisch Limburg, er in zijn verhaal erop wees dat Outlaw Motorcycle Gangs (OMG’s – ja!) een faciliterende rol tussen andere criminele groepen hebben. Een vroeg signaal dat wellicht niet meteen alle alarmbellen doet afgaan is dus het onderzoeken waard, want misschien liggen de relaties complexer dan ze lijken. Ook Shanna Mehlbaum, onafhankelijk onderzoeker en criminoloog, benadrukte dat onderbuikgevoelens eigenlijk altijd terecht blijken te zijn. Deze moeten dus niet worden afgedaan als ongefundeerd of onbetrouwbaar, maar verdienen het om opgepakt te worden. Paul van Miert, de burgemeester van Turnhout zei treffend ‘als het regent in Antwerpen, dan drupt het in Turnhout.’

De bal ligt hier volgens mij voor een groot deel bij data scientists en andere analisten. Zij kunnen namelijk een belangrijke taak vervullen door vroege of onopvallende tekenen te signaleren en, misschien nog wel belangrijker, te onderzoeken wat die tekenen dan zouden kunnen zijn. Signalen zoals flinke toenames in lokale vestigingen van bedrijven uit criminogene branches zijn ons wel bekend, maar er zijn ongetwijfeld ook early warnings waar wij nog niet aan gedacht hebben! Het lijkt mij ook erg interessant om te onderzoeken welke rol data scientists kunnen hebben bij dat ‘onderbuikgevoel’. Per definitie is dat namelijk iets wat moeilijk te duiden is. Kan data helpen om onderbuikgevoelens te onderbouwen? Of kunnen we onderbuikgevoelens op een betekenisvolle manier visualiseren, zodat het de aandacht krijgt die het verdient?

3. A problem well stated is a problem half solved

Ook dit thema werd als eerste benoemd door dr. Amir Rostami. Hij zei dat er vaak te snel naar een ‘oplossing’ wordt gegrepen, zonder dat eerst uitgebreid besproken wordt wat het probleem nou eigenlijk is, hoe groot het probleem is, en voor wie het een probleem is. Ook mijn Nederlandse gesprekspartners tijdens de lunchpauzes herkenden dit. Ik vond dat dr. Robby Roks die aan de Erasmus Universiteit onderzoek doet naar internationaal drugstransport in de haven van Rotterdam een mooi voorbeeld gaf van een problem well stated. Hij werkt met crime scripts – een soort stripverhalen die een model vormen voor veelvoorkomende patronen in criminaliteit (zie ook een van onze eerdere blogs hierover). Voor internationale drugshandel gaf hij daarmee aan dat dit probleem eigenlijk niet één maar drie problemen zijn: ten eerste, drugshandel waar drugs verstopt zit in een container of sporttas, ten tweede drugshandel waarbij drugs verstopt zit in het handelswaar, zoals bananen en ananassen, en ten derde drugshandel waarbij drugs verstopt zit op het schip zelf. Specifiek voor ieder van deze drie patronen kon hij zwakke plekken op de Rotterdamse haven aanwijzen. Ik zou niet durven beweren dat het probleem daarmee half solved is, maar een goed begin is het halve werk. Of ja, minder dan de helft, dus.

Photo by Roman Mager on Unsplash

Ook voor dit thema zie ik een rol weggelegd voor ons als data scientists. Vaak verwacht men van data dat er heel complexe modellen en kamers vol computers nodig zijn om tot nieuwe inzichten te kunnen komen. In de praktijk is dat vaak niet zo: alleen al het zorgvuldig inventariseren van de beschikbare informatie en het op een intelligente manier weergeven ervan kan veel prangende vragen oplossen. Met andere woorden: waar we data kunnen inzetten om bijvoorbeeld te voorspellen waar de volgende drugsdumping kan zijn, zou altijd de eerste stap moeten zijn om te inventariseren hoeveel drugsdumpingen er eigenlijk zijn geweest, wat er gedumpt wordt, waar dat vandaan komt.

Congres in Corona-tijd

Er waren niet meer dan 80 gasten welkom bij dit congres, zodat de afstand te allen tijde goed bewaakt kon worden. In de zalen stonden de stoelen in een strak raster opgesteld. Voor tijdens de pauzes waren stoelen neergezet in de lounge, zodat iedereen plek heeft aan een tafel. Drankjes werden uitgeserveerd aan tafel en niet aan de bar, en borrelhapjes mocht je alleen oppakken met een servetje. Onder het mom van ‘nieuwe mensen leren kennen’ waren alle bezoekers met een oranje of blauwe sticker op hun naamkaartje ingedeeld in twee groepen, met ieder hun eigen designated zone, afgezet met oranje of blauwe ballonnen.

Voor mij, als iemand die nieuw is in deze community, was dat eigenlijk best prettig. Ik hoefde me niet bij drukbevolkte statafels naar binnen te kletsen, en een soepele openingszin ligt altijd klaar (‘wel gek hè, die afstand?’). Het is natuurlijk ook wel echt gek. Waar ik normaal toch zeker een dozijn handen zou schudden bij een evenement zoals dit, waren dat er nu misschien vijf geweest. Waar je normaal voorgesteld zou worden aan elkaars collega’s (‘Daar hebben we Klaas, die doet ook iets met data!’), moet je het nu treffen met je toevallige tafelpartner waar je de hele pauze aan vast zit. (Gelukkig hadden ze voor gezellige gespreksstarters gezorgd voor als je het even niet getroffen hebt – ik had ze niet nodig, gelukkig.)

Voorbeelden van gespreksstarters

Een ander nadeel vind ik dat een deel van de sprekers nu digitaal inbelden. Op zich een goede oplossing natuurlijk, maar het is jammer dat je zo’n spreker dan niet in de pauze kan benaderen om verder te praten. Toch vind ik een congres als deze nu de moeite waard. Dit congres heeft wel laten zien dat het mogelijk is om een fysiek evenement te organiseren op een veilige en verantwoorde manier en dat dat toch zeker beter is dan het digitale alternatief!

Relevante links

Whitepaper

Blogs

Webinars

Design Sprints in tijden van Corona

Wij zien de Design Sprint als een ideale manier om te innoveren en te starten met datagedreven werken in de publieke sector. Bij de oorspronkelijke Shintō Labs Design Sprint is het de bedoeling om met een klein team een aantal dagen intensief met elkaar te werken aan een oplossing in een afgesloten ruimte. Helaas ziet de wereld er in 2020 heel anders uit en is het geen vanzelfsprekendheid meer om fysiek bij elkaar te komen. Dat vergt enige uitdaging met het organiseren van Design Sprints.

Tegelijkertijd biedt het ook kansen om meer interactief en digitaal samen te werken. Wij zijn namelijk van mening dat de Shintō Labs Design Sprint ook online gehouden kan worden, zonder af te doen aan onze belofte: binnen vijf dagen ontwerpen en toetsen we een werkend prototype. Sterker nog, Remote Design Sprints hebben zelfs een aantal stevige voordelen boven fysieke sprints! In deze blog delen wij onze ervaringen, tips en oplossingen voor het doen van online Design Sprints.

Wat is het belangrijkste verschil tussen een digitale en een fysieke Design Sprint?

Wij krijgen regelmatig de vraag of design sprints ook digitaal kunnen. Maar wat is het belangrijkste verschil tussen een digitale Design Sprint en een fysieke Design Sprint? We bespreken in deze blog twee varianten van de design sprint:de fysieke Design Sprint, en de digitale Design Sprint (of remote Design Sprint). Het zal geen verrassing zijn dat het voornaamste verschil tussen een fysieke en een digitale Design Sprint is dat het sprintteam bij een fysieke sprint vijf dagen lang gezamenlijk in één ruimte werkt aan de sprint, terwijl bij een digitale Design Sprint het sprintteam in een digitale ruimte, zoals Teams, Zoom of GoToMeeting, samenkomt. Dat kan nodig zijn omdat het team thuis werkt in verband met het Coronavirus, maar bijvoorbeeld ook omdat verschillende teamleden in verschillende uithoeken van Nederland wonen. Een derde variant is de hybride Design Sprint. Bij een hybride Design Sprint worden bepaalde onderdelen digitaal gedaan en andere onderdelen fysiek, of zijn sommige leden van het sprintteam fysiek aanwezig en anderen digitaal. Naast het gebruik van software zoals Teams zijn er eigenlijk weinig grote verschillen tussen de fysieke en de digitale Design Sprint – de dagindeling, de voorbereiding, en het resultaat zijn bijna hetzelfde.

Shintō Labs Design Sprint

Remote Design Sprint: wat zijn de voor- en nadelen?

De afgelopen maanden hebben we allemaal gemerkt dat als het hele team thuis werkt, brainstorms en andere creatieve sessies vaak worden uitgesteld ‘tot we weer op kantoor zijn’, of toch niet zo soepel verlopen als we gewend zijn. Een (digitale) Design Sprint kan dan goed helpen om de discussie te structureren en om ideeën om te zetten in acties. Natuurlijk vinden wij het ook prettig om een paar dagen samen met een enthousiast team ‘in een hok te zitten’. Intensief samenwerken, kwartjes zien vallen, en het creëren van een goede sfeer zijn inspirerende aspecten van een Design Sprint. We zullen dus niet ontkennen dat een remote Design Sprint qua vibe wat lager scoort dan een fysieke sprint.  We durven wel te beweren dat het inhoudelijke resultaat van een remote Design Sprint – een gedeeld begrip van een complex probleem, een verzameling mogelijke oplossingen, en natuurlijk een gevalideerd prototype – gelijk is aan dat van een fysieke Design Sprint. Een Design Sprint gaat immers niet alleen om het bij elkaar brengen van mensen, maar vooral om het bij elkaar brengen van ideeën, en die passen gelukkig wèl door een glasvezelkabel.

Remote werken: online etiquette

Wellicht voor velen gesneden koek, voor anderen is het altijd nog steeds wennen: het online videobellen. Zeker met een remote Design Sprint is het van belang dat we de etiquette goed volgen om niet afgeleid worden door omgevingsgeluid zoals het balken van een ezel uit de tuin van de buurman (echt!), een slechte verbinding, onnodige discussies en andere ongemakkelijkheden. Bij een fysieke Design Sprint leggen wij ook altijd bij de introductie de ‘spelregels’ uit van de werkdagen. Ook bij Remote Design Sprints gelden spelregels om het geheel effectief en efficiënt (en niet onbelangrijk), plezierig te houden. Dit zijn in de basis de online etiquette voor video bellen en voor de zekerheid zetten wij het nog even op een rijtje:

De Basics

  • Een goede koptelefoon. Een goede koptelefoon schermt omgevingsgeluid en zorgt ervoor dat je je aandacht er beter bij kunt houden.
  • Een eigen laptop/desktop/tablet. In een Remote Design Sprint moet iedereen een eigen device hebben. Zet bij het inloggen van de sessie je volledige naam en je organisatie als ‘naam’ zodat iedereen weet dat jij het bent en alleen jij.
  • Rustige omgeving. Zowel voor jezelf als voor de andere sprint leden is het van belang om in een rustige ruimte te zitten waar niet om de paar minuten mensen binnen lopen of koffie zetten.
  • Een goede Internetconnectie. Zoek een plek op waarbij je voldoende bereik hebt en een stabiele verbinding voor videobeeld. Bij hele belangrijke bijeenkomsten kiezen wij er zelfs voor een verbinding met draad (ethernet) in plaats van draadloos – het zekere voor het onzekere.
  • Webcam aan. Laat weten dat je er bent en dat je er actief bent. Zet je webcam aan gedurende de sessies zodat iedereen je kan zien en weet dat je je aandacht er bij hebt.

Online videobellen: etiquette

Gedurende de sessies

  • Zet je microfoon standaard uit. Zet je microfoon alleen aan als je aan het woord bent. De omgevingsgeluiden kunnen afleiden en het proces en concentratie verstoren.
  • Steek je hand op als je iets wil zeggen/vragen. De Sprint Master ziet de handen en zal vervolgens de beurt geven.
  • Handgebaren voor snelle of eenvoudige terugkoppeling: vaak kan je met een handgebaar als de benodigde terugkoppeling geven. De drie meest gebruikte zijn:
    • Ja / mee eens: duim omhoog
    • Nee / niet mee eens: duim omlaag
    • Twijfel / ik weet het nog niet: hand horizontaal wiegen.
    • Uiteraard kan je zelf veel andere handgebaren bedenken die voldoende duidelijk zijn. Denk aan: wijsvinger voorwaarts roteren (tempo mag iets hoger), handpalm ‘remmen’ (tempo mag omlaag)  , time-out (koffie/bio-break), etc.

Etiquette deel 2: gedurende de sessies

Remote Whiteboards: kijk naar Mural of Mira

Het vertalen van de fysieke Design Sprint naar een remote Design Sprint kent een aantal obstakels. In de eerste plaats hechten we bij een fysieke Design Sprint veel waarde aan whiteboards, post-its, stiften en stapels papier. Er wordt veel getekend en geschreven, zowel door de sprintmaster als door de andere deelnemers, en alles wat we op papier zetten blijft gedurende de hele sprint toegankelijk ter inspiratie. Sinds de komst van software als Mural en Mira is dit gelukkig geen serieus obstakel meer. Deze software levert digitale whiteboards waaraan alle deelnemers vanaf hun eigen computer kunnen bijdragen. Bijkomende voordelen van zulke software is dat er oneindig veel ruimte is; we gebruik kunnen maken van ons eigen Design Sprint template om ons proces te structureren; en we aan het eind van de sprint met één muisklik een overzichtelijke rapportage van de hele sprint kunnen vastleggen!

Screenshot brainstormen met Mural

Andere werkvormen bij Remote Design Sprint

Een ander obstakel is dat het nou eenmaal behoorlijk vermoeiend is om lang achter elkaar achter een beeldscherm te zitten en digitale discussies te voeren. Bij een digitaal gesprek is het altijd net even wat ingewikkelder om te beoordelen of een ander al is uitgepraat, en zijn er meer afleidingen. Om met dit nadeel om te gaan hebben we de werkvormen die we gebruiken bij een design sprint aangepast. Waar we bij een fysieke sprint open gesprekken niet schuwen, proberen we bij een remote design sprint de balans te vinden tussen individuele en collectieve activiteiten. Zo zullen we jullie bijvoorbeeld vragen eerst zelf een aantal sprintvragen op te schrijven en te beoordelen, en deze daarna pas aan de rest van de groep voor te leggen. Daarnaast houden we ook wat vaker pauze.

Een groot voordeel van een remote Design Sprint ten opzichte van een fysieke sprint is dat afstand geen probleem meer is. Dat klinkt triviaal, maar het biedt ongekende voordelen: sprintteamleden hoeven niet samen op één plek te zijn, dus we kunnen sprintteam-leden, experts en testers uit het hele land (en daarbuiten) uitnodigen (!).

Digitale setup voor online Design Sprint

Remote Design Sprint: plezier hebben

Al onze klanten zijn – naast het resultaat – ook altijd zeer te spreken over de energie en het plezier dat ze beleven aan een Design Sprint. Die energie is en het plezier is bij een Remote Design Sprint lastiger vast te houden, maar niet onmogelijk. Een aantal tips en trucs die we hebben gekregen van deelnemers, andere sprint masters en docenten van universiteiten die inmiddels ook bij ons een plek hebben gekregen bij de Remote Design Sprint.

  • Maak een WhatsApp groepje aan om met elkaar in contact te blijven als er bijvoorbeeld een WiFi storing is of je laptop crasht, kan je alsnog met elkaar contact hebben en te laten weten wat er aan de hand is.
  • Werk in sessies van maximaal 45 minuten. Daarna volgt 15 minuten pauze. In die 15 minuten pauze worden soms wat individuele oefeningen gedaan, maar nooit meer dan 10 minuten. Er moet altijd minstens 5 minuten pauze zijn.
  • Wissel online en offline activiteiten af. Permanent naar het scherm kijken is vermoeiend en komt de creativiteit niet ten goede.
  • Probeer geregeld een leuke oefening te doen die niet per se direct iets met de sprint te maken heeft. Denk daarbij aan het maken van een foto van je lunch en die met elkaar delen. Of stel een vraag die iedereen kan beantwoorden met pen en papier en vervolgens het voor de camera houden. Het blijft een uitdaging om de aandacht vast te houden, maar met wat luchtige oefeningen is het goed te doen.

Is een combinatie van remote en fysieke design sprints ook mogelijk?

Jazeker! De Corona-pandemie heeft ons gedwongen met een frisse blik naar onze Design Sprints te kijken, maar het concept van remote design sprinten of hybride design sprinten is niet nieuw voor ons. Zo hebben we gemerkt dat het voor de data scientist die het prototype gaat bouwen nuttig kan zijn om een gedeelte van de design sprint remote aanwezig te zijn. Op die manier kan de data scientist bijdragen aan het sprintproces en tegelijkertijd voorbereidend werk doen voor het bouwen van het prototype, zoals het verzamelen van data of het klaarzetten van een aantal onmisbare onderdelen van het prototype. Ook worden de validatiesessies op dag 5 vaak digitaal gedaan. Dat is handig wanneer we met grote groepen te maken hebben, of bijvoorbeeld met testers vanuit verschillende Nederlandse gemeentes.

 

Sprintmaster Mignon Wuestman bezig met het onderdeel Value Proposition Design

In onze ervaring is het niet ongebruikelijk dat sprintdagen 1 tot 3 fysiek zijn, en sprintdagen 4 en 5 geheel digitaal. In de praktijk bekijken we per sprint wat de goede balans is tussen fysieke en digitale activiteiten. Ons uitgangspunt daarbij is niet dat fysieke design sprints beter zijn dan digitale design sprints: waar sommige onderdelen of werkvormen beter uit de verf komen bij een fysieke bijeenkomst, komen andere onderdelen juist digitaal beter tot hun recht!

Is een remote sprint korter dan een fysieke sprint?

Omdat er bij een remote sprint sneller ter zake wordt gekomen en lange digitale discussies minder inspirerend kunnen zijn, kan het verleidelijk zijn om de Design Sprint in te korten naar 3 of 4 dagen in plaats van 5. Wij raden dit niet aan. De Big Challenge waar we mee aan de slag gaan is immers nog even complex, en het goed verkennen van die challenge en mogelijke oplossingen ervan kost tijd. Daarnaast kost kennismaken met elkaar en de digitale omgeving en effectief en geconcentreerd communiceren via een beeldscherm juist meer tijd dan bij een fysieke sprint. Alleen wanneer het onderwerp van de sprint zich leent voor een ingekort programma, zoals bijvoorbeeld bij een Lens Design Sprint, raden we aan de sprint in te korten.

Als jullie tips hebben voor ons, mail ze naar mij op mignon@shintolabs.nl

Overzicht verschillen fysiek vs remote vs hybride Design Sprint

Meer informatie

Wil je meer weten over (remote) Design Sprinten? Laat het ons dan weten via onderstaand formulier!


Meer digitale content

Wil je automatisch op de hoogte blijven van onze digitale content? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

Relevante links

Whitepapers

Blogs

Academy

Testimonials

Photo credits Chris Montgomery on Unsplash

Masterclass – Het opsporen van verdachte netwerken in gemeentelijke data

Deze maand zijn we gestart met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als text analytics en graph databases.

Het opsporen van verdachte netwerken in gemeentelijke data

In deze editie vertelt data scientist Wesley Brants over over het opsporen van verdachte netwerken in gemeentelijke data. Aanbod komen onderwerpen zoals netwerktheorie, netwerk analyse, crime scripts en organized crime lab. Naast uitleg over de werking van graph databases worden ook voorbeelden uit onze praktijk besproken zoals de case Ondermijning & Fraude bij de gemeente Zaanstad en onze Risico Radar Ondermijning.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Wesley? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

De slides

Master-Class-Netwerkanalyse

 

Relevante links

Andere masterclasses

Blogs

 

Masterclass – Hoe voorkom ik bias in algoritmes

Deze maand zijn we gestart met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als netwerkanalyses en graph databases.

Correctie van bias-versterkende feedbackloops

In deze editie vertelt CTO en Co-founder Eric van Esch over de rol van bias (onbewuste vooroordelen) in algoritmes, of zoals hij dat liever noemt: algoritmische systemen, en wat je daar tegen kunt doen.  Naast theoretische kennis worden ook voorbeelden uit onze praktijk besproken zoals de Milieu Navigator en onze Risico Radar Ondermijning.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Eric? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

De slides

webinar-bias

 

Relevante links

Andere masterclasses

Blogs

 

Hoe je als gemeente kan vernieuwen met data en technologie in 5½ tips

Naast haar werk voor Shintō Labs, verdedigt Mignon Wuestman op 26 juni a.s. haar proefschrift over de evolutie van innovaties voor de Universiteit Utrecht. Zij deed vier jaar lang onderzoek naar de ‘stambomen’ van (wetenschappelijke) innovaties, en werkte op het raakvlak van onder andere complexiteitstheorie, economische geografie en sociologie. In deze blog deelt ze een aantal inzichten uit haar promotieonderzoek en gerelateerde onderzoeken, specifiek binnen de context van de lokale overheid.

Innovatie is een belangrijke drijvende kracht achter bedrijven, overheden en andere maatschappelijke spelers. Het helpt namelijk om maatschappelijke en technische problemen op te lossen, productiekosten te verlagen, je te onderscheiden van anderen, of nieuwe markten aan te boren. Daarnaast speelt innovatie natuurlijk een enorme rol in de wetenschap en in de kunst.

Het bedenken van nieuwe ideeën, het selecteren van goede ideeën, en het daadwerkelijk tot uitvoering brengen van die ideeën is echter niet eenvoudig. Dat komt doordat innovatie per definitie onzekerheid met zich meebrengt. De (maatschappelijke) problemen die we willen oplossen zijn over het algemeen namelijk zo complex dat het onmogelijk is om ze volledig te overzien. Daarnaast kunnen we niet in de toekomst kijken om goed te beoordelen wat het effect van een bepaalde innovatie zal zijn. Het gevolg daarvan is dat het vaak niet mogelijk is om volledig rationele beslissingen te maken, zoals vaak door economen wordt verondersteld. Om ondanks deze onzekerheid toch te kunnen innoveren is dus een belangrijke vraag: hoe kunnen overheden het beste omgaan met de onzekerheid van innovatie?

Innovatie is staan op de schouders van reuzen

In het kort zijn innovaties op de markt gebrachte inventies. Het kan daarbij gaan om producten die je vastlegt in patenten en in een winkel verkoopt, maar ook om wetenschappelijke ontdekkingen die opgeschreven en gepubliceerd worden, of bijvoorbeeld nieuw beleid dat ingevoerd wordt.

Figuur 1: stamboom van innovaties

Het ontstaan van innovatie wordt vaak vergeleken met de evolutie van planten en dieren. Net als in de biologie, zijn termen als ‘mutatie’, ‘fitness’, en ‘selectieomgeving’ ook relevant bij innovaties. Net als in de biologie, is het ook bij innovaties zo dat je verschillende generaties kan onderscheiden, en wordt er informatie doorgegeven van generatie op generatie. In de biologie heb je het dan over DNA, in de innovatietheorie gaat het bijvoorbeeld om producteigenschappen. Waar je in de biologie dus met stambomen, of ‘genealogieën’ kan werken om deze ontwikkeling te visualiseren, kan dat met innovaties dus ook (figuur 1). In het kort geldt voor dat soort netwerken:

  • Ieder bolletje stelt een idee (een innovatie) voor. Zo’n idee kan zijn vastgelegd in een patent, een wetenschappelijk artikel, een beleidsstuk of het brein van een slimme uitvinder of het collectieve brein van een team
  • Ieder lijntje staat voor het erven van bepaalde eigenschappen van idee naar idee
  • Ideeën kunnen eigenschappen erven van meerdere bestaande ideeën. Dat noemen we ‘recombinatie’.
  • Door dit proces ontstaan er paden die divergeren en convergeren, en die daarmee iets zeggen over de evolutie van ideeën.

Precies dit soort netwerken vinden we terug onder wetenschappelijke artikelen en patenten (figuur 2), teams van jazzmuzikanten (figuur 3), en in het geval van mijn thesis, wiskundigen (figuur 4). Naast netwerken van patenten, papers, teams of individuen zijn dit dus ook netwerken van innovaties.

Figuur 2: Citatienetwerk van Ethernet-patenten 1977-2002 (Fontana et al., 2009)

Figuur 3: Netwerk van steden verbonden door jazzmuzikanten-mobiliteit (Phillips et al., 2011)

Figuur 4: Mentorschapsgenealogie van Nederlandse wiskundigen (Wuestman et al., 2020)

Er zijn veel voorbeelden te geven van overheidsprocessen die de recombinatorische aard van innovatie illustreren. Kruisbestuivingen tussen verschillende lokale overheden, afdelingen of teams zijn een goed voorbeeld. Individuele werknemers nemen ook ideeën mee uit eerdere projecten of banen.

Nu je weet dat innovaties voortkomen uit het recombineren van eerdere innovaties, is het niet moeilijk om je voor te stellen hoeveel innovaties er mogelijk zijn. In theorie kan ieder ‘bolletje’ gecombineerd worden met ieder ander bolletje. We kunnen er echter niet vanuit gaan dat ieder van die combinaties ook een goed idee oplevert (of, in evolutionaire termen: een hoge ‘fitness’ heeft). Sterker nog, dikke kans dat de overgrote meerderheid geen goed idee is. Als innovator ben je dus op zoek naar een speld in een hooiberg. Hoe voorkom je dat je je blind staart op het hooi, en zo snel mogelijk die speld vindt?

1. Bepaal je doel

Er zijn verschillende types innovaties. Grofweg onderscheiden we er twee: incrementele en radicale innovaties.

Incrementele innovaties zijn kleine veranderingen die ons idee over ‘hoe de wereld in elkaar steekt’ in stand houden. Het zijn verbeteringen aan bestaande eigenschappen die bijvoorbeeld de gebruiksvriendelijkheid vergroten of het productieproces versnellen. Als we incrementele innovaties bekijken vanuit het evolutionaire perspectief dat ik hierboven heb uitgelegd, kun je incrementele innovaties vaak zien als recombinaties van ideeën die op elkaar lijken. Combineer bijvoorbeeld de goede eigenschappen van bolletje #9 met de goede eigenschappen van bolletje #10 met elkaar. In lokale overheden komen natuurlijk veel innovaties voor, waaronder veel incrementele innovaties. Zo kan een gemeente bijvoorbeeld de aanpak van een andere gemeente overnemen, maar deze aanpassen naar de lokale omstandigheden.

Radicale innovaties zijn grote veranderingen die wel onze aannames over de wereld op het spel zetten. Radicale innovaties leiden tot nieuwe paradigma’s. Vanuit evolutionair perspectief kan je zeggen dat radicale innovaties tot belangrijke nieuwe vertakkingen in een netwerk van ideeën leiden. Vaak zijn radicale innovaties tot stand gekomen door recombinaties van heel diverse ideeën: bolletjes die in het netwerk heel ver uit elkaar liggen, zoals bolletjes #10 en #16. Natuurlijk komen ook radicale innovaties voor in de overheid. Dit gebeurt bijvoorbeeld wanneer een overheidsorganisatie methoden uit de start-up wereld gebruikt om toe te passen op overheidsproblematiek.

Incrementele innovaties komen dus vaak tot stand door recombinaties van ideeën die op elkaar lijken, terwijl radicale innovaties recombinaties zijn van ideeën die niet op elkaar lijken. Dit gegeven kan je gebruiken wanneer je wil innoveren. Het kan nuttig zijn om jezelf af te vragen of je uit bent op een kleine verbetering of op een rigoureuze doorbraak. Zoals ik eerder zei, kan je je het netwerk van ideeën namelijk ook voorstellen als een netwerk van mensen. Als je het zo bekijkt, zou je kunnen concluderen dat incrementele innovaties vaak bedacht worden door teams van mensen die op elkaar lijken, zoals experts op het product dat verbeterd moet worden, terwijl radicale innovaties vaak bedacht worden door diverse teams die in staat zijn inzichten uit verschillende werelden te combineren.

Tip 1: radicale innovaties vragen om diversere ‘inputs’ dan incrementele innovaties.

Een consequentie van het combineren van ideeën die ver uit elkaar liggen is niet alleen dat ze een grotere kans hebben om tot een doorbraak te leiden. Ideeën die zo ver uit elkaar liggen zijn namelijk waarschijnlijk veel moeilijker te combineren dan ideeën die op elkaar lijken. Dat kan komen doordat niemand eerder zoiets geprobeerd heeft, of omdat de ideeën zo verschillend zijn dat ze nauwelijks compatibel zijn. Het is daarom aannemelijk dat incrementele innovaties tot een relatief kleine opbrengst leiden, maar ook minder risicovol zijn, terwijl radicale innovaties een enorme opbrengst kunnen leveren, maar ook een grotere kans hebben om op niks uit te draaien. Ook dat is iets om rekening mee te houden wanneer je wil innoveren!

Tip 2: diversiteit aan inputs is ‘high risk, high gain, dus kies waar je voor wil gaan.

Survival of the fittest bij start-ups en spin-offs

Neem bijvoorbeeld het concept van ‘spin-offs’. Spin-offs zijn kleine, nieuwe bedrijven die ontstaan vanuit grotere, gevestigde bedrijven. Vaak is het zo dat een werknemer bij een gevestigd bedrijf vertrekt omdat zij een idee heeft dat niet past binnen het gevestigde bedrijf, en besluit haar eigen bedrijf te beginnen. De kans is groot dat zij daarbij toch een aantal aspecten van het gevestigde bedrijf zal meenemen, zoals de kennis die zij daar heeft opgedaan. Deze kennis ‘erft’ het nieuwe bedrijf dus van het oude bedrijf. Niet alle spin-offs zullen lang blijven bestaan: alleen die spin-offs die het lukt om zich zo te ontwikkelen dat zij goed aansluiten bij de markt en relevante productieketens zal het lukken om succesvol te zijn. In andere woorden: die bedrijven die zich het best weten aan te passen aan hun selectieomgeving. U ziet het al aankomen: survival of the fittest.

2. Fail fast

Om snel tot dat ene goede idee tussen de 99 slechte ideeën te komen is het natuurlijk belangrijk om zo min mogelijk tijd, geld en frustratie te besteden aan ideeën die uiteindelijk niet blijken te werken. Dat is natuurlijk behoorlijk intuïtief, maar er is ook een innovatietheoretische reden om niet te veel te investeren in ideeën die zichzelf nog niet bewezen hebben. Dat heeft te maken met ‘padafhankelijkheid’.

Padafhankelijkheid betekent dat wanneer we eenmaal een bepaalde route zijn ingeslagen in het netwerk van innovaties, het heel lastig is om nog van die route af te wijken. Daar zijn een aantal redenen voor. Ten eerste is het door de recombinatorische aard van innovaties zo dat onze opties op dit moment worden bepaald door onze keuzes uit het verleden. Je kan immers alleen combinaties maken van ideeën die er al zijn. Als je veel investeert in een bepaald pad, vorm je daarmee dus een belangrijk deel van je bibliotheek aan ideeën. Ten tweede raken we vaak ‘locked-in’ in ideeën waar we als maatschappij veel in geïnvesteerd hebben. Ter illustratie: in tegenstelling tot u misschien denkt is ons QWERTY-toetsenbord helemaal niet ontworpen om zo snel mogelijk te kunnen typen. Het QWERTY toetsenbord komt uit de tijd van de typemachines, en is zo ontworpen dat lettercombinaties die vaak voorkomen ver uit elkaar geplaatst zijn, zodat de hamertjes van de typemachine niet in de knoop raken. Het toetsenbord is voor ons dus suboptimaal en helpt ons niet om snel te typen. Het lukt ons echter niet om over te stappen naar een sneller of ergonomischer toetsenbord, want probeer maar eens opnieuw te leren typen. Iets soortgelijks geldt ook voor de overstap van benzine- en dieselauto’s naar elektrische auto’s, waarvoor er nog niet zo’n gedegen infrastructuur bestaat als voor benzineauto’s. Nationale en lokale overheden hebben bij uitstek te maken met dit soort ‘interdependencies’, omdat zij verantwoordelijk zijn voor het beheer van hele systemen en niet, zoals vaak in de bedrijfswereld voorkomt, van individuele producten.

Het gevolg van padafhankelijkheid is dat het belangrijk is om veel te leren over verschillende alternatieve oplossingen voor een probleem, zodat je kan voorkomen dat je je committeert aan een suboptimale oplossing. Lock-ins kan je niet helemaal voorkomen omdat je niet kan weten of een optimale oplossing op dit moment in de toekomst nog steeds de beste oplossing is, maar het helpt zeker om op de hoogte te blijven van nieuwe ontwikkelingen en gekozen oplossingen altijd te blijven valideren. Investeer dus niet te veel in die 99 slechte ideeën. Zet in op leren, en wees bereid om van richting te veranderen als dat nodig is.

Tip 3: voorkom dat je vastzit in een suboptimale oplossing door veel te experimenteren

Tip 4: begin vroeg met valideren, en blijf valideren.

3. Denk modulair

Maatschappelijke en technische problemen zijn vaak niet alleen complex in de zin van ‘ingewikkeld’, maar ook in de zin van ‘complexe systemen’. Complexe systemen zijn systemen die bestaan uit heel veel kleine, relatief eenvoudige, onderdeeltjes. Door de interactie tussen die onderdeeltjes ontstaan patronen die bijna niet te verklaren zijn. Denk bijvoorbeeld aan het dansen van een zwerm spreeuwen, auto’s die files vormen, onze hersenen en de zenuwcellen daarbinnen, of het ecosysteem in een bos. Het ingewikkelde daaraan is dat je bij een complex systeem nooit helemaal kan overzien wat de gevolgen van een interventie zijn. Als je te veel zwijnen in een bos uit zou zetten, zou er door de interactie van die zwijnen met andere onderdelen van het systeem zomaar een onvoorziene insectenplaag kunnen ontstaan. Bij innovatie in onze maatschappij werkt het net zo: wanneer je één onderdeel van de maatschappij verandert, zou dat kunnen betekenen dat een heel ander onderdeel niet meer werkt of anders werkt.

Stambomen van gereedschappen

Over de hele wereld worden de meeste antropologische musea ingericht per bevolkingsgroep of werelddeel. Het Pitt Rivers Museum in Oxford, waar ik vaak kwam toen ik voor mijn promotieonderzoek een paar maanden te gast was aan de universiteit, besloot het anders aan te pakken. Meneer Rivers hield bij zijn (enigszins omstreden) collectie gebruiksvoorwerpen geen geografische indeling maar een evolutionaire indeling aan. Hij verzamelde bijvoorbeeld alle knuppels die hij had, en vormde hiermee een soort stamboom. In het plaatje hieronder is prachtig te zien hoe het ontwerp van de knuppel varieerde van plek tot plek, en door de tijd heen steeds verder divergeerde. Dat is op zich niet gek, want knuppels zijn een cultureel product dat door mensen wordt gemaakt en wordt aangepast aan hun lokale omgeving. Dat is toch fascinerend?

Figuur 5: Evolutionaire indeling knuppels (Pitt Rivers Museum Oxford)

In de wereld van de criminaliteitsbestrijding is er bijvoorbeeld sprake van het ‘waterbedeffect’: wanneer er druk wordt uitgeoefend op een vorm van criminaliteit op een bepaalde plek, zoals witwassen in een specifieke gemeente, kan dat als gewenst gevolg hebben dat die vorm van criminaliteit afneemt. Een onvoorzien bij-effect kan echter zijn dat er een toename ontstaat van criminaliteit op een andere plek, of van andere soorten criminaliteit, omdat de criminele activiteit zich verplaatst.

Soms kan dit soort complexiteit verholpen worden door het probleem op te delen in verschillende geïsoleerde modules. In dat geval spelen de complexe afhankelijkheden alleen binnen een module, en niet tussen modules onderling. Dan kunnen modules afzonderlijk geoptimaliseerd worden, en dat is veel makkelijker dan het optimaliseren van het hele systeem. In onze complexe samenleving is dat helaas makkelijker gezegd dan gedaan. In zo’n geval geldt: wees je bewust van de complexiteit van het probleem dat je probeert op te lossen. Staar je niet blind op een specifiek voorval, maar bestudeer de context waarin dit voorval plaatsvindt en verken welke mogelijke bij-effecten kunnen optreden bij een interventie.

Tip 5: denk en experimenteer op onderdelen, en niet op het geheel.

Tip 5: als Tip 5 niet lukt, wees je dan tenminste bewust van complexiteit.

Vodcast

Zie ook de vodcast van Mignon over dit onderwerp:

Relevante links

Credits

Photo by Diz Play on Unsplash

 

Masterclass – Innovatietheorie voor de datagedreven overheid

Deze maand zijn we gestart met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als netwerkanalyses en graph databases.

Innovatietheorie voor de datagedreven overheid

In deze editie vertelt data scientist Mignon Wuestman over haar onderzoek naar innovatietheorie en de toepassing daarvan voor de datagedreven overheid. Naast theoretische kennis wordt onze Design Sprint aanpak benoemd als voorbeeld en de Woningbouw Monitor ter illustratie van een modulair systeem.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Mignon? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

De slides

Innovatietheorie_MLW_v2

 

Relevante links

Andere masterclasses

Blogs

 

Masterclass – Text Analytics en Machine Learning in de overheid

Deze maand starten we met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als netwerkanalyses en graph databases.

Text Analytics en Machine Learning in de overheid

In deze editie vertelt data scientist Martijn Heijstek over een toepassing van Text Analytics en Machine Learning in de overheid. Hij behandelt de case waarin content automatisch wordt geclassificeerd in het verlengde van een zaaksysteem: in dit geval Djuma van Visma|Circle.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Martijn? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

Relevante links

Andere masterclasses

Blogs

 

 

Society 4.0: Beschavingen prototypen en veiligheidsvraagstukken oplossen in de nieuwe maatschappij

Congresverslag – ResilIT  / SNiC

Eind november werd het Stichting Nationaal Informatica Congres, oftewel het SNiC, georganiseerd in de Flint in Amersfoort. Het SNiC is een jaarlijks congres waarin huidige ontwikkelingen in de informatica rondom een thema worden besproken door middel van lezingen, workshops en discussie-panels. Alle studieverenigingen zijn welkom, en met de geregelde bussen worden ze vanuit alle uithoeken naar het congres gereden. Zo ook de studievereniging GEWIS van TU/e, waar ik zelf lid van ben geweest tijdens mijn studententijd en ooit nog een bestuursjaar heb gedaan. Dit jaar werd de organisatie door Inter-Actief, de studievereniging uit Enschede op zich genomen, met als thema “ResilIT”. Dit thema omvat alles rondom de impact van IT en hoe IT kan helpen met de weerbaarheid (Reselient) van de maatschappij. De lezingen waren dan ook opgedeeld in spannende categorieën, zoals “Cyber Threats” en “Disaster Management. Centraal stond het begrip Society 4.0.

Society 4.0

Centraal in alle lezingen stond het begrip Society 4.0. Laten we de discussie van “4.0” direct even beslechten (herinnert u zich “Web 2.0” nog? Laat staan dat we “Society 3.0” ergens gemist hebben? Of zitten we nu in “3.9”) en even aannemen dat dit het containerbegrip is waarin ‘the next forseeable future‘ wordt bedoeld. Punt. In ieder geval, de redenering is: de afgelopen jaren is er enorme vooruitgang geboekt, ook in het technologische gebied. Deze nieuwe technieken veranderen de maatschappij naar iets wat door onderzoekers dus Society 4.0 is genoemd. Dat u het even weet.

Deze nieuwe society kan worden voorgesteld als futuristische steden zonder milieuvervuiling, auto’s op elektriciteit rondzweven en waar misdaad volledig van de kaart is. Maar door de toename van het aantal mensen en de toenemende complexiteit wordt de samenleving en onze positie daarin steeds fragieler, zo wordt gesteld. Hoe kan IT deze negatieve impacts op de maatschappij helpen?

Society 4.0 in de ruimte

Na een imposant introductiemuziekje en de warme welkomstwoorden van de voorzitter van de organisatie, kwam niemand minder dan André Kuipers het podium op. Zijn lezing begon uiteraard met indrukwekkende plaatjes gemaakt vanuit het International Space Station, en een vertelling over wat hij daar allemaal had meegemaakt. Maar al snel ging hij door naar wat voor onderzoek er in de ruimte kan worden gedaan dat kan helpen met het verkrijgen van een goede Society 4.0.

Uiteraard kunnen vanuit de ruimte veel dingen worden gemeten. Met het satellietsysteem Galileo bijvoorbeeld worden veel meer dingen gemeten en gedaan dan standaard GPS-signalen verzenden voor communicatie en weersvoorspellingen creëren. Er kunnen metingen worden gedaan voor agricultuur, zodat men weet wat te doen voor een goede oogst van gewassen, maar ook voor wijnboeren zodat we allemaal lekkere wijn kunnen drinken! De satellieten verzamelen data over ozon, de plastic soep en milieuvervuiling zoals smog en broeikasgassen zodat we kunnen meten wat de effecten van getroffen maatregelen zijn. Dit valt ook weer te betrekken op de stikstofcrisis die nu speelt. Vooral indrukwekkend was de data die werd gebruikt rondom het voorspellen van natuurrampen; aardbevingen, overstromingen, etc. De dijken in Nederland bijvoorbeeld staan continu onder observatie zodat verzwakkingen meteen kunnen worden aangepakt.
Daarnaast kunnen er in de ruimte ook dingen ontwikkeld worden die op aarde veel lastiger te onderzoeken vallen. Dit komt omdat het er geen zwaartekracht is en de ruimte een vacuüm is, waardoor onderzoek naar nierstenen, bacteriën en andere micro-organismes daar veel beter kunnen worden onderzocht. Ook kunnen testen voor software zonder veel vertraging worden uitgevoerd voor de auto-industrie, robotica en natuurlijk software voor satellieten zelf. Meneer Kuipers sloot af met informatie over de opleiding voor astronaut, gepaard met grappige verhalen en foto’s, waarna hij het podium snel verliet om naar zijn volgende praatje toe te kunnen.

Society 4.0 in de samenleving

De tweede openingslezing, gegeven door Michael Haupt, was wat filosofischer. Meneer Haupt is een Strategic Foresight Practitioner die veel lezingen geeft over Society 4.0. Online heeft hij een reeks aan blogs genaamd “Postcards from 2035”. Deze blog is geschreven vanuit het oogpunt van zijn dochter, die in 2035 21 jaar zal zijn. In haar kaarten beschrijft ze de wereld zoals die in 2035 is. Deze voorspellingen/redeneringen zijn de expertise van meneer Haupt, maar voor de leek is het zeer abstract. De titel van zijn lezing is “Why it’s up to to computer scientists to save the world”. Hoe dit dan gedaan kon worden bleef een beetje uit tot het einde. Volgens meneer Haupt werkt de huidige maatschappij volgens de regels van “Game A”. Game A werd beschreven als een “Catch-22”; een systeem dat zichzelf in stand houdt. Maatregelen zijn vooral gericht op symptoombestrijding, maar zouden eigenlijk het systeem zelf moeten aanpakken. Daarom moeten we werken naar een “Game B”, waarin een we niet focussen op individualistische aspecten van de maatschappij maar op het grotere, coherente geheel. Met een dergelijk Game B zouden computer scientists data kunnen verzamelen die correct is, en niet foutieve data die Game A in stand houdt. Om deze Game B te testen is meneer Haupt bezig met het oprichten van Special Equitable Exchange Zones (SEEZs), waarin nieuwe vormen van beschaving kunnen worden geprototyped.

Society 4.0 in de beveiliging

De parallelsessies waren onderverdeeld in verschillende categorieën, zoals Cyber threats, Disaster Management en Society 4.0. De eerste lezing in Cyber Threat had de onheilspellende titel “Call for help” , en werd gegeven door AIVD Security Operations-medewerker Guido (zijn achternaam werd niet gegeven vanwege privacy-redenen). Guido vertelde over zijn werk bij de AIVD en wat de nieuwe ontwikkelingen in de IT inhielden voor zijn werk. Veel technologie rondom internet deze dag is gebaseerd om mensen en objecten met elkaar te verbinden. Deze “centralisatie van het internet” kan handig zijn. Het is heel makkelijk om overal je thermostaat te kunnen beheersen, of via een horloge overal connected te zijn. Maar op het moment dat energiecentrales ook aan het internet wordt verbonden omdat er in de Society 4.0 geen alternatieven zijn om een centrale optimaal te laten werken, wordt het vanuit een veiligheidsperspectief risicovoller. Daarbij speelt ook de nodige politiek; een aanval kan dan wel volledig technisch van aard zijn, maar verdedigen tegen zo’n aanval is vaak veel meer politiek geladen. Privacy-issues en internationale conflicten zijn niet ongewoon in deze situaties. Guido gaf daarom een lijst met dingen die wij als computer scientists kunnen doen om ervoor te zorgen dat we ons kunnen weren van gevaar in Society 4.0.

  1. Security By Design: Als er een beveiliging zit ingebakken in het systeem waar een gebruiker of een aanvaller niet om heen kan omdat de applicatie of software nu eenmaal zo gedesigned is, wordt het al moeilijker om “per ongeluk”  een datalek of een aanval te laten plaatsvinden.
  2. Weet wat je in huis hebt. In een verbonden tijdperk moet je weten wat je hebt in je netwerk. Welke personen, apparaten, servers en externe software hebben toegang tot je netwerk of je applicatie. Op het moment dat je dit goed in kaart brengt, vallen verdachte zaken eerder op.
  3. Ga uit van een inbreuk. Op deze manier kun je plannen wat er moet gebeuren wanneer er een aanval of een datalek plaatsvindt. Bedenk protocollen, weet waar welke data is en breng in kaart wat er is gelekt of wat er is aangevallen.
  4. Zorg voor inhouse security skills. Op het moment dat je een eerste laag security zelf al kan uitvoeren, ben je minder afhankelijk van externe partijen. Hoe meer afhankelijkheden, hoe gevoeliger je bent voor een inbreuk.
  5. Werk samen. Op het moment dat we samen werken, kunnen we met elkaars informatie ons beter weren. Binnen een bedrijf moet je ervoor zorgen dat iedereen iets afweet van waar wat ongeveer staat en wie moet worden ingeschakeld. Kennisoverdracht is hier key.
  6. Pas altijd op. Wees niet te naïef, vooral als je gevoelige data verwerkt. Weet waar je afhankelijkheden liggen.

Society 4.0 in de hackers-society

Het 5e punt, samenwerken, is een van de belangrijkste speerpunten van een goede Society 4.0. En dit werd ook maar al te duidelijk in de volgende lezing; “Fighting DDoS-attacks together on a national scale”. De lezing werd gegeven door Jair Santanna, een zeer energieke professor van de Universiteit Twente en een adviseur voor de High Tech Crime Police Unit, met als expertise digital forensics. De lezing begon met een snelle samenvatting van wat een DDoS-aanval nu precies is, maar, zo werd al snel gezegd; iets doen is leuker dan iets horen. Dus had meneer Santanna een applicatie ontwikkeld, een klein routertje meegenomen en wat simpele code geschreven, waardoor we vanuit de zaal vanaf een laptop of telefoon eenvoudig mee konden doen aan een DDoS-aanval. Naast mij zat een eerstejaars bachelor-student wiskunde, die na deze doe-het-zelf-demo zei: “Wow, nu snap ik eindelijk hoe mensen gehackt kunnen worden”.

Een DDoS-aanval doen op een router die nergens aan verbonden is, dat is natuurlijk aardig en demonstratief. Maar in vrijwel alle gevallen DDoS-aanvallen uiteraard niet wenselijk. Men moet zich dus kunnen beschermen. Helaas zitten er in de huidige maatschappij flink wat politieke spellen verworven omtrent DDoS-aanvallen. Data rondom een DDoS-aanval kan niet zomaar prijsgegeven worden, niet van de dader noch van het slachtoffer. Daarom heeft meneer Santanna iets slims bedacht. Hij heeft een converter geschreven die een DDoS-aanval omzet naar een simpele “fingerprint”, zonder dat daar data van de aanvaller of het slachtoffer nodig is. Deze fingerprints vergelijkt hij met visnetten; op het moment dat er een fingerprint voor jouw DDoS-aanval in het visnet zit, komt hij er niet door en wordt hij dus uitgefilterd. Door van partners die hij vertrouwd en fingerprints te verzamelen en van mensen die graag aan het project mee willen doen, wordt het visnet zo geavanceerd dat er geen DDoS meer doorheen kan. Het is een open project die werkelijke data gebruikt. Het plan is optimistisch, maar past perfect in het plaatje van Society 4.0 waarin er veel wordt samengewerkt. Vragen waren er wel. Als alle data openbaar is, kunnen hackers dat dan niet juist gebruiken om een maas in het visnet te vinden? Santanna maakte zich niet druk. Om door zo’n visnet heen te komen, zou een hacker om alle fingerprints heen moeten werken om die ene maas in het net te vinden. Wat de hacker uren zal kosten. En vervolgens kan de hacker de aanval één keer loslaten. Daarna heb ik de fingerprint en kan de hacker opnieuw beginnen. Zeer interessant, hopelijk komt dit initiatief ooit goed van de grond.

Society 4.0 in China

De laatste lezing had de titel “The new Nexus of security, geopolitcs and digitalization“. Het is al een tijdje in het nieuws dat China een grote nieuwe speler is in de wereld van IT. In deze lezing werd verteld in wat voor technologieën China allemaal aan het groeien was, vooral Artificial Intelligence was een term die vaak viel. Dit verhaal werd gemengd met een dosis geopolitiek, een expert op het gebied van politiek rondom China vertelde wat de gevolgen konden zijn en wat een koppositie van een land als China in een Society 4.0. Een harde conclusie was er natuurlijk niet, het verhaal was vooral hypothetisch opgesteld en de woorden “if” en “when” vielen dan ook geregeld. Het was zeker niet slecht met China bovenaan, maar echt goed kon je het nu ook weer niet noemen volgens de presentators. Desalniettemin was het een prima lezing om te volgen, en werden er wat wijsheden gegeven om mee te nemen:

  1. Neem in beslissingen altijd de politieke situaties mee in andere landen
  2. Zorg dat je niet afhankelijk bent van de rest van de rest van de wereld
  3. Zorg ervoor dat je dingen zelf bezit, om afhankelijkheid te verkleinen. Kennis, resources, the works.

Society 4.0 everywhere

De laatste lezing werd gegeven door Jan Hendrik Croockewit, de oprichter van de healthcare afdeling van Nedap. Een inspirerend praatje, waarin werd verteld hoe ze bij Nedap al zorgen dat ze zo goed mogelijk mee kunnen met een Society 4.0. Maar de voornaamste boodschap van zijn verhaal was dat als we pragmatisch moesten denken hoe te functioneren in wat voor maatschappij dan ook, dat alles duidelijk moest zijn. Mensen moesten design meteen kunnen snappen. De power of simplicity werd zwaar onderschat, naar zijn mening. Dit werd duidelijk gemaakt met een onverwachte analogie van een broek van de Zeeman versus een dure broek met een merk.

Al met al was het een interessant congres met een filosofisch maar ook een boeiend onderwerp, ook zeker voor Shintō Labs. Wellicht kunnen wij met deze wijsheden onze diensten ook verlenen om bij te dragen aan een positieve Society 4.0

Mocht je zelf actief mee willen denken of gewoon op de hoogte willen blijven, neem dan contact met ons op of schrijf je in voor de nieuwsbrief.

Relevante links

Webinars

Casebeschrijving

Blog

Research

 

Van radar tot sonar: signaleren van ondermijnende criminaliteit met data science

De afgelopen weken is er bijna in elke krant of tv-programma aandacht aan besteed: ondermijning of ondermijnende criminaliteit. De schokkende moord op advocaat Derk Wiersum heeft de discussie extra brandstof gegeven. Wij waren die dag op het Congres Ondermijning en Georganiseerde Criminaliteit in Tilburg en ook daar was het het nieuws het gesprek van de dag. Centrale vraag: wat kunnen we doen om een vuist te maken tegen ondermijnende criminaliteit?

Extra geld is mooi, maar wat gaan we ermee doen? Verschillende strategieën passeerden de revue. Burgemeester Theo Weterings van de gemeente Tilburg had het over het stimuleren van preventie door als overheid aanwezig te zijn in de ‘haarvaten’ van de wijk. Uit de zaal kwam ook de oproep tot het uitbreiden van capaciteit, en ja zelfs het (opnieuw) organiseren van een specialistische eenheid, zoals die er in het verleden is geweest. Zou minister Grapperhaus meegeluisterd hebben?

Figuur: Congres Ondermijning & Georganiseerde Criminaliteit

Prof. Pieter Tops riep op tot het bestuderen van de optie om sommige vormen van drugsproductie- en handel te legaliseren. Hij waarschuwde dat legaliseren niet per definitie een oplossing is (mogelijk zelfs contra-productief) en benadrukte dat hij opriep tot discussie en studie, niet direct tot actie.

Wat opviel was dat geen van de geleerden, bestuurders of experts in de ochtend sprak over innovatie of het gebruik van nieuwe technologie. Terwijl als je het ze persoonlijk zou vragen, ze waarschijnlijk zouden zeggen dat dat zeker een belangrijk speerpunt zou moeten zijn. Gelukkig was er bij het publiek wel degelijk behoefte aan het gebruiken van technologie om de informatiepositie te verbeteren en ook in de middag werd door diverse sprekers aandacht aan dit onderwerp besteed.

Risico Radar Ondermijning

Shintō Labs heeft in samenwerking met Bureau Beke en het RIEC Rotterdam een Risico Radar Ondermijning ontwikkeld. Deze Risico Radar Ondermijning heeft als doel om in een regio of gebied opvallende activiteiten, die mogelijk te maken hebben met ondermijning, inzichtelijk te maken. In de middag lieten we tijdens een sessie zien hoe deze Radar tot stand is gekomen en hoe het werkt. Een uitgebreid webinar van onze Risico Radar Ondermijning is overigens hier te vinden.

Wij krijgen vaak de vraag wat het verschil is tussen een ‘radar’ en ‘sonar’ in context van ondermijnende criminaliteit en het detecteren van risicovolle gebieden. In deze blog wil ik dit verschil toelichten aan de hand van de kenmerken, het doel,  de toepassing en enkele voorbeelden. Ook zullen we daarbij aangeven hoe de verschillende vormen gebruikt worden en hoe de Radar en de Sonar complementair kunnen zijn.

Radar en Sonar

De Radar en Sonar zijn twee verschillende begrippen die in oorspronkelijke betekenis gebruik maken van een ‘echo’ om objecten of locaties te detecteren. Onze interpretatie van de Radar en de Sonar in context van ondermijnende criminaliteit is als volgt:

  • Een Radar detecteert opvallende signalen en fenomenen in een gebied (breedte), zonder diepgaand detailonderzoek te doen. Het heeft een signaleringsfunctie en zou aanleiding kunnen zijn voor een diepteonderzoek met hulp van een Sonar.
  • Een Sonar detecteert juist specifieke locaties, objecten en individuen (diepte). Dit gaat typisch gepaard met gesloten bronnen om een zo volledig mogelijk beeld te krijgen. Een Sonar onderzoek kan aanleiding geven tot actie of interventie.

Het een en ander is in de onderstaande afbeelding uitgewerkt.

Verschil tussen Radar en Sonar

Figuur: Verschil tussen Radar en Sonar

De Radar nader toegelicht

De Radar is ontwikkeld met als doel om fenomenen inzichtelijk te maken en signalen af te geven in een regio, wijk of buurt. Het richt zich vooral op de breedte van het spectrum en kan volledig ontwikkeld worden met hulp van open bronnen en open data. Privacy aspecten spelen geen rol aangezien alles geaggregeerd wordt en de radar zonder gebruik te maken van persoonsgegevens tot stand komt.

Kenmerken

  • De Radar richt zich op het inzichtelijk maken van ondermijningsfenomenen, zoals criminogene branches, verdachte hoeveelheden van bepaalde type organisaties en opvallende gebieden.
  • De Radar maakt gebruik van open bronnen en open data (OSINT = Open Source Intelligence).
  • De Radar is per definitie binnen de grenzen van de AVG. Immers, er worden geen tot personen herleidbare gegevens gebruikt of getoond.

Doel

  • Het primaire doel van de Radar is het creëeren van awareness – bewustzijn –  en het geven van inzicht wat er speelt op gebied van ondermijning in uw regio.
  • De Radar geeft bovendien aanleiding om bepaalde gebieden nader te onderzoeken of meer toezicht te houden.
  • De Radar is een strategisch middel en helpt bij beleidsvorming om regiogerichte aanpak te organiseren.

Typische bronnen

De radar maakt gebruik van open bronnen en open data. Enkele gebruikte bronnen zijn:

  • CBS data
  • Kamer van Koophandel data
  • BAG data
  • Insolventie register

Voorbeelden

  • Oververtegenwoordiging van criminogene branches;
  • Extreme toename van een bepaalde branche (verhoudingsgewijs, ook in vergelijking met andere regio’s);
  • Het waterbed effect: interventies in een bepaald gebied zullen effect hebben in de regio (zowel geografisch, alsmede alternatieve branches – het is een bekend fenomeen dat georganiseerde criminaliteit van branche verschuift zodra daar de aandacht op gevestigd is.

Indicatoren

De indicatoren waar de Risico Radar Ondermijning op steunt zijn ontwikkeld met hulp van wetenschappelijk onderzoek door Bureau Beke en het RIEC Rotterdam. Bureau Beke heeft op basis van een literatuurstudie en expert-interviews  een lijst van 53 indicatoren ontwikkeld die gericht toegepast zijn om de opvallende locaties te kunnen detecteren.

Voorbeeld van een Radar: de Risico Radar Ondermijning

Het bovenstaande voorbeeld volgt uit onze Risico Radar Ondermijning en illustreert hoe een oververtegenwoordiging van een risicovolle branche gevisualiseerd wordt in gebieden van van 100×100 meter. Met hulp van de indicatoren kunnen we een heatmap weergeven waarin het zwaartepunt getoond wordt. Dit hoeft niet te betekenen dat het daar niet goed gaat, maar zou aanleiding kunnen zijn om daar nader onderzoek te doen.

De Sonar nader toegelicht

Waar de Radar vooral gericht is op een regionaal beeld en signaleringsfunctie is de Sonar het logische vervolg: de diepgang om te ontdekken of er werkelijk iets speelt en waar precies de verdachte activiteiten plaatsvinden. De Sonar wordt vooralsnog ontwikkeld met hulp van gesloten bronnen (verrijkt met open bronnen) om bij een object (locatie, pand of bedrijf) of subject (verdachte persoon) alle relevante gegevens inzichtelijk te krijgen om gerichte acties of interventies te plannen. Het is dan ook meer een tactische en operationele tool en uiteraard speelt de AVG hier een zeer prominente rol. Privacy by Design is dan ook een van de fundamenten van de Sonar.

Kenmerken van een Sonar

De Sonar is ontwikkeld om meer specifieke antwoorden te geven: dit speelt er op het subject (persoon) of object (bedrijf of  pand).

  • De focus van de Sonar is het geven van een diep en zo volledig mogelijk inzicht bij een locatie of persoon.
  • De gebruikte data is een combinatie van open data en gesloten data
  • De Sonar moet daarmee uitgebreid getoetst worden aan de AVG – een beoordeling van een Privacy Impact Assessment (PIA) is een standaard onderdeel van dit proces.

Doel van een Sonar

  • De Sonar is gemaakt voor gerichte analyses;
  • De Sonar is een meer tactisch en operationele oplossing om te helpen prioriteiten te stellen in waar de medewerkers hun handhavingsinspanning op moeten richten;
  • De Sonar helpt concrete interventies voor te bereiden door relevante bronnen te combineren en signalen en indicatoren te stapelen.

Voorbeelden van een Sonar

Indicatoren

De indicatoren die gebruikt worden bij de verschillende Sonars zijn sterk afhankelijk van de lenzen die ingezet worden. Zo gebruiken wij onder andere de indicatoren van de Landelijke Aanpak Adreskwaliteit of wetenschappelijke bronnen die we konden vinden. Deze worden altijd aangevuld met ‘straatkennis’ van domeinexperts die de Sonar’s mee-ontwerpen tijdens een Design Sprint.

Voorbeeld van een Sonar: opsporen woon en adresfraude

Figuur: Voorbeeld van een Sonar – opsporen woon en adresfraude

Synergie tussen Radar en Sonar

Wij zijn overtuigd van de synergetische waarde bij het combineren van Radar en Sonar. De Radar toont de opvallende gebieden en bijvoorbeeld een oververtegenwoordiging van een bepaalde risico branche. De (geautoriseerde!) gebruikers van de Sonar kunnen vervolgens in dat gebied meer diepteonderzoek doen naar bedrijven binnen die branche en specifieke locaties nader bekijken. De terugkoppeling van die onderzoeken kunnen weer gebruikt worden om de Sonar en de Radar te voeden en met betere resultaten te komen. Dit samenspel van Radar naar Sonar en weer terug naar Radar zijn wij op dit moment aan het ontwikkelen. Zodra wij de eerste resultaten hebben, zullen wij dat met jullie delen. Mocht je zelf actief mee willen denken of gewoon op de hoogte willen blijven, neem dan contact met ons op of schrijf je in voor de nieuwsbrief.

Relevante links

Webinars

Casebeschrijving

Blog

Research

 

Onderzoek: hoe geodemografie kan helpen om data ‘eerlijker’ weer te geven

De afgelopen elf maanden ben ik ondergedompeld in de wereld van data. Via de ‘track’ Data Science als onderdeel van Information Studies aan de UvA kwam ik in contact met allerlei toffe algoritmes en maakte ik kennis met de problematiek achter de technische hoogstandjes. Een van deze problemen was gericht op ondermijning in Amsterdam en bij het zoeken naar vergelijkbare projecten kom je dan al snel uit bij Shintō Labs.

Met zwetende handjes heb ik een voorzichtig mailtje gestuurd naar het ‘Shinteam’ of ik ‘heel misschien’ en ‘alleen als het uitkomt’  langs mocht komen om de mogelijkheid tot een afstudeerstage te bespreken. Wat ik niet verwachtte is dat de daaropvolgende uitnodiging zo relaxed en soepel verliep dat ik direct verkocht was.  Daar wil ik graag mijn thesis schrijven! Inmiddels zijn we vijf maanden verder en is het papiertje op zak en ik kan wel stellen dat ik geen spijt heb van deze keuze. Natuurlijk was het hard buffelen, maar het waren ook enorm leerzame maanden waarbij ik vanaf dag één door het team ben opgenomen. Ook nam ik deel aan de Design Sprint met het RIEC Rotterdam en Bureau Beke op het thema Risico Radar Ondermijning, waarbij we op basis van open bronnen de mogelijke hotspots inzichtelijk maken. In deze sprint kon ik mijn onderzoek mooi toepassen.

In deze blog beschrijf ik mijn onderzoeksopzet en de eerste resultaten. In de onderstaande video kun je ook de presentatie zelf zien.


 

De casus

De core business van Shintō Labs bestaat uit het maken van datagedreven applicaties voor overheidsinstellingen. Vaak bevat een applicatie een dashboard met een kaart waarop dan data is geplot. In verband met privacy wordt die data vaak gepresenteerd per postcode, buurt of wijk (en dus niet per huis of gebouw).

De keuze voor het type gebiedsindeling kan echter een vertekenend beeld geven van de werkelijkheid. In figuur 1 zie je bijvoorbeeld drie representaties van exact dezelfde data, maar met verschillende gebiedsindelingen. Dit probleem staat in de boeken bekend als MAUP – The Modifiable Area Unit Problem. Dit fenomeen doet zich ook voor wanneer we data presenteren per postcode, buurt of wijk: hoe meer variatie er in zo een gebied plaats vindt, hoe meer informatie wordt weggegooid wanneer de data wordt geaggregeerd.

Figuur 1 Voorbeeld van ‘The Modifiable Area Unit Problem’

Een manier om dit probleem aan te pakken is door gebiedsindelingen datagestuurd te maken. Als we de bestaande wijken/buurten loslaten en kijken naar de achterliggende data, dan kunnen we gebieden creëren die de mensen in het gebied zo veel mogelijk vertegenwoordigen.  Dit doen we door middel van geodemografie;  ‘The study of people by where they live’ (Harris, 2005).

Geodemografie

Zoals de naam al prijs geeft is dit vakgebied een combinatie van geografie en demografie, waarmee de data ook direct complex wordt. In geodemografie word er gezocht naar betekenisvolle bundels om de mensen in een gebied te kunnen beschrijven. Deze bundels worden in de literatuur ook wel micro-communes of urban neighbourhoods genoemd. Door middel van algoritmen worden mensen ingedeeld in clusters, die vervolgens worden geplot op een kaart. In principe volgt iedere geodemografische clustering ruwweg hetzelfde proces van datapreparatie, algoritmeselectie en parameterselectie, maar het probleem ontstaat bij de evaluatie. Want wat zijn betekenisvolle clusters? Dat is een bijna filosofische vraag, die niet zomaar beantwoord kan worden. Voor de fijnproevers raad ik het paper van ‘What are true clusters’ aan van Christian Hennig.

Figuur 2. Voorbeeld van een geodemografische clustering van Eindhoven. Bron: CBS

Geodemografische cluster-evaluatie

In tegenstelling tot standaard ‘gesuperviseerde methoden’ is het valideren van een geodemografische clustering een schemerig gebied tussen kunst en wetenschap, het kwantitatieve en het kwalitatieve, objectiviteit en subjectiviteit (Harris, 2005). Zoals mijn docent het noemt, is cluster-evaluatie in feite een vorm van zwarte magie. 

Binnen de geodemografie is er wel een idee van enkele eigenschappen die een clustering betekenisvol maken, waarvan de belangrijkste eigenschap is, dat de clustering aansluit bij het doel en de context van het clusterprobleem. Om dat doel meetbaar te maken gebruiken we interne en/of externe criteria die helpen bij het maken van de keuze van het algoritme en de parameter instellingen.

De externe criteria bestaan soms uit vergelijkingen met referentieclassificaties of een zogenoemde ground truth. Veel vaker worden subjectieve criteria opgelegd met behulp van experts of de eindgebruikers. De interne evaluatie van een clustering bestaat uit het meten van een bepaalde regel die de data beschrijft zoals ‘hoe compact zijn de clusters?’ of ‘wat is de ratio tussen de gemiddelde inter en intra clusterafstand?’. Hoewel deze regels objectief zijn, is het wel de vraag hoeveel waarde je moet hechten aan de resulterende waarden en hebben deze regels zeker niet altijd toegevoegd nut. Over het algemeen wordt interne evaluatie daarom vooral gebruikt om het cluster proces te sturen en niet te leiden (Alexiou, 2017).

De interne evaluatie regels hebben nog een extra uitdaging, want deze methoden zijn over het algemeen niet aangepast aan geodemografische clustering. De meest gebruikelijke metrieken (zoals de Within-cluster sum-of-squares en de Silhouette index) worden alleen toegepast op de demografische data en niet op de geografische data. Dit terwijl ´echte’ microcommunes samenhang lijken te vertonen in zowel de geografische als demografische ruimte (Wolf et al., 2019).

De kern

In mijn onderzoek heb ik geprobeerd een regel op te stellen die speciaal geadapteerd is voor geodemografische data. Deze regel is gebaseerd op de Silhouette score, maar met een speciale functie die afstand kwantificeert als combinatie van geo- en demografische data. Er zitten aan een dergelijke functie nog flink wat haken en ogen: hoe verhoudt bijvoorbeeld geografie zich tot demografie? Uiteindelijk hebben we als ‘proof of concept’ de aanpak van Wolf et al. overgenomen (inmiddels liep de onderzoeksperiode al tegen het einde).

Uit een kleinschalig experiment komt naar voren dat de geodemografische score wel degelijk wat interessante patronen vertoont. Zeker ten opzichte van de conventionele (non-geografische) Silhouette score lijkt de nieuwe regel een stuk minder triviale patronen weer te geven. Dit bleek ook uit de validatie (feedback van gebruikers) van het prototype van de Risico Radar Ondermijning zoals ik die heb gerealiseerd voor het RIEC Rotterdam.

Lessons learned

Het voorgaande stuk ging vrij snel de diepte in en eindigt tamelijk theoretisch. Maar wat zijn nu de take home wijsheden die we tijdens het onderzoek zijn tegengekomen?

Een van de belangrijkste redenen om interne evaluatie regels te zoeken is om subjectiviteit in geodemografie te verminderen. We willen graag goed gefundeerde keuzes maken tijdens het clusterproces en idealiter is geodemografie zo transparant mogelijk. In de praktijk blijven de objectieve evaluatie technieken slechts een onderdeel van het clusterproces, waar de keuzes voor het algoritme en de parameter instellingen uiteindelijk worden gemaakt door mensen. Het maken van een geodemografische clustering is niet moeilijk, maar een goede geodemografische clustering maken is een flinke uitdaging, die ook afhangt van de context.

Hoe nu verder?

Tot nu toe hebben we een paar keer genoemd dat interne validatie regels vooral ‘betekenis’ krijgen in het kader van een context en met een expert/gebruiker om de context te interpreteren. Hoewel mijn thesis vooral de theorie van geodemografische evaluatie beslaat, zijn we natuurlijk erg benieuwd of de interne regels ook echt hulp bieden tijdens het clusteren. Daarom ben ik met het Shintō Labs team begonnen aan een interactieve module waarmee je je eigen (geodemografische) data kan clusteren. De module geeft adviezen op basis van de interne evaluatie regels, maar uiteindelijk is het aan de gebruiker om de waarde van de clustering in te schatten. Voor nu blijft het dashboard bij een prototype, maar mocht je interesse hebben in deze applicatie, neem dan contact op met het Shintō Labs.

Figuur 3. Prototype van het dashboard

Referenties

  • Alexiou, A. (2017). Putting ’Geo’ into Geodemographics: evaluating the performance of national classification systems within regional contexts. PhD thesis, University of Liverpool.
  • Harris, R., Sleight, P., and Webber, R. Geodemographics, GIS and Neighbourhood Targeting. Wiley, London, UK, 2005
  • Hennig, C. (2015). What are the true clusters?. Pattern Recognition Letters64, 53-62.
  • Wolf, L., Knaap, E., and Rey, S. J. (2019). Geosilhouettes: geographical measures of cluster fit.

Relevante links

Webinars

Casebeschrijving

Blog

Research