Berichten

Dé drie thema’s voor ondermijning in 2020

Na maanden zonder evenementen, groepen mensen of überhaupt maar fysieke meetings was er eindelijk weer ruimte voor een heus congres. Op 16 september jl. organiseerde het Studiecentrum voor Bedrijf en Overheid de 5e editie van het Congres Ondermijning en Georganiseerde Criminaliteit. Strakke handhaving van de 1,5 meterregel kunnen we aan veiligheidsexperts natuurlijk goed overlaten, maar (net)werkt dat ook een beetje? En nog belangrijker: wat zijn de grote thema’s die aan bod kwamen?

Als voormalig promovenda ben ik een behoorlijk doorgewinterde conferentieganger. De conferenties waar ik kwam waren vaak behoorlijk breed van onderwerp (‘evolutionary economics’) en trokken figuren van allerlei pluimage aan. Dat maakt de praatjes fascinerend, maar niet per se relevant. Dit was mijn eerste conferentie die gericht is op professionals in plaats van academici, en waar mensen hun praktijkervaringen delen in plaats van hun papers. Waar ik dus vooral nieuwsgierig naar was: kan ik mijn inzichten tijdens dit congres nu echt toepassen op mijn werk. Daarnaast was ik benieuwd naar wat op dit moment de belangrijkste thema’s rondom ondermijning zijn, en vroeg ik me af hoeveel mensen ik nou echt zou kunnen ontmoeten tijdens een congres op 1,5m afstand.

De ondermijningsthema’s van 2020

Natuurlijk zijn er veel verschillende thema’s aan bod gekomen. Zo is daar altijd de roep om samenwerking en een integrale aanpak. De burgemeesters van Antwerpen en Turnhout zeiden overigens dat ze jaloers waren op de Nederlandse aanpak. Die opmerking illustreert de complexiteit van ondermijning, want des te beter wij het in Nederland doen, des te meer zij last hebben van het resulterende waterbedeffect. Ook wetgeving en het veilig en verantwoord omgaan met privacygevoelige informatie werden veel besproken. Drie thema’s wil ik er specifiek uitlichten: de onzichtbaarheid van ondermijnende criminaliteit, de kanarie in de kolenmijn, en a problem well stated is a problem half solved.

1. Onzichtbaarheid van ondermijnende criminaliteit

Hoewel dit congres eigenlijk voor een Nederlands èn Vlaams publiek bedoeld is, moesten de meeste Vlamingen het in verband met het Coronavirus jammer genoeg laten afweten. Het publiek van dit congres bestond voornamelijk uit medewerkers van (Nederlandse) gemeentes en mensen van de politie. Op de vraag wat volgens de deelnemers nou het meest ondermijnende effect van georganiseerde criminaliteit is, vond ik de antwoorden opvallend eenduidig. Een groot deel van het publiek noemde onzichtbaarheid als meest ondermijnende factor, wijzend op de subtiele manier waarop boven- en onderwereld verstrengeld raken zonder dat we het merken. Veel vormen van ondermijnende criminaliteit gebeuren voor je neus zonder dat je het doorhebt, of vinden plaats achter de voordeur. En, zo merkten verschillende mensen in het publiek op, zelfs als de effecten van ondermijning in sommige gevallen toch zichtbaar worden, blijven de echte daders buiten beeld. Ik kan mij voorstellen dat dit de handhavers en de beleidsmakers in de zaal enorm frustreert. Naast onzichtbaarheid werd ook normvervaging veel genoemd: het langzaamaan normaal worden van abnormaal gedrag.

Zoals ik eerder al zei, heb ik geprobeerd mij af te vragen wat onze rol als data scientists hier kan zijn. Hoewel ik het lastig vind om een thema als normvervaging te duiden, is de onzichtbaarheid van ondermijning natuurlijk iets wat wij ons erg aantrekken. Het op een veilige, betrouwbare en slimme manier verzamelen, analyseren en visualiseren van data kan namelijk een belangrijk instrument zijn, daar waar onze eigen zintuigen te kort schieten!

2. De kanarie in de kolenmijn

De eerste spreker, de Zweedse criminoloog dr. Amir Rostami, wees er al op: let op de vroege signalen, en neem die signalen serieus, ook als ze niet alarmerend zijn of onbetrouwbaar lijken. Rostami noemde dat de aanwezigheid van motorclubs vaak een vroeg signaal van straatbendes zijn. Dat vond ik in eerste instantie moeilijk te geloven, omdat motorclubs een heel andere doelgroep hebben dan straatbendes. Zou het iets te maken hebben met een onderliggende maatschappelijke structuur die criminele subculturen faciliteert? Volgens Rostami niet – volgens zijn onderzoek is er een veel directere link tussen motorbendes en andere groepen lawbreakers zoals voetbalhooligans, gangs, en politieke of religieuze extremisten. Hij analyseerde een ecology of lawbreakers (wat mij als evolutionair econoom slash netwerkanalist bijzonder aanspreekt): een netwerk van personen die samen een misdaad plegen (co-offending), gegroepeerd op de verschillende criminele organisaties die ze aanhangen, en vond iets opvallends: motorbendes hebben een brugfunctie tussen de andere groepen lawbreakers. Motorclubs hebben dus wel degelijk iets te maken met straatbendes: ze vormen een voedingsbodem. Geen wonder dus dat ook Cedric Stuyck, sectiehoofd Georganiseerde Misdaad van Belgisch Limburg, er in zijn verhaal erop wees dat Outlaw Motorcycle Gangs (OMG’s – ja!) een faciliterende rol tussen andere criminele groepen hebben. Een vroeg signaal dat wellicht niet meteen alle alarmbellen doet afgaan is dus het onderzoeken waard, want misschien liggen de relaties complexer dan ze lijken. Ook Shanna Mehlbaum, onafhankelijk onderzoeker en criminoloog, benadrukte dat onderbuikgevoelens eigenlijk altijd terecht blijken te zijn. Deze moeten dus niet worden afgedaan als ongefundeerd of onbetrouwbaar, maar verdienen het om opgepakt te worden. Paul van Miert, de burgemeester van Turnhout zei treffend ‘als het regent in Antwerpen, dan drupt het in Turnhout.’

De bal ligt hier volgens mij voor een groot deel bij data scientists en andere analisten. Zij kunnen namelijk een belangrijke taak vervullen door vroege of onopvallende tekenen te signaleren en, misschien nog wel belangrijker, te onderzoeken wat die tekenen dan zouden kunnen zijn. Signalen zoals flinke toenames in lokale vestigingen van bedrijven uit criminogene branches zijn ons wel bekend, maar er zijn ongetwijfeld ook early warnings waar wij nog niet aan gedacht hebben! Het lijkt mij ook erg interessant om te onderzoeken welke rol data scientists kunnen hebben bij dat ‘onderbuikgevoel’. Per definitie is dat namelijk iets wat moeilijk te duiden is. Kan data helpen om onderbuikgevoelens te onderbouwen? Of kunnen we onderbuikgevoelens op een betekenisvolle manier visualiseren, zodat het de aandacht krijgt die het verdient?

3. A problem well stated is a problem half solved

Ook dit thema werd als eerste benoemd door dr. Amir Rostami. Hij zei dat er vaak te snel naar een ‘oplossing’ wordt gegrepen, zonder dat eerst uitgebreid besproken wordt wat het probleem nou eigenlijk is, hoe groot het probleem is, en voor wie het een probleem is. Ook mijn Nederlandse gesprekspartners tijdens de lunchpauzes herkenden dit. Ik vond dat dr. Robby Roks die aan de Erasmus Universiteit onderzoek doet naar internationaal drugstransport in de haven van Rotterdam een mooi voorbeeld gaf van een problem well stated. Hij werkt met crime scripts – een soort stripverhalen die een model vormen voor veelvoorkomende patronen in criminaliteit (zie ook een van onze eerdere blogs hierover). Voor internationale drugshandel gaf hij daarmee aan dat dit probleem eigenlijk niet één maar drie problemen zijn: ten eerste, drugshandel waar drugs verstopt zit in een container of sporttas, ten tweede drugshandel waarbij drugs verstopt zit in het handelswaar, zoals bananen en ananassen, en ten derde drugshandel waarbij drugs verstopt zit op het schip zelf. Specifiek voor ieder van deze drie patronen kon hij zwakke plekken op de Rotterdamse haven aanwijzen. Ik zou niet durven beweren dat het probleem daarmee half solved is, maar een goed begin is het halve werk. Of ja, minder dan de helft, dus.

Photo by Roman Mager on Unsplash

Ook voor dit thema zie ik een rol weggelegd voor ons als data scientists. Vaak verwacht men van data dat er heel complexe modellen en kamers vol computers nodig zijn om tot nieuwe inzichten te kunnen komen. In de praktijk is dat vaak niet zo: alleen al het zorgvuldig inventariseren van de beschikbare informatie en het op een intelligente manier weergeven ervan kan veel prangende vragen oplossen. Met andere woorden: waar we data kunnen inzetten om bijvoorbeeld te voorspellen waar de volgende drugsdumping kan zijn, zou altijd de eerste stap moeten zijn om te inventariseren hoeveel drugsdumpingen er eigenlijk zijn geweest, wat er gedumpt wordt, waar dat vandaan komt.

Congres in Corona-tijd

Er waren niet meer dan 80 gasten welkom bij dit congres, zodat de afstand te allen tijde goed bewaakt kon worden. In de zalen stonden de stoelen in een strak raster opgesteld. Voor tijdens de pauzes waren stoelen neergezet in de lounge, zodat iedereen plek heeft aan een tafel. Drankjes werden uitgeserveerd aan tafel en niet aan de bar, en borrelhapjes mocht je alleen oppakken met een servetje. Onder het mom van ‘nieuwe mensen leren kennen’ waren alle bezoekers met een oranje of blauwe sticker op hun naamkaartje ingedeeld in twee groepen, met ieder hun eigen designated zone, afgezet met oranje of blauwe ballonnen.

Voor mij, als iemand die nieuw is in deze community, was dat eigenlijk best prettig. Ik hoefde me niet bij drukbevolkte statafels naar binnen te kletsen, en een soepele openingszin ligt altijd klaar (‘wel gek hè, die afstand?’). Het is natuurlijk ook wel echt gek. Waar ik normaal toch zeker een dozijn handen zou schudden bij een evenement zoals dit, waren dat er nu misschien vijf geweest. Waar je normaal voorgesteld zou worden aan elkaars collega’s (‘Daar hebben we Klaas, die doet ook iets met data!’), moet je het nu treffen met je toevallige tafelpartner waar je de hele pauze aan vast zit. (Gelukkig hadden ze voor gezellige gespreksstarters gezorgd voor als je het even niet getroffen hebt – ik had ze niet nodig, gelukkig.)

Voorbeelden van gespreksstarters

Een ander nadeel vind ik dat een deel van de sprekers nu digitaal inbelden. Op zich een goede oplossing natuurlijk, maar het is jammer dat je zo’n spreker dan niet in de pauze kan benaderen om verder te praten. Toch vind ik een congres als deze nu de moeite waard. Dit congres heeft wel laten zien dat het mogelijk is om een fysiek evenement te organiseren op een veilige en verantwoorde manier en dat dat toch zeker beter is dan het digitale alternatief!

Relevante links

Whitepaper

Blogs

Webinars

Design Sprints in tijden van Corona

Wij zien de Design Sprint als een ideale manier om te innoveren en te starten met datagedreven werken in de publieke sector. Bij de oorspronkelijke Shintō Labs Design Sprint is het de bedoeling om met een klein team een aantal dagen intensief met elkaar te werken aan een oplossing in een afgesloten ruimte. Helaas ziet de wereld er in 2020 heel anders uit en is het geen vanzelfsprekendheid meer om fysiek bij elkaar te komen. Dat vergt enige uitdaging met het organiseren van Design Sprints.

Tegelijkertijd biedt het ook kansen om meer interactief en digitaal samen te werken. Wij zijn namelijk van mening dat de Shintō Labs Design Sprint ook online gehouden kan worden, zonder af te doen aan onze belofte: binnen vijf dagen ontwerpen en toetsen we een werkend prototype. Sterker nog, Remote Design Sprints hebben zelfs een aantal stevige voordelen boven fysieke sprints! In deze blog delen wij onze ervaringen, tips en oplossingen voor het doen van online Design Sprints.

Wat is het belangrijkste verschil tussen een digitale en een fysieke Design Sprint?

Wij krijgen regelmatig de vraag of design sprints ook digitaal kunnen. Maar wat is het belangrijkste verschil tussen een digitale Design Sprint en een fysieke Design Sprint? We bespreken in deze blog twee varianten van de design sprint:de fysieke Design Sprint, en de digitale Design Sprint (of remote Design Sprint). Het zal geen verrassing zijn dat het voornaamste verschil tussen een fysieke en een digitale Design Sprint is dat het sprintteam bij een fysieke sprint vijf dagen lang gezamenlijk in één ruimte werkt aan de sprint, terwijl bij een digitale Design Sprint het sprintteam in een digitale ruimte, zoals Teams, Zoom of GoToMeeting, samenkomt. Dat kan nodig zijn omdat het team thuis werkt in verband met het Coronavirus, maar bijvoorbeeld ook omdat verschillende teamleden in verschillende uithoeken van Nederland wonen. Een derde variant is de hybride Design Sprint. Bij een hybride Design Sprint worden bepaalde onderdelen digitaal gedaan en andere onderdelen fysiek, of zijn sommige leden van het sprintteam fysiek aanwezig en anderen digitaal. Naast het gebruik van software zoals Teams zijn er eigenlijk weinig grote verschillen tussen de fysieke en de digitale Design Sprint – de dagindeling, de voorbereiding, en het resultaat zijn bijna hetzelfde.

Shintō Labs Design Sprint

Remote Design Sprint: wat zijn de voor- en nadelen?

De afgelopen maanden hebben we allemaal gemerkt dat als het hele team thuis werkt, brainstorms en andere creatieve sessies vaak worden uitgesteld ‘tot we weer op kantoor zijn’, of toch niet zo soepel verlopen als we gewend zijn. Een (digitale) Design Sprint kan dan goed helpen om de discussie te structureren en om ideeën om te zetten in acties. Natuurlijk vinden wij het ook prettig om een paar dagen samen met een enthousiast team ‘in een hok te zitten’. Intensief samenwerken, kwartjes zien vallen, en het creëren van een goede sfeer zijn inspirerende aspecten van een Design Sprint. We zullen dus niet ontkennen dat een remote Design Sprint qua vibe wat lager scoort dan een fysieke sprint.  We durven wel te beweren dat het inhoudelijke resultaat van een remote Design Sprint – een gedeeld begrip van een complex probleem, een verzameling mogelijke oplossingen, en natuurlijk een gevalideerd prototype – gelijk is aan dat van een fysieke Design Sprint. Een Design Sprint gaat immers niet alleen om het bij elkaar brengen van mensen, maar vooral om het bij elkaar brengen van ideeën, en die passen gelukkig wèl door een glasvezelkabel.

Remote werken: online etiquette

Wellicht voor velen gesneden koek, voor anderen is het altijd nog steeds wennen: het online videobellen. Zeker met een remote Design Sprint is het van belang dat we de etiquette goed volgen om niet afgeleid worden door omgevingsgeluid zoals het balken van een ezel uit de tuin van de buurman (echt!), een slechte verbinding, onnodige discussies en andere ongemakkelijkheden. Bij een fysieke Design Sprint leggen wij ook altijd bij de introductie de ‘spelregels’ uit van de werkdagen. Ook bij Remote Design Sprints gelden spelregels om het geheel effectief en efficiënt (en niet onbelangrijk), plezierig te houden. Dit zijn in de basis de online etiquette voor video bellen en voor de zekerheid zetten wij het nog even op een rijtje:

De Basics

  • Een goede koptelefoon. Een goede koptelefoon schermt omgevingsgeluid en zorgt ervoor dat je je aandacht er beter bij kunt houden.
  • Een eigen laptop/desktop/tablet. In een Remote Design Sprint moet iedereen een eigen device hebben. Zet bij het inloggen van de sessie je volledige naam en je organisatie als ‘naam’ zodat iedereen weet dat jij het bent en alleen jij.
  • Rustige omgeving. Zowel voor jezelf als voor de andere sprint leden is het van belang om in een rustige ruimte te zitten waar niet om de paar minuten mensen binnen lopen of koffie zetten.
  • Een goede Internetconnectie. Zoek een plek op waarbij je voldoende bereik hebt en een stabiele verbinding voor videobeeld. Bij hele belangrijke bijeenkomsten kiezen wij er zelfs voor een verbinding met draad (ethernet) in plaats van draadloos – het zekere voor het onzekere.
  • Webcam aan. Laat weten dat je er bent en dat je er actief bent. Zet je webcam aan gedurende de sessies zodat iedereen je kan zien en weet dat je je aandacht er bij hebt.

Online videobellen: etiquette

Gedurende de sessies

  • Zet je microfoon standaard uit. Zet je microfoon alleen aan als je aan het woord bent. De omgevingsgeluiden kunnen afleiden en het proces en concentratie verstoren.
  • Steek je hand op als je iets wil zeggen/vragen. De Sprint Master ziet de handen en zal vervolgens de beurt geven.
  • Handgebaren voor snelle of eenvoudige terugkoppeling: vaak kan je met een handgebaar als de benodigde terugkoppeling geven. De drie meest gebruikte zijn:
    • Ja / mee eens: duim omhoog
    • Nee / niet mee eens: duim omlaag
    • Twijfel / ik weet het nog niet: hand horizontaal wiegen.
    • Uiteraard kan je zelf veel andere handgebaren bedenken die voldoende duidelijk zijn. Denk aan: wijsvinger voorwaarts roteren (tempo mag iets hoger), handpalm ‘remmen’ (tempo mag omlaag)  , time-out (koffie/bio-break), etc.

Etiquette deel 2: gedurende de sessies

Remote Whiteboards: kijk naar Mural of Mira

Het vertalen van de fysieke Design Sprint naar een remote Design Sprint kent een aantal obstakels. In de eerste plaats hechten we bij een fysieke Design Sprint veel waarde aan whiteboards, post-its, stiften en stapels papier. Er wordt veel getekend en geschreven, zowel door de sprintmaster als door de andere deelnemers, en alles wat we op papier zetten blijft gedurende de hele sprint toegankelijk ter inspiratie. Sinds de komst van software als Mural en Mira is dit gelukkig geen serieus obstakel meer. Deze software levert digitale whiteboards waaraan alle deelnemers vanaf hun eigen computer kunnen bijdragen. Bijkomende voordelen van zulke software is dat er oneindig veel ruimte is; we gebruik kunnen maken van ons eigen Design Sprint template om ons proces te structureren; en we aan het eind van de sprint met één muisklik een overzichtelijke rapportage van de hele sprint kunnen vastleggen!

Screenshot brainstormen met Mural

Andere werkvormen bij Remote Design Sprint

Een ander obstakel is dat het nou eenmaal behoorlijk vermoeiend is om lang achter elkaar achter een beeldscherm te zitten en digitale discussies te voeren. Bij een digitaal gesprek is het altijd net even wat ingewikkelder om te beoordelen of een ander al is uitgepraat, en zijn er meer afleidingen. Om met dit nadeel om te gaan hebben we de werkvormen die we gebruiken bij een design sprint aangepast. Waar we bij een fysieke sprint open gesprekken niet schuwen, proberen we bij een remote design sprint de balans te vinden tussen individuele en collectieve activiteiten. Zo zullen we jullie bijvoorbeeld vragen eerst zelf een aantal sprintvragen op te schrijven en te beoordelen, en deze daarna pas aan de rest van de groep voor te leggen. Daarnaast houden we ook wat vaker pauze.

Een groot voordeel van een remote Design Sprint ten opzichte van een fysieke sprint is dat afstand geen probleem meer is. Dat klinkt triviaal, maar het biedt ongekende voordelen: sprintteamleden hoeven niet samen op één plek te zijn, dus we kunnen sprintteam-leden, experts en testers uit het hele land (en daarbuiten) uitnodigen (!).

Digitale setup voor online Design Sprint

Remote Design Sprint: plezier hebben

Al onze klanten zijn – naast het resultaat – ook altijd zeer te spreken over de energie en het plezier dat ze beleven aan een Design Sprint. Die energie is en het plezier is bij een Remote Design Sprint lastiger vast te houden, maar niet onmogelijk. Een aantal tips en trucs die we hebben gekregen van deelnemers, andere sprint masters en docenten van universiteiten die inmiddels ook bij ons een plek hebben gekregen bij de Remote Design Sprint.

  • Maak een WhatsApp groepje aan om met elkaar in contact te blijven als er bijvoorbeeld een WiFi storing is of je laptop crasht, kan je alsnog met elkaar contact hebben en te laten weten wat er aan de hand is.
  • Werk in sessies van maximaal 45 minuten. Daarna volgt 15 minuten pauze. In die 15 minuten pauze worden soms wat individuele oefeningen gedaan, maar nooit meer dan 10 minuten. Er moet altijd minstens 5 minuten pauze zijn.
  • Wissel online en offline activiteiten af. Permanent naar het scherm kijken is vermoeiend en komt de creativiteit niet ten goede.
  • Probeer geregeld een leuke oefening te doen die niet per se direct iets met de sprint te maken heeft. Denk daarbij aan het maken van een foto van je lunch en die met elkaar delen. Of stel een vraag die iedereen kan beantwoorden met pen en papier en vervolgens het voor de camera houden. Het blijft een uitdaging om de aandacht vast te houden, maar met wat luchtige oefeningen is het goed te doen.

Is een combinatie van remote en fysieke design sprints ook mogelijk?

Jazeker! De Corona-pandemie heeft ons gedwongen met een frisse blik naar onze Design Sprints te kijken, maar het concept van remote design sprinten of hybride design sprinten is niet nieuw voor ons. Zo hebben we gemerkt dat het voor de data scientist die het prototype gaat bouwen nuttig kan zijn om een gedeelte van de design sprint remote aanwezig te zijn. Op die manier kan de data scientist bijdragen aan het sprintproces en tegelijkertijd voorbereidend werk doen voor het bouwen van het prototype, zoals het verzamelen van data of het klaarzetten van een aantal onmisbare onderdelen van het prototype. Ook worden de validatiesessies op dag 5 vaak digitaal gedaan. Dat is handig wanneer we met grote groepen te maken hebben, of bijvoorbeeld met testers vanuit verschillende Nederlandse gemeentes.

 

Sprintmaster Mignon Wuestman bezig met het onderdeel Value Proposition Design

In onze ervaring is het niet ongebruikelijk dat sprintdagen 1 tot 3 fysiek zijn, en sprintdagen 4 en 5 geheel digitaal. In de praktijk bekijken we per sprint wat de goede balans is tussen fysieke en digitale activiteiten. Ons uitgangspunt daarbij is niet dat fysieke design sprints beter zijn dan digitale design sprints: waar sommige onderdelen of werkvormen beter uit de verf komen bij een fysieke bijeenkomst, komen andere onderdelen juist digitaal beter tot hun recht!

Is een remote sprint korter dan een fysieke sprint?

Omdat er bij een remote sprint sneller ter zake wordt gekomen en lange digitale discussies minder inspirerend kunnen zijn, kan het verleidelijk zijn om de Design Sprint in te korten naar 3 of 4 dagen in plaats van 5. Wij raden dit niet aan. De Big Challenge waar we mee aan de slag gaan is immers nog even complex, en het goed verkennen van die challenge en mogelijke oplossingen ervan kost tijd. Daarnaast kost kennismaken met elkaar en de digitale omgeving en effectief en geconcentreerd communiceren via een beeldscherm juist meer tijd dan bij een fysieke sprint. Alleen wanneer het onderwerp van de sprint zich leent voor een ingekort programma, zoals bijvoorbeeld bij een Lens Design Sprint, raden we aan de sprint in te korten.

Als jullie tips hebben voor ons, mail ze naar mij op mignon@shintolabs.nl

Overzicht verschillen fysiek vs remote vs hybride Design Sprint

Meer informatie

Wil je meer weten over (remote) Design Sprinten? Laat het ons dan weten via onderstaand formulier!


Meer digitale content

Wil je automatisch op de hoogte blijven van onze digitale content? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

Relevante links

Whitepapers

Blogs

Academy

Testimonials

Photo credits Chris Montgomery on Unsplash

Masterclass – Het opsporen van verdachte netwerken in gemeentelijke data

Deze maand zijn we gestart met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als text analytics en graph databases.

Het opsporen van verdachte netwerken in gemeentelijke data

In deze editie vertelt data scientist Wesley Brants over over het opsporen van verdachte netwerken in gemeentelijke data. Aanbod komen onderwerpen zoals netwerktheorie, netwerk analyse, crime scripts en organized crime lab. Naast uitleg over de werking van graph databases worden ook voorbeelden uit onze praktijk besproken zoals de case Ondermijning & Fraude bij de gemeente Zaanstad en onze Risico Radar Ondermijning.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Wesley? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

De slides

Master-Class-Netwerkanalyse

 

Relevante links

Andere masterclasses

Blogs

 

Masterclass – Hoe voorkom ik bias in algoritmes

Deze maand zijn we gestart met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als netwerkanalyses en graph databases.

Correctie van bias-versterkende feedbackloops

In deze editie vertelt CTO en Co-founder Eric van Esch over de rol van bias (onbewuste vooroordelen) in algoritmes, of zoals hij dat liever noemt: algoritmische systemen, en wat je daar tegen kunt doen.  Naast theoretische kennis worden ook voorbeelden uit onze praktijk besproken zoals de Milieu Navigator en onze Risico Radar Ondermijning.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Eric? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

De slides

webinar-bias

 

Relevante links

Andere masterclasses

Blogs

 

Masterclass – Innovatietheorie voor de datagedreven overheid

Deze maand zijn we gestart met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als netwerkanalyses en graph databases.

Innovatietheorie voor de datagedreven overheid

In deze editie vertelt data scientist Mignon Wuestman over haar onderzoek naar innovatietheorie en de toepassing daarvan voor de datagedreven overheid. Naast theoretische kennis wordt onze Design Sprint aanpak benoemd als voorbeeld en de Woningbouw Monitor ter illustratie van een modulair systeem.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Mignon? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

De slides

Innovatietheorie_MLW_v2

 

Relevante links

Andere masterclasses

Blogs

 

Masterclass – Text Analytics en Machine Learning in de overheid

Deze maand starten we met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als netwerkanalyses en graph databases.

Text Analytics en Machine Learning in de overheid

In deze editie vertelt data scientist Martijn Heijstek over een toepassing van Text Analytics en Machine Learning in de overheid. Hij behandelt de case waarin content automatisch wordt geclassificeerd in het verlengde van een zaaksysteem: in dit geval Djuma van Visma|Circle.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Martijn? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

Relevante links

Andere masterclasses

Blogs

 

 

Onderzoek: hoe geodemografie kan helpen om data ‘eerlijker’ weer te geven

De afgelopen elf maanden ben ik ondergedompeld in de wereld van data. Via de ‘track’ Data Science als onderdeel van Information Studies aan de UvA kwam ik in contact met allerlei toffe algoritmes en maakte ik kennis met de problematiek achter de technische hoogstandjes. Een van deze problemen was gericht op ondermijning in Amsterdam en bij het zoeken naar vergelijkbare projecten kom je dan al snel uit bij Shintō Labs.

Met zwetende handjes heb ik een voorzichtig mailtje gestuurd naar het ‘Shinteam’ of ik ‘heel misschien’ en ‘alleen als het uitkomt’  langs mocht komen om de mogelijkheid tot een afstudeerstage te bespreken. Wat ik niet verwachtte is dat de daaropvolgende uitnodiging zo relaxed en soepel verliep dat ik direct verkocht was.  Daar wil ik graag mijn thesis schrijven! Inmiddels zijn we vijf maanden verder en is het papiertje op zak en ik kan wel stellen dat ik geen spijt heb van deze keuze. Natuurlijk was het hard buffelen, maar het waren ook enorm leerzame maanden waarbij ik vanaf dag één door het team ben opgenomen. Ook nam ik deel aan de Design Sprint met het RIEC Rotterdam en Bureau Beke op het thema Risico Radar Ondermijning, waarbij we op basis van open bronnen de mogelijke hotspots inzichtelijk maken. In deze sprint kon ik mijn onderzoek mooi toepassen.

In deze blog beschrijf ik mijn onderzoeksopzet en de eerste resultaten. In de onderstaande video kun je ook de presentatie zelf zien.


 

De casus

De core business van Shintō Labs bestaat uit het maken van datagedreven applicaties voor overheidsinstellingen. Vaak bevat een applicatie een dashboard met een kaart waarop dan data is geplot. In verband met privacy wordt die data vaak gepresenteerd per postcode, buurt of wijk (en dus niet per huis of gebouw).

De keuze voor het type gebiedsindeling kan echter een vertekenend beeld geven van de werkelijkheid. In figuur 1 zie je bijvoorbeeld drie representaties van exact dezelfde data, maar met verschillende gebiedsindelingen. Dit probleem staat in de boeken bekend als MAUP – The Modifiable Area Unit Problem. Dit fenomeen doet zich ook voor wanneer we data presenteren per postcode, buurt of wijk: hoe meer variatie er in zo een gebied plaats vindt, hoe meer informatie wordt weggegooid wanneer de data wordt geaggregeerd.

Figuur 1 Voorbeeld van ‘The Modifiable Area Unit Problem’

Een manier om dit probleem aan te pakken is door gebiedsindelingen datagestuurd te maken. Als we de bestaande wijken/buurten loslaten en kijken naar de achterliggende data, dan kunnen we gebieden creëren die de mensen in het gebied zo veel mogelijk vertegenwoordigen.  Dit doen we door middel van geodemografie;  ‘The study of people by where they live’ (Harris, 2005).

Geodemografie

Zoals de naam al prijs geeft is dit vakgebied een combinatie van geografie en demografie, waarmee de data ook direct complex wordt. In geodemografie word er gezocht naar betekenisvolle bundels om de mensen in een gebied te kunnen beschrijven. Deze bundels worden in de literatuur ook wel micro-communes of urban neighbourhoods genoemd. Door middel van algoritmen worden mensen ingedeeld in clusters, die vervolgens worden geplot op een kaart. In principe volgt iedere geodemografische clustering ruwweg hetzelfde proces van datapreparatie, algoritmeselectie en parameterselectie, maar het probleem ontstaat bij de evaluatie. Want wat zijn betekenisvolle clusters? Dat is een bijna filosofische vraag, die niet zomaar beantwoord kan worden. Voor de fijnproevers raad ik het paper van ‘What are true clusters’ aan van Christian Hennig.

Figuur 2. Voorbeeld van een geodemografische clustering van Eindhoven. Bron: CBS

Geodemografische cluster-evaluatie

In tegenstelling tot standaard ‘gesuperviseerde methoden’ is het valideren van een geodemografische clustering een schemerig gebied tussen kunst en wetenschap, het kwantitatieve en het kwalitatieve, objectiviteit en subjectiviteit (Harris, 2005). Zoals mijn docent het noemt, is cluster-evaluatie in feite een vorm van zwarte magie. 

Binnen de geodemografie is er wel een idee van enkele eigenschappen die een clustering betekenisvol maken, waarvan de belangrijkste eigenschap is, dat de clustering aansluit bij het doel en de context van het clusterprobleem. Om dat doel meetbaar te maken gebruiken we interne en/of externe criteria die helpen bij het maken van de keuze van het algoritme en de parameter instellingen.

De externe criteria bestaan soms uit vergelijkingen met referentieclassificaties of een zogenoemde ground truth. Veel vaker worden subjectieve criteria opgelegd met behulp van experts of de eindgebruikers. De interne evaluatie van een clustering bestaat uit het meten van een bepaalde regel die de data beschrijft zoals ‘hoe compact zijn de clusters?’ of ‘wat is de ratio tussen de gemiddelde inter en intra clusterafstand?’. Hoewel deze regels objectief zijn, is het wel de vraag hoeveel waarde je moet hechten aan de resulterende waarden en hebben deze regels zeker niet altijd toegevoegd nut. Over het algemeen wordt interne evaluatie daarom vooral gebruikt om het cluster proces te sturen en niet te leiden (Alexiou, 2017).

De interne evaluatie regels hebben nog een extra uitdaging, want deze methoden zijn over het algemeen niet aangepast aan geodemografische clustering. De meest gebruikelijke metrieken (zoals de Within-cluster sum-of-squares en de Silhouette index) worden alleen toegepast op de demografische data en niet op de geografische data. Dit terwijl ´echte’ microcommunes samenhang lijken te vertonen in zowel de geografische als demografische ruimte (Wolf et al., 2019).

De kern

In mijn onderzoek heb ik geprobeerd een regel op te stellen die speciaal geadapteerd is voor geodemografische data. Deze regel is gebaseerd op de Silhouette score, maar met een speciale functie die afstand kwantificeert als combinatie van geo- en demografische data. Er zitten aan een dergelijke functie nog flink wat haken en ogen: hoe verhoudt bijvoorbeeld geografie zich tot demografie? Uiteindelijk hebben we als ‘proof of concept’ de aanpak van Wolf et al. overgenomen (inmiddels liep de onderzoeksperiode al tegen het einde).

Uit een kleinschalig experiment komt naar voren dat de geodemografische score wel degelijk wat interessante patronen vertoont. Zeker ten opzichte van de conventionele (non-geografische) Silhouette score lijkt de nieuwe regel een stuk minder triviale patronen weer te geven. Dit bleek ook uit de validatie (feedback van gebruikers) van het prototype van de Risico Radar Ondermijning zoals ik die heb gerealiseerd voor het RIEC Rotterdam.

Lessons learned

Het voorgaande stuk ging vrij snel de diepte in en eindigt tamelijk theoretisch. Maar wat zijn nu de take home wijsheden die we tijdens het onderzoek zijn tegengekomen?

Een van de belangrijkste redenen om interne evaluatie regels te zoeken is om subjectiviteit in geodemografie te verminderen. We willen graag goed gefundeerde keuzes maken tijdens het clusterproces en idealiter is geodemografie zo transparant mogelijk. In de praktijk blijven de objectieve evaluatie technieken slechts een onderdeel van het clusterproces, waar de keuzes voor het algoritme en de parameter instellingen uiteindelijk worden gemaakt door mensen. Het maken van een geodemografische clustering is niet moeilijk, maar een goede geodemografische clustering maken is een flinke uitdaging, die ook afhangt van de context.

Hoe nu verder?

Tot nu toe hebben we een paar keer genoemd dat interne validatie regels vooral ‘betekenis’ krijgen in het kader van een context en met een expert/gebruiker om de context te interpreteren. Hoewel mijn thesis vooral de theorie van geodemografische evaluatie beslaat, zijn we natuurlijk erg benieuwd of de interne regels ook echt hulp bieden tijdens het clusteren. Daarom ben ik met het Shintō Labs team begonnen aan een interactieve module waarmee je je eigen (geodemografische) data kan clusteren. De module geeft adviezen op basis van de interne evaluatie regels, maar uiteindelijk is het aan de gebruiker om de waarde van de clustering in te schatten. Voor nu blijft het dashboard bij een prototype, maar mocht je interesse hebben in deze applicatie, neem dan contact op met het Shintō Labs.

Figuur 3. Prototype van het dashboard

Referenties

  • Alexiou, A. (2017). Putting ’Geo’ into Geodemographics: evaluating the performance of national classification systems within regional contexts. PhD thesis, University of Liverpool.
  • Harris, R., Sleight, P., and Webber, R. Geodemographics, GIS and Neighbourhood Targeting. Wiley, London, UK, 2005
  • Hennig, C. (2015). What are the true clusters?. Pattern Recognition Letters64, 53-62.
  • Wolf, L., Knaap, E., and Rey, S. J. (2019). Geosilhouettes: geographical measures of cluster fit.

Relevante links

Webinars

Casebeschrijving

Blog

Research

5 praktische handvatten om ‘algoritmekramp’ tegen te gaan

‘De gemeente Rotterdam stopt omstreden fraudeonderzoek met SyRi,’ kopte de Volkskrant op 4 juli jl. Een van de vele berichten de afgelopen tijd waarin het gebruik van data-analyse of erger ‘algoritmes’ negatief in het nieuws komt. Recent publiceerde de NOS nog een fraai artikel getiteld ‘Overheid gebruikt op grote schaal voorspellende algoritmes, ‘risico op discriminatie’. Ook hier ontstaat (in ieder geval door de kop) het beeld dat er sprake is van wildgroei en het ‘kwaad’ zich verder verspreidt zonder dat er grip op is. De begeleidende podcast van de journalisten geeft een genuanceerder beeld. We horen de journalist zelfs zeggen dat het begrijpelijk en goed is dat de overheid gebruik maakt van moderne technologie.

De discussie is terecht. Het gebruik van algoritmes kent risico’s. Maar het lijkt niet goed te lukken om het gesprek over algoritmes genuanceerd en goed geïnformeerd te voeren. Alleen al het woord algoritme zorgt voor een soort verkramping in de discussie en lijkt de gebruiker ervan in het beklaagdenbankje te zetten. Als bedrijf dat de overheid helpt om datagedreven te werken, waren we ons vanaf het begin bewust van de risico’s en ontwerpen en ontwikkelen we op een verantwoorde manier oplossingen. Niet omdat de publieke opinie daarom vraagt, maar omdat we een eigen moreel kompas hebben.

Omdat we vaker vragen krijgen over de ethische kanten van het gebruik van algoritmes hebben we een aantal handvatten op een rij gezet. Geen doorgrond essay, of concreet raamwerk, maar een aantal ervaringen uit onze praktijk. Omdat we open zijn over hoe wij omgaan met de risico’s van het gebruik van algoritmes.

1. Gebruik geen voorspellende algoritmes (als het niet nodig is)!

Ik geeft toe. Een beetje een dooddoener. Het begint natuurlijk bij de vraag: wat zijn voorspellende algoritmes? Ik ga er vanuit dat hiermee bedoeld wordt het begrip ‘predictive analytics’. Een methode waarmee veelal op basis van machine learning voorspellingen worden gedaan. Maar de wereld van data-analyse is breder dan alleen voorspellende algoritmes. Sterker nog: in onze praktijk zetten we predictive analytics vaak niet eens in. Zeker niet in onze oplossingen in het domein van toezicht & handhaving of veiligheid & openbare orde. Waarom niet? Omdat we geloven in ‘waardegestuurde’ ontwikkeling. Zie ook ons blog ‘Van datagestuurd naar waardegestuurd werken’. In het kort: zet het probleem en de gebruiker centraal en kijk van daaruit welke pijn het grootst is. Keer op keer blijkt dat de meeste waarde in eerste instantie wordt toegevoegd met een ‘beschrijvende analyse’. Niks voorspellingen op basis van machine learning dus, of in ieder geval niet vóór dat we weten waar de waarde zit, wat de feitelijke situatie is (beschrijvende analyse) en waar het probleem zit (diagnostisende analyse). Pas als aan die voorwaarden is voldaan kan er voorzichtig gekeken worden naar voorspellingen. Tot die tijd: gebruik geen voorspellende algoritmes!

Bron: Gartner

2. Wees transparant over data en modellen!

Zoals je in het artikel van de Volkskrant kunt lezen is een van de grootste obstakels bij SyRi dat voor de gebruiker niet duidelijk is op basis van welke datasets en indicatoren er een inzicht wordt verschaft. Omdat wij onze oplossingen ontwerpen vanuit gebruikersperspectief herkennen we hun behoefte om te weten op basis waarvan het systeem ergens een ‘rood puntje laat knipperen’. Zo zijn we voor de gemeente Zaanstad een data applicatie aan het ontwikkelen die de gemeente helpt bij het opsporen van o.a. woonfraude waarbij vanuit de applicatie inzichtelijk is welke datasets zijn gebruikt en op basis waarvan een indicatie wordt gegeven.

Screenshot prototype Ondermijning met beschrijving datasets en indicatoren

Screenshot prototype Ondermijning met beschrijving datasets en indicatoren

3. Gebruik indicatoren op basis van gedegen onderzoek!

Een veelgehoorde vrees is dat data-applicaties inzichten bieden die discrimineren. Data is immers niet objectief! Zeker bij het gebruik van ‘feedback loops’ zal een model leren op basis van ervaringen (data) uit het verleden en dat verleden bevestigen en versterken. Wat is dus een deugdelijk indicatie om bijvoorbeeld een pand te onderzoeken of daar iets mis is? Vaak vertalen we indicatoren van de (vak)mensen uit de praktijk naar het model maar proberen dat ook te onderbouwen door (wetenschappelijk) onderzoek. Zo hebben we met het RIEC Rotterdam een Risico Radar Ondermijning ontwikkeld waarbij Bureau Beke op basis van literatuuronderzoek en expert interviews een lijst van 52 indicatoren samengesteld die wij hebben gebruikt om zicht te krijgen op risico’s op ondermijning door bedrijven. In september organiseren we samen met het RIEC en Bureau Beke een webinar waarin we hier meer over vertellen. Zijn deze indicatoren daarmee allemaal 100% objectief? Nee, maar wel binnen de normen van de (gedrags-)wetenschap als significant bestempeld.

Jurriaan Souer (Shintō Labs) in actie met dr. Henk Ferwerda van Bureau Beke, onderzoeksbureau voor criminologische vraagstukken

4. Laat systemen niet beslissen, maar help de expert!

Er zijn (soms schrijnende) voorbeelden van Kafkaëske situaties waarbij de overheid besluiten neemt waar de mens geen grip meer op heeft. ‘Computer says no.’ De angst is dat voorspellende algoritmes besluiten nemen zonder dat er een mens aan te pas komt. Als ik dan roep dat zoiets nooit moet kunnen, dan zegt mijn collega Jurriaan relativerend tegen me: ‘Dus ook niet bij slimme vuilnisbakken die automatisch opdracht geven aan de vuilnisophaaldienst om geleegd te worden?’. Tja, daar natuurlijk wel. Maar in onze praktijk komt het zelden voor dat gebruikers één antwoord willen, laat staan een geautomatiseerd besluit. Ze willen een instrument dat ze helpt om op basis van hun eigen expertise makkelijker of sneller inzicht te krijgen dan nu het geval is. We kennen voorbeelden van beleidsambtenaren uit het veiligheidsdomein die na een melding soms anderhalve dag kwijt zijn om in 15 systemen te kijken om te bepalen of er iets aan de hand is. Het enige dat we doen is de data sneller aanleveren dan nu en deze zodanig visualiseren dat de expert kan besluiten om al dan niet tot actie over te gaan. We helpen dus bij het maken van een risico inschatting.

5. Realiseer je dat ‘bias’ in de mens zit en daarmee ook in de data

Tijdens onze Design Sprints, het startpunt van onze ontwikkeling, nemen we veel tijd om gebruikers te laten vertellen over het vraagstuk. We willen weten hoe ze daar nu mee omgaan, dus zonder data-analyse en algoritmes. Als wij met mensen uit de wereld van toezicht en handhaving praten en ze vragen waar risico op een overtreding is, dan kunnen ze zo een lijstje van risicoindicatoren oplepelen. Hoe ze daarbij komen? Ervaring. Als jij bij controles meerdere keren fraude aantreft bij een bepaald soort bedrijven dan word je als handhaver alerter en controleer je vaker bij dat soort bedrijven. Is dat terecht? Misschien wel, misschien niet. In iedere geval heel menselijk. Dataprojecten versterken niet de bias. Ze leggen die juist bloot.

Bron: https://dilbert.com/

Tot slot

Ik zat laatst het radioprogramma BNR Digitaal te luisteren toen ik Rudy van Belkom hoorde zeggen: ‘We hebben het altijd over ‘explainable AI’ maar hoe ‘explainable’ is menselijk gedrag eigenlijk?’ Een mooi inzicht wat mij betreft. Geen complexer neuraal netwerk dan het menselijk brein. Discriminatie is een product daarvan. Laten we ons dus met of zonder algoritmen daarvan bewust blijven. Waar het om gaat, is dat we de uitwassen tot een minimum beperken.

P.s. binnenkort zal onze Chief Data Scientist Eric een vervolg op dit blog schrijven hoe we in technische zin het risico op ‘bias’ proberen te minimaliseren. Wil je automatisch bericht ontvangen via email als dat blog verschijnt? Schrijf je dan hier in.

Relevante links

Credits top photo: Alexandra Gorn (via Unsplash.com)

 

Evenementen

Niets Gevonden

Uw zoekopdracht leverde helaas geen artikelen op