Tag Archief van: machine learning

Negen innovatieve ideeën voor de Woningbouw Monitor

Onze trouwe volgers weten dat de ‘Lean Startup’ een belangrijke inspiratiebron voor ons denken en doen is. In het kort: hoe kunnen we ideeën zo snel mogelijk toetsen op waarde alvorens we tijd en energie in de realisatie ervan gaan stoppen. Ook bij de doorontwikkeling van onze producten hanteren wij deze aanpak, waarbij we eerst proefversies (of ‘beta-versies’) van functies beschikbaar stellen om feedback op te halen bij onze gebruikers. Hoe ziet dat eruit? In dit blog belichten we 9 nieuwe ideeën voor de Woningbouw Monitor.

Het ‘Labs’ onderdeel van de Woningbouw Monitor is een verzameling innovatieve functionaliteiten (in ontwikkeling) die het productteam van Shintō Labs ontworpen heeft om gebruikers van de Woningbouw Monitor nog beter te ondersteunen. De nieuwe functies zijn nog niet helemaal uitontwikkeld, maar geeft de gebruikers van de Woningbouw Monitor wel de mogelijkheid om ze in een vroeg stadium uit te proberen en daar feedback op te geven,

 

Figuur 1: het ‘Labs’ onderdeel van de Woningbouw Monitor

Voor iedereen die zich aangemeld heeft is een nieuw menu item ‘Labs’ in de Woningbouw Monitor beschikbaar. Labs is permanent in ontwikkeling en de inhoud is dan ook aan verandering onderhevig. Op moment van schrijven bevat Labs  negen nieuwe functionaliteiten die ik hieronder zal toelichten:

  1. Snel overzicht plot
  2. Uitval prognose
  3. Vertraging analyse
  4. Doelstellingen plot
  5. BAG Woningvoorraad+
  6. Vergunningen
  7. Conversie
  8. Rubik’s Cube
  9. Rapportage lab

1. Snel overzicht plot

Probleem: specifieke (afwijkende) grafieken

De Woningbouw Monitor heeft verschillende grafieken en overzichten voor de beleidsmedewerkers. De veelvoorkomende vragen zoals: aantallen woningtypen, projectfase, opleverjaren, prijsklassen, huur/koop, sociale huur, etc. en zowel cumulatief als jaarlijks worden standaard meegeleverd en reageren bovendien op de filters aan de rechterkant. Maar, vaak zijn er specifieke vragen die nét niet in een standaard grafiek passen. Uiteraard kan alle data te allen tijde geëxporteerd worden naar Excel voor verder analyse en grafiekjes, maar soms wil de beleidsmedewerker even snel een eigen dwarsdoorsnede maken van de data.

Oplossing: zelf grafieken samenstellen

Met de Snel Overzicht Plot kan een beleidsmedewerker zelf grafieken samenstellen op basis van enkele parameters. Kies zelf welke groepen je wilt gebruiken en hoe je de kleurverdeling wenst. Kies vervolgens de gewenste opmaak zodat het visueel aan je wensen voldoet. Maak op deze manier in een handomdraai je eigen grafieken en sleep het grafiekje zo naar je Word-rapportage of presentatie.

Figuur 2: Snel overzicht plot

2. Uitval prognose

Probleem: “what if”-scenario’s doorrekenen

De Woningbouw Monitor is een cijfermatige werkelijkheid. Maar wie zegt dat alle projecten die in Planologische voorbereiding zitten ook daadwerkelijk gebouwd gaan worden? Iedereen die actief is in de woningbouw weet dat er altijd een mate van onzekerheid is – zeker nu. Hoe gaan we om met dit soort onzekerheden en halen we dan onze doelstelling wel?

Oplossing: Uitval Prognose

Met de uitval prognose kun je aangeven per projectfase hoe groot de kans is dat de woningen in de projecten binnen die fase ook daadwerkelijk gerealiseerd worden. Met een zekere bandbreedte en inschatting kan op die manier een aantal “what-if”-scenario’s worden doorgerekend.

Figuur 3: Uitvalprognose

3. Vertraging analyse

Probleem: Hoe weet je wat de kans is dat een project vertraagd?

Dat projecten vertragen is nu eenmaal een feit. Maar wat zijn kenmerken waardoor projecten vertragen? Welke factoren dragen daar aan bij?

Oplossing: Voorspellend model

Om deze vraag te beantwoorden hebben we met hulp van machine learning een decision tree gemaakt om een voorspelling te maken van het risico op vertraging. Je kunt zelf parameters kiezen die meegewogen worden in de analyse en het systeem geeft antwoord op de vraag welke factoren een rol hebben gespeeld.

 

Figuur 4: Vetragingsanalyse

4. Doelstellingen plot

Probleem: Halen we specifieke doelstellingen? En met welke scenario’s halen we onze doelstellingen ?

De programma match is een standaard functionaliteit van de Woningbouw Monitor, maar die geeft vooral aan men op koers ligt voor de algemene doelstellingen zoals gedefinieerd in het woonprogramma. Maar wat als we specifieke extra doelstellingen hebben? En verschillende scenario’s willen bekijken om te zien of dat haalbaar is?

Oplossing: Doelstellingen plot

Met de doelstellingen plot kunnen verschillende scenario’s doorgerekend worden om de oplevering per jaar te bepalen. Wat als we ‘x’-aantal woningen per jaar in de categorie ‘huur’ en ‘y’-aantal woningen in de categorie ‘koop’ realiseren, komen we dan uit met onze doelstellingen? Met dit soort scenario’s kan geanticipeerd worden op de beoogde doelstellingen.

5. BAG Woningvoorraad+

Probleem: Wat zit er op dit moment allemaal in mijn buurt/wijk/dorp/stad ?

In de basis hadden we vooral de BAG als bron voor de woningvoorraad. Maar steeds meer komt er vraag om meer kenmerken toe te voegen. Hoe staat het met de gezinssamenstelling? Inkomen? En andere sociaal-demografische voorzieningen? Maar ook: welke voorzieningen zijn er in de buurt? Deze informatiebehoefte is noodzakelijk voor de beleidsmedewerkers om de juiste afwegingen te maken, adviezen te geven en te rapporteren.

Oplossing: Meerdere bronnen combineren en inzichtelijk maken in de Woningvoorraad+

Met de BAG Woningvoorraad+ bieden we precies een antwoord op bovenstaande vragen. We combineren BAG data met CBS data en OSM om een goed beeld te geven wat er speelt in een buurt/wijk/dorp/stad. Je kunt op gemeente niveau, of een kleinere geografische eenheid kiezen (of zelf een gebied intekenen) en alle relevante informatie bevragen en samenvatten.

6. Vergunningen

Probleem: Zijn er relevant vergunningen afgegeven?

Om de informatiepositie van de beleidsmedewerker te versterken is er de behoefte om ook inzage te krijgen in welke vergunningen er afgegeven zijn. Een melding van een relevante vergunningen kan voor de beleidsmedewerker een signaal zijn om bepaalde projecten aan te passen of om contact op te nemen met de betreffende afdeling om de details op te vagen.

Oplossing: Vergunningen

De Vergunningen functionaliteit doet eigenlijk wat je zou verwachten: het ‘luistert’ naar een open data set met gepubliceerde vergunningen, filtert die op relevantie en laat die in een overzicht zien. Aan de hand van de voorkeuren van de beleidsmedewerker kan deze datastroom geoptimaliseerd worden.

7. Conversie: data conversie monitor

Probleem: Datakwaliteit van integraties waarborgen

De Woningbouw Monitor heeft soms integraties met achterliggende systemen uit de ‘back office’ van een gemeente. Die data wordt dan periodiek opgehaald, opgeschoond en ingelezen. De data is echter zelden volledig opgeschoond, van hoge kwaliteit, en betrouwbaar. Hoewel het wel mogelijk is om geïmporteerde data te wijzigen in de Woningbouw Monitor wordt dit idealiter in de bron aangepast. Maar hoe hou je zicht op wat er wel en wat er niet goed gaat?

Oplossing: Data conversie monitor

De data conversie monitor houdt keurig bij welke import wanneer is gedaan en wat er wel en wat er niet goed is gegaan. Zo ontstaat er een uitval lijst waarmee de bron eigenaren de nieuwe data import in een aantal iteraties kunnen optimaliseren. Bekijk het webinar met de gemeente Ede over hoe zij op deze manier in enkele slagen de uitval lijst met 90% hebben weten te reduceren.

8. Rubik’s Cube

Probleem: Datasets grouperen en kantelen

De datastructuur van de Woningbouw Monitor is opgebouwd uit rijen met project (en deelproject) informatie. Maar soms wil je de data ook ‘kantelen’ of op een andere manier ‘groeperen’, net als bij de Rubik’s Cube.

Oplossing: Rubik’s Cube

De Rubik’s Cube is een nieuwe module waarbij je bestaande datasets kunt groeperen en kantelen om zo nieuwe inzichten te krijgen en nieuwe rapportages te maken. Dit wordt typisch gebruikt in een gemeente met meerdere kernen om zo de data te groeperen per woonkern en dit verder uit te splitsen. De Rubik’s Cube is een hele leuke nieuwe toevoeging die veel gebruikt wordt

9. Rapportage

Probleem: Eigen rapportages

Shintō Labs levert standaard de provincierapportage en daarnaast kunnen alle selecties altijd geëxporteerd worden (naar Excel). Maar soms willen gemeentes een eigen rapportage voor specifieke overleggen. Dat kan zijn op basis van bepaalde kenmerken of statussen (bijvoorbeeld: groepeer alle projecten met juridische status ‘in aanbouw genomen’), soms op basis van geografische eigenschappen ‘binnen de ring’ en ‘buiten de ring’, etc. Dit soort maatwerk Excel rapportages worden door gemeentes gebruikt bij overleggen rondom prioritering.

Oplossing: Rapportages

Shintō Labs heeft om die reden een module ontwikkeld voor eigen rapportages waarbij de beleidsmedewerker met een druk op de knop de gewenste rapportage gepresenteerd krijgt. Afhankelijk van hoe generiek de wensen zijn worden deze rapportages standaard aangeboden in het Lab voor andere gemeentes.


Dit zijn negen voorbeelden van functionaliteiten die uit de Labs van de Woningbouw Monitor komen. Er zijn nog meerdere functionaliteiten in ontwikkeling. Mocht je hiervan op de hoogte willen blijven, schrijf je dan in voor onze nieuwsbrief of neem gerust contact met ons op.

Zie ook

Webinar

Whitepapers

Blogs

 Testimonials

Foto credit: Michael Bader op Unsplash

Masterclass – Text Analytics en Machine Learning in de overheid

Deze maand starten we met een serie video’s waarin we onze kennis delen onder de noemer: Shintō Labs Masterclass. In iedere editie komt een expert aan het woord om over een specifiek onderwerp zijn of haar kennis te delen. We gaan in op verschillende vraagstukken rondom datagedreven werken en data analytics in de overheid. Onderwerpen kunnen variëren van innovatie methodiek, privacy, ethiek maar ook meer technische onderwerpen als netwerkanalyses en graph databases.

Text Analytics en Machine Learning in de overheid

In deze editie vertelt data scientist Martijn Heijstek over een toepassing van Text Analytics en Machine Learning in de overheid. Hij behandelt de case waarin content automatisch wordt geclassificeerd in het verlengde van een zaaksysteem: in dit geval Djuma van Visma|Circle.

Vragen en feedback

Heb je een vraag of opmerkingen over de vodcast van Martijn? Laat het ons dan weten via onderstaand formulier!


Abonneren

Wil je automatisch op de hoogte blijven van nieuwe edities van de Shintō Labs Masterclass? Abonneer je dan op ons Youtube kanaal of stuur ons bericht via bovenstaand formulier en vink de ‘blog’ optie aan!

Relevante links

Andere masterclasses

Blogs

 

 

Biosensoren als voorspeller van agressief gedrag bij cliënten

Peter de Looff promoveerde half mei aan de Radboud Universiteit op een onderzoek bij Expertisecentrum De Borg, een expertisecentrum voor geestelijke gezondheidszorg. Het onderzoek ging over het gebruik van biosensoren als voorspeller van agressief gedrag bij cliënten en burn-outverschijnselen bij begeleiders. Samen met Peter ontwikkelde Remko Duursma van Shintō Labs een Shiny app waarin de data kan worden geanalyseerd.

Slimme horloges

Peter liet met zijn onderzoek zien dat slimme horloges (voorzien van biosensoren die bijvoorbeeld beweging, huidgeleiding en hartslag meten) kunnen voorspellen wanneer bij een cliënt of begeleider de spanning te hoog oploopt. Zo’n 20 minuten voordat een cliënt een agressieve uitbarsting krijgt, zijn er opvallende piekjes in huidgeleiding te zien. Dat is belangrijk om te weten, want het geeft begeleiders de kans om de opbouwende stress bij cliënten te verminderen voordat het escaleert. En bij zichzelf kunnen ze ook maatregelen nemen om de spanning weg te nemen, bijvoorbeeld door het toepassen van ademhalingstechnieken. In deze video deelt Peter in een kleine 10 minuten de belangrijkste bevindingen uit zijn onderzoek Aggressive behaviour, burnout and physiology. Predictors of aggression in patients and burnout symptoms in nursing staff: biosensors.

Shintō Academy

In augustus benaderde Peter Shintō Labs door zich in te schrijven aan de Academy voor de Training Prototypen met Shiny. In het contact dat daarop volgde met onze trainer Remko Duursma bleek dat een maatwerk training beter paste bij de vraag van Peter. Het analyseren van de onderzoeksdata had Peter al met RStudio gedaan, maar nu wilde hij een applicatie bouwen met Shiny. Uiteindelijk hebben Peter en Remko samen in vier dagen niet alleen aan kennisoverdracht gedaan maar ook een prototype van een Shiny applicatie gebouwd voor deze toepassing. Wil je meer weten over de Training Prototypen met Shiny of de andere trainingen? Check dan onze Academy website!

Zie ook:

 

 

5 praktische handvatten om ‘algoritmekramp’ tegen te gaan

‘De gemeente Rotterdam stopt omstreden fraudeonderzoek met SyRi,’ kopte de Volkskrant op 4 juli jl. Een van de vele berichten de afgelopen tijd waarin het gebruik van data-analyse of erger ‘algoritmes’ negatief in het nieuws komt. Recent publiceerde de NOS nog een fraai artikel getiteld ‘Overheid gebruikt op grote schaal voorspellende algoritmes, ‘risico op discriminatie’. Ook hier ontstaat (in ieder geval door de kop) het beeld dat er sprake is van wildgroei en het ‘kwaad’ zich verder verspreidt zonder dat er grip op is. De begeleidende podcast van de journalisten geeft een genuanceerder beeld. We horen de journalist zelfs zeggen dat het begrijpelijk en goed is dat de overheid gebruik maakt van moderne technologie.

De discussie is terecht. Het gebruik van algoritmes kent risico’s. Maar het lijkt niet goed te lukken om het gesprek over algoritmes genuanceerd en goed geïnformeerd te voeren. Alleen al het woord algoritme zorgt voor een soort verkramping in de discussie en lijkt de gebruiker ervan in het beklaagdenbankje te zetten. Als bedrijf dat de overheid helpt om datagedreven te werken, waren we ons vanaf het begin bewust van de risico’s en ontwerpen en ontwikkelen we op een verantwoorde manier oplossingen. Niet omdat de publieke opinie daarom vraagt, maar omdat we een eigen moreel kompas hebben.

Omdat we vaker vragen krijgen over de ethische kanten van het gebruik van algoritmes hebben we een aantal handvatten op een rij gezet. Geen doorgrond essay, of concreet raamwerk, maar een aantal ervaringen uit onze praktijk. Omdat we open zijn over hoe wij omgaan met de risico’s van het gebruik van algoritmes.

1. Gebruik geen voorspellende algoritmes (als het niet nodig is)!

Ik geeft toe. Een beetje een dooddoener. Het begint natuurlijk bij de vraag: wat zijn voorspellende algoritmes? Ik ga er vanuit dat hiermee bedoeld wordt het begrip ‘predictive analytics’. Een methode waarmee veelal op basis van machine learning voorspellingen worden gedaan. Maar de wereld van data-analyse is breder dan alleen voorspellende algoritmes. Sterker nog: in onze praktijk zetten we predictive analytics vaak niet eens in. Zeker niet in onze oplossingen in het domein van toezicht & handhaving of veiligheid & openbare orde. Waarom niet? Omdat we geloven in ‘waardegestuurde’ ontwikkeling. Zie ook ons blog ‘Van datagestuurd naar waardegestuurd werken’. In het kort: zet het probleem en de gebruiker centraal en kijk van daaruit welke pijn het grootst is. Keer op keer blijkt dat de meeste waarde in eerste instantie wordt toegevoegd met een ‘beschrijvende analyse’. Niks voorspellingen op basis van machine learning dus, of in ieder geval niet vóór dat we weten waar de waarde zit, wat de feitelijke situatie is (beschrijvende analyse) en waar het probleem zit (diagnostisende analyse). Pas als aan die voorwaarden is voldaan kan er voorzichtig gekeken worden naar voorspellingen. Tot die tijd: gebruik geen voorspellende algoritmes!

Bron: Gartner

2. Wees transparant over data en modellen!

Zoals je in het artikel van de Volkskrant kunt lezen is een van de grootste obstakels bij SyRi dat voor de gebruiker niet duidelijk is op basis van welke datasets en indicatoren er een inzicht wordt verschaft. Omdat wij onze oplossingen ontwerpen vanuit gebruikersperspectief herkennen we hun behoefte om te weten op basis waarvan het systeem ergens een ‘rood puntje laat knipperen’. Zo zijn we voor de gemeente Zaanstad een data applicatie aan het ontwikkelen die de gemeente helpt bij het opsporen van o.a. woonfraude waarbij vanuit de applicatie inzichtelijk is welke datasets zijn gebruikt en op basis waarvan een indicatie wordt gegeven.

Screenshot prototype Ondermijning met beschrijving datasets en indicatoren

Screenshot prototype Ondermijning met beschrijving datasets en indicatoren

3. Gebruik indicatoren op basis van gedegen onderzoek!

Een veelgehoorde vrees is dat data-applicaties inzichten bieden die discrimineren. Data is immers niet objectief! Zeker bij het gebruik van ‘feedback loops’ zal een model leren op basis van ervaringen (data) uit het verleden en dat verleden bevestigen en versterken. Wat is dus een deugdelijk indicatie om bijvoorbeeld een pand te onderzoeken of daar iets mis is? Vaak vertalen we indicatoren van de (vak)mensen uit de praktijk naar het model maar proberen dat ook te onderbouwen door (wetenschappelijk) onderzoek. Zo hebben we met het RIEC Rotterdam een Risico Radar Ondermijning ontwikkeld waarbij Bureau Beke op basis van literatuuronderzoek en expert interviews een lijst van 52 indicatoren samengesteld die wij hebben gebruikt om zicht te krijgen op risico’s op ondermijning door bedrijven. In september organiseren we samen met het RIEC en Bureau Beke een webinar waarin we hier meer over vertellen. Zijn deze indicatoren daarmee allemaal 100% objectief? Nee, maar wel binnen de normen van de (gedrags-)wetenschap als significant bestempeld.

Jurriaan Souer (Shintō Labs) in actie met dr. Henk Ferwerda van Bureau Beke, onderzoeksbureau voor criminologische vraagstukken

4. Laat systemen niet beslissen, maar help de expert!

Er zijn (soms schrijnende) voorbeelden van Kafkaëske situaties waarbij de overheid besluiten neemt waar de mens geen grip meer op heeft. ‘Computer says no.’ De angst is dat voorspellende algoritmes besluiten nemen zonder dat er een mens aan te pas komt. Als ik dan roep dat zoiets nooit moet kunnen, dan zegt mijn collega Jurriaan relativerend tegen me: ‘Dus ook niet bij slimme vuilnisbakken die automatisch opdracht geven aan de vuilnisophaaldienst om geleegd te worden?’. Tja, daar natuurlijk wel. Maar in onze praktijk komt het zelden voor dat gebruikers één antwoord willen, laat staan een geautomatiseerd besluit. Ze willen een instrument dat ze helpt om op basis van hun eigen expertise makkelijker of sneller inzicht te krijgen dan nu het geval is. We kennen voorbeelden van beleidsambtenaren uit het veiligheidsdomein die na een melding soms anderhalve dag kwijt zijn om in 15 systemen te kijken om te bepalen of er iets aan de hand is. Het enige dat we doen is de data sneller aanleveren dan nu en deze zodanig visualiseren dat de expert kan besluiten om al dan niet tot actie over te gaan. We helpen dus bij het maken van een risico inschatting.

5. Realiseer je dat ‘bias’ in de mens zit en daarmee ook in de data

Tijdens onze Design Sprints, het startpunt van onze ontwikkeling, nemen we veel tijd om gebruikers te laten vertellen over het vraagstuk. We willen weten hoe ze daar nu mee omgaan, dus zonder data-analyse en algoritmes. Als wij met mensen uit de wereld van toezicht en handhaving praten en ze vragen waar risico op een overtreding is, dan kunnen ze zo een lijstje van risicoindicatoren oplepelen. Hoe ze daarbij komen? Ervaring. Als jij bij controles meerdere keren fraude aantreft bij een bepaald soort bedrijven dan word je als handhaver alerter en controleer je vaker bij dat soort bedrijven. Is dat terecht? Misschien wel, misschien niet. In iedere geval heel menselijk. Dataprojecten versterken niet de bias. Ze leggen die juist bloot.

Bron: https://dilbert.com/

Tot slot

Ik zat laatst het radioprogramma BNR Digitaal te luisteren toen ik Rudy van Belkom hoorde zeggen: ‘We hebben het altijd over ‘explainable AI’ maar hoe ‘explainable’ is menselijk gedrag eigenlijk?’ Een mooi inzicht wat mij betreft. Geen complexer neuraal netwerk dan het menselijk brein. Discriminatie is een product daarvan. Laten we ons dus met of zonder algoritmen daarvan bewust blijven. Waar het om gaat, is dat we de uitwassen tot een minimum beperken.

P.s. binnenkort zal onze Chief Data Scientist Eric een vervolg op dit blog schrijven hoe we in technische zin het risico op ‘bias’ proberen te minimaliseren. Wil je automatisch bericht ontvangen via email als dat blog verschijnt? Schrijf je dan hier in.

Relevante links

Credits top photo: Alexandra Gorn (via Unsplash.com)