De Opdrachtgever

Visma Circle

De opdrachtgever was Visma | Circle

De Challenge

Gemeentes krijgen veel post binnen, fysiek en digitaal. Het efficiënt classificeren (wat is het?) en koppelen aan persoon of bestaande zaak (van wie is het?) is een omvangrijk probleem. De challenge van dit project was of we dit autoclassificatie probleem konden aanpakken met hulp van machine learning technieken en kunstmatige intelligentie.

De Aanpak

Voor dit traject is samengewerkt met Visma | Circle om eerst te onderzoeken of het technisch realiseerbaar is en of de klanten hier interesse in hebben. Met hulp van een Design Sprint is dit proces ingevuld en na een positieve validatie vanuit techniek, inhoud en klantervaring is dit omgezet in een werkende oplossing.

Het Resultaat

Djumalytics is opgezet met hulp van een neurale netwerk en Microsoft Cognitive Service en kan ingekomen post herkennen en automatisch registreren, maar ook documenten en e-mails die behandelaars aan een zaak toe willen voegen. Inmiddels maken vele gemeentes gebruik van Djumalytics in hun dagelijkse werkzaamheden.

300000

Hoeveelheid documenten getraind voor het model

159475

Te trainen parameters

800

pagina’s dagelijks geclassificeerd

200

Zaaktypen in de trainingset

Maatschappelijk vraagstuk

Wat krijg je als een modern SaaS-based zaaksysteem combineert met kunstmatige intelligentie en deep learning technologie? Dat was de vraag die onderzocht werd samen met Visma | Circle. De uitdaging waar veel gemeentes voor staan is hoe de grote hoeveelheden inkomende post efficiënt en effectief  vewerkt kunnen worden. De vragen die altijd spelen zijn:

  • Van wie komt het document ? (en dat kan zowel een persoon als een organisatie zijn)
  • Waar heeft het document betrekking op ? (wat is het onderwerp? heeft het betrekking op een lopende zaak?)
  • Wat is het ’type’ document ? (de classificatie: een aanvraag? een melding? etc).

Dit is een kennisintensief probleem en vraagt veel van de medewerkers bij gemeentes. Veel soorten documenten lijken namelijk behoorlijk op elkaar. Bovendien komen documenten in alle soorten en maten binnen: van e-mails tot handgeschreven brieven.

De vraag was dan ook of automatische beeldherkenning en machine learning technieken gebruikt kunnen worden om deze documenten te classificeren en voor te sorteren op een snellere en correctere afhandeling door de medewerkers.

Dat was het doel van Djumalytics: slimme software om documenten foutloos, snel en steeds beter (zelflerend) te laten registreren.

Djumalytics

Meer informatie?

Bekijk het Webinar:


Het Resultaat

  • Automatisch herkennen van documenten

    Djumalytics vergelijkt de binnenkomende post met de vele documenten waarop het model getraind is en geeft de gebruiker een suggestie voor classificatie terug.

  • NAW herkenning

    Djumalytics herkent de afzender (persoon of bedrijf) van de post. Om dit te optimaliseren wordt er in de verschillende lagen gebruik gemaakt van integraties met basisregistrsties, zoals de BAG, het Handelsregister en de BRP.

  • Diepe integratie met Djuma

    Djumalytics maakt volledig onderdeel uit van Djuma en dit betekent dat de integratie een stukje verder gaat dan met bijvoorbeeld een slimme scanstraat. Bij het registreren van een document staan gegevens zoals zaaktype, omschrijving, titel en documenttype al ingevuld.

Technologie

Machine Learning is een breed onderdeel van kunstmatige intelligentie dat zich bezighoudt met de ontwikkeling van algoritmes en technieken waarmee computers kunnen leren. In Djumalytics wordt veel gebruik gemaakt van Machine Learning om de data te analyseren en kennis uit documenten te abstratheren. Er worden zowel deterministische methodes gebruikt (die op basis van regels altijd tot een antwoord leiden) als probabilistische methodes (die gebruik maken van statistische methoden om de beste oplossing te berekenen met een bepaalde kans).

In de kern zit een neurale netwerk dat door middel van interconnected layers opzoek naar non lineare verbanden binnen de data. Dit alles is als een webservice beschikbaar zodat het zaaksysteem Djuma hier gebruik van kan maken. Voor de eindgebruiker is het puur functioneel: Djuma geeft bij een document aan welk type het is en wat relevante kenmerken zijn.

Sleutel woorden: Python, Keras, Text Analytics, Optical Character Recognition (OCR), Natural Language Processing (NLP), Lemmatization, TF-IDF, Multilayer Perceptron (MLP), skewed datasets.

Keras

De Data

Bij het bepalen van de NAW  maakt djumalytics gebruik van de volgende databronnen:

BAG

Voor het toetsen van adressen

Handelsregister

Voor het toetsen van bedrijfsadressen

BRP

Voor het bepalen van personen en huisadressen

Wil je meer weten?

Neem gerust contact met ons op voor meer informatie:


Misschien vind je dit ook interessant