• Home
  • Big data en machine learning in het land van Woo

Big data en machine learning in het land van Woo

0042 - Artificial Intelligence - ImagetxtInformatievragen van burgers en media op basis van de Wet open overheid (Woo) leggen steeds meer beslag op overheidsorganisaties. Ambtenaren zijn zeeën aan tijd kwijt met het doorzoeken van beleidsdocumenten en e-mails en met het weglakken van gevoelige gegevens. Gemeentes, provincies en de kerndepartementen in Den Haag kunnen er niet meer onderuit hun gegevensmanagement slim te organiseren en zoveel als mogelijk de afhandeling van de Woo te automatiseren. Met een volwassen datastrategie besparen diensten flink op de arbeidsuren en wordt de samenwerking met interne en externe partners hechter en veiliger.

In haar taak om het maatschappelijke leven in goede banen te leiden heeft ook de Nederlandse overheid te maken met explosief groeiende datavolumes. In de technische sectoren hebben uitvoerende diensten in samenwerking met de markt het grootste deel van hun taken geautomatiseerd, maar op beleidsniveau ontbreekt nog al te vaak een coherente datastrategie. De afhandeling van Woo-verzoeken is hiervan een voorbeeld. Bij afwezigheid van strategie, of bij het gebruik van een lappendeken aan noodoplossingen (point solutions) kan er chaos uitbreken wanneer er een groot informatieverzoek of een combinatie van Woo-aanvragen binnenkomt. Belangrijke beleidsnota’s blijken zoek te zijn, informatie is op eigen houtje opgeslagen in excelsheets en wordbestanden, gegevensbestanden zijn niet toegankelijk of zijn verspreid ondergebracht bij mede-overheden en externe partners. ICT en de juridische afdeling werken langs elkaar heen en werkstromen raken verstoord. Zoals de wet van Moore stelt, ondersteund door de dagelijkse praktijk, verdubbelt de hoeveelheid data iedere 18 maanden. Als gevolg hiervan verdubbelen de kosten bij het verwerken van Woo-verzoeken ook ongeveer iedere anderhalf jaar mee.

Snoeien en samenwerken

Een eerste poging om de afhandeling van Woo-verzoeken te systematiseren is het gebruik van een enkelvoudig platform, waarbij de software van verschillende aanbieders zoals Office 365, Adobe, SharePoint, Exchange, FileNet en verschillende documentarchivering zijn geïntegreerd. Met geavanceerd zoeken, automatisch ontdubbeling en andere geavanceerde technieken, neemt het aantal documenten dat nog persoonlijk moet worden beoordeeld af tot wel 90 procent. Voorheen waren beleidsmedewerkers of speciaal voor de Woo ingehuurde juristen hier weken of zelfs maanden mee bezig, nu is het eerste schiftwerk binnen enkele seconden voor elkaar.

Zo kan de software eenvoudig e-mail trails bijhouden en worden ontbrekende e-mails teruggehaald, kan het e-mails automatisch identificeren voor beleidstechnische onderwerpen en voert de programmatuur verfijnde, semantische zoekopdrachten uit. De techniek is inmiddels zo ver dat er uit de data emoties en sentimenten kunnen worden gefilterd en geanalyseerd, om hieruit verrassend effectieve analyses te onttrekken.

Met de inzet van een eenduidig platform en duidelijke datastrategie werken interne afdelingen efficiënter samen. En vanwege de innige verwevenheid en intensieve gegevensuitwisseling tussen (mede)overheden en maatschappelijke organisaties,  zijn beveiligingsauthorisatie en gegevenstoegang eenvoudiger te organiseren. Doordat meer data op hetzelfde platform wordt gehuisvest is er strakkere regie mogelijk over wie wel en niet toegang heeft tot de gegevens. De data is niet langer verspreid opgeslagen over verschillende systemen, waardoor de beveiligingsrisico’s aanzienlijk afnemen.

Volwassen worden

Met het zogeheten ‘maturity model’ dat Woo-specialist ZyLAB heeft ontwikkeld, kan een overheidsorganisatie toetsen hoe geavanceerd het eigen datamanagementsysteem nu werkelijk is. Bij de volgende stap in de volwassenwording van het systeem handelt de medewerker een Woo-verzoek af aan de hand van datagedreven analyses. Met ondersteuning van machine learning heeft de ambtenaar beter overzicht in welke informatie wel en niet kan worden gedeeld met de indiener. Doordat vanuit de data zichtbaar wordt gemaakt hoe personen, feiten en gebeurtenissen met elkaar zijn verbonden, worden patronen, trends en achterliggende context naar voren gehaald.

Met geavanceerde waarheidsvinding, op het meest ‘volwassen’ niveau, leert het systeem om overig potentieel relevante informatie voor beoordeling op te zoeken, nog voordat het Woo-verzoek binnen is en voordat er nog maar duidelijk is waarnaar gezocht moet worden. Zo creëert de software categorieën van vergelijkbare concepten en beleidsonderwerpen waar de informatie voor toekomstige Woo-verzoeken is ondergebracht. Nieuwe documentatie en nieuw opgedane inzichten wordt automatisch gerapporteerd, van label voorzien en gekoppeld aan de bestaande datasets.

Met geavanceerde zoektechnieken en deduplicatie worden enorme datasets teruggebracht tot enkele procenten van hun oorspronkelijke omvang. Omdat irrelevante informatie uit de datasets is verwijderd, wordt er nog eens een derde tot de helft bespaard op de beoordeling van documenten. De relevante (eind)documenten komen automatisch naar boven en de behandelend ambtenaar hoeft niet meer tal van (bijna-) duplicate versies te beoordelen.  Ook labelt het systeem overige relevante data, zoals audio- en videobestanden, voor toekomstig gebruik.

Als gevolg zijn de zoekresultaten van een hogere kwaliteit, nauwkeurigheid en houdbaarheid. Uit onderzoek van ZyLAB blijkt dat de door de software aangebrachte tags consistenter zijn dan wanneer menselijke beoordelaars dit doen. Met een eigen Woo-platform  wordt tevens het hoogste haalbare beveiligingsniveau gehaald, omdat alle data onder eigen dak blijft. De samenwerking tussen interne afdelingen en met collega-overheden en maatschappelijke partners wordt duidelijker vastgelegd en met standaard procedures en hulpmiddelen wordt de productie van gegevens vooraf geregeld. Iedereen is bekend met zijn rol en met automatische processen worden de meeste taken vooraf verwerkt.

Met een gespecialiseerd Woo-platform kunnen beleidsmakers ervoor kiezen om stapsgewijs en op gecontroleerde wijze naar een hoger niveau van systeemvolwassenheid te gaan. De organisatie raakt eerst vertrouwd met de technologie door in eerste instantie kleinere gegevensverzamelingen te verwerken, waarna stapsgewijs nieuwe functionaliteiten kunnen worden toegevoegd. 2018 is het jaar dat big data en machine learning ook het land van Woo hebben bereikt. 

Lees meer over de mogelijkheden die het Woo-maturity model bieden in de whitepaper ‘Woo en Big Data: van groeipijn naar volwassenwording’.