ZyLAB Blog - Nederlands

Een digitale revolutie in het land van Woo

Geschreven door Daniel Schuuring | 22 februari 2019 10:15:44 Z

Het is de vrees van iedere IT-collega: een datastrategie die zo lek is als een mandje. Informatie die weglekt tussen verschillende opslagsystemen zonder adequate beveiliging. Collega’s die jarenlang op eigen houtje in honderden Excel sheets en Word bestanden informatie autonoom opslaan. Belangrijke emails met bijlagen die zoekraken of vertrouwelijke audiobestanden die met Whatsapp worden uitgewisseld. Het moge duidelijk zijn dat overheidsorganisaties nog belangrijke slagen moeten maken in de volwassenwording van hun datamanagement.

In een wereld die alsmaar verder digitaliseert, groeien de datavolumes explosief en Nederland is hierop geen uitzondering. Hoewel dit besef nog niet bij iedereen lijkt te zijn doorgedrongen, kunnen grote en innig verweven organisaties er niet meer omheen om de verzameling, verwerking en productie van hun gegevens slim te organiseren. Met verouderde, ‘onvolwassen’ informatiesystemen raak je immers de controle over datamanagement kwijt, inclusief beveiliging, kwaliteitscontrole en consistentie van beleid.

Een goed voorbeeld hiervan bij de overheid is de afhandeling van informatieverzoeken op basis van de Wet open overheid (Woo), vele duizenden per jaar en hard groeiend. Ambtenaren en juristen zijn weken, als niet maanden bezig met het opzoeken, doorschiften en anonimiseren van duizenden documenten of gigabytes aan gegevenssets. Wanneer een overheidsdienst geen overzicht heeft van de omvang en complexiteit van de gegevens in eigen huis, laat staan die van collega-overheden of maatschappelijke partners, is niet te voorspellen hoeveel tijd en energie een Woo-verzoek gaat kosten. 

Vinger in de dijk

Een eerste oplossing is om een point solution op te zetten die het meest acute probleem van gegevensverzameling of -verwerking oplost, met vervolgens een nieuwe oplossing voor een volgend probleem en een andere oplossing voor een ander probleem etc. Het gevolg is een lappendeken aan noodoplossingen die onderling slecht zijn verbonden, waardoor data ‘weglekt’ en de beveiliging hopeloos achterhaald is. Een andere strategie is om het gehele datamanagement inclusief beveiliging over te dragen aan een externe partij, maar het gebrek aan kennis en ervaring met het bedrijfsproces bij krachten van buitenaf brengt alleen maar nieuwe hoofdpijn met zich mee.

Bij de behandeling van grote Woo-verzoeken kan reguliere software zoals dat van Microsoft en Adobe het handmatige uitzoekwerk deels automatiseren, maar omdat deze tools weinig gespecialiseerd zijn, blijft het dweilen met de kraan open. Ook bestaan er grote twijfels over de consistentie en betrouwbaarheid van de zoekresultaten met deze tools. De kwaliteit van de beveiliging is bovendien afhankelijk van iedere afzonderlijke software. En ook wanneer een organisatie de data binnenshuis weet te houden, blijft met deze geïmproviseerde processen het gevaar bestaan dat bij onvoorziene situaties alsnog beschermde data of privégegevens op straat komt te liggen.

Plan B

Om deze reden zijn overheidsdiensten die met grote datahoeveelheden te maken krijgen in rap tempo bezig hun informatiesystemen te moderniseren aan de hand van het ZyLAB Woo-maturity model. Bij een informatievraag van een burger of journalist op basis van de Woo worden alle aanwezige datasets waartoe de behandelaar nauwelijks toegang heeft alsnog doorzoekbaar gemaakt. Met specialistische technologie kan de data worden geëxtraheerd uit PDF- bestanden, BMP- en TIF-afbeeldingen en  gecomprimeerde bestanden als PST en ZIP. Op een enkel gespecialiseerd Woo-platform wordt alle data centraal opgeslagen en georganiseerd. De dagelijkse bedieningsprocedure integreert met data die opgeslagen is in Office 365, MS-SharePoint, Adobe, FileNet, MS-Exchange en overige documentarchieven.


Zo is de software in staat om:

  • alle ingesloten documenten en bestanden uit te pakken en te standaardiseren;
  • met optische tekenherkenning (OCR) alle componenten doorzoekbaar te maken;
  • de hoeveelheid gegevens te verminderen nadat deze met deNISTing1, deduplicatie en andere geautomatiseerde functies aan controle zijn onderworpen;
  • aan alle eisen van de AVG (GDPR) en andere privacyregels te voldoen middels automatische redactie en classificatie;
  • op eenvoudige wijze met een enkele beveiligde webinterface data te produceren voor alle gebruikers.

De Woo en machine learning

Een nog verdergaande vorm van automatisering bij grote Woo-verzoeken is het gebruik van machine learning en kunstmatige intelligentie. Zo kan de computer geleerd worden om bepaalde beleidsdocumenten te herkennen die niet verstrekt hoeven te worden.  Dit proces is vijftien tot twintig keer efficiënter dan handmatige opzoekwerk. De semantische zoekmachine clustert, categoriseert en doorzoekt grote verzamelingen ongestructureerde tekst. Als gevolg zijn behandelend ambtenaren minder tijd kwijt met het langdurig en saai uitzoekwerk en is er meer ruimte om de overgebleven documenten te beoordelen. Ook wordt de samenwerking met externe partners overzichtelijker, wat de beveiligingsrisico's verder inperkt.

De laatste stap in het Woo (systeem)volwassenheidsmodel is slimme waarheidsvinding met intelligent aflakken. De computer leert waarnaar gezocht moet worden, nog voordat het Woo-verzoek binnen is. Het ontwerpt een spil van lastige en veelvoorkomende onderwerpen, waarmee toekomstige verzoeken sneller kunnen worden afgehandeld. Door alle gegevens en alle beslissingen in één systeem onder te brengen, biedt deze strategie de hoogst mogelijke kwaliteit en consistentie in datamanagement, alsook het hoogste beveiligingsniveau.

Lees in de whitepaper ‘Woo en Big Data: van groeipijn naar volwassenwording’ meer over het Woo-maturity model.