Datagedreven werken staat bij ons nog in de kinderschoenen, zeggen veel directeuren in de publieke sector.[1] Alles kan, zegt de data-analist: “U vraagt, wij draaien.” Beide antwoorden illustreren de huidige kloof. De data-analist redeneert vanuit data, de directeur of beleidsmedewerker vanuit de maatschappelijke opgave. Ze vinden elkaar nog onvoldoende. Veel vakartikelen maken het onderwerp te moeilijk. Artificial intelligence, machine learning, deep learning… In dit artikel lees je wat nodig is om de kloof te dichten.
Wat is datagedreven werken?[2] Data gebruiken bij het doen van je werk. Voor een deel doe je dat al: je maakt gebruik van managementinformatie en monitors, je gebruikt onderzoeksrapporten, een jaarverslag, kijkt op waarstaatjegemeente.nl of doet mee aan een benchmark als Vensters. En je gebruikt die informatie om inzicht te krijgen in een vraagstuk en om tot actie te komen. Hoewel nog niet overal gemeengoed, is daar niets nieuws aan. Wel zijn de hoeveelheid gegevens en de rekenkracht van de computers toegenomen en dat vergroot ook het aantal beschikbare technieken. Een voorbeeld: ook in de jaren 90 maakten wij bij organisatiedoorlichtingen gebruik van jaarrekeninganalysen. Daar was je dan per jaarrekening een paar uur mee bezig. Tegenwoordig doen we dit in een handomdraai, door het slim structureren van openbare data. Zo hebben we voor de regio Midden-Holland 3.800 jaarrekeningen van zorgaanbieders geanalyseerd. De regio noemt als waarde daarvan[3] ‘het scheiden van het kaf van het koren’ en ‘het verminderen van de tijd die nu nodig is om de rechtmatigheid en gezondheid van zorgaanbieders te controleren’. Ze zien nu op een half A4’tje met welke partijen ze verantwoord zaken kunnen doen. De omvang en snelheid van analysen zijn dus wel veranderd. Tot dusver werden inzichten voor een belangrijk deel bepaald door persoonlijke kennis en ervaring. Nu winnen gegevens aan belang.
‘Het gaat om de vaardigheden om data te vertalen in zinvolle inzichten’
Door slim gebruik te maken van gegevens uit verschillende bronnen ontstaan nieuwe inzichten. Denk aan buurtgegevens van de gemeente en politiemeldingen, die gezamenlijk een beeld geven van waar problemen ontstaan. Maar het verandert weinig aan hoe we werken: handelen op basis van feiten. De kern is: wat wil je weten en waarom? En wat doe je als je het antwoord hebt? Met andere woorden, het gaat om de vaardigheden om data te vertalen in zinvolle inzichten. En in staat zijn te handelen op basis van die inzichten.[4] De inzichten die je wilt opdoen, bepalen met welke gegevens je aan de slag gaat. Vaak lijkt de explosief toenemende hoeveelheid data leidend te zijn. “Dat is verkeerd en heeft als risico dat je compleet verdrinkt”, stelt Gert van der Kooij, Chief Digital Officer van Hoogheemraadschap van Rijnland. De hoeveelheid data neemt overigens vooral toe doordat steeds meer apparaten zijn voorzien van sensoren en zo zelf data genereren.
Waarom zou je datagedreven willen werken?
De crux is betere en beter onderbouwde beslissingen te nemen, als organisatie beter aan te sluiten op de maatschappelijke opgaven. Deze worden complexer en de verwachtingen van de burger zijn steeds hoger. Tegelijk neemt de hoeveelheid beschikbare informatie ook toe. De waarde zit ook in wendbaarheid: op het juiste moment over de juiste informatie beschikken. Tijdens de coronacrisis werd dit glashelder bij het sturen op aantal IC-bedden, de reproductiefactor en het aantal besmettingen. Ook organisaties waar je mee samenwerkt, zullen data gebruiken om zaken voor elkaar te krijgen.[5]
‘Medewerkers gaan niet rennen omdat ze gegevens mogen gebruiken, maar wel wanneer ze de taak met gegevens beter kunnen uitvoeren’
Hoe gaat jouw organisatie datagedreven werken?
Het volgende schema laat zien hoe een verantwoordelijk directeur zijn organisatie datagedreven kan laten werken. In onze optiek dien je dit vanuit twee invalshoeken te doen:
- Vanuit de maatschappelijke opgave (links): de informatiebehoefte in beeld brengen, die ontstaat door te willen inspelen op deze opgaven.
- Vanuit de data (rechts): basisregistraties op orde brengen, databeheer borgen, informatie ontsluiten voor medewerkers.
Die twee invalshoeken moet je bij elkaar brengen. Meest logisch is om te beginnen vanuit de maatschappelijke opgaven. Daarmee werk je direct aan actuele vragen en sluiten dataprojecten aan op wat mensen echt willen weten. En daarmee bedoelen we dus meer dan een gelikt uitziend dashboard. Het lastige hiervan is dat dit nauwe samenwerking vereist tussen drie vakgebieden, die dat nog niet zo gewend zijn:
- Inhoudelijk specialisten (beleidsmedewerkers): een dataproject begint met een goede probleemformulering. En wanneer de analysen beschikbaar zijn, maken inhoudelijk specialisten het verhaal naast de cijfers. Zij vertalen de resultaten naar inzichten in het maatschappelijke vraagstuk en naar acties. Daarvoor moeten ze het echte probleem scherp hebben en de waarde en beperking van de cijfers kennen.
- Gegevensbeheerders/functioneel beheerders: hun rol is data te verzamelen, klaar te zetten voor analysen en deze te delen met de data-analisten. Gegevensbeheerders werken vaak bij de primaire processen, ‘in de lijn’. Denk aan een geo-specialist bij beheer openbare ruimte of een functioneel applicatiebeheerder bij werk en inkomen.
- Data-analisten[6]: de brug tussen de inhoudelijk specialisten en de gegevensbeheerders. Data-analisten kunnen op basis van data beschrijvende en verklarende analysen maken. In de praktijk blijkt goed beschrijven en verklaren al heel waardevol, zoals bijvoorbeeld de gemeente Zaanstad constateerde: “De eerste stap is goed terugkijken.”[7] Vaak is dit ook het meest haalbaar.
Deze samenwerking komt niet vanzelf tot stand. Bestuur en directie moeten daarin het voortouw nemen door de waarde van informatie te laten zien bij het realiseren van strategische doelen.[8] Medewerkers gaan niet rennen omdat ze gegevens mogen gebruiken, maar wel wanneer ze de taak dan beter kunnen uitvoeren. En wanneer bestuur en directie dat in woord en daad uitdragen. Zo is een kerntaak van waterschappen om het waterpeil te beheren. Dat is belangrijk voor boeren en om te voorkomen dat huizen verzakken. Goede informatie over neerslag en pompgegevens kunnen daarbij helpen.[9] Voor gemeenten bieden data kansen om meer grip te krijgen op hoofdpijndossiers als het sociaal domein, met oplopende financiële tekorten en frauderende zorgaanbieders.Hierna lichten we beide kanten uit het schema toe.
- Informatiebehoefte in kaart brengen. Daarbij gaat het om de volgende vragen:
- Bij wie en welke thema’s is er behoefte aan informatie?
- Wie is eigenaar van de vraag? Wat wil diegene bereiken?
- Hoe kunnen we indicatoren ontwikkelen? Hoe verhouden die zich tot elkaar?
- Hoe gaan we in de behoefte voorzien? In de P&C-cyclus of erbuiten?
2. Registraties op orde brengen. Daarbij gaat het om de volgende vragen:
- Met welke wettelijke en beleidskaders moeten we rekening houden? Wat is er sectoraal afgesproken? In hoeverre voldoen we hier aan? Welke kernregistraties hebben we daarnaast binnen onze eigen organisatie vastgesteld?[10] En welke andere gegevensbronnen hebben we, bijvoorbeeld uit onze bedrijfsvoeringsystemen en digitalisering van processen?
- Volgens welke principes werken we met data? Veilig, vindbaar, toegankelijk, koppelbaar, herbruikbaar?
- Wie is per registratie verantwoordelijk? Hoe en wat leggen we hierin vast? Wie mag wat zien en doen?
- Hoe organiseren we het gebruik ervan door medewerkers en uitwisseling met externe partijen? Wat is daarvoor nodig, ook qua contracten? Wie is bij zo’n samenwerking eigenaar van de informatie? Belangrijk om vast te leggen wanneer je een externe partij de analyse laat uitvoeren!
- Welke externe databronnen en benchmarks willen we gebruiken?
Hoe pak je datagedreven werken praktisch aan?
De hiervoor geschetste aanpak is te gebruiken als kapstok voor een organisatievisie op datagedreven werken. Die kun je in zes tot acht wekelijkse bijeenkomsten praktisch vorm geven met een datalab. Selecteer hiervoor een maatschappelijk vraagstuk en nodig rond dit thema de drie typen medewerkers (maximaal circa acht in totaal) uit om gezamenlijk de volgende vragen te bespreken:
- Welk probleem willen we oplossen? (vraagstelling en informatiebehoefte)
- Hoe vinden we de databronnen? (datamanagement)
- Hoe analyseren we data? (analysemethoden)
- Hoe rapporteren we inzichten zodanig dat deze daadwerkelijk bijdragen aan de besluitvorming? (adviesvaardigheden, betrekken van management en inhoudelijk beleidsmedewerker)
- Wat is de waarde van de inzichten en acties? (resultaatmeting en evaluatie)
Vervolgens maak je een gezamenlijke analyse van de maatschappelijke opgave en de samenhang tussen de onderdelen. De directeur of beleidsmedewerker brengt zijn kennis, ervaring, intuïtie, rapporten, gesprekken en beleidsmodellen in. En de data-analist geeft de mogelijkheden en beperkingen van de data en analysemogelijkheden aan. Teken samen het model op een flap-over, of met een applicatie als Miro. Wat is de samenhang, wat zijn de indicatoren, welke data zijn voorhanden?
‘Traditionele modellen starten met theorie en veronderstelde oorzakelijke verbanden, maar de praktijk werkt vaak omgekeerd’
Een datalab is een mooie manier om klein te beginnen. Je kunt deze aanpak vervolgens herhalen voor andere maatschappelijke vraagstukken. Zo leer je gaandeweg alle inhoudelijke teams om met data te werken. Dan wordt ook duidelijk wat de organisatie verder moet regelen om daadwerkelijk datagedreven aan de slag te gaan.
Belangrijke voorwaarden voor datagedreven werken
- Goede kwaliteit data. Het meten, analyseren, interpreteren en rapporteren moet correct gebeuren. Waar komen data vandaan, hoe zijn deze gemeten en verzameld, zijn de definities eenduidig? De kwaliteit van data blijkt in de praktijk nogal te variëren.[11] Wanneer de datareeks groot genoeg is, kan de data-engineer afwijkingen eruit filteren en ontbrekende waarnemingen invullen.
- Goede analyse en interpretatie van data[12]: is er sprake van statistische correlaties of van oorzakelijke verbanden? Waar traditionele modellen startten met theorie en veronderstelde oorzakelijke verbanden, werkt de huidige praktijk vaak omgekeerd: algoritmen zoeken naar verbanden in data, naar correlaties. Dat hoeft geen oorzaak en gevolg te zijn, maar kunnen ook schijnverbanden zijn, die op de een of andere manier de voorspellende kracht van het model vergroten. De ene benadering is niet per se beter of slechter dan de andere. Het traditionele model, bijvoorbeeld regressieanalyse, gebruik je om het gezonde verstand in te blijven zetten. Algoritmen (machine learning) zet je in om verborgen nuttige verbanden te ontdekken. Belangrijk is steeds: zitten alle belangrijke variabelen in het model? En weet je wat je doet en waarom?
- Waarborgen van privacy en beveiliging. Dat vereist onder meer standaardcontracten, zoals een verwerkersovereenkomst, een overeenkomst voor het delen van informatie en wat verder nodig is in het kader van de AVG. De gemeente Den Haag stelt bijvoorbeeld: ‘Gemeente Den Haag garandeert de privacy van burgers en maakt duidelijk voor welke doeleinden data worden gebruikt.’ Verder heeft de gemeente een beleidskader voor informatieveiligheid opgesteld.[13] Omdat veel overheidstaken in ketens worden gedaan, moet vaak data gedeeld worden. Onze ervaring is dat dit kan, ook vanuit het oogpunt van privacy, maar wel aandacht en inspanning vereist.
- Waarborgen van de ethische kant. Welke indicatoren en analysen vinden we ethisch verantwoord? Een voorspelling kan ook te veel kracht hebben of ongewenst zijn. Bijvoorbeeld wanneer een model voorspelt welke mensen minder geschikt zijn voor een baan. Wanneer we de uitkomsten daarvan serieus nemen, krijgen deze mensen daadwerkelijk minder kans op een baan. Zelfs wanneer dit model in eerste instantie totaal onzinnig is, zal de voorspellende kracht ervan steeds sterker worden doordat het zichzelf voortdurend bevestigt.
- Goed beheren van data. Datamanagement is een cruciale opgave voor organisaties, omdat verspreid binnen de organisatie steeds meer gegevens worden vastgelegd: HR, financieel, cliënten, burgers, de toestand van apparaten en leidingen, de besturing van machines, het onderhoudsniveau van de groenvoorziening, etc. Bij een waterschap was één inspectiedrone in staat om zo uitvoerig een betonnen wand te inspecteren dat meteen de maximum dataopslagcapaciteit van het gehele waterschap was bereikt. Organisaties worstelen daarmee. Data-analisten zijn 80 procent van hun tijd kwijt aan het verzamelen van gegevens, voordat ze kunnen beginnen. Enkele handreikingen[14]:
- Beheer niet alle data centraal. Daar wordt een organisatie inflexibel van. Beperk je tot gegevens die voor de organisatie als geheel belangrijk zijn, waar wet- en regelgeving dominant zijn, waar het cruciaal is om één waarheid te hebben. Denk aan data over financiën, HRM, burgers en het functioneren van de primaire processen als geheel.
- Beheer gegevens ter versterking van specifieke primaire processen decentraal. Denk aan de besturing van specifieke machines, satellietbeelden die relevant zijn voor het werk van een afdeling. Het nut van deze gegevens voor de betreffende eenheid staat daarin voorop.
- Bepaal centraal de principes, regels en richtlijnen voor het werken met data. En maak organisatiebreed afspraken wie welke databestanden beheert. Organiseer ook kennisuitwisseling tussen deze functionarissen. En zorg dat de benodigde applicaties beschikbaar zijn voor data-analyse en -visualisatie.
Aan de hand van enkele voorbeelden tonen we hoe datagedreven werken functioneert in de praktijk.
CJIB
Het Centraal Justitieel Incassobureau (CJIB) was in 2019 een van de drie finalisten bij de Verkiezing Beste Overheidsorganisatie: “De jury is onder de indruk van de innovaties van het CJIB, en dan met name de instrumenten die een persoonsgerichte aanpak mogelijk maken.” Datagedreven werken speelt daarbij een belangrijke rol. Vanuit het oogpunt van maatschappelijk verantwoord innen probeert CJIB de kosten voor burgers die wel willen maar niet kunnen betalen zo veel mogelijk te beperken. Streven is dat boetes voor deze groep niet meer terechtkomen in de incasso- of dwangfase, door telefonisch te innen. Burgers worden daartoe op basis van data geselecteerd. Het gaat om mensen die een tweede aanmaning niet hebben betaald en waarbij de kans op betaling bij een deurwaarder hoog is. Bij 30 procent van deze telefoontjes wordt meteen betaald, zodat deurwaarderskosten worden voorkomen. Daarnaast werkt men met een Debt Alert, een data-analyse die vroeg signalen van schulden herkent en koppelt aan een gepaste actie voor het CJIB. Het aantal klachten is met 10 procent afgenomen.
Gemeente Deventer
Ook voor de gemeente Deventer is datagedreven werken een speerpunt. De gemeente maakt de schuldenproblematiek op wijkniveau zichtbaar, op basis van gegevens van energieleveranciers, het waterbedrijf en zorgverzekeraars. Vervolgens helpen sociale teams te voorkomen dat jongeren net boven de 18 schulden gaan opbouwen.
WDOD
Ieder jaar controleert het waterschap Drents Overijsselse Delta 8.000 sloten met een totale lengte van zo’n 2.500 kilometer of deze goed zijn schoongemaakt door de eigenaren, veelal agrariërs. Nieuwe technieken maken het mogelijk om de controle met veel minder mensen uit te voeren dan voorheen. Dit is efficiënter en bespaart kosten. Met de digi-schouw brengen satellietbeelden in kaart hoe de sloten zijn onderhouden en schoongemaakt. Een computerprogramma analyseert de foto’s en beoordeelt in welke sloot te veel begroeiing in het water staat. Medewerkers hoeven hierdoor in het veld alleen nog die locaties te beoordelen die als ‘niet schoon’ uit de computer rollen. Jaarlijks komt dat neer op slechts 6 procent van de 8.000 sloten.
Gemeente Almelo
Met de decentralisaties in het sociaal domein zijn gemeenten sinds 2015 verantwoordelijk voor jeugdzorg en zorg aan langdurig zieken en ouderen. De Almelose gemeentepolitiek wilde daarom meer inzicht in zorglocaties om vast te stellen of die aansluiten op de zorgbehoefte van inwoners. Waar wonen ouderen, in wat voor woningen, zijn die levensloopbestendig of eenvoudig aan te passen? Door openbare bronnen als locatiegegevens en KvK-gegevens te combineren met eigen registraties en data van zorgaanbieders, heeft Almelo op buurtniveau zicht op het aanbod. Met deze ‘sociale kaart’ is de gemeente beter in staat een ruimtelijke afweging te maken ten aanzien van verzoeken van zorgaanbieders om in een bepaalde buurt een vestiging te openen.
VNG
De VNG beheert waarstaatjegemeente.nl, een dataplatform met data over alle gemeenten op elk beleidsterrein. Daarnaast werkt de VNG samen met gemeenten aan projecten waarbij de inzet van data centraal staat, zoals het Veiligheidsinformatieknooppunt in Breda. Zij brengt ook databehoeften van gemeenten in kaart. Een voorbeeld is de analyse van koplopers en achterblijvers op de thema’s ondermijning en armoede en schulden. Tot slot werkt zij aan open datastandaarden en open raadsinformatie. Hierbij gaat het om het bundelen en herbruikbaar maken van alle vergaderstukken van gemeenteraden.
Register van Overheidsorganisaties
Het ministerie van BZK, CBS en het exploitatiecentrum Officiële Overheidspublicaties werken samen aan een online Register van Overheidsorganisaties. Eenduidige registratie en koppeling van bestanden maakt dat in de toekomst beleidsvragen over de samenstelling en het functioneren van de overheid beter beantwoord kunnen worden en tegen een lagere lastendruk voor instellingen. Het wordt ontsloten via www.overheid.nl en via LinkedData gekoppeld aan bronnen zoals wetten.overheid.nl. Met een uniek identificatiekenmerk voor iedere organisatie kan bovendien de koppeling naar andere databronnen eenvoudig gemaakt worden.
Leer- en expertisepunt datagedreven werken
Een initiatief van het ministerie van BZK, aangekondigd in de Data Agenda Overheid uit 2019. Het LED maakt kennis over datagedreven werken beschikbaar voor het openbaar bestuur.
Datagedreven werken: een kwestie van beginnen!
Directie en bestuur moeten het voortouw nemen om meer datagedreven te gaan werken. Het is vooral een kwestie van beginnen, zorgen dat de olievlek zich verspreidt en gaandeweg leren. Het ligt voor de hand om te beginnen met domeinen waar je het meest buikpijn van hebt. Denk aan het sociaal domein bij gemeenten, met de oplopende tekorten. Daar zijn ook veel data beschikbaar, vanuit het berichtenverkeer, de contractenadministratie, GGD-informatie en open data van het CBS. Maar ook domeinen als duurzaamheid, energie, mobiliteit, een leefbare woonomgeving en de eigen bedrijfsvoering lenen zich er goed voor. Wij wensen je veel inzichten en goed onderbouwde acties toe!
*Met dank aan: Gert van der Kooij (Chief Data Officer, Hoogheemraadschap van Rijnland), Walter Huith (directeur Bedrijfsvoering, gemeente Amstelveen), Geert-Jan Ketelaar (kwartiermaker datagedreven werken gemeente Almelo) en Ester Baauw (programmamanager ICTU).
Noten
[1] Zie bijvoorbeeld interview met Tanaquil Arduin, Chief Data Officer gemeente Den Haag, www. Digitaleoverheid.nl, 2020.
[2] In dit artikel gaan we alleen in op datagedreven werken en niet op de digitale transformatie. Beide onderwerpen zijn wel sterk verweven, iets wat we in een volgend artikel behandelen.
[3] Zie ‘Goede voorbeelden van ontregelen in het sociaal domein’ op de website ‘Ontregel de zorg’, www.ordz.nl.
[4] Frankiewicz, B. and Chamorro-Premuzic, T. ‘Digital Transformation Is About Talent, Not Technology’. In: Harvard Business Review, 6 mei 2020.
[5] Daarnaast gaat het om waarden als effectiviteit, efficiency, transparantie en kwaliteit. Zie Datagedreven werken, wat is er voor nodig?, Ministerie van Justitie en Veiligheid, juli 2019.
[6] Grofweg gaat het om medewerkers die de voorbereidingen treffen om met data te kunnen werken (data-engineer) en data te analyseren (data-scientist).
[7] 10 Datalessen van koploper Zaanstad, Platform 31.
[8] Zie ook: Ladley, J. and Redman, T.C. ‘Use Data to Accelerate Your Business Strategy’. In: Harvard Business Review, 3 maart 2020.
[9] ‘HAL24K en Tauw slepen prijs Data Challenge 2017 van Rijkswaterstaat in de wacht’. In: ICTmagazine.nl, 23 juni 2017.
[10 Basis is NORA: de Nederlandse Overheid Referentie Architectuur. Hiervan afgeleid zijn GEMMA (GEMeentelijke Model Architectuur), EAR (rijksoverheid), PETRA (provincies) en WILMA (waterschappen). Voor een voorbeeld van landelijk vastgestelde basisregistraties, zie https://www.gemmaonline.nl/index.php/GEMMA2/0.9/id-cb1f8378-2c00-498f-9b83-c999c5ed273d
[11] Haller, E. en Satell, G. ‘Data-Driven Decisions Start with These 4 Questions’. In: Harvard Business Review, 11 februari 2020.
[12] Zie voor een interessant overzicht van vraagstukken die daarbij optreden: Blauw, S. (2018), Het best verkochte boek ooit (met deze titel), De Correspondent Uitgevers.
[13] Datagedreven werken voor onze stad, datastrategie 2020-2022, gemeente Den Haag.
[14] DalleMule, L. en Davenport, T.H. ‘What’s Your Data Strategy?’. In: Harvard Business Review, mei-juni 2017.
Geef een reactie