Derde groep rondt opleiding ‘Datascience voor toezichthouders’ af

Op 16 januari jongstleden sloot de derde groep medewerkers van verschillende toezichtorganisaties hun 12-daagse opleiding ‘Datascience voor toezichthouders’ af. Als afronding van de opleiding presenteerden zij een praktijkopdracht. Over een zelfgekozen onderwerp uit hun werkpraktijk en in bijzijn van geïnteresseerde collega’s lieten zij zien hoe ze datgene wat ze geleerd hebben in de praktijk gebruiken.

Data, machine learning en visualisaties

Mattias Sjerps van de Inspectie van het Onderwijs (IvhO) liet zien hoe hij technieken van machine learning gebruikt om risicoscores van scholen te voorspellen. Deze technieken blijken hier niet alleen aan te kunnen bijdragen maar brengen ook nieuwe voorspellers in beeld.

Piet van Hoffen van de Inspectie Leefomgeving en Transport (ILT) zet machine learning in om data uit een inmiddels niet meer gebruikte database van goederenvervoer te verkennen. Het leverde vooral inzichten op in hoe je wel en niet gebruik kunt maken van een zogenaamde “ongebalanceerde dataset”: een bestand waarbij de interesse vooral uitgaat naar een heel beperkt deel,namelijk dat van niet-nalevers. Een probleem waar datascientists bij toezichthouders heel vaak mee kampen en oplossingen voor moeten zoeken.

Gerben van Baren (ook ILT) presenteerde de analyses die hij uitvoerde om het baangebruik op Schiphol te voorspellen. Hij liet hierbij zien welke handigheden hij ontwikkelt om resultaten van datascience snel en actueel te kunnen gebruiken in documenten, powerpoints en online (shiny-) apps.

Arjan vd Put (ILT) liet zien hoe hij de technieken uit de opleiding gebruikt om inzichten te halen uit échte big data: locatiegegevens van schepen in een dagelijks groeiend bestand van 150 miljoen records.

Pieter Oosterwijk van de Algemene Rekenkamer kon helaas niet alles alles laten zien wat hij met het geleerde in de opleiding doet. Veel hiervan is namelijk onderdeel van een lopend onderzoek. Wel kon hij zijn dashboard over leeftijdsopbouw van de personeelsbestanden van het Rijk – uit te splitsen naar departementen, directoraten generaal, diensten etc. – presenteren. Pieter sloot af met een oproep aan de groep om mee te denken over een normenkader/toetsframe voor de inzet van algoritmen.
 

Anton de Vries (ILT) sloot de middag af met zijn data-speurwerk naar schepen met risico op verhoogde zwaveluitstoot.
 

Nieuwe groep

In april start een nieuwe groep. Er is nog plek voor deelnemers. Aanmelden kan via het Netwerk Publiek Toezicht (groep Datascience). Mocht u nog geen account op het Netwerk Publiek Toezicht hebben aangemaakt, dan kunt u zich via een paar simpele klikken registreren. U kunt ook contact opnemen met Marcel Zandvliet (marcel.zandvliet@inspectieraad.nl), telefoon: 0653180026.

Geïnteresseerd in verdieping van datascience kennis? Binnenkort start ook een groep met een cursus Bayesiaanse statistiek!