‘Microdata zijn de toekomst van ons onderzoek’

Ruurd Schoonhoven, Senior Relatiebeheerder Microdata Services bij het CBS, ging recent met pensioen. Annette Scherpenzeel begon in september 2020 bij het CBS als hoofd Microdata Services. E-data sprak hen.

Annette Scherpenzeel (links) is sinds september 2020 hoofd Microdata Services bij het CBS. Onlangs is Ruurd Schoonhoven, Senior
Relatiebeheerder Microdata Services bij het CBS, met pensioen gegaan. Credits: Bart van Vliet

Beiden hebben de nodige ervaring in de wetenschap en ervaring met data-analyse. Schoonhoven promoveerde in de biomedische fysica in Nijmegen. Hij werkte de eerste helft van zijn carrière als fysicus in het gehooronderzoek bij het UMC Leiden en begon in 2004 bij het Centraal Bureau voor de Statistiek (CBS). Scherpenzeel promoveerde in methoden en statistiek aan de Universiteit van Amsterdam. Hierna werkte ze als survey methodoloog en projectcoördinator bij onder andere CentERdata en de Survey of Health, Ageing and Retirement in Europe (SHARE).

Hoe heeft de microdata-afdeling zich door de jaren ontwikkeld?

Schoonhoven: “Eerst was het gebruik van CBS microdata in sociaalwetenschappelijk onderzoek nog vrij kleinschalig. De mogelijkheid bestond al in de jaren negentig, maar toen moest dergelijk onderzoek nog binnen het CBS zelf worden uitgevoerd. In 2006 is de Remote Access omgeving ontwikkeld, zodat onderzoekers vanuit een beveiligde ruimte in hun eigen instelling hun onderzoek konden doen.”

Schoonhoven vervolgt: “Er heeft sindsdien een flinke professionaliseringsslag plaats­gevonden. Waar het CBS vroeger vooral via enquêtes werkte, zijn sinds omstreeks 2000 registerbestanden steeds belangrijker geworden, met als kern voor persoonsstatistiek de Gemeentelijke Basisadministratie. Registerbestanden zijn integrale datasets met gegevens over de hele Nederlandse populatie. Dit maakt het aantrekkelijker om de data voor onderzoek te gebruiken. Bovendien kunnen wetenschappers sinds medio 2017 vanaf hun eigen computer de Remote Access omgeving betreden, uiteraard met een streng beveiligd inlogsysteem. Hierdoor is onderzoek met microdata nog toegankelijker geworden. Dit zien we terug in de hoeveelheid gebruikers: dit aantal is verdubbeld in de afgelopen vijf jaar.”

Naarmate de hoeveelheid data toenam, ontstond de wens om meer rekenkracht te hebben, met dezelfde vertrouwelijkheid en veiligheid als de Remote Access omgeving. Schoonhoven: “Het CBS heeft toen samen met SURF de ODISSEI Secure Supercomputer ontwikkeld. Hierdoor kunnen onderzoekers gebruik maken van CBS microdata met de rekenkracht van de nationale supercomputer Cartesius. Deze samenwerking voelt heel vanzelfsprekend. Het CBS interesseerde zich al langer voor een samenwerking met universiteiten, en ODISSEI is de nationale data-infrastructuur voor de sociale wetenschappen.”

Wat zijn de toekomstplannen van de microdata-afdeling?

Scherpenzeel: “Ik wilde graag bij het CBS werken vanuit wetenschappelijke interesse. Vroeger speelden enquêtes een grote rol in sociaalwetenschappelijk onderzoek, maar steeds minder respondenten willen daaraan meedoen. Ik zie dus een toekomst van groeiend gebruik van microdata gecombineerd met andere vormen van data. Deze baan sprak mij dus aan. En ik blijf het leuk vinden om een praktische functie uit te oefenen, dichtbij data en dichtbij gebruikers.”

Scherpenzeel: “Een uitdaging voor de microdata-afdeling zie ik op technisch gebied. Niet alle projecten hoeven meteen een supercomputer te gebruiken. Maar er zitten ook grenzen aan de servers van de normale Remote Access omgeving. Het is wellicht nodig om bijvoorbeeld servers met meer geheugen te gaan gebruiken. Dit is een nabije toekomstproject.

Een tweede ontwikkeling is de groei in gebruikersaantallen, en in diversiteit van projecten. Wie laten we toe, hoe houden we het veilig en beheersbaar? Onlangs is een externe evaluatie geweest. Hieruit bleek dat het gebruik van CBS microdata heel goed beveiligd is, maar natuurlijk zijn er altijd punten waarop we nog beter op verdere groei in de toekomst voorbereid kunnen zijn.

Een ander doel is internationalisering. Nederland is een koploper in het toegang geven tot registerdata. Daar wil ik graag een voorbeeld­rol van maken, zodat we in de toekomst naar een geharmoniseerd datamodel toe kunnen. De metadata moeten via een portal goed vindbaar zijn, zodat het voor onderzoekers in een internationale context makkelijker is de juiste data te vinden en deze te hergebruiken.”

Schoonhoven: “Er is veel aandacht voor de ODISSEI Secure Supercomputer. Minder spectaculair, maar minstens zo belangrijk, is de financiële ondersteuning die ODISSEI biedt voor microdataprojecten. De groep wetenschappers die van de ODISSEI microdatakorting of beurzen gebruikmaakt, is groot. Hierdoor wordt onderzoek met microdata een stuk toegankelijker. Hiernaast hoop ik ook dat het CBS in de toekomst de capaciteit van de computers kan uitbreiden op een gebruiksvriendelijke en flexibele manier.”

Scherpenzeel: “Bovendien is outreach belangrijk. Bij sociale en economische wetenschappers zijn de microdata ondertussen goed bekend. Ik zou de microdata wel in andere domeinen van wetenschap meer bekend willen maken, zoals bij gezondheidswetenschappen. Ik zie hier zeker ook een rol voor ODISSEI, waarmee we natuurlijk al informatie-evenementen houden. Maar ik zou dat ook vanuit het CBS verder willen ontwikkelen. We kunnen onderzoekers meer gaan opzoeken met roadshows. Ook wil ik in de toekomst het onderzoek dat gedaan wordt met microdata meer naar buiten brengen. Bijvoorbeeld door resultaten van dat onderzoek op onze website te plaatsen en in onze nieuwsbrief voor gebruikers te delen.”

En wat zijn jullie eigen plannen?

Schoonhoven: “Ik heb geen specifieke plannen met mijn pensioen, maar ik weet wel waar ik meer tijd voor wil maken. Zo wil ik in ieder geval meer piano spelen. Ik verheug me daarnaast op een live Community Conference van ODISSEI in het najaar.” Scherpenzeel sluit af: “Ik werk natuurlijk nog niet zo lang bij het CBS, ik hoop dat wel nog minstens tien jaar te mogen doen. Ik heb echt ambitie om de mogelijkheden van microdata nog meer zichtbaar te maken, samen met het team.”

Lees hier meer over CBS microdata.

Meer informatie

Het Centraal Bureau voor de Statistiek (CBS) verzamelt data op persoons- en bedrijfsniveau. Onder strenge voorwaar­den kunnen wetenschappers gepseudo­nimiseerde microdata voor onderzoek gebruiken. Dit kon al enige tijd in de beveiligde Remote Access omgeving van het CBS. Tegenwoordig kunnen projecten die grotere rekenkracht nodig hebben, gebruikmaken van de ODISSEI Secure Supercomputer. Voor meer informatie kan contact worden opgenomen met CBS Microdata Services, via microdata@cbs.nl.