Zo maak je kwalitatieve data herbruikbaar

Interviews, informatie uit focusgroepen of dagboeken – allemaal voorbeelden van kwalitatieve data die gebruikt worden in onderzoek. Een vernieuwde handboek bekijkt de unieke uitdagingen van het beschikbaarstellen van kwalitatieve data en geeft richtlijnen voor de verschillende fases in het onderzoeksproces.

door Ricarda Braukmann

Kwalitatieve onderzoeksdata bevatten een schat aan informatie en zijn erg interessant voor hergebruik, maar ze komen ook met unieke uitdagingen: Het verwijderen of beschermen van persoonsgegevens is in deze ongestructureerde data lastig of onmogelijk. Bij gevoelige onderwerpen of kwetsbare groepen kunnen de data dan ook niet openbaar gedeeld worden. Ook is de context belangrijk voor de interpretatie van kwalitatieve data waardoor het extra van belang is om een hergebruiker voldoende informatie te geven om de juiste conclusies te kunnen trekken.

DANS ondersteunt het beschikbaarstellen van kwalitatieve data en de interviews uit de Oral History collectie zijn zelfs een van de grootste collecties in de DANS Data Station Social Sciences and Humanities. DANS werkt vaak samen met de data-eigenaren om de kwalitatieve data voor te bereiden voor publicatie en de juiste toegangscategorie te kiezen (zie ook de februari editie 2023 van e-Data & Research: https://edata.nl/2023/02/24/rust-vinden-door-je-verhaal-te-vertellen/). In 2023 ontstond het idee om de ervaringen samen te vatten in een handboek en de eerste versie van de Guidebook ‘Making Qualitative Data Reusable’ is inmiddels al bijna 14 duizend keer bekeken. Een vernieuwde versie wordt binnenkort gepubliceerd.

Langs de life cycle

De guidebook neemt de lezer mee langs de research data life cycle en geeft voor elke stap tips om de herbruikbaarheid van de kwalitatieve data te verbeteren.

Aan het begin van het onderzoek is het al van belang om na te denken of en hoe de data gedeeld kunnen worden. “Vaak zien we dat onderzoekers data wel willen delen en dat er geen ethische bezwaren zijn maar dat het niet goed is verwerkt in de informed consent formulieren”, vertelt Maaike Verburg (DANS), een van de auteurs. Informed consent blijft echter de meest gebruikte juridische basis om data te delen en het advies is dan ook om herbruikbaarheid van begin af aan centraal te stellen en deelnemers hierin mee te nemen.

As open as possible, as closed as necessary

“Dat betekent echter niet dat alle data zo maar openbaar moeten worden”, legt Verburg verder uit. “De guide besteed aandacht aan de ethische aspecten van kwalitatieve data, zoals de CARE principes, en bespreekt de afwegingen die we moeten maken tussen de waarde van het beschikbaar stellen en de mogelijke risico’s voor de deelnemers”. Een centraal onderdeel van de guide is dan ook een beslisboom waarin de verschillende opties worden toegelicht: van open of restricted access tot beveiligde omgevingen. “Voor alle datasets geldt dat in elk geval documentatie beschikbaar zou moeten zijn en promoten we het principe as open as possible, as closed as necessary.”

Open formats

Tips om de transparantie te bevorderen geeft de guidebook bijvoorbeeld in een nieuw hoofdstuk over pre-registratie voor kwalitatieve data. Voor het verwerken en analyseren van data wordt het belang van open formaten en free en open source software (FOSS) benadrukt en tot slot worden voorbeelden gegeven van gepubliceerde kwalitatieve datasets. 

De auteurs hopen dat de nieuwe guidebook verder zal bijdragen aan de toegankelijkheid van kwalitatieve data en het hergebruik ervan. De nieuwe guidebook is beschikbaar op Zenodo en wordt tijdens het Open Science Festival in Groningen op 24 oktober, gepresenteerd in een workshop sessie.