Van ontvangers van onderzoeksbeurzen en auteurs van wetenschappelijke artikelen wordt tegenwoordig verwacht dat ze hun data delen, zowel vanuit het oogpunt van overheidsbeleid als vanuit het oogpunt van best practice.

Door: Christine L. Borgman en Paul T. Groth

Richtlijnen voor het delen van data, zoals de FAIR-principes (Findable, Accessible, Interoperable, Reusable) instrueren de onderzoekers over hoe ze hun datasets beschikbaar kunnen maken voor anderen. De FAIR-principes en andere beleidsverklaringen over het delen van data impliceren dat onderzoeksdata waardevolle entiteiten zijn die moeten worden beheerd, nuttig zijn voor anderen, en hergebruikt zullen worden. Deze aannames leggen echter een zware last op onderzoekers en data archieven die hen ondersteunen. Onderzoeksprojecten genereren vaak veel grotere hoeveelheden data dan praktisch bewaard kunnen of misschien zouden moeten worden. Het vrijgeven of documenteren van alle data en apparatuur op een manier die ze voor iedereen, voor altijd herbruikbaar maakt, is zelden mogelijk of haalbaar. Naast het streven naar maximalisatie van datahergebruik, is het daarom van essentieel belang om de haalbaarheid van deze aanpak te bespreken.

Wie, waarom, hoe

Het delen van onderzoeksdata is complex, arbeidsintensief, duur en vereist investeringen in infrastructuur van meerdere belanghebbenden. Hoewel het beleid voor open science zich voornamelijk richt op het vrijgeven van data, blijkt dat het hergebruik ervan moeilijk, kostbaar en mogelijk zelfs niet altijd plaatsvindt. Het zou daarom verstandig zijn om bij investeringen in databeheer te overwegen wie de data mogelijk zal hergebruiken, op welke manier, waarom, voor welke doeleinden, en wanneer. Aangezien onderzoekers niet alle potentiële hergebruiksscenario’s kunnen voorzien, is het doel van deze studie het identificeren van factoren die belanghebbenden kunnen helpen bij het nemen van beslissingen over investeringen in onderzoeksdata, het identificeren van potentiële hergebruikers en hergebruiksmogelijkheden, en het verbeteren van processen voor data-uitwisseling.

Afstand

Op basis van empirisch onderzoek naar het delen en hergebruiken van data is een theoretisch concept ontwikkeld dat de ‘afstand’ tussen de maker en hergebruiker van data inzichtelijk maakt. Daarbij zijn zes afstandsdimensies geïdentificeerd die van invloed zijn op het effectief overdragen van kennis: domein, methoden, samenwerking, curatie, doeleinden, en tijd en temporaliteit. Hoewel deze dimensies voornamelijk sociaal van aard zijn, spelen bijbehorende technische aspecten een rol bij het verkleinen – of vergroten – van de afstand tussen makers en hergebruikers. Onze theoretische benadering van de afstand tussen makers en potentiële hergebruikers van data leidt tot aanbevelingen aan vier categorieën van belanghebbenden – makers, hergebruikers, archivarissen en financieringsinstanties – over hoe het delen en hergebruiken van data effectiever kan worden gemaakt.

Borgman, C. L., & Groth, P. T. (2024). From Data Creator to Data Reuser: Distance Matters (arXiv:2402.07926). arXiv. https://doi.org/10.48550/arXiv.2402.07926