‘DANS biedt schatkamer aan online onderzoeksinformatie’

Data verdienen het om bewaard te worden. Want alleen door data te delen, kunnen ook andere onderzoekers kennis uit de data halen. Precies voor dat doel is DANS 15 jaar geleden opgericht.

“Volgens Re3data.org, een wereldwijd register van repositories voor onderzoeksgegevens, telt ons land momenteel bijna 60 research data repositories, databases en metadatacatalogi. Dat is geweldig.” Aan het woord is Peter Doorn, tot 1 april directeur DANS. “Deze hoeveelheid databewaarplaatsen geeft onderzoekers altijd de mogelijkheid om data te delen. Maar er is een keerzijde; de meeste repositories uit de lijst garanderen geen lange termijn duurzaamheid van de opgeslagen data. En dat is nu juist van het grootste belang.”

Wekkerfunctie

Doorn: “Er is de afgelopen 15 jaar veel veranderd. In 2005 was de bestuurlijke interesse in het toegankelijk maken van onderzoeksdata nog heel beperkt. Universiteiten voerden geen beleid daarover. Het idee van Open Access publicaties was wel al geboren, zo rond 2002. Maar de waarde van research data drong pas goed door in de jaren 2010. De term ‘Big Data’ stamt net als DANS uit 2005, maar was aanvankelijk alleen in beperkte kring een hot item. Voormalig vicevoorzitter van de EU Neelie Kroes was één van de eerste beleidsmakers die de waarde van onderzoeksdata inzag en breed verkondigde. Ze noemde het ‘het nieuwe goud’ en de ‘olie voor de wetenschap’; nu zijn dat afgesleten clichés. Tegenwoordig hebben alle Nederlandse universiteiten een afdeling Research data support en hanteren KNAW en NWO heldere principes voor databeheer en databeschikbaarheid. Ik vrees trouwens dat ook de datafraude-gevallen in het afgelopen decennium een wekkerfunctie hebben gehad.”

Veertienvoudiging

In vijftien jaar is DANS uitgegroeid tot hét Nederlandse instituut voor permanente toegang tot digitale onderzoeksgegevens. DANS zorgt ervoor dat onderzoekers en dataprofessionals onderzoeksgegevens vindbaar, toegankelijk, interoperabel en herbruikbaar kunnen maken. Zo biedt DANS naast trainings- en adviestrajecten diverse diensten: DataverseNL, EASY en NARCIS. Doorn: “In 2019 groeiden deze diensten sneller dan ooit tevoren. Via EASY (CoreTrustSealgecertificeerd) zijn inmiddels ruim 120.000 onderzoeksdatasets duurzaam opgeslagen, klaar voor hergebruik door diverse toegangscategorieën en persistent identifiers. Verdeeld over wetenschappelijke discipline zijn dit vooral archeologische data-sets en datasets uit de geesteswetenschappen en sociaal-culturele wetenschappen. Bijna 40.000 datasets zijn in 2019 gedownload, een vertienvoudiging in tien jaar tijd. NARCIS is dé nationale portal voor wie informatie zoekt over wetenschappers en hun werk. NARCIS biedt nu toegang tot 260.000 datasets van 18 Nederlandse en 2 internationale repositories en ook toegang tot bijvoorbeeld meer dan 2 miljoen digitale publicaties van 37 Nederlandse onderzoeksinstellingen, waarvan 765.000 open access beschikbaar. Data-verseNL biedt onderzoekers de mogelijkheid om onderzoeksgegevens al tijdens onderzoek op te slaan, te delen en te publiceren, het platform bevat bijna 1.300 datasets en telde 37.500 downloads.”

Schat aan datasets

“De ransomware-aanval op de Universiteit Maastricht in de kerstperiode 2019 laat zien hoe rampzalig het is als onderzoekers niet meer bij hun data kunnen. Daarnaast geeft het publiceren van data ook iets extra’s aan onderzoek, aan de invulling van de rol als wetenschapper en aan iemands zichtbaarheid – wat mede van belang is om nieuwe projecten gefinancierd te krijgen. Door data via een archief te delen ofwel te publiceren, wordt het onderzoeksproces beter verifieerbaar.” De bij DANS opgeslagen datasets zijn enorm divers. Zo zijn bijvoorbeeld de ervaringen van Nederlandse oorlogsveteranen digitaal vastgelegd in audiobestanden met bijbehorende transcripten. Als men wil weten wat het weer was bij Kaap de Goede Hoop op 6 januari 1763: het staat in een van de gearchiveerde scheepsjournaals uit de periode 1750 tot 1850. Ook alle Nationale Kiezersonderzoeken zijn beschikbaar. Verder is veel archeologische data beschikbaar, zoals digitale kaarten van vindplaatsen en scans van analoge veldtekeningen, objectfoto’s en veldfoto’s en tabellen met determinaties van vondsten. 224 jaar na de eerste volkstelling in Nederland zijn er meer dan twee eeuwen aan data over bevolkingsgrootte, leeftijden, geslacht en beroepsgroepen online te raadplegen. En in 2019 stelde het Amsterdam UMC als eerste ziekenhuis in Europa geanonimiseerde data over intensive-carepatiënten beschikbaar via DANS. Dit zijn slechts enkele voorbeelden van de tienduizenden datasets die via EASY te vinden zijn. Beschikbaar gesteld door wetenschappelijke onderzoekers voor wetenschappelijke onderzoekers en anderen. Iedereen kan zoeken in EASY en een groot deel van de datasets downloaden. Soms zijn er bijvoorbeeld privacyredenen die ervoor zorgen dat alleen geregistreerde gebruikers toegang krijgen. Bij de vermelding ‘Open Access’ is de dataset voor iedereen toegankelijk.

Optimaal hergebruik van data

Ingrid Dillo, adjunct-directeur: “Nationaal en internationaal is het delen van data prioriteit, waarbij een verantwoorde, toegankelijke dataopslag basisvoorwaarde is om data een langere levensduur en verhoogde waarde te geven. Zo financiert de Europese Commissie projecten en infrastructuren om de toegankelijkheid van onderzoeksresultaten te bevorderen, zoals: EOSC-hub, OpenAIRE, FAIRsFAIR en FREYA. DANS leidt FAIRsFAIR, een groot Europees project waarin gewerkt wordt aan praktische oplossingen voor het gebruiken van de FAIR-principes tijdens de levens-cyclus van onderzoeksgegevens. Een ander voorbeeld van een onlangs gestart project is het project Social Sciences and Humanities Open Cloud (SSHOC), waarin DANS een van de projectpartners is. Binnen het nieuwe Europese financieringsprogramma Horizon Europe (2021-2027) wordt het ‘hergebruiken van onderzoeksdata’ genoemd als een van de speerpunten. Ook het internationaal erkende keurmerk voor repositories CoreTrustSeal is een voorbeeld van internationale samenwerking. In de Wetenschapsvisie van Minister Van Engelshoven (OCW) komt ‘open science’ veelvuldig voor. Ook NWO vindt dat onderzoeksresultaten die zijn betaald uit publieke middelen, wereldwijd vrij toegankelijk moeten zijn. De KNAW onderstreept hetzelfde belang met haar invulling van het thema Open Science.” Met de toename van belang van het delen van data stijgt ook het aantal spelers binnen het Nederlandse datalandschap. Binnen CLARIAH en ODISSEI werkt DANS mee aan een nationale data-infrastructuur voor respectievelijk de geesteswetenschappen en sociale wetenschappen. Onlangs is ook de FAIR Software Route gelanceerd door het eScience Center en DANS, een online stap-voor-stap handleiding voor ontwikkelaars, onderzoekers en datastewards om onderzoekssoftware FAIR te maken. Doorn sluit af: “Na 15 jaar geef ik het roer aan mijn opvolger Henk Wals. Ik heb er alle vertrouwen in dat hij samen met mij en de medewerkers van DANS een aansprekende en toekomstgerichte visie uitwerkt op de steeds belangrijkere rol van DANS in het complexe datalandschap. Het verleden is en blijft een gigantische bron voor de toekomst.”

De directie van DANS: Ingrid Dillo (links), Peter Doorn (tot 1 april aanstaande, rechts) en Henk Harmsen (niet op de foto).
Credits: Bart van Vliet

Maak kans op subsidie

Ook data uit kleine projecten kunnen heel waardevol zijn voor hergebruik. Door de KDP-subsidies van DANS wordt dit mogelijk gemaakt, het afgelopen jaar zijn weer tien subsidies verstrekt. Informatie over de subsidie-ronde 2020 staat op de website van DANS.

H. Wals nieuwe directeur DANS

1 april start Henk Wals als nieuwe directeur van DANS. Wals is sociaaleconomisch historicus. Hij studeerde en promoveerde aan de Universiteit van Amsterdam. Wals was eerder directeur Huygens ING en Internationaal Instituut voor Sociale Geschiedenis, ook KNAW-instituten. Peter Doorn blijft als adviseur bij DANS betrokken.

Dit jaar bestaat DANS 15 jaar

Een overzicht van de geschiedenis en activiteiten voor dit jaar staat op de website van DANS.