“Stap voor stap richting een nationale data-infrastructuur”

DANS lanceert domeingerichte Data Stations

Onderzoekers die data willen bewerken, delen, analy­seren en archiveren, kloppen steeds vaker aan bij DANS, het nationaal expertisecentrum en repository voor onderzoeksdata. 

Op verzoek van onderzoekers en dataprofessionals bewaart DANS bijna 200.000 datasets gegarandeerd duurzaam. Het KNAW/NWO-instituut is sinds 2006 een belangrijke speler binnen de Nederlandse en wereldwijde onderzoeksgemeenschap. De komende periode gaat DANS domein­gerichte Data Stations aanbieden, diensten die zijn toegesneden op de behoeften binnen wetenschappelijke disciplines. Daarmee wordt DANS naast een archief voor datasets uit voltooide onderzoeksprojecten, ook een omgeving waarin onderzoekers datasets kunnen vormen, bewerken, analyseren en delen. Henk Wals, directeur DANS, licht toe: “De omstandigheden en behoeften binnen wetenschappelijke domeinen lopen nogal uiteen. Datasets in de natuurwetenschappen of de levenswetenschappen kunnen bijvoorbeeld gigantisch groot zijn, en in de levenswetenschappen of de sociale wetenschappen bovendien privacygevoelig. In de geesteswetenschappen zijn sets meestal kleiner, maar vaak complex, bijvoorbeeld omdat historische data incompleet en tijdreeksen inconsistent zijn. De metadataschema’s en de gebruikte tooling verschillen ook per discipline. De roep om domeinspecifieke werkplaatsen voor data werd de afgelopen jaren steeds groter.”

Cross-disciplinaire aanpak

Wals vervolgt: “Tegelijkertijd zien we dat onderzoek steeds vaker een cross-disciplinaire aanpak vereist. Interoperabiliteit over domeinen heen wordt belangrijker, maar het datalandschap is gelaagd: het begint bij de individuele dataruimte van een onderzoeker, dan het niveau van instituties, dan domeinen, dan het nationale niveau en uiteindelijk internationaal. Op elk niveau bevinden zich organisaties met diensten voor onderzoekers. Voorbeelden naast DANS zijn 4TU.ResearchData, SURF en DTL. Voor het maximaal faciliteren van cross-disciplinair onderzoek is het belangrijk dat de organisaties op de knooppunten van alle lagen samenwerken en één infrastructuur vormen. Uiteindelijk maakt het voor een onderzoeker niet uit waar data en software vandaan komen, als het maar op elkaar aansluit.”  

Vier Data Stations

Terug naar de Data Stations. Er komen er vier: Archaeology, Social Sciences & Humanities, Physical & Technical Sciences en Life, Health & Medical Sciences. Voor de laatste twee wordt afgestemd met respectievelijk 4TU.ResearchData en DTL over waar DANS aanvullend kan opereren of op welke data-niches DANS zich het beste kan richten. Ook wordt nauw samengewerkt met SURF, onder meer voor veilige opslag van de data. Via een interne procedure selecteerde DANS Data Station Managers die inhoudelijk goed thuis zijn in de domeinen. Wals: “Het idee achter de Data Stations is om dicht tegen het onderzoek aan te kruipen, aan te sluiten bij onderzoeksinfrastructuren en uit te gaan van de noden en wensen die in verschillende communities leven. Een Data Station moet je zien als een conglomeraat van services, met in de kern een instantie van Dataverse. Elk station wordt bemenst door Data Station Managers die vanuit hun eigen onderzoeksachtergrond het wetenschapsdomein en de mensen daarin goed kennen en dus constructieve verbindingen kunnen leggen.”

Voor onderzoekend Nederland

Door het nieuwe dienstenpakket en samenwerking op verschillende lagen zet DANS stappen richting een samenhangende basisinfrastructuur voor onderzoekend Nederland. Wals sluit af: “Samen met de andere datadienstverleners en de onderzoeksinfrastructuren in de verschillende wetenschapsdomeinen willen we een compleet pakket vormen dat gebruikers een naadloze ervaring biedt. Lokale Digital Competence Centers kunnen dan van dit dienstenpakket gebruik maken om onderzoekers te helpen met hun data te werken en deze FAIR te deponeren. Zo zou uiteindelijk een heldere en efficiënte nationale infrastructuur voor research data kunnen ontstaan.”

dans.knaw.nl

Data Station Archaeology

Hella Hollander is verantwoordelijk voor het Data Station Archaeology. Ze studeerde archeologie (Universiteit Leiden) en is projectleider van verschillende infrastructuren, projecten en andere co-creaties zoals ARIADNE, 4CH, Iperion-HS, Pure3D, Limes en Exalt. Ook is ze lid van de stuurgroep van E-rihs.NL waarin Nederlandse partners werken aan de Europese infrastructuur voor erfgoedwetenschap.

“Data afkomstig uit archeologisch onderzoek duurzaam opslaan, waardoor de data ook op termijn vindbaar en herbruikbaar zijn, kan via DANS. Mocht je daar vragen over hebben, laat het mij weten.”

Data Station Social Sciences & Humanities

Ricarda Braukmann en Femmy Admiraal zijn de managers van het Data Station Social Sciences & Humanities.

Ricarda studeerde Psychologie (Universiteit Twente) en Cognitieve Neurowetenschappen (Radboud Universiteit) en promoveerde op een interdisciplinair onderzoeksproject naar de vroege ontwikkeling van autisme (Radboud Universiteit). Ze is actief binnen (inter)nationale infrastructuren zoals ODISSEI en CESSDA. Ook is ze betrokken bij de ontwikkeling van trainingen op het gebied van Research Data Management.

“In de sociale wetenschappen werken we vaak met gevoelige data. Ik wil er graag aan bijdragen dat deze data goed bewaard blijven en, waar mogelijk, op een veilige manier her­gebruikt kunnen worden om nieuwe vragen te beantwoorden.”

Femmy is taalkundige en antropoloog (Universiteit van Amsterdam), zij promoveerde op een diepgaand onderzoek naar linguïstische codering van ruimtelijke referentie in de bedreigde taal Baure (Bolivia). Zij is actief in Europese infrastructuren DARIAH en CLARIN, en in verschillende onderzoeksprojecten, zoals PARTHENOS en Polifonia.

“In een veld met zo veel verschillende soorten data vind ik het een fantastische uitdaging om de geesteswetenschappen te ondersteunen in duurzame toegankelijkheid, op een manier die precies bij hun data past.”

Data Station Physical & Technical Sciences en Data Station Life, Health & Medical Sciences

Cees Hof is het aanspreekpunt van deze Data Stations. Cees is zijn carrière begonnen als aquatisch ecoloog (Radboud Universiteit) en onderzocht als promovendus (Universiteit van Amsterdam) en postdoc (University of Bristol) hoe fossielen ontstaan en de rol van fossielen in evolutionaire reconstructies. 

Ervaring met het delen van data en de werking van data-infrastructuren deed hij op als coördinator van verschillende grote (open) dataprojecten, zoals de bouw van de de Global Biodiversity Information Facility (GBIF). Cees is ook een van de Research Data Management trainers binnen DANS.

“Door wetenschappelijke data gestructureerd te archiveren en te delen, dragen we bij aan betere wetenschap voor een meer gezonde, groene, duurzame, inclusieve en innovatieve toekomst. Via mijn werk bij DANS kan ik een belangrijke bijdrage leveren aan deze missie.”

Data Vault 

DANS biedt naast de Data Stations ook de Data Vault; een beveiligd, betrouwbaar en gecertificeerd repository voor de lange termijn opslag van data. De Data Vault huisvest alle datasets die (ooit) door onderzoekers aan DANS zijn toevertrouwd, en functioneert ook als een repository voor grote datacollecties afkomstig van universiteiten en onderzoeksinstituten. Cees Hof is aanspreekpunt voor de Vault. 

DataverseNL

Naast de Data Stations biedt DANS ook DataverseNL.

DataverseNL is een platformdienst waarin universiteiten, hogescholen en onderzoeksinstellingen hun eigen instellingsrepository kunnen onderbrengen. 

De aldaar gedeponeerde datasets zijn tevens vindbaar via de domeingerichte Data Stations. Aanspreekpunt voor DataverseNL is Marion Wittenberg. Marion heeft Sociologie en sociaal-wetenschappelijke Informatica gestudeerd (Universiteit van Amsterdam) en heeft jarenlange ervaring als datamanager en projectmanager op het gebied van datacuratie.

“DataverseNL is meer dan een veilige online omgeving waarin deelnemers zelf hun datamanagement kunnen inrichten, het is een samenwerkingsverband vol ‘good practices’ op het gebied van research data management.”