Hey Google, Hey Siri, Hey ODISSEI !

Metadata van meerdere providers zoeken, vinden en  aan  elkaar knopen

Of we binnenkort met de woorden ‘Hey ODISSEI’ gegevens over datasets (metadata) kunnen oproepen, valt nog te bezien maar een zoekmachine voor metadata uit de sociale wetenschappen is in de maak.

ODISSEI (Open Data Infrastructure for Social Science and Economic Innovations) is een samenwerkingsverband van verschillende universiteiten en organisaties zoals CBS, DANS, SURF en de VU, om statistisch onderzoek binnen -met name- de sociale wetenschappen te verbeteren en vergemakkelijken. Vanuit deze onderzoeksinfrastructuur is een portal in ontwikkeling dat het uitvoeren van wetenschappelijk onderzoek niet alleen makkelijker, maar ook leuker maakt. Om metadata van verschillende instellingen te vinden en aan elkaar te knopen, wordt gebruikgemaakt van een linked data model en is er gekeken naar internationale standaarden voor metadata zoals DDI (Data Documentation Initiative) en de metadata standaard van CESSDA (Consortium for Social Science Data Archives). De metadata van verschillende dataproviders wordt in de portal op dezelfde manier opgesteld waardoor deze behalve goed doorzoekbaar, ook vergelijkbaar zijn. Ook wordt het gemakkelijk om ‘sleutels’ te vinden zodat snel duidelijk wordt via welke variabele bestanden gelinkt kunnen worden.

Snel en efficiënt

De metadata van de bestanden die het CBS ter beschikking stelt via een remote access omgeving, zullen in het ODISSEI-portal worden opgenomen. Het doorspitten van honderden pdf-documenten in de online catalogus is daarmee verleden tijd. Ook metadata van het LISS panel en duizenden sociaalwetenschappelijke datasets die bij DANS zijn opgeslagen zijn vindbaar via de portal. Maar dat is nog maar het begin want ODISSEI ambieert om ook metadata van andere dataproviders zoals DataverseNL, NTR en SHARE via de portal vindbaar te maken. En daar blijft het niet bij. Heb je als (potentiële) gebruiker van data gevonden wat je zocht, dan kun je direct via de portal je toegangsaanvraag bij de desbetreffende instelling indienen. Uiteraard vindt het uitvoeren van het onderzoek in een beveiligde omgeving (zoals de microdata-omgeving bij het CBS) plaats. Een sprong voorwaarts dus, maar niet alleen voor de gebruikers van data. Ook de dataproviders komen aan hun trekken. De leveranciers van de data krijgen eenvoudig inzicht in het ‘wie-wat-waarom’.  Wie is geïnteresseerd in welke data en voor welk doel. Ook zal de portal de metadata beschikbaar stellen voor internationale dataportalen van CESSDA en de European Open Science Cloud (EOSC).

De eerste resultaten

De afgelopen maanden is via een testportal om feedback van onderzoekers gevraagd. Aan de hand daarvan worden nu verbeteringen doorgevoerd. Zo is bijvoorbeeld de user interface verbeterd en worden links gemaakt naar gerelateerde datasets in de CBS databank StatLine. Op het Open Science Festival is onlangs de eerste versie van de portal gelanceerd en de komende twee jaar zal ODISSEi verder werken aan deze ODISSEI-zoekmachine die voor eenieder beschikbaar is. Een ‘nieuw tijdperk’ waarin we via enkele ‘klikken’ de juiste bronnen, data en expertise kunnen vinden.

Wil je meer weten? Neem dan contact op met info@ODISSEI-data.nl