Het gebeurt me regelmatig. In de Europese wandelgangen krijg ik vaak de vraag: “Hoe krijgt Nederland dat toch voor elkaar?” Of het nu gaat over FAIR data, Open Science, of de steeds belangrijker wordende rol van data stewardship—Nederland wordt gezien als een voorbeeld. Europese collega’s kijken met bewondering naar onze aanpak, en willen er graag […]

Read more

Door HERBERT VAN DE SOMPEL In de oktober-2021 editie van e-Data & Research werd aandacht besteed aan FAIR Signposting, een aanpak die machine-vriendelijke wegwijzers plaatst op en rond landingpagina’s. Dit helpt bots eenvoudig toegang te krijgen tot de metadata, de PID (Persistent IDentifier), het artikel, of de dataset die door die landingspagina beschreven wordt. Sindsdien […]

Read more

Van ontvangers van onderzoeksbeurzen en auteurs van wetenschappelijke artikelen wordt tegenwoordig verwacht dat ze hun data delen, zowel vanuit het oogpunt van overheidsbeleid als vanuit het oogpunt van best practice. Door: Christine L. Borgman en Paul T. Groth Richtlijnen voor het delen van data, zoals de FAIR-principes (Findable, Accessible, Interoperable, Reusable) instrueren de onderzoekers over […]

Read more

Op 6 maart 2024 kondigde MLCommons (een consortium dat werkt aan standaarden voor kunstmatige intelligentie) de introductie aan van Croissant. Dit is een metadatastandaard, bedoeld om datasets geschikt te maken voor machine learning (ML). Door datasets te voorzien van metadata volgens de Croissant-standaard, worden de datasets makkelijker vindbaar en bruikbaar voor allerlei tools en platforms. […]

Read more

Bart van der Sloot, Sascha van Schendel (eds), (2024), The Boundaries of Data, Amsterdam University Press Het boek The Boundaries of Data onderzoekt de uitdagende vraag welk effect huidige en toekomstige technische ontwikkelingen hebben op het gegevensbeschermingskader en de bescherming van de verschillende soorten gegevens met betrekking tot anonimisering, pseudonimisering, aggregatie en identificatie van gegevens. […]

Read more

In samenspraak met Universiteit Leiden is er als stageopdracht onderzoek gedaan naar synthetische datasets die inzetbaar zijn in het onderwijs. Op basis van de eisen en wensen is er een generatiemethode, om synthetische data mee te genereren, gezocht waarmee de balans tussen de privacy, getrouwheid en geschiktheid doeltreffend blijft. Dit heeft geresulteerd in een synthetische […]

Read more

Het CBS heeft op basis van administratieve overheids­registers persoonsnetwerken geconstrueerd van familie, huisgenoten, klasgenoten, buren en collega’s. Bronnen zijn onder andere de Basis-registratie Personen, de Polisadministratie en onderwijsinformatie van DUO. Door Marjolijn Das (CBS/EUR/LDE Centre for BOLD Cities), Fijnanda van Klingeren (CBS), Jan van der Laan (CBS), Edwin de Jonge (CBS) Vanuit deze bronnen is […]

Read more

Het duurde maar een paar uur. De verwoestende brand van 2018 in het Nationaal Museum van Brazilië vernietigde, naast vele andere kostbare voorwerpen, “de collectie met betrekking tot inheemse talen, inclusief de opnames sinds 1958, de gezangen in alle uitgestorven talen, de Curt Nimuendajú-archieven en de etnologische en archeologische referenties van alle etnischegroepen in Brazilië […]

Read more