STORM, CoronaWatchNL en 17-eeuwse kranten winnaars Dataprijs

Eind 2020 werd aan drie inspirerende datasets de RDNL Dataprijs 2020 uitgereikt, erkenning gevend aan de inspanning om de data te willen delen. E-data zet de winnaars op een rij.

Door: Deirdre Casella en Heidi Berkhout

Ingebed in het partnerevent Together We Share reikte RDNL voor de 6e keer de Dataprijs uit. Naast een keynote over de Europese Open Science Cloud door Dataprijs-juryvoorzitter prof. dr. Karel Luyben (Rector Magnificus Emeritus en Nationaal Coördinator Open Science), zeven interactieve parallelsessies georganiseerd door RDNL-partners en dataexperts uit het Nederlandse datalandschap en aanmoedigingsprijzen, vormden de uitreiking van de Dataprijs 2020 de finale van het event. 

Nieuwe mogelijkheden

Binnen de categorie exacte en technische wetenschappen prees de jury de winnaar mede omdat de data zich bevinden in een stabiele omgeving, open toegankelijk zijn en nieuwe onderzoeksmogelijkheden met zich meebrengen. Onderzoeker Nadia Bloemendaal (Instituut voor Milieukunde, Vrije Universiteit van Amsterdam), wiens dataset STORM de Nederlandse Dataprijs won, gaf aan “het prijzengeld te besteden aan een interactieve website waarop het risico van een tropische cycloon wordt gevisualiseerd.” 

Vakwerk

Jonathan de Bruin (Universiteit Utrecht) nam namens het team de prijs van de categorie medisch en levenswetenschappen in ontvangst voor CoronaWatchNL. De jury gaf aan: tegenwoordig is veel informatie en data publiek beschikbaar. Data op dusdanige wijze aanbieden dat anderen er echt verder mee kunnen, is vakwerk. De Bruin noemde in zijn dankwoord “aanbevelingen te doen voor het creëren van FAIR-datasets in crisissituaties, gecombineerd met inzichten uit RDM, Open en Citizen Science, zodat data op snel en transparant gepubliceerd kunnen worden als de tijd dringt.”

Unanieme winnaar

Winnaar in de categorie geestes- en sociale wetenschappen werd Nicoline van der Sijs (Instituut voor de Nederlandse Taal, Delpher/KB). Namens de jury een unanieme winnaar in deze categorie. Want, aldus de jury: de data zijn publiek toegankelijk en bruikbaar voor onderzoekers uit allerlei disciplines. De toepassingen zijn legio en ook het feit dat wordt gewerkt met vrijwilligers geeft aan dat deze collectie iedereen raakt. Winnares Van der Sijs benadrukte de waarde en potentie van het combineren van FAIR-datapraktijken met Citizen Science binnen de crowdsourced research database van de winnende dataset getranscribeerde 17e-eeuwse kranten. Ze sprak haar dank uit aan de vrijwilligers die het delen van de gegevens mogelijk maakten. 

researchdata.nl

Winnaars Dataprijs

Winnaar – exacte en technische wetenschappen:  STORM

De STORM-dataset bevat 10.000 jaar aan synthetische tropische cycloonsporen. Dit zijn tropische cyclonen die theoretisch mogelijk, maar (nog) niet voorgekomen zijn. De gegevens kunnen worden gebruikt om het tropische cycloonrisico te berekenen in alle (kust) regio’s die vatbaar zijn voor tropische cyclonen. Het is de eerste publiek toegankelijke dataset die op wereldwijde schaal tropische cyclonen representeert, vooral interessant voor risico-analisten, onderzoekers en beleidsmakers.

doi.org/10.4121/uuid:82c1dc0d-5485-43d8-901a-ce7f26cda35d

Winnaar – medische en levenswetenschappen: CoronaWatchNL

De CoronaWatchNL-dataset bevat openbare en accurate gegevens over COVID-19 in Nederland. De dataset bestaat uit data uit nieuwsrapporten en betrouwbare statistische gegevens, bijvoorbeeld afkomstig van het RIVM, LCPS, NICE en Nationale Corona Dashboard. Dit project standaardiseert en publiceert de gegevens en maakt ze vindbaar, toegankelijk, interoperabel en herbruikbaar. Onderzoekers, epidemiologen en beleidsmakers hoeven niet meer zelf deze data te verzamelen en samen te voegen.

github.com/J535D165/CoronaWatchNL

Winnaar – sociale en geesteswetenschappen: 17-eeuwse kranten 

Deze dataset bevat een transcriptie van de oudste Nederlandstalige kranten, gepubliceerd tussen 1618 en 1700; het gaat om 14 titels, 6.184 kranten met circa 120.000 artikelen en circa 20 miljoen woorden. Ruim 200 vrijwilligers hebben in vijf jaar tijd alle 20 miljoen woorden handmatig overgetikt en gecorrigeerd, waardoor een betrouwbaar full-text-doorzoekbaar onderzoekscorpus is gecreëerd. 
De dataset is relevant voor onderzoekers van alle historische disciplines binnen de geesteswetenschappen. 

delpher.nl/kranten