Een team aan de Universiteit Utrecht ontwikkelde onder leiding van Rens van de Schoot software die onderzoekers kan ondersteunen bij het snel vinden van relevante artikelen.
In veel wetenschappelijke vakgebieden komt er met een enorme snelheid een grote hoeveelheid nieuwe artikelen bij. Dit maakt het schier onmogelijk om artikelen binnen een redelijke tijd te doorzoeken en te beoordelen. Rens van de Schoot, hoogleraar statistiek aan de Universiteit Utrecht, vroeg zich af of dit handiger kon. Samen met Daniel Oberski, UHD aan dezelfde universiteit, ontwikkelden ze ASReview: Automated Systematic Review.
Elke ronde slimmer
Rens van de Schoot: “Als je zoekt in een bestaande database, dan gebruik je één keer de zoektermen en krijg je in één keer de resultaten. ASReview kent een iteratief proces: als mens laat je de machine weten of een artikel wel of niet relevant is. De machine leert hiervan, ordent de artikelen opnieuw en geeft nieuwe resultaten ter beoordeling; het proces begint opnieuw. Deze active learning cycle maakt de machine elke zoekronde een stapje slimmer, de mens blijft het ‘orakel’.
Het programma is sinds een half jaar door iedereen vrij te gebruiken. Het vakgebied van de gebruiker is irrelevant: het kan een database als PubMed zijn, LexisNexis, maar het programma is ook in te zetten voor oud-Griekse teksten of krantenartikelen. Van de Schoot: “De data moeten wel digitaal beschikbaar zijn. Het moet ook een grote database zijn, zo groot dat je het als mens niet meer kan lezen. De taak van de machine is om relevante teksten er tussenuit te vissen.”
Open source software
ASReview is open source software en op de computer van de gebruiker te installeren. Daarmee blijft het data-eigenaarschap, waaronder gegevens over iemands zoektocht, in handen van de gebruiker zelf. Samen met het ODISSEI Social Data Science Team wordt ondersteuning gegeven aan onderzoekers die gebruik willen maken van de software.
Verder ontwikkelen
Van de Schoot sluit af: “Nu moeten we de wetenschap ermee gaan bedrijven. Bovendien willen we het verder ontwikkelen. Recente simulaties hebben laten zien dat ASReview wat betreft selectie nu al dezelfde kwaliteit levert als mensen, maar dan met een grotere snelheid. We gaan verder onderzoeken welke machine learning modellen je het best kan gebruiken per tekstsoort.”