‘Wat is de impactfactor van Vondel of Michiel de Ruyter?’

KB-fellow Joep Leerssen visualiseert het verloop van de ‘canoniciteit’ van historische figuren en teksten met behulp van data uit de KB-thesaurus en de DBNL.

“Als wetenschappers worden we afgerekend op onze impactfactor. Hoeveel publicaties heb je in welke bladen? Hoe vaak worden die papers vervolgens weer geciteerd?” Joep Leerssen, hoogleraar Moderne Europese Letterkunde aan de Universiteit van Amsterdam, bedacht dat je zo’n impactfactor ook zou kunnen berekenen voor schrijvers, filosofen en andere belangrijke personen uit de Nederlandse geschiedenis. “Wat is bijvoorbeeld de impactfactor van Vondel of van De Ruyter? En hoe is die veranderd in de loop der tijd?”

Veertiende fellow

Tijdens zijn fellowship bij de Koninklijke Bibliotheek (KB) en het NIAS kreeg Leerssen de kans deze vragen te beantwoorden met behulp van de collecties gedigitaliseerde tekstbestanden van de KB. Vanaf september 2017 tot en met afgelopen januari was hij de veertiende fellow – de vijfde op rij die gebruikmaakte van digitaal, in plaats van analoog, materiaal. Eind januari sloot hij zijn fellowship af met een publiekslezing waarin hij zijn bevindingen deelde. E-data & Research sprak de onderzoeker ongeveer een maand daarvoor.
“Voordat ik begon met dit fellowship hield ik me al bezig met het analyseren van netwerken”, vertelt Leerssen. Zo stond hij aan de wieg van de Encyclopedia of Romantic Natio­nalism in Europe (ERNiE), een digitale encyclopedie met artikelen over belangrijke thema’s en personen uit negentiende-eeuws Europa. “De encyclopedie is opgebouwd als SQL-database. Die bevat onder andere uitgebreide briefwisselingen waar je hele mooie netwerkvisualisaties van kunt maken.”

Sneller onderzoek

Angst voor het gebruik van digitale methoden voor zijn onderzoek heeft Leerssen nooit gekend. “Eigenlijk werkt elke geesteswetenschapper sowieso met databases: een bibliografische kaartenbak is in feite al een database. Een computer kan die, nadat hij gedigitaliseerd is natuurlijk, alleen veel sneller doorzoeken dan je als onderzoeker kunt.”
Aan de hand van de impactfactor van culturele entiteiten, onderzocht Leerssen tijdens zijn fellowship de canonvorming in het Nederlandse culturele zelfbesef. “Op dat gebied zijn er grofweg twee scholen te onderscheiden. De ene stelt dat de Nederlandse identiteit oud en bestendig is, de andere dat dit tijdens het nationalisme van de 19e eeuw een flinke oppepper heeft gekregen. Dat wilde ik graag empirisch meten. Werden Erasmus en Michiel de Ruyter altijd al als nationale iconen gezien of zijn zij dat later pas geworden?”
Om de ‘canoniciteit’, de impactfactor van een culturele entiteit, te bepalen, kon Leerssen niet alleen kijken naar het aantal vermeldingen in de KB-thesaurus (de digitale database waarop de catalogus draait) en in de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL). “Namen leven voort in standbeelden, naamgeving van instituten, straatnamen, maar dat zegt niks over hoe levendig het bijbehorende gedachtegoed is. Er is een verschil tussen naamsbekendheid en canoniciteit”, aldus Leerssen.

“Het werken met de complexiteit van grote datasets is vaak moeilijker dan gedacht, maar het levert wel veel op.” foto Bart van Vliet

3D-film als spin-off

“Je kunt grofweg drie typen canoniciteit onderscheiden”, legt hij uit. “Anne Frank is een voorbeeld van actieve canoniciteit. Haar boek wordt nog steeds gelezen en belangrijk gevonden. Dan heb je academische canoniciteit, waarbij een naam belangrijk is in bepaalde vakkringen, maar bij het grote publiek verder inhoudelijk niet bekend is, zoals de romans van Couperus. En ten slotte heb je nog banale canoniciteit, waarbij het louter om naamsbekendheid gaat. Een naam als Boerhaave kennen de meeste mensen alleen van de Boerhaavekliniek, maar slechts weinigen weten ook wie het was.”
Om dit aspect te registreren, keek Leerssen onder andere naar de mate van ‘procreativiteit’, ‘het vermogen om spin-offs op te leveren’. “Een boek dat alleen op een plank staat is eigenlijk dood; er moet wel iets mee gebeuren. Commentaren, herdrukken, bewerkingen. Kijk naar Les Misérables van Victor Hugo, dat boek is verfilmd, verstript en er is een musical van. En Vondels Gijsbrecht van Aemstel wordt elk jaar opnieuw gespeeld in de Amsterdamse Schouwburg – dat laat zijn sporen na.” Ook de vroege aanwezigheid in nieuwe media is een indicatie volgens Leerssen: “De overwintering op Nova Zembla, canoniek thema van dichter Tollens tot de schoolplaat van Isings, was de eerste Nederlandse 3D-filmproductie.”

Zoekresultaten wegen

Vijf maanden is niet veel om zo’n onderzoeksvraag te beantwoorden, maar gelukkig stond Leerssen er niet alleen voor. “Ik heb hele goede hulp gehad van de informatici van de KB”, vertelt hij. “Zij schreven de scripts waarmee ik de enorme catalogi kon doorzoeken en verfijnden deze als dat nodig was. Dat bood de technische mogelijkheden.” De scripts werden vervolgens geïmplementeerd in NodeGoat, de online infrastructuur waarmee onder andere ERNiE opereert, ontwikkeld door ex-studenten van Leerssen. “Na een week of acht kon ik al beginnen met data­mining. Sinds november kwam de boel echt in een stroomversnelling. Inmiddels zijn er veertig- tot vijftigduizend entiteiten geïmporteerd. Dat gaat dan van personen als de Vlaamse dichter Maerlant, of Bilderdijk, tot werken als Van den vos Reynaerde.”
Leerssen moest alle zoekresultaten van deze entiteiten in Delpher en de DBNL zorgvuldig wegen. “Honderd hits in de 17e eeuw is iets anders dan honderd hits nu; daar moet een inflatiecorrectie overheen. En een vermelding door historicus Johan Huizinga legt meer gewicht in de schaal dan een anonieme vermelding in een obscuur dorpsblaadje. De absolute aantallen moesten gewogen aantallen worden.”
En welke school had dan gelijk wat betreft de Nederlandse identiteit? “Nou, je ziet een dip in de 18e eeuw en pieken rond 1870 en 1920-30”, zegt Leerssen. “Maar die pieken lijken vooral het nationalistische klimaat van de tijd aan te geven. De oorzaak-gevolgrelatie lijkt dus andersom te zijn. Dat vind ik het mooie van zo’n fellowship: je begint met de ontwikkeling van een instrumentarium en gaandeweg verandert je vraagstelling en de theorie.” De komende tijd zal Leerssen zijn bevindingen publiceren.

Nieuwe perspectieven

De digitale geesteswetenschappen ziet Leerssen als een uitdaging. “Het werken met de complexiteit van grote datasets is vaak moeilijker dan gedacht, maar het levert wel veel op. Het biedt nieuwe perspectieven.” De komende tijd zal hij zijn onderzoek nog voortzetten. “Het cultuurnationalistische gedachtegoed is nu weer heel actueel, met het populisme en de alt-rightbeweging. Dat is interessant om te onderzoeken.”
kb.nl/organisatie/kb-fellowship

Joseph Theodoor (Joep) Leerssen 

Joep Leerssen is een Nederlands literatuur­wetenschapper en historicus. Hij studeerde vergelijkende literatuur­weten­schap en Engels aan de Universiteit van Aken en vervolgde met Anglo-Irish Studies aan het University College te Dublin. Daar voltooide hij ook zijn conservatoriumstudie. In 1986 promoveerde Leerssen cum laude aan de Universiteit van Utrecht op het proef­schrift Mere Irish and Fíor-Ghael. Sinds 1991 is hij hoogleraar Moderne Europese Letterkunde aan de Universiteit van Amsterdam. Van 1995 tot 2006 was Leerssen directeur van het Huizinga Insti­tuut. In 2003 was hij gasthoogleraar aan Harvard University. In 2008 ontving hij de Spinozapremie. In 2009 werd hij erelid van de Royal Irish Academy. In 2010 werd hij door de Koninklijke Nederlandse Akademie van Wetenschappen benoemd tot Akade­mie­hoogleraar. Leerssen kreeg in 2015 de Dr. Wijnaendts Francken-prijs toegekend voor zijn boek Spiegelpaleis Europa.