Tekstwetenschappers werken al heel lang samen met ontwikkelaars om teksten digitaal te structureren. Maar de kloof tussen technologie en onderzoek is nog altijd moeilijk te overbruggen.
Het proefschrift van Joris van Zundert, onderzoeker en ontwikkelaar aan het Huygens Instituut, legt de vinger op de zere plek. Want hoewel zijn collega-tekstonderzoekers erg afhankelijk zijn van digitale infrastructuur, sluiten de bestaande technieken eigenlijk nog steeds niet aan bij het onderzoek. Dat heeft veel te maken met de dominante positie van de TEI-gemeenschap, die sinds 1987 technieken ontwikkelt om teksten digitaal te structureren voor wetenschappelijke tekstedities. Hoewel deze gemeenschap niet alleen bestaat uit XML-experts, maar net zo goed uit tekstonderzoekers, is het XML-model dat ze ontwikkelden niet erg geschikt voor letterkundig onderzoek.
Matroesjka-model
“Veel tekstwetenschappers zeggen: we kunnen eigenlijk maar beperkt uitdrukken wat tekst is door deze techniek te gebruiken”, vertelt Van Zundert. “XML is eigenlijk te vergelijken met een Russische matroesjka: elke laag moet ingebed zijn in een andere laag. Maar voor literaire teksten werkt dat niet. Een literair verhaal bestaat uit meerdere lagen, bijvoorbeeld een letterlijke en een symbolische laag, die niet per se een hiërarchisch verband hebben, maar ook los van elkaar kunnen staan. Die gelaagdheid is eigenlijk niet goed uit te drukken in die XML-vorm.”
XML had ook anders gebruikt kunnen worden, maar de technische keuzes die de TEI helemaal in het begin heeft gemaakt, blokkeert nu effectief onderzoek naar de gelaagdheid van een tekst. En dat is volgens Van Zundert illustratief voor een veel algemener probleem binnen de Digital Humanities. Binnen de projecten die hij volgde voor zijn onderzoek zag hij het steeds weer gebeuren: “De inhoudelijke onderzoekers, die nog niet bedreven zijn in technische middelen, laten zich volledig inpakken door de techneuten. Daarbij is overigens geen kwaadwillendheid in het spel, want die techneuten stellen zich heel open en eerlijk op. Maar bij de inhoudelijke onderzoekers is gewoon niet voldoende kennis van wat de consequenties zijn van technische keuzes die worden gemaakt. Ze maken vaak ongeïnformeerde keuzes. Met als gevolg dat je jaren later zit met allerlei infrastructuur die helemaal niet aansluit bij de onderzoeksvragen.”
Methodische conversatie
Hoe groter en definitiever een model – zoals in het geval van de TEI – hoe duurder het is om het nog aan te passen. “Doordat de methodische conversatie tussen onderzoekers en ontwikkelaars maar niet op gang komt, ontstaan er eigenlijk altijd middelmatige, niet functionerende oplossingen. Dat is doodzonde, want er is ontzettend veel tijd en geld mee gemoeid.” Hij kan er somber over zijn, maar tegelijkertijd ziet Van Zundert ook lichtpuntjes. Zo is er een tendens bij wetenschappelijke instellingen om programmeurs en onderzoekers weer te laten samenwerken in afdelingen, in plaats van ze van elkaar te scheiden. “Het idee om ontwikkelaars in een eigen afdeling te plaatsen is afgekeken van het bedrijfsleven, maar werkt niet in een onderzoekscontext.”
En ook zijn er steeds meer ‘hybride wetenschappers’, die net als Van Zundert zowel onderzoeks- als ontwikkelcapaciteiten hebben. Digital Humanities wordt steeds vaker onderdeel van het curriculum. Maar nog niet genoeg, volgens de onderzoeker. “We lopen flink achter op landen als Duitsland en Amerika. Daar wordt veel steviger ingezet op Digital Humanities door computationele methoden in te brengen op bachelorniveau in de opleidingen. Daar kunnen wij een voorbeeld aan nemen. ”
https://scholarlypublications.universiteitleiden.nl/handle/1887/3464403