TRIADO maakt archieven doorzoekbaar

Hoe maak je van kilometers ongestructureerd archiefmateriaal bruikbare digitale onderzoeksdata? Naar die methodiek is het project Tribunaalarchieven als Digitale Onderzoeksfaciliteit (TRIADO) op zoek. 

Het meest geraadpleegde Tweede Wereld­oorlogarchief van Nederland, het Centraal Archief Bijzondere Rechtspleging (CABR), dient als casus voor TRIADO. Op dit moment is het CABR alleen doorzoekbaar via een database, op naam van verdachten, en zijn de stukken niet digitaal raadpleegbaar. TRIADO, dat mogelijk is gemaakt dankzij het KNAW-Onderzoeksfonds, ontsluit en verrijkt voor het eerst op een geautomatiseerde wijze dit rijke WO2-archief digitaal en op documentniveau. Hierdoor wordt het mogelijk om gegevens over tientallen personen, gebeurtenissen en plaatsen in dossiers te doorzoeken. En dus om grootschalig vergelijkend onderzoek te doen. 

Digitale technieken

Het Netwerk Oorlogsbronnen, Nationaal Archief, Huygens ING en NIOD Instituut voor Oorlogs-, Holocaust- en Genocide-­studies zijn in 2017 van start gegaan met het generieke deel van het project. Hierin wordt onderzocht welke digitale technieken gebruikt kunnen worden om hybride archiefmateriaal digitaal te ontsluiten. Begin 2018 is een steekproef uit het CABR gedigitaliseerd en doorzoekbaar gemaakt (ge-OCR’d). Met speciale software voor Named Entity Recognition en automatische datumextractie wordt vervolgens informatie over onder meer personen, locaties en datumaanduidingen vastgesteld. De uit de documenten gehaalde gegevens over wie, wat, waar en wanneer worden gekoppeld aan referentiedata uit onder meer de WO2-thesaurus en de Basisregistraties Adressen en Gebouwen. Marielle Scherer, data­manager Huygens ING: “Deze verrijkingsfase zorgt voor structurering van de data en een betere doorzoekbaarheid van de dossiers uit de steekproef”. 

Een fysiek CABR-dossier wordt met TRIADO digitaal doorzoekbaar gemaakt. foto Nationaal Archief

Nieuwe vragen

Het projectteam is enthousiast. Anne Gorter, bij het Nationaal Archief projectleider nadere toegankelijkheid CABR: “Door deel te nemen aan dit project bereiden we ons voor op de toekomst en op klantvragen die gaan komen”. Edwin Klijn, projectleider TRIADO en programmamanager Netwerk Oorlogsbronnen: “Ik kan haast niet wachten om te zien welke nieuwe vragen we kunnen stellen aan dit archief en hoe digitale methodieken ons daarbij kunnen helpen”. 

Data laten spreken

Voor het tweede, onderzoeksdeel van TRIADO formuleert onderzoeker Ismee Tames van het NIOD met een wetenschappelijke adviescommissie verschillende kwantitatief-statistische onderzoeksvragen. Tames: “Denk aan vragen als: ‘Wie werd wanneer door Nederlandse collaborateurs gearresteerd? Hoe verhoudt dit zich tot de ontwikkeling van het Duitse vervolgingsbeleid? Wie waren de collaborateurs en verzetslieden eigenlijk: zien we veranderingen in bijvoorbeeld leeftijd, gender of regio?’ Dat we nu de data tot ons laten spreken in plaats van een van tevoren opgestelde lijst met namen terug te zoeken, is een veelbelovende stap voorwaarts”.
bit.ly/TRIADOproject

Het Netwerk Oorlogsbronnen wordt gefaciliteerd door het NIOD Instituut voor Oorlogs-, Holocaust- en Genocidestudies en gefinancierd door het Ministerie van VWS, Vfonds en VSBfonds.