Begin dit jaar is CLARIAH PLUS van start gegaan, als vervolg op het CLARIAH CORE-project. Wat kunnen we verwachten?

“In CLARIAH CORE richtten we ons op drie vakgebieden: taalkunde, mediastudies en sociale en eco­nomische geschiedenis. Maar onze ambitie was altijd al groter”, vertelt Lex Heerma van Voss, Principal Investigator (PI) van CLARIAH. “Naast het uitbreiden van de digitale onderzoeksinfrastructuur voor deze drie vakgebieden, wil CLARIAH de komende jaren ook andere vakgebieden binnen de geesteswetenschappen bereiken.”

Taaldata centraal

Daarvoor is een nieuw werkpakket in het leven geroepen, waarin taaldata centraal staan. “In het werkpakket taalkunde is taal het doel, in het nieuwe werkpakket is taal het middel”, aldus Karina van Dalen-Oskam, hoogleraar Computationele Literatuurwetenschap en leider van het nieuwe werkpakket. “Dit nieuwe werkpakket is er voor onderzoekers die met teksten inzicht verkrijgen in culturele en historische ontwikkelingen. Het gaat dan meer om de inhoud dan om de taal.”

Van Dalen-Oskams team is nog bezig een keuze te maken welke tools ze willen verbeteren. “We denken bijvoorbeeld aan manieren om automatisch meningen in teksten te herkennen en aan het herkennen van de beschrijving van gebeurtenissen. Ook willen we zorgen dat gegevens en tools voor onderzoek naar betwist auteurschap bij elkaar komen, en dat onderzocht kan worden hoe teksten uit bepaalde categorieën door de tijd heen zijn veranderd.”

Analyses CLaaS

Om dit alles technisch mogelijk te maken, bouwen de CLARIAH-ontwikkelaars CLaaS: CLARIAH-as-a-Service. “Dat is een op CLARIAH toegepaste versie van een PaaS, Platform-as-a-Service”, legt Heerma van Voss uit. “Veel data en tools in de geesteswetenschappen worden aangeboden via een interface. De gebruiker logt in op een server van de aanbieder, zoekt daar iets op en bewerkt of downloadt de data. Voor veel gebruikers is dat voldoende, maar er zijn ook onderzoekers die ingewikkeldere combinaties van datasets en tools hebben, of bewerkingen willen uitvoeren die heel veel rekenkracht vergen. Dat maakt CLaaS mogelijk. Voor de komende tijd staan er tientallen punten op onze agenda. Persoonlijk vind ik het belangrijk dat we de interfaces voor de grote groep gebruikers nog gebruiksvriendelijker maken. De MediaSuite is daar al een heel mooi voorbeeld van.”

clariah.nl

Op de hoogte blijven?

Historici, literatuurwetenschappers, filosofen en andere geïnteresseerden kunnen zich aanmelden voor de nieuwsbrief van het nieuwe werkpakket door een mail te sturen naar karina.van.dalen@huygens.

knaw.nl