Column: Tools: ik wil wel, maar waar moet ik precies beginnen?

In het vorige nummer van E-data schreef ik dat men in de humanities door de bomen het bos niet meer ziet. Te veel tools, te weinig samenwerking. Er wordt wel degelijk geprobeerd om een geesteswetenschappelijke e infrastructuur aan te leggen, luidt de samenvatting van een ingezonden brief in het huidige nummer. Zie de initiatieven en plannen voor de komende jaren van Virtual Language Observatory, CLAPOP, Bamboo Dirt en DASISH. Vanzelfsprekend juich ik dergelijke initiatieven van harte toe, maar je kunt vier initiatieven om duidelijkheid te scheppen ook zien als meer van hetzelfde. Voor de gemiddelde gebruiker zal het er niet snel helderder op worden.

Onlangs gaf ik een gastcollege aan een paar van die gemiddelde gebruikers. In dit geval ging het om masterstudenten boekwetenschap. De vraag van de docent was of ik wilde laten zien hoe ik bepaalde tools gebruikte. Ik liet onder meer zien hoe je met indexeringssoftware snel door grote datacollecties kunt zoeken – een van de weinige technieken die ik zelf redelijk beheers. Wildcards, jokertekens, woorden of namen in elkaars nabijheid zoeken, ik heb er dagelijks veel baat bij. Vervolgens demonstreerde ik hoe je in Evernote heel makkelijk data kunt ordenen en van metadata kunt voorzien. Omdat dit alles bij veel masterstudenten tot glazige blikken leidde, stapte ik over op technieken om snel relevante bronnen op internet te vinden. Zoals via Google zoeken binnen een site, gebruikmaken van de url, zoeken naar bepaalde bestandstypen en filtertechnieken. ‘Had ik dat maar eerder in m’n studie geleerd, dat had me echt enorm veel tijd gescheeld’, verzuchtte een studente. Anderen beaamden dit. Voor de duidelijkheid: voor zover ik dat kon beoordelen waren het allemaal leergierige en slimme mensen. Maar tegelijk was duidelijk dat ze niet erg vertrouwd waren met wat in mijn ogen inmiddels tot de basisvaardigheden van de e-humanities zou moeten behoren. Of eigenlijk: tot de basisvaardigheid van iedere student op een universiteit, hogeschool en middelbare school.

Natuurlijk heb ik gevraagd welke slimme tools ze gebruikten of kenden. Hun antwoorden, kort samengevat: van sommige tools hadden ze wel gehoord, maar z gebruikten ze niet of nauwelijks want ze waren te moeilijk en het ontbrak aan duidelijke uitleg. Dat is ook mijn ervaring. Het is fijn dat er straks – over enkele jaren – websites zijn waarin je kunt zoeken naar honderden tools en honderdduizenden datacollecties. Maar ik zou het al erg fijn vinden als er nu een site zou bestaan met de tien beste en meest gebruikte tools voor bijvoorbeeld historisch en letterkundig onderzoek.

En niet alleen een lijstje met een korte beschrijving, maar iedere tool zou moeten worden voorzien van een heldere handleiding. Plus, nog belangrijker, een korte videocursus die je stap voor stap laat zien: 1. Hoe je de tool installeert, 2. wat je er in grote lijnen mee kunt, 3. hoe je een tool op maat kunt maken. En dan graag een paar datasets erbij zodat je zelf kunt ervaren hoe ongelooflijk nuttig zulk gereedschap kan zijn. Eis van de subsidiegever: de site moet minstens een keer per jaar grondig worden geactualiseerd. Hoezeer dit ook voor de hand ligt, bij mijn weten ontbreekt het aan zo’n platform. Ik zou er zelf onmiddellijk gebruik van gaan maken, want er kan inmiddels veel meer dan ik weet. Maar net als voor die studenten geldt voor mij: ik wil wel, maar ik weet niet of nauwelijks waar ik moet beginnen.

Ewoud Sanders
Taalhistoricus en journalist. Sanders is vaste medewerker van onder meer NRC Handelsblad en Onze Taal.