De zoekmachine ISEBEL bevat zo’n 70 duizend sagen afkomstig uit Nederland, Duitsland en Denemarken. Verhalenonderzoeker Theo Meder van het Meertens Instituut hoopt dat andere landen volgen.
Zoeken naar verhalen over weerwolven, zeemeerminnen of heksen in een collectie van Europese volksverhalen: dat was in de jaren 60 en 70 van de vorige eeuw al een van de ambities van het Meertens Instituut. Het was de tijd van Voskuil, waarin het toenmalige Volkskundebureau veel verhalen verzamelde. Voor die tijd een stap te ver, zo bleek, maar nu door ‘machine learning’ toch eindelijk mogelijk. De techniek staat voor niets. Of toch? “Het was een helse klus”, zegt Meder.
Zelf werkt Meder al sinds 1994 aan de Nederlandse Volksverhalenbank. Het was zelfs de opdracht waarmee hij destijds werd aangesteld: om eenzelfde databank te maken als de al bestaande Nederlandse Liederenbank, maar dan met volksverhalen. In het door NWO gefinancierde project ISEBEL zijn de sagen uit deze databank nu gekoppeld aan een Duitse en een Deense volksverhalenbank, die je samen kunt doorzoeken. De meeste verhalen komen uit Nederland en Denemarken: die hebben er allebei zo’n 30 duizend geleverd. De overige komen uit Duitsland.
Volksgeloof
Sagen zijn iets anders dan sprookjes, legt Meder uit. Het zijn kortere vertellingen die staan voor een bepaalde vorm van volksgeloof. Vroeger dacht men dat weerwolven en heksen echt bestonden. Daarin schuilt tevens een belangrijk verschil tussen de genoemde databanken. De Deense en Duitse databanken bevatten namelijk verhalen die zijn opgetekend rond 1900, terwijl de meerderheid van de Nederlandse verhalen is verzameld in de jaren 1960 en 1970. Zoals de verhalen van Dam Jaarsma, die tussen 1965 en 1980 voor het Meertens Instituut 16.867 volksverhalen verzamelde in Friesland.
Meder: “De Duitse en Deense verzamelaars hebben mensen gesproken die nog echt geloofden in die sagen. Ze geloofden in hekserij, weerwolven, reuzen, kabouters, trollen, tovenaars. Toen de grootste verhalenverzamelaar van Nederland, Dam Jaarsma, de Friezen ging ondervragen, vertelden zij wel dat hun ouders of grootouders daar vroeger nog in geloofden, maar zijzelf niet meer.”
Drietrapsraket
Ondanks die verschillen in datering is het interessant om parallellen te zoeken tussen de landen. Je wilt bijvoorbeeld via de Engelse zoekterm ‘werewolf’ alle weerwolven kunnen vinden. Maar het bouwen van die applicatie was niet zo eenvoudig. Om alle 70 duizend sagen met de hand te vertalen was geen optie, dus dat moest automatisch gebeuren. En daar gooiden de ouderwetse spelling van het Fries en ook het Platduits roet in het eten. Google Translate kon met deze spellingsvarianten niet overweg, en bovendien waren er zoveel teksten dat het vertalen via Google niet meer gratis was.
De Amerikaanse onderzoekers in het project ontwikkelden daarom een eigen vertaalmodule op basis van ‘machine learning’. Toch vertoonde ook die vertaalmodule in eerste instantie haperingen, vertelt Meder. “Toen bedachten we dat die vertaalmachine sommige folklorewoorden niet kende, zoals ‘duivelsdrek’ of ‘alruin’. Vervolgens hebben we een hele lijst gemaakt met Duitse, Deense, Friese en Nederlandse woorden en de Engelse vertaling. Dat werkte al een stuk beter. Maar nog steeds vond de zoekmachine bijvoorbeeld nog te weinig heksen in Friesland. Toen hebben we onze vertaler ook nog de opdracht gegeven om alle trefwoorden die aan de verhalen hingen – zoals in dit geval ‘heks’ – te vertalen. Zo werkt de uiteindelijke zoekmachine als een drietrapsraket.”
Weerwolven en bossen
Een andere hobbel in het project bleek nog dat de databases niet op een uniforme manier waren opgebouwd. “De Duitse database is niet lineair opgebouwd, maar volgens een netwerkenstructuur, dat maakte het voor de ontwikkelaars superingewikkeld.” Toch denkt Meder dat daarmee nu de grootste problemen getackeld zijn. “Alleen als de IJslanders gaan aansluiten – en dat willen ze graag – hebben we weer een vertaalprobleem, want automatisch vertalen van IJslands naar Engels is nog heel moeilijk. Dat zal uiteindelijk via het Deens moeten.”
En dan wordt het eindelijk tijd om onderzoek te doen. Meder heeft al een kleinschalig onderzoek gedaan naar de verspreiding van verhalen over zeemeerminnen. In alle drie de landen blijken die verhalen vooral aan de kust voor te komen. Ook keek hij naar verhalen over weerwolven. “Daar werd bijvoorbeeld van gezegd dat ze vooral zouden voorkomen in katholieke gebieden. Maar als je het Noord-Duitse gebied erbij pakt, blijkt dat niet te kloppen. Want ook daar komen veel weerwolfverhalen voor, maar dit gebied is van oudsher protestants. Dan blijkt het plausibeler om een verband te leggen tussen bosrijk gebied en het voorkomen van dit soort verhalen, zoals een Duitse onderzoeker nu heeft gesuggereerd. Al met al verruimt ISEBEL dus ons blikveld.”
ISEBEL (afkorting van: Intelligent Search Engine for Belief Legends) is een samenwerking van het Meertens Instituut, de universiteit van Berkeley (VS), en de universiteit van Rostock (Duitsland).