Tips en tricks over werken met Speech to Text

Wat zijn de voordelen en uitdagingen van audio-antwoorden in een online vragenlijst? Centerdata deelt de ervaring met spraaktechnologie Speech to Text.

Door: Joris Mulder

Het LISS panel, dat beheerd wordt door Centerdata, verzamelt sinds 2007 data door middel van online vragenlijstonderzoek. Panelleden beantwoorden de vragen door een antwoord aan te klikken of, in het geval van een open vraag, een antwoord te typen. Dit levert een scala aan waardevolle gegevens op voor onderzoekers en beleidsmakers.

Twee experimenten

In aanvulling op deze klassieke methode van online dataverzameling kan het LISS panel ook Speech to Text in online vragenlijsten toepassen. Het afgelopen jaar zijn er twee experimenten uitgevoerd waarbij deze spraaktechnologie succesvol in online vragenlijsten werd ingezet.
In deze experimenten konden respondenten hun open antwoorden inspreken in plaats van typen. De gegeven antwoorden zijn op twee manieren opgeslagen: als audiobestand en als transcriptie naar tekst. De winst van deze methode van dataverzameling is dat er, naast het primaire antwoord op de vraag, waardevolle aanvullende data worden verzameld. Denk bijvoorbeeld aan de toon van een respondent bij een antwoord, de linguïstische en verbale capaciteiten en de grootte van iemands woordenschat. Dit kan inzicht geven in het cognitief functioneren, de sociaaleconomische status of het verbaal redeneervermogen van een respondent. Tevens bieden de data de mogelijkheid tot sentiment- of emotieanalyses (al dan niet gerelateerd aan een bepaald onderwerp waar mensen meer of minder binding mee hebben) en Natural Language Processing (het analyseren van natuurlijke taal met behulp van kunstmatige intelligentie).

Aandachtspunten

Naast deze voordelen zijn er ook enkele nadelen en aandachtspunten. Zo zijn er soms technische beperkingen, bijvoorbeeld omdat een respondent geen werkende microfoon heeft of een te oude (niet geschikte) browser gebruikt. Ook wil een deel van de panelleden überhaupt niet deelnemen aan deze vorm van dataverzameling. Hierdoor kan er (selectieve) non-respons ontstaan. Een belangrijk aandachtspunt is privacy. Een stem geldt als persoonlijke data en kan tot persoonsidentificatie leiden. Data die middels Speech to Text worden verzameld, dienen dan ook onder voorwaarden opgeslagen te worden. Het LISS panel zorgt er bovendien voor dat alle audio­bestanden en transcripts door een medewerker worden gecontroleerd op eventuele persoonlijke informatie die men in het antwoord geeft (zoals een naam of plaatsnaam).

Beschikbare data

De data van de Speech to Text-­experimenten komen eind 2021 beschikbaar in het LISS Data Archive en zijn te gebruiken voor eigen onderzoek. Voor meer informatie kan contact worden opgenomen met Joris Mulder, Survey Onderzoeker bij Centerdata, via joris.mulder@centerdata.nl.

centerdata.nl