Diemen (NL) – Onderzoek naar telefoongesprekken moet de communicatie tussen mens en machine optimaliseren.


Taalonderzoekers van het door de Vlaamse en Nederlandse regering gesteunde onderzoeksproject Corpus Gesproken Nederlands gaan telefoongesprekken opnemen. Die gesproken taal, met een omvang van tien miljoen woorden, vormt 'trainingsmateriaal' voor spraakcomputers en zal de Nederlandse communicatie tussen en mens en machine verbeteren.
Voor die gesprekken werven de taalkenners sprekers uit alle lagen van de Nederlandse en Vlaamse bevolking. Iedere deelnemer belt over een willekeurig onderwerp met twee volwassen personen (één man en één vrouw). In totaal voert de beller met iedere persoon drie gesprekken van vijf tot tien minuten.
Vervolgens verwerken de taalkundigen de duizenden gesprekken in een databank voor spreektaal. Ze schrijven de opnamen uit en koppelen die aan het geluidsfragment. Daarbij houden ze rekening met omstandigheden van het gesprek en gegevens van de spreker, zoals geslacht, leeftijd, regio en beroep, die vaak de manier waarop mensen praten beïnvloeden.
Op een aantal terreinen lijkt het Nederlands te moeten wijken voor het Engels. Met dit project zal het mogelijk zijn om technologieën die voor het Engels ontwikkeld zijn ook op het Nederlands toe te passen. Zodoende kan onze taal concurreren met de opkomende Engelse taal.

Corpus Gesproken Nederlands

Frédérique Melman