December 2008

Beschrijving van het Nederlandse Woordassociatie Project

Simon De Deyne en Gert Storms
Universiteit Leuven

Algemeen

Taal- en geheugen-onderzoekers zijn geïnteresseerd in woordassociaties omdat deze informatie hun belangrijke kennis verleent over de ontwikkeling en organisatie van ons mentaal lexicon.
Het Nederlandse Woord Associatie Project is een grootschalig onderzoeksproject gestart in 2003 met als doel het vrij beschikbaar stellen van een uitgebreide databank van woordassociaties voor psychologisch en linguïstisch onderzoek.

Enkele Toepassingen

De betekenis en het gebruik van woorden verandert gedurende onze levensloop. Woordassociaties kunnen gebruikt worden om de invloed van veroudering op de representatie van woorden en hun betekenis na te gaan bij gezonde mensen en mensen met een neurodegeneratieve aandoening zoals Alzheimer of dementie.
Woordassociaties vertellen ons ook veel over de algemene werking van ons geheugen. Wanneer woordassociaties in een netwerk voorgesteld worden blijkt dat dit netwerk een specifieke small world topologie vertoont. Net zoals in sociale netwerken, waar twee willekeurige personen slechts door een klein aantal schakels van elkaar verwijderd zijn, zijn twee willekeurige woorden gemiddeld door niet meer dan 4 associaties van elkaar verwijderd. Een dergelijke netwerkstructuur kan mee verklaren waarom sommige woorden heel gemakkelijk onthouden worden, terwijl andere minder snel opgeroepen worden.
Deze netwerken vertonen een sterke overeenkomst met zoeksystemen zoals Google, waarbij pagina's die sterk gelinkt zijn met andere pagina's hoog in de zoekresultaten gerankt staan. Mogelijk kan onze kennis over hoe het brein woorden representeert bruikbaar zijn voor het ontwerpen van verbeterde zoeksystemen.
Ten slotte kunnen woordassociaties in verschillende talen interessante verschillen en gelijkenissen bloot leggen. In dergelijke crossculturele studies kan nagegaan worden op welke manier bepaalde woordbetekenissen verschillen tussen Nederlandstaligen en anderstaligen. Momenteel willen we naast data uit Vlaanderen ook data verzamelen in Nederland om een vergelijking mogelijk te maken.

Karakteristieken van het project

De gegevens voor deze studie zijn gebaseerd op ongeveer 37.000 deelnemers van alle leeftijden uit Nederland en België.
Tijdens een vorige fase werden voor 1.424 Nederlandse woorden associaties verzameld. Ondertussen bevat de databank meer dan 1,6 miljoen woordassociaties voor ongeveer 6000 woorden.
Uiteindelijk willen we een woordassociatie lexicon van minimum 10.000 woorden samenstellen. Dit zou overeen moeten komen met een groot deel van de courant gebruikte Nederlandse woorden.
detail voor het woord aardbei

woordassociaties voor 'aardbei'

Literatuur

Gerelateerde webpagina's

Op termijn zal het mogelijk zijn om via een website de meest voorkomende associaties voor ieder woord op te zoeken en te representeren in een netwerk. Hieronder kunnen wel al een aantal illustraties van het associatienetwerk bekeken worden.
assocatienetwerk assocatienetwerk

illustraties van associatienetwerken



De resultaten uit een vorige fase van deze studie zijn beschikbaar als tekstbestanden gescheiden door een komma. Deze data bevat de woordassociaties voor 1424 stimuliwoorden en werden verzameld tussen 2003 and 2006. Voor elk van deze stimuliwoorden werden drie verschillende associaties verzameld bij minimum 83 deelnemers. Merk op dat deze bestanden vrij omvangrijk zijn.
Voor de huidige studie zoeken we nog steeds een groot aantal deelnemers. Iedereen die wil, kan deelnemen via deze link:
http://www.kuleuven.be/lsa/
Updates over dit project en informatie over andere projecten zijn ook terug te vinden op mijn onderzoekspagina.

Contact

Voor vragen, suggesties, of opmerkingen mag u mailen naar:
Simon De Deyne (simon.dedeyne [at] psy.kuleuven.be)

laatst gewijzigd op woensdag 10 december 2008 15:31