Subsecties

7. Over de voorkeur van fonologische versprekingen om bestaande woorden te maken: Terugkoppeling of zelfbewaking?

 Sieb Nooteboom 
Sieb Nooteboom is professor in de fonetiek aan de Universiteit van Utrecht en vice-decaan van de Faculteit der Letteren. Enkele thema´s die in zijn onderzoek zijn terug te vinden zijn: woordherkenning, prosodie, de mentale organisatie van spraakproductie en de rol van vaste uitdrukkingen in spraakproductie en -perceptie.
  

7.1 Voorkeur voor echte woorden

Een spreker wil zeggen veel gaas, verspreekt zich en zegt geel vaas. Zulke versprekingen komen veel voor. Merk op dat in deze verspreking de twee niet bedoelde woorden die onstaan door het abusievelijk verwisselen van de twee beginmedeklinkers, allebei bestaande woorden zijn. Dat is lang niet altijd zo. Een verspreking als *jeel *veuk voor veel jeukzou ook heel goed kunnen voorkomen. A priori is er geen reden om te denken dat, op het mentale niveau van spraakprogrammering waar fonologische versprekingen ontstaan, bestaande woorden meer kans hebben om als versprekingen op te treden dan onzinwoorden. Baars, Motley en Mackay (1975) publiceerden een klassiek geworden experiment, waarin ze verwisselingen van beginconsonanten uitlokten in woordparen als bad goof, door zo'n woordpaar vooraf te laten gaan door een reeks woordparen zoals give book, go back, get boot. De spreker krijgt dan de neiging om bad goof uit te spreken als gad boof. De stimuluswoordparen waren zo gekozen dat lexicale uitkomsten, als in barn door (>darn bore), even vaak mogelijk waren als niet-lexicale uitkomsten, zoals gad boof. Zij vonden in de uitgelokte versprekingen, in strijd met wat men a priori zou verwachten, een overtuigende voorkeur voor lexicale woordparen, een effect dat ik verder lexicale voorkeur zal noemen. Hun verklaring hiervoor was als volgt. Zij stelden zich voor dat de uit te spreken woorden mentaal worden klaar gezet om uitgesproken te worden, en dat er intern in de geest van de spreker als het ware een eindredactie wordt gepleegd op de klaargezette woorden. Bij die eindredactie zou lexicaliteit van de klaargezette vorm een belangrijk criterium zijn. Daardoor zouden niet-bestaande vormen een veel grotere kans hebben om weggeredigeerd en gecorrigeerd te worden dan bestaande vormen.

Het is natuurlijk bij voorbaat niet zeker dat zo'n effect van lexicaliteit, gevonden onder bepaalde stringente experimentele condities, ook zou gelden voor spontane spraak. Garrett (1976) vond zo'n ``lexicale voorkeur'' dan ook niet in een analyse van een verzameling spontane versprekingen in Amerikaans Engels. Hij maakt willekeurige paren van woorden die voorkwamen in een corpus gepubliceerde interviews, en verwisselde dan de beginconsonanten van die woorden. Het bleek dat 33% van deze ``pseudo-versprekingen'' bestaande woorden waren. Dit was niet verschillend van het percentage bestaande woorden in zijn verzameling echte versprekingen. De conclusie leek dus gerechtvaardigd dat fonologische versprekingen niet vaker tot echte woorden leiden dan men volgens kans zou verwachten. Er leek geen ``lexicale voorkeur'' te zijn. Maar Dell and Reich (1981) gebruikten een iets andere methode en vonden wél zo'n voorkeur. Zij maakten willekeurige woordparen van woorden die voorkwamen in een corpus van versprekingen, verwisselden de beginconsonanten, bepaalden hoe vaak deze pseudo-versprekingen tot echte woorden leidden, waarbij zij de gevonden percentages normeerden voor de frequentie waarmee de beginfonemen in het corpus voorkwamen. Het aantal bestaande woorden in echte versprekingen was significant hoger dan voorspeld uit hun pseudo-versprekingen, en dus concludeerden zij dat er in fonologische versprekingen een voorkeur is voor bestaande woorden. Helaas, toen Del Viso, Igoa, en Garcia-Albea (1991) de methode van Dell en Reich toepasten op een versprekingencorpus in het Spaans, vonden zij weer geen significant verschil in frequentie van bestaande woorden tussen pseudo-versprekingen en echte versprekingen. De gegevens in de literatuur zijn dus niet éénduidig.

Garrett, en Dell en Reich, en Del Viso en anderen, maakten geen onderscheid tussen korte en lange woorden. Maar als je de beginmedeklinker van een lang woord vervangt door een willekeurige andere beginmedeklinker, waardoor bijvoorbeeld perifeer *gerifeer wordt, is de kans dat een echte woord ontstaat zo goed als nihil. Bij één-syllabige woorden, bijvoorbeeld bij peen wordt geen, is die kans veel groter. Het is denkbaar dat een effect van lexicale voorkeur in de korte woorden bij Garrett en bij Del Viso e.a. statistisch gemaskeerd werd door een overvloed aan lange woorden. Om die reden heb ik opnieuw naar het effect van lexicale voorkeur gekeken (Nooteboom, in druk). Daarbij ging ik als volgt te werk.

Ik selecteerde alle versprekingen in een corpus spontane Nederlandse versprekingen waarbij één foneem van een één-syllabig woord vervangen was door een ander foneem. Dat ene foneem hoefde niet de beginmedeklinker te zijn, het mocht ook de klinker of een eindmedeklinker zijn. Als het een medeklinker was, ging het wel steeds om een enkel foneem, dat geen deel was van een medeklinkergroep. Ik vond 311 zulke fonologische versprekingen. Daarvan waren er 218 bestaande woorden en 93 onzinwoorden. Deze getallen suggereren een voorkeur voor bestaande woorden, maar dat zou een illusie kunnen zijn, want we weten niet wat kans zou hebben gegeven. Het is redelijk te veronderstellen dat het kansniveau voor iedere individuele verspreking afhankelijk is van de fonotactische alternatieven voor het vervangen foneem. Stel bijvoorbeeld dat de p van pit vervangen wordt door de b van bit. Dan is dit één gerealiseerde mogelijkheid uit de volgende alternatieven: kit, tit, bit, dit, fit, *sit, git, vit, zit, *mit, *nit, *jit, lit, rit, hit. Van die vijftien alternatieven zijn er 12 bestaande woorden, en 3 onzinwoorden. De kans op een bestaand woord is dus 12/15 (=4/5), en de kans op een onzinwoord 3/15 (=1/5). Dat kan natuurlijk ook heel anders uitpakken. Stel dat de p van pook vervangen wordt door de j van *jook, dan is dat één gerealiseerde mogelijkheid uit de volgende alternatieven: kook, *took, *book, *dook, *fook, *sook, *gook, *vook, *zook, *mook, *nook, *jook, look, rook, *hook. De kans op een echt woord is in dit geval 4/15 (1/5) en de kans op een onzinwoord 12/15 (4/5). Ik heb nu voor de hele verzameling van foneemverwisselingen in één-syllabige woorden als kansniveau voor een bestaand woord aangehouden het gemiddelde van alle kansen voor individuele versprekingen. Dat levert de gegevens in tabel 1:

Gevonden aantallen Verwachte aantallen
Bestaande woorden 218 155.5
Onzinwoorden 93 155.5

Tabel 1. Gevonden en verwachte aantallen van bestaande woorden en onzinwoorden bij versprekingen waarin een foneem van een één-syllabig woord wordt vervangen door een ander foneem. De verwachte aantallen zijn gebaseerd op de gemiddelde proporties van fonotactische alternatieven die bestaande of juist onzin-woorden zijn. ( chi2 = 67 ; df = 1 ; p<0.0001 ).

Het is duidelijk dat fonologische versprekingen in spontaan gesproken Nederlands een sterke en hoogst significante lexicale voorkeur vertonen. Het lijkt niet waarschijnlijk dat zo'n lexicale voorkeur tot het Nederlands beperkt is. Waarschijnlijker is dat we hier te maken hebben met een gevolg van de wijze waarop de menselijke spraakproductie werkt. De vraag is dan waar die voorkeur voor bestaande woorden vandaan komt.

7.2 De bron van lexicale voorkeur in fonologische versprekingen: Terugkoppeling of zelfbewaking?

Dell en Reich (1980) en Dell (1986) beschrijven een model van spraakproductie in de vorm van een gelaagd netwerk van knopen en verbindingen daartussen, waardoor zich activatie voortplant. Eerst worden lexicale eenheden (woorden, morfemen) geactiveerd. De activatie van een bepaalde lexicale eenheid activeert daarna de fonemen van de klankvorm van die eenheid, maar de activatie van ieder foneem wordt teruggekoppeld naar alle lexicale eenheden die dat foneem in hun klankvorm hebben. Dit leidt er toe dat als bijvoorbeeld het woord pook is geactiveerd, daarna de fonemen p,oo,en k worden geactiveerd. De p activeert dan weer een klein beetje alle lexicale eenheden waar een p in voorkomt, etc. Het meest profiteert natuurlijk het woord pook zelf van die terugkoppeling, want dat krijgt extra activatie van alle drie de geactiveerde fonemen. Stel nu dat door een verspreking, een fout bij de fonologische codering, pook wordt uitgesproken als dook. Dan krijgt de lexicale eenheid dook een behoorlijke extra activatie van de geactiveerde fonemen d, oo en k. De lexicale eenheid pook krijgt ook nog een forse opkomer van de oo en de k, maar toch niet zo veel als dook. Als de verspreking op foneemniveau eenmaal gemaakt is, zorgt die extra activatie door de terugkoppeling er voor dat die foutieve versproken vorm het best kan winnen van de bedoelde vorm. Merk op dat fonologische voorbereiding van dook in plaats van pook tot extra activatie van zowel pook als dook leidt, en dus tot competitie tussen die woorden.

Maar stel dat door een verspreking pook wordt uitgesproken als jook. Dan krijgt pook nog steeds een aardige opkomer van de oo en de k, maar jook kan geen extra activatie krijgen door de terugkoppeling omdat er geen lexicale eenheid jook bestaat. Dan is de kans niet gering dat door de terugkoppeling naar pook, waardoor de oorspronkelijk bedoelde fonemen p, oo, en k weer opnieuw worden geactiveerd, pook het toch weer wint, en de versproken vorm jook niet gerealiseerd wordt. Versprekingen die bestaande woorden vormen, zoals dook, hebben zo een veel grotere kans om uitgesproken te worden dan versprekingen die onzinwoorden vormen, zoals jook. Deze theorie voorspelt dus een voorkeur voor bestaande woorden bij fonologische versprekingen. Omgekeerd, is het bestaan van lexicale voorkeur een argument voor de terugkoppeling van het foneemniveau naar het woordniveau.

Levelt (1989) en Levelt, Roelofs en Meyer (1999) presenteren een theorie van spraakproductie waarin terugkoppeling geen rol speelt. In hun modulaire model zijn de opeenvolgende niveau's strikt gescheiden. Zij onderscheiden beneden het niveau van conceptualisatie een niveau van lemma's. Ieder lemma is een lexicale eenheid met zijn semantische en morfo-syntactische eigenschappen. In normale omstandigheden komt er maar één geactiveerd lemma beschikbaar voor een open plaats in een morfo-syntactische structuur. Vanuit zo'n geactiveerd lemma wordt een lexeem geactiveerd. Een lexeem is een lexicale eenheid met zijn morfo-fonologische eigenschappen, zoals aantal syllaben met klemtoonplaats en een reeks fonemen. Daarna vindt morfo-fonologische codering plaats, zoals vormaanpassing van morfemen aan hun omgeving (Bijvoorbeeld COMPARATIEF wordt -der na -r, elders -er), en re-syllabificatie (gaat+ie wordt gaa+tie). Tenslotte wordt vanuit iedere veel voorkomende fonologische syllabe een articulatorische syllabe geactiveerd in een verzameling articulatorische syllaben, zodat de articulatorische gebaren van veel voorkomende syllaben niet steeds opnieuw behoeven te worden uitgerekend (Levelt en Wheeldon, 1994).

De voornaamste reden van Levelt en anderen om geen terugkoppeling aan te nemen, is dat ze geen enkele functie voor zo'n terugkoppeling zien. Met andere woorden, zonder terugkoppeling doet de spraakproductie het prima, en met terugkoppeling bepaald niet beter. Daarom proberen ze zo lang mogelijk vast te houden aan een model zonder terugkoppeling. Om dat vol te houden is er een andere verklaring nodig van lexicale voorkeur bij fonologische versprekingen. Daarvoor gaan ze terug naar de verklaring die werd gegeven door Baars en anderen (1975), dus een interne eindredactie van wat klaargezet is om uitgesproken te worden. Zij nemen aan dat die eindredacteur of zelfbewaker (monitor) gebruik maakt van hetzelfde systeem voor spraakperceptie dat ook wordt ingezet om de spraak van andere mensen te verstaan en te begrijpen. Dat wat klaargezet is om uitgesproken te worden heet interne spraak. Wheeldon en Levelt (1995) beargumenteren vanuit een serie ingenieuze experimenten dat de interne spraak fonologisch en niet fonetisch van vorm is. De interne spraak wordt, evenals de externe, al gesproken spraak, ``beluisterd'' door de spraakperceptie zodat de zelfbewaker in de gaten kan houden of alles in orde is. Daarbij gebruikt de zelfbewaker onder andere een criterium van lexicaliteit: ``Is dit een bestaand woord?''. Een niet bestaand woord als gevolg van een verspreking heeft daardoor meer kans te worden opgemerkt, verworpen en gecorrigeerd dan een bestaand woord als gevolg van een verspreking. Dit heeft als gevolg dat in de gerealiseerde spraak fonologische versprekingen een voorkeur vertonen voor bestaande woorden, zonder dat er binnen het productiesysteem onmiddellijke terugkoppeling is van fonemen naar woorden in de zin van Dell (1986).

Er zijn dus tenminste twee alternatieve verklaringen voor lexicale voorkeur in fonologische versprekingen. Merk op dat door de manier waarop de discussie in de literatuur is verlopen, het al of niet bestaan van onmiddellijke terugkoppeling van fonemen naar woorden en de twee alternatieve verklaringen voor lexicale voorkeur met elkaar verweven zijn geraakt op een wijze die niet logisch noodzakelijk is. Er zijn twee logisch onafhankelijke vragen te stellen: 1) Waardoor wordt lexicale voorkeur in fonologische versprekingen veroorzaakt? 2) Is er terugkoppeling van fonemen naar woorden in de mentale programmering van spraak? Om te proberen antwoorden te vinden op deze twee vragen is een experiment uitgevoerd analoog aan het experiment van Baars e.a. (1975), maar met een paar aanpassingen.

7.3 Kiezen tussen terugkoppeling en zelfbewaking als oorzaak van lexicale voorkeur.

Hoe zouden we nu een keuze kunnen maken tussen de twee genoemde verklaringen voor lexicale voorkeur? Daar zijn wellicht verschillende mogelijkheden voor. Een belangrijk verschil tussen terugkoppeling binnen het productieproces à la Dell en zelfbewaking à la Levelt is dat de terugkoppeling geheel automatisch is, terwijl de zelfbewaking gebruik maakt van het systeem voor spraakperceptie, en geacht wordt een ``semi-bewust'' proces te zijn (Levelt et al. 1999): Soms betrappen we ons zelf op het corrigeren van een verspreking die we nog niet hebben uitgesproken. Ook gebeurt het dat een spreker een verspreking die al bezig is uitgesproken te worden zó snel corrigeert dat het onmogelijk is dat de spreker heeft gereageerd op de openlijke spraak. Een voorbeeld van Levelt (1983, p. 473, 474 ) in een situatie waarin de spreker een keuze heeft tussen verticaal en horizontaal is: v...horizontaal. Omdat de v...korter is dan zelfs een snelle menselijke reactietijd, moet de spreker hier wel op zijn eigen interne spraak hebben gereageerd. Het lijkt er dus op dat de interne eindredactie van klankvormen die klaargezet zijn om uitgesproken te worden, soms geëxternaliseerd wordt. Wat ik hier suggereer is dat de snelle, meestal volkomen onbewuste, detectie en correctie van versprekingen in de interne spraak die wordt aangenomen door Baars e.a. (1975) en door Levelt e.a. (1999), soms pas werkt nadat de uitspraak al begonnen is, en dan er toe leidt dat de uitspraak wordt gestopt en eventueel gecorrigeerd. Er is reden om aan te nemen dat de omstandigheden in een experiment zoals dat van Baars e.a. er toe leiden dat zulke openlijke reacties op de interne spraak relatief vaak te zien geven. Die reden is dat kort geleden Humphreys (2002) liet zien dat een behoorlijk percentage uitgelokte foneemverwisselingen voortijdig worden afgebroken. Dat is van belang, omdat de twee concurrerende verklaringen van lexicale voorkeur verschillende voorspellingen doen over de structuur van zulke data.

Het terugkoppelingsmodel van Dell (1986) voorspelt een grotere frequentie van lexicale versprekingen zowel voor de voltooide als voor de afgebroken versprekingen van het type s...fik sein. Dat is zo omdat volgens dit model het ontstaan van lexicale voorkeur los staat van de zelfbewaking die er toe leidt dat versprekingen voortijdig worden afgebroken. De zelfbewakingstheorie van Levelt et al (1999) zegt dat een lagere frequentie van voltooide niet-lexicale versprekingen dan van voltooide lexicale versprekingen het gevolg is van een grotere frequentie van afgebroken (weggeredigeerde) niet-lexicale versprekingen dan van afgebroken lexicale versprekingen, en voorspelt daarmee, anders dan het model van Dell, dat een lager aantal voltooide niet-lexicale versprekingen gepaard gaat met een groter aantal afgebroken niet-lexicale versprekingen, dus een interactie tussen lexicaal versus niet-lexicaal en voltooid versus afgebroken.

Een tweede mogelijkheid om meer inzicht te krijgen in de werking van het mechanisme waardoor lexicale voorkeur wordt veroorzaakt is wellicht het effect van fonetische afstand tussen de twee te verwisselen fonemen. Een voorspelling hierover is het makkelijkste voor de zelfbewakingsverklaring. Immers, de zelfbewaking maakt gebruik van het spraakperceptie-systeem dat we ook gebruiken om de spraak van anderen te verstaan. Het ligt voor de hand dat grotere verschillen vaker gedetecteerd worden dan kleinere verschillen. We voorspellen dus een toename van het aantal afgebroken versprekingen met een toename van de fonetische afstand. A priori is er geen reden om te voorspellen dat dit effect verschillend zal zijn voor lexicale en niet-lexicale versprekingen.

Het is lastiger om te beredeneren wat het effect van fonetische afstand zal zijn wanneer er terugkoppeling is à la Dell. De reden is dat terugkoppeling twee effecten heeft. Het versterkt de activatie van het correcte woord, maar het versterkt ook de competitie tussen het correcte woord en het alternatief met de uitgelokte verspreking. Wat nu het effect is op de relatieve frequentie van lexicale en niet-lexicale versprekingen hangt af van de preciese instelling van de parameters van het model. Het model van Dell zoals het op dit moment werkt laat zien dat (a) onder overigens gelijke condities lexicale versprekingen vaker voorkomen dan niet-lexicale, en (b) die lexicale voorkeur aanzienlijk groter wordt wanneer de fonetische afstand tussen de twee te verwisselen fonemen groter wordt, vooral doordat het aantal niet-lexicale versprekingen drastisch daalt met het groter worden van de fonetische afstand (Dell, persoonlijke communicatie). Een voorbeeld met fictieve getallen staat in Tabel 2:

woord-woord onzinwoord-onzinwoord
fonetisch gelijkend 27 19
fonetisch niet gelijkend 17 9

Tabel 2: Voorspelling vanuit Dell's(1986) model met fictieve getallen van relatieve frequenties van lexicale en niet-lexicale versprekingen, afzonderlijk voor fonetisch gelijkende en fonetisch niet-gelijkende verwisselde fonemen.

Dit kunnen we als voorspelling gebruiken. Merk op dat voor voltooide versprekingen beide verklaringen een zelfde voorspelling doen: Een geringe lexicale voorkeur voor een kleine fonetische afstand, en een grotere lexicale voorkeur voor een grotere fonetische afstand. Maar volgens het model van Dell is er weer geen reden om te voorspellen dat dit anders zal zijn voor afgebroken versprekingen. Bij het zelfbewakingsmodel voorspellen we dat, terwijl de frequentie van voltooide niet-lexicale versprekingen sterk afneemt met groter wordende fonetische afstand, de frequentie van afgebroken niet-lexicale versprekingen juist sterk toeneemt met groter wordende afstand.

Overigens is het door het model van Dell voorspelde effect van fonetische afstand op de relatieve frequenties van uitgelokte verwisselingen sterk gebonden aan de specifieke afstemming van dat model. Stel dat we het terugkoppelingsloze model WEAVER++ zoals beschreven door Roelofs (1997, 2002) en bedoeld als implementatie van de theorie van Levelt e.a. (1999) bij wijze van gedachtenexperiment zouden voorzien van terugkoppeling à la Dell. Dit nieuwe model met terugkoppeling zou dan vermoedelijk heel andere voorspellingen doen over het effect van fonetische afstand op de relatieve frequenties van uitgelokte foneemverwisselingen. Dit heb ik niet onderzocht. Ik heb wel gespeculeerd over de voorspellingen die WEAVER++, verrijkt met terugkoppeling, zou doen over de responsietijden in het huidige experiment.

7.4 Hoe kunnen we te weten komen of er terugkoppeling is tussen fonemen en lexemen?

Het is eerder duidelijk geworden dat terugkoppeling van activatie tussen het niveau van fonemen en het niveau van lexemen effecten heeft op de mate van activatie van de betrokken eenheden. Het is redelijk om aan te nemen dat sterkere activatie gepaard gaat met sneller beschikbaar komen van de betreffende eenheid, en daardoor met kortere responsietijden. Helaas doet het model van Dell geen voorspellingen over responsietijden. Het enigszins verwante model WEAVER++ van Roelofs (1997, 2002, zie ook Levelt, Roelofs en Meyer, 1999) doet dat wel. Dit model is een implementatie van de eerder besproken theorie van Levelt e.a. (1999). WEAVER++ kent echter geen terugkoppeling. We beschikken op dit moment niet over een rekenmodel van spraakproductie waaruit we enigszins precieze kwantitatieve voorspellingen kunnen afleiden over wat de aanwezigheid van terugkoppeling tussen fonemen en lexemen voor gevolgen zou hebben voor de responsietijden. Er zijn wel verstandige aannames over te doen.

Uit de werking van WEAVER++ zonder terugkoppeling weten we dat verhoging van activatie er toe leidt dat een lexeem sneller z'n activatiedrempel overschrijdt, en daardoor sneller beschikbaar komt. Soms komt het voor dat twee lexemen hun activatiedrempel overschrijden, waarna ze in competitie zijn met elkaar zijn. Die competitie heeft weer een vertragend effect op het beschikbaar komen van het winnende lexeem. Laten we ons nu voorstellen dat in dit model terugkoppeling à la Dell wordt ingevoerd, en bezien wat dat betekent in een experiment met fonologische voorbereiding van versprekingen à la Baars et. al. (1975). Die terugkoppeling zou, wanneer de uitgelokte verspreking lexicaal is, leiden tot extra activatie en dus tot sneller beschikbaar komen van het correcte woord, maar zou ook potentieel leiden tot competitie met de uitgelokte lexicale verspreking en daardoor tot vertraging van het beschikbaar komen van het winnende lexeem. Omdat die extra activatie van het correcte lexeem er altijd zou zijn, en die competitie alleen in uitzonderingsgevallen, wanneer namelijk het concurrerende lexeem ook zijn activatiedrempel overschrijdt, is het redelijk om aan te nemen dat gemiddeld over alle foutloze producties die extra activatie het wint van de competitie, en dus om te voorspellen dat in foutloze producties de responsietijden korter zullen zijn wanneer de uitgelokte verspreking lexicaal is dan wanneer deze niet-lexicaal is.

Laat ik dit illustreren aan een paar voorbeelden. We kijken eerst naar het effect van terugkoppeling op de foutloze uitspraak van pook bij fonologische voorbereiding van pook » dook. We zien dan dat er door terugkoppeling van fonemen naar lexemen extra activatie zou zijn van pook door de fonemen van dook, maar potentieel ook extra competitie tussen pook en dook. De extra activatie verkort de responsietijd doordat de activatiedrempel eerder wordt overschreden, de competitie verlengt de responsietijd in het geval dat meer dan één lexeem de activatiedrempel heeft overschreden. De veronderstelling is dat competitie relatief zeldzaam is. Daaruit kunnen we de voorspelling afleiden dat als er terugkoppeling zou zijn tussen fonemen en lexemen, dit in het algemeen zou leiden tot een verkorting van de responsietijd voor foutloos gesproken pook wanneer een verspreking van pook als dook was voorbereid. Wanneer echter een verspreking van pook als jook zou zijn voorbereid, is er geen verkortende extra activatie van pook als gevolg van de terugkoppeling, omdat er nu eenmaal geen lexeem jook bestaat.

De gevolgde redenering leidt tot de volgende voorspelling: Gevallen als foutloos gesproken pook met een voorbereide lexicale verspreking dook hebben gemiddeld kortere responsietijden dan gevallen als foutloos gesproken pook met een voorbereide verspreking jook. Het is goed om te onthouden dat deze voorspelling afhankelijk is van de speculatieve aannames over de relatie tussen extra activatie en competitie. De gevolgde redenering laat bijvoorbeeld niet toe om aan te geven wat het model van Dell zou voorspellen over responsietijden wanneer het daartoe aangepast zou worden.

Omdat we om onafhankelijke redenen in ons experiment de fonetische afstand tussen de twee te verwisselen beginmedeklinkers als experimentele variabele gebruiken, is het goed hier ook stil te staan bij een mogelijk effect van die fonetisch afstand op de responsietijden in de foutloos gesproken gevallen. Wanneer de uitgelokte verspreking een bestaand woord is, zal de extra activatie van het correcte woord door terugkoppeling groter zijn naarmate de fonetische afstand kleiner is, omdat de overlap in fonetische kenmerken tussen de twee concurrerende lexemen groter is. Hieruit zou je voorspellen dat de responsietijden in de foutloos gesproken gevallen afnemen met kleiner wordende fonetische afstand. Maar natuurlijk neemt ook de competitie toe tussen die twee concurrerende lexemen toe. Dit kan potentieel tot verlenging van de responsietijden leiden. Gegeven onze aanname dat de extra activatie door terugkoppeling er altijd is, maar competitie zeldzaam, mogen we er vanuit gaan dat in de grote meerderheid van gevallen de extra activatie door terugkoppeling groter wordt met kleiner wordende fonetische activatie, waardoor de responsietijden zullen afnemen met kleiner wordende fonetische afstand. Wanneer de uitgelokte verspreking een onzinwoord is, is er geen extra terugkoppeling en zal er dus ook geen effect zijn van fonetisch afstand. Het is uiteraard weer zo dat als het model van Dell zo aangepast zou worden dat het voorspellingen zou doen over responsietijden, die voorspellingen andere zouden kunnen zijn.

7.5 Een experiment: Uitlokken van foneemverwisselingen.

Het basis-idee van Baars et al. was dat foneemverwisselingen (Engels: ``spoonerisms'', genoemd naar de 19e-eeuws Reverend Dr. Spooner, die fameus was om de vele foneemverwisselingen die hij, overigens waarschijnlijk opzettelijk, maakte, verg. Potter, 1980) kunnen worden uitgelokt door fonologische voorbereiding (Engels: ``phonological priming''), zoals in het eerder gegeven voorbeeld, waarbij achtereenvolgens een aantal fonologisch voorbereidende woordparen (give book, go back, get boot), gevolgd door een doel-woordpaar (bad goof) te zien zijn, waarna het laatste woordpaar gevolgd wordt door een signaal of commando om het laatste woordpaar uit te spreken. Zo'n experiment hebben we opgezet in het Nederlands, waarbij de essentiële verschillen met het voorbeeld de volgende waren:


De proefpersonen kregen ruim de tijd om zich te corrigeren.



De fonetische afstand tussen de twee te verwisselen fonemen werd gebruikt als experimentele variabele.



De responsietijd werd gebruikt als afhankelijke variabele.


Het experiment is opgezet en uitgevoerd door de afstudeerder Eelco de Vries. De gegevens over foneemverwisselingen zijn naderhand door mij opnieuw geanalyseerd, en de responsietijden zijn ook pas veel later door mij gemeten.

7.5.1 Stimuli

Voorbereidende en doel-woordparen bestonden uit paren van éénlettergrepige Nederlandse woorden, en werden visueel aangeboden in duidelijke hoofdletters op een computer-scherm. Alle woordparen werden in eerste instantie stil gelezen. Er waren 3, 4, 5, 6, of 7 (gemiddeld 4) voorbereidende woordparen voorafgaand aan doel-woordparen. Ook waren er 3, 4, 5, 6, of 7 (gemiddeld 4) voorafgaande maar niet fonologisch voorbereidende woordparen, voorafgaand aan controle-woordparen, die net als de doelwoordparen moesten worden uitgesproken. In totaal waren er 36 doelwoordparen met 144 fonologisch voorbereidende woordparen, en 36 controle-woordparen, eveneens met 144 voorafgaande niet uit te spreken woordparen. De doelwoordparen en de controle-woordparen waren niet dezelfde. Dat heeft als bezwaar dat door verschillen tussen de woordparen de vergelijkbaarheid minder wordt. Maar in het andere geval zouden we dezelfde woordparen meerdere malen aan dezelfde proefpersonen hebben moeten aanbieden, en ook dat heeft bezwaren. Zowel van de 36 doelwoordparen als van de 36 controlewoordparen waren er 18 die bij uitgelokte foneemverwisseling tot een paar onzinwoorden zouden leiden, en 18 die tot een paar bestaande woorden zouden leiden. Een voorbeeld van het eerste is kalm denk > dalm kenk, een voorbeeld van het tweede is geur ziek > zeur giek. De beginmedeklinkers van de doel-woordparen waren gekozen uit de groep /f, s, X, v, z, b, d, p, t, k/. Iedere groep van 18 doelwoordparen was verdeeld in drie groepen van zes waarin de twee beginmedeklinkers 1 (bv. f vs s), 2 (bv. f vs z), of 3 (bv. f vs d) kenmerken van elkaar verschilden.

Na ieder doel-woordpaar en ieder controle-woordpaar zag de proefpersoon een seconde later op het scherm het commando SPREEK UIT. Weer een seconde later zag de proefpersoon het commando CORRECTIE. Voorafgaand aan de hele reeks van stimuli waren er 7 oefenstimuli, met gemiddeld 4 niet-voorbereidende voorafgaande woordparen. Het totale aantal visueel gepresenteerde woordparen was 144 fonologisch voorbereidende, 144+28 fonologisch niet-voorbereidende, 7 oefen-, 36 doel-, en 36 controle-woordparen = 395. Het totale aantal visuele commando's, was 72 + 7 = 79 maal SPREEK UIT en 72 + 7 = 79 maal CORRECTIE, is 158.

7.5.2 Proefpersonen

Er waren 50 proefpersonen, waarvan 17 mannen en 33 vrouwen. Allen hadden geen idee van het doel van het experiment. De meesten waren staflid of student van de Universiteit Utrecht. Allen hadden Nederlands als moedertaal en niemand had een bekende voorgeschiedens van spraak- of gehoorsgestoordheid. Leeftijden varieerden van 17 tot 56.

7.5.3 Procedure

Aan iedere proefpersoon werd individueel het experiment afgenomen in een geluidsgeïsoleerde cabine. De presentatie van de stimuli werd bestuurd vanuit een computer. De volgorde van doel- en controle-stimuli was volgens een toevalsvolgorde die verschillend was voor iedere proefpersoon. Iedere (niet-) voorbereidend woordpaar, ieder SPREEK UIT-commando en ieder CORRECTIE-commando was zichtbaar gedurende 900 ms en werd gevolgd door 100 ms met een leeg scherm. De proefpersonen hadden de instructie om, als ze het SPREEK UIT-commando zagen, het laatste woordpaar dat ze hadden gezien hardop uit te spreken. Ook hadden ze de instructie om, als ze een verspreking maakten, dat onmiddellijk te corrigeren. Zij hoefden daarbij niet te wachten op het CORRECTIE-commando. Dat diende vooral om te zorgen dat er genoeg tijd was voor correctie. Alle spraak van iedere proefpersoon werd met een microfoon opgenomen en opgeslagen op één spoor van een digitale band met twee sporen voor verdere verwerking. Op het andere spoor werden bij ieder uit te spreken woordpaar twee tonen opgenomen van 1000 Hz en 50 ms, één bij het begin van de presentatie van het SPREEK UIT-commando en één bij het begin van de presentatie van het CORRECTIE-commando. Deze signalen hielpen bij de orientatie in latere analyse, en de eerste van de twee was onmisbaar voor het meten van responsietijden.

7.5.4 Het verzamelen van de gegevens.

Reacties op alle doel- en alle controle-stimuli werden getranscribeerd door twee fonetisch niet-naïeve transcribeerders, met gebruik van een computerprogramma voor het zichtbaar maken en het hoorbaar maken van de golfvorm van audiosignalen. Transcripties verschilden in minder dan 2% van alle uitingen, en in minder dan 10% van alle versprekingen. In alle gevallen waarin transcripties verschilden werd de stimulus door mij opnieuw beluisterd. Als er dan twijfel bleef tussen verschillende interpretaties werd steeds gekozen voor die interpretatie die zo dicht mogelijk bij de correcte responsie lag. Op die wijze kregen de proefpersonen het voordeel van de twijfel. Responsietijden werden in de golfvorm gemeten vanaf het begin van het SPREEK UIT-commando tot het begin van de gesproken responsie.

7.6 Resultaten 1: Foneemverwisselingen.

Er werden in totaal 680 foutieve reacties geteld bij de doel-woordparen en controle-woordparen samen, waarvan 381 bij de doel-woordparen. De meeste van deze fouten hadden niets te maken met de experimentele condities. Hier concentreren we ons op 56 complete foneemverwisselingen, zoals geur ziek > zeur giek en 67 voortijdig afgebroken foneemverwisselingen zoals s.. fik sein en guu.. fuut geeuw, van het verwachte type bij de doelwoordparen. Terwijl de voortijdig afgebroken versprekingen vrijwel altijd werden gecorrigeerd, werden de voltooide verwisselingen in maar 5 van de 56 gevallen gecorrigeerd. In dat opzicht heeft de poging om correcties uit te lokken gefaald.

Bij de doel-woordparen was de voornaamste experimentele variabele de lexicaliteit van de uitgelokte foneemverwisseling. De eerste vraag is uiteraard of de verdeling van foneemverwisselingen een lexicale voorkeur vertoont. De relevante gegevens staan in Tabel 3.

voltooid afgebroken
woord-woord 37 28
onzinwoord-onzinwoord 19 39

Tabel 3. Het effect van lexicaliteit op de frequentie van verwachte voltooide en voortijdig afgebroken foneemverwisselingen ( chi2 = 7.21 ; df = 1 ; p<0.01 ).

De 56 volledige foneemverwisselingen laten, geheel volgens de verwachting, een duidelijk effect van zo'n lexicale voorkeur zien: 37 foneemverwisselingen met een lexicale uitkomst en 19 foneemverwisselingen met een niet-lexicale uitkomst. Dit verschil is significant volgens een binomiaaltoets ( p < 0.01 ). Zo'n lexicale voorkeur is er niet voor de voortijdig afgebroken foneemverwisselingen, waar eerder het tegengestelde lijkt te gebeuren: 28 voor de lexicale en 39 voor de niet-lexicale versprekingen. De afgebroken versprekingen waren vrijwel allen van het type s...fik sein, waarbij we veilig kunnen aannemen dat de spreker reageert op een fout in zijn of haar interne spraak, en niet op de externe spraak. Dit verschil op zich zelf is niet significant. Er is wel een significante interactie tussen woord-woord versus onzinwoord-onzinwoord en voltooid versus afgebroken. Deze interactie steunt het idee van Levelt et al. (1999) dat lexicale voorkeur verklaard zou moeten worden uit de werking van de zelfbewaking bij het spreken: De eindredactie van de in interne spraak klaargezette vormen detecteert vaker onzinwoordversprekingen dan bestaand-woordversprekingen, en dit zou de oorzaak zijn van lexicale voorkeur. Er lijkt weinig twijfel te zijn dat de zelfbewaking bij het spreken een deel van de gemaakte versprekingen detecteert, verwerpt, en eventueel corrigeert. Als Baars e.a. en Levelt e.a. gelijk hebben, gebeurt dat vaak zo snel dat de luisteraar er niets van merkt. De gevallen waarin de spreker al met uitspreken van een klaargezette vorm is begonnen om dan pas te stoppen, zouden wellicht de uitzonderingsgevallen zijn. Volgens Levelt c.s. maakt de zelfbewaking gebruik van hetzelfde spraakperceptie-mechanisme dat dient om de spraak van anderen waar te nemen. Als dat juist is, zou je verwachten dat grote fonetische verschillen vaker gedetecteerd worden dan kleine fonetische verschillen. Dat zou er toe leiden dat in de afgebroken versprekingen het aantal toeneemt met groter wordende fonetische afstand, en in de voltooide versprekingen het aantal afneemt met groter wordende fonetische afstand. Dat is precies wat we zien tabel 3, althans voor de niet-lexicale versprekingen, waar er een door de zelfbewakingstheorie maar niet door de terugkoppelingstheorie voorspelde significante interactie is tussen fonetische afstand en voltooid versus afgebroken.

(a) woord-woord
voltooid afgebroken
1 kenmerk 10 9
2 kenmerken 21 9
3 kenmerken 6 8

(b) onzinwoord-onzinwoord
voltooid afgebroken
1 kenmerk 12 11
2 kenmerken 6 12
3 kenmerken 1 16

Tabel 3. Interactie tussen fonetische afstand en voltooid versus afgebroken (a) in woord-woord versprekingen ( chi2 = 3.31 ; df = 2 ; p>0.1 ; niet significant), (b) in onzinwoord-onzinwoord versprekingen ( chi2 = 9.51 ; df = 2 ; p<0.01 ; significant).

Dit levert al weer steun voor de zelfbewakingsverklaring voor lexicale voorkeur. De lexicale versprekingen laten een ander beeld zien: Geen effect van fonetische afstand op de frequentie waarmee versprekingen worden gedetecteerd, en geen significante interactie. A priori is niet duidelijk waarom het effect van fonetische afstand verschillend zou zijn voor lexicale en niet-lexicale versprekingen. Dit punt komt terug in de discussie. Deze analyse van de gemaakte versprekingen geeft vooralsnog meer steun aan de zelfbewakingsverklaring voor lexicale voorkeur dan aan de terugkoppelingsverklaring. Maar als inderdaad lexicale voorkeur veroorzaakt wordt door de werking van de zelfbewaking, mogen we daaruit nog niet de conclusie trekken dat er geen terugkoppeling zou zijn van fonemen naar woorden.

7.7 Resultaten 2: Responsietijden

De veronderstelling achter het meten van responsietijden in dit experiment was dat responsietijden een functie zouden zijn van de mate van mentale activatie van de uitgesproken eenheden en daardoor wellicht inzicht zouden kunnen verschaffen in de aan- of afwezigheid van terugkoppeling tussen het foneemniveau en het lexicale niveau. Het eerste wat te doen staat is dan ook om na te gaan of die uitgangsveronderstelling klopt. Als er fonologische voorbereiding is van een bepaalde beginfoneemverwisseling, bijvoorbeeld van een verwisseling van z.... g.... onder invloed van een aantal voorafgaande woordparen met g.... z...., dan veroorzaakt deze fonologische voorbereiding op het foneemniveau competitie tussen de correcte z en de foute g voor het eerste woord en tussen de correcte g en de foute z voor het tweede woord. Die competitie zorgt er voor dat activatie die zonder de fonologische voorbereiding naar het correcte foneem zou gaan, nu verdeeld moet worden over het correcte en het foute foneem. Als dan toch het correcte foneem wint, zal dit foneem minder geactiveerd zijn dan wanneer er geen fonologische voorbereiding zou zijn. We verwachten daarom dat de responsietijden van foutloos uitgesproken woordparen met fonologische voorbereiding gemiddeld langer zullen zijn dan responsietijden voor foutloos uitgesproken woordparen zonder fonologische voorbereiding. Als die verwachting uitkomt kan dat geïnterpreteerd worden als een bevestiging van de uitgangsveronderstelling. Het gemiddelde voor woordparen zonder fonologische voorbereiding is 563 ms (standaardfout 3,9 ms), het gemiddelde voor woordparen met fonologische voorbereiding is 593 ms (standaardfout 4,4 ms). Het verschil is significant volgens een variantie-analyse met herhaalde metingen ( F[1,49] = 20.5 ; p<0.001 ). Dit resultaat maakt aannemelijk dat inderdaad, zoals vermoed, responsietijden korter worden met toenemende activatie van de uit te spreken eenheden.

Eerder hebben we gezien dat als we, bij wijze van gedachtenexperiment, WEAVER++ zouden uitbreiden met een terugkoppeling à la Dell, dit er toe zou leiden dat responsietijden in het huidige experiment, voor de talloze gevallen dat er geen verspreking wordt gemaakt, korter zouden zijn wanneer de uitgelokte maar niet gemaakte verspreking een bestaand woord zou zijn geworden dan wanneer de uitgelokte maar niet gemaakte verspreking een onzinwoord zou zijn geworden. Ook zagen we dat die verkorting voor bestaande woorden sterker zou worden naarmate de fonetische afstand tussen de twee te verwisselen fonemen kleiner zou worden. We voorspellen dus dat in ons experiment (a) responsietijden in foutloze gevallen significant korter zijn voor verwachte lexicale versprekingen dan voor verwachte niet-lexicale versprekingen, en (b) er een significante interactie is tussen lexicaal versus niet lexicaal en fonetische afstand, doordat het verschil tussen lexicaal en niet-lexicaal groter wordt naarmate de fonetische afstand kleiner wordt. De relevante gegevens staan in Fig. [*]. Volgens een variantie-analyse met herhaalde metingen is er inderdaad een significant verschil tussen lexicaal en niet-lexicaal ( F[1,49] = 18 ; p<0.0001 ). Er is ook een significant effect van het aantal kenmerken verschil ( F[2,98] = 15,5 ; p<0.0001 ), en een significante interactie tussen lexicaal versus niet-lexicaal en het aantal fonetische kenmerken verschil ( F[49,1107] = 12,7 ; p<0.043 ).

Figuur: Responsietijden in foutloze en vloeiende gesproken realisaties van woordparen als een functie van (a) lexicaliteit van de verwachte maar niet gemaakte foneemverwisselingen, en (b) fonetische afstand tussen de beginmedeklinkers van de twee woorden.
\includegraphics[width=15cm,keepaspectratio]{nooteboom-figuur1.eps}

Deze resultaten maken het aannemelijk dat er in de mentale voorbereiding van spraak terugkoppeling bestaat tussen het foneemniveau en het niveau van lexicale eenheden.

7.8 Discussie

De bedoeling van het beschreven experiment was antwoorden te krijgen op twee vragen: (1) ``Wat is de oorzaak van lexicale voorkeur in fonologische versprekingen?'', en (2) ``Bestaat er in de mentale programmering van spraak terugkoppeling van het foneemniveau naar het lexicale niveau?'' Om de eerste vraag te beantwoorden is in eerste aanleg de volgende redenering gevolgd: Als lexicale voorkeur veroorzaakt wordt door terugkoppeling in de spraakproductie tussen fonemen en woorden, dan verwacht je hetzelfde patroon te vinden voor voltooide foneemverwisselingen en voortijdig afgebroken foneemverwisselingen. Als daarentegen lexicale voorkeur veroorzaakt wordt door de werking van de zelfbewaking bij het spreken, verwacht je dat de voorkeur voor lexicale versprekingen in voltooide verwisselingen gepaard gaat met een voorkeur voor niet-lexicale versprekingen in de voortijdig afgebroken versprekingen. De resultaten gaven aan dat het laatste het geval is. Het is jammer dat het om betrekkelijk kleine aantallen gaat. Het zou daarom voor het trekken van een stevige conclusie wenselijk zijn als andere, soortgelijke, experimenten hetzelfde patroon lieten zien. Helaas zijn er heel weinig experimenten van dit type gepubliceerd waarin afzonderlijk naar voortijdig afgebroken versprekingen is gekeken. Baars et al. (1975) en ook anderen na hen hebben wel een categorie ``partial spoonerisms'' onderscheiden, maar gezien hun omschrijving ging dit vooral over anticipaties van het type dalm denk, waar de eerste foneemvervanging wel en de tweede niet gerealiseerd is.

De enige waarvan ik weet dat ze afzonderlijk, en om een heel andere reden, naar voortijdig afgebroken foneemverwisselingen heeft gekeken is Karin Humphreys (2002) in haar dissertatie. Van de drie experimenten die zij beschrijft is er één wellicht voldoende vergelijkbaar met het hier beschreven experiment om haar resultaten hier te bespreken. Dat is een experiment à la Baars et al. (1975), waarin de verwachte uitkomsten echter niet woord-woord en onzinwoord-onzinwoord waren, maar van het type onzinwoord-woord of van het type woord-onzinwoord waren. Wat zij wilde laten zien en ook vindt is dat lexicale voorkeur vooral een effect is op het eerste woord van de verwachte verspreking, en dat de foneemvervanging in het tweede woord een automatisch gevolg is van de foneemvervanging in het eerste woord. Als haar interpretatie juist is, kunnen we dus haar woord-onzinwoord uitkomsten vergelijken met onze woord-woord uitkomsten, en haar onzinwoord-woord uitkomsten met onze onzinwoord-onzinwoord uitkomsten. Zij vindt 51 volledige woord-onzinwoord en 20 volledige onzinwoord-woord uitkomsten, een significante lexicale voorkeur (Binomiaaltoets: p<0.0002). Zij vindt 29 voortijdig afgebroken woord-onzinwoord uitkomsten en 38 onzinwoord-woord uitkomsten. Hier lijkt op het eerste gezicht sprake te zijn van een omgekeerde lexicale voorkeur, zoals voorspeld uit de zelfbewakingsverklaring. Overigens is het verschil tussen 29 en 38, net als voor afgebroken versprekingen in ons eigen experiment, weer op zich zelf niet significant (al is de interactie tussen de twee typen uitkomsten en voltooid versus afgebroken dat, net als in het eigen experiment, wel). Maar als we nu even veronderstellen dat het in deze bijdrage beschreven experiment en het experiment van Humphreys voldoende vergelijkbaar zijn om de uitkomsten bij elkaar op te tellen, dan kunnen we opnieuw, met meer materiaal, bekijken of de lexicale en niet-lexicale voortijdig afgebroken uitkomsten significant verschillen. De twee experimenten samen leveren dan 57 lexicale en 77 niet-lexicale afgebroken uitkomsten. Dit verschil op zichzelf is zo goed als significant (binomiaaltoets p=0.0502). Dit geeft nog wat steun aan het idee dat lexicale voorkeur veroorzaakt wordt door het afvangen van niet-lexicale versprekingen door de zelfbewaking.

Een volgende poging om te kiezen tussen de twee verklaring was gebaseerd op het idee dat het voor de zelfbewaking makkelijker is om versprekingen te detecteren wanneer de fonetische afstand tussen het correcte en het foute woord groot is dan wanneer die afstand klein is. We verwachtten daarom dat, terwijl het aantal voltooide niet-lexicale versprekingen afneemt met de fonetische afstand, het aantal afgebroken niet-lexicale versprekingen toeneemt met de fonetische afstand. A priori is overigens geen reden om aan te nemen dat dit anders zal zijn voor lexicale versprekingen. De terugkoppelingsverklaring voorspelt geen verschil tussen relatieve frequentie van voltooide en afgebroken niet lexicale versprekingen. De resultaten laten zien dat er een sterke en significante interactie is in de voorspelde richting tussen voltooid versus afgebroken en fonetische afstand voor de niet-lexicale versprekingen. Dit geeft opnieuw steun aan de zelfbewakingsverklaring à la Levelt. Voor de lexicale versprekingen vinden we overigens deze interactie niet, alsof fonetische afstand er bij de lexicale versprekingen veel minder toe doet dan bij de niet lexicale. Een mogelijke verklaring hiervoor is dat de zelfbewaking gebruikt maakt van de woordherkenning. Een onzinwoord dat slechts één kenmerk verschilt van een bedoeld bestaand woord zal dan al gauw als dat bestaande woord worden herkend, omdat dat de lexicale eenheid is die er het meest op lijkt. Het onzinwoord heeft immers geen eigen lexicale status en kan niet als zichzelf herkend worden. Redelijkerwijs neemt de kans dat een onzinwoord wordt herkend als het bedoelde bestaande woord snel af met het toenemen van de fonetisch afstand. Een bestaand woord dat slechts één kenmerk verschilt van het bedoelde bestaande woord zal zeer waarschijnlijk wél als zichzelf herkend worden, omdat dat bestaande woord het meest lijkt op zich zelf, en dat blijft zo wanneer de fonetische afstand toeneemt. Dit zou het patroon van de resultaten redelijk verklaren.

Er is mij gesuggereerd dat het feit dat niet-lexicale versprekingen vaker worden afgebroken dan lexicale versprekingen z'n oorzaak zou kunnen hebben in een verschil in spreeksnelheid: Bestaande woorden zouden sneller worden uitgesproken dan niet-lexicale, en bij langzamer uitspraak zou de kans op foutendetectie en voortijdig afbreken groter zijn dan bij snellere uitspraak. De structuur van mijn resultaten en verdere mij ter beschikking staande gegevens laten niet toe deze hypothese te toetsen. Het zou zo kunnen zijn. Maar merk op dat deze verklaring voor de structuur van de data niet in strijd is met een zelfbewakingsverklaring voor lexicale voorkeur: Dat lexicale versprekingen sneller uitgesproken worden dan niet-lexicale reflecteert ongetwijfeld een verschil in snelheid van codering in de interne spraak. Dus ook wanneer de versprekingen geheel intern worden gecorrigeerd, voordat de spraak begonnen is, zouden niet-lexicale versprekingen meer tijd krijgen dan lexicale versprekingen om afgebroken en gecorrigeerd te worden. Dit levert een iets andere versie op van de zelfbewakingsverklaring: In plaats van een beroep op lexicaliteit als criterium van de zelfbewaker, komt nu interne coderingsnelheid als verklaringsgrond voor de gevonden verschillen. Maar wezenlijk tast het de voorspellingen uit de opvattingen van Levelt et al. (1999) over de relatie tussen lexicale voorkeur en zelfbewaking niet aan.

Een mogelijkheid die onder ogen gezien moet worden is dat de tot zo ver besproken resultaten typisch zijn voor de experimentele condities waaronder ze zijn verkregen, en weinig zeggen over wat er in spontane spraak gebeurt. Dit te meer omdat ik eerder in een ander onderzoek (Nooteboom, in druk) heb gevonden dat zelfcorrecties in spontane spraak geen enkel effect van lexicale voorkeur, positief of negatief, te zien gaven. Ik heb daar toen, achteraf gezien wellicht ten onrechte, de conclusie uit getrokken dat lexicale voorkeur niet veroorzaakt wordt door de normale zelfbewaking van spraak. Bij de analyse van zelfcorrecties had ik echter geen onderscheid gemaakt tussen afgebroken versprekingen, van het type s...fik sein en voltooide versprekingen van het type sik fein ...fik sein. Recentelijk ben ik nog eens terug gegaan naar die spontane versprekingen, en heb eens geteld hoeveel lexicale en niet-lexicale volledige en hoeveel lexicale en niet-lexicale voortijdig afgebroken versprekingen er in de verzameling voorkomen. Er zijn 219 lexicale en 195 niet-lexicale volledige versprekingen, tegenover 35 lexicale en 18 niet-lexicale afgebroken versprekingen. Het eerste verschil is niet significant (p=0.13), het tweede verschil is wel significant in een binomiaaltoets (p = 0.02). Ook de interactie is significant volgens een chi2-toets (chi2= 6.7; df=1; p<0.01). Dit maakt aannemelijk dat ook in de productie van spontane spraak de zelfbewaking van interne spraak onder andere lexicaliteit als een criterium gebruikt, en dat daardoor lexicale voorkeur veroorzaakt kan zijn.

Al met al geven de tot nu toe besproken resultaten aanleiding om het idee heel serieus te nemen dat lexicale voorkeur veroorzaakt wordt door zelfbewaking of interne eindredactie op wat is klaargezet om uitgesproken te worden. De structuur van de resultaten geeft weinig steun aan het idee dat lexicale voorkeur wordt veroorzaakt door terugkoppeling van het foneemniveau naar het lexicale niveau. Maar, zoals eerder besproken, dit zegt nog weinig over het wel of niet bestaan van zulke terugkoppeling. Om daar uitsluitsel over te geven, hebben we de responsietijden van foutloze responsies in het experiment gemeten. Het basisidee daarbij was dat, als er geen terugkoppeling zou zijn, er geen enkele manier is waarop de responsietijden van die foutloze producties beïnvloed zouden kunnen worden door het verschil tussen lexicale en niet-lexicale versprekingen die nooit gemaakt zijn. Als er wel terugkoppeling is, en we veronderstellen dat in de meerderheid van gevallen grotere excitatie gepaard gaat met kortere responsietijden, voorspellen we dat responsietijden voor foutloze responsies korter zijn wanneer de fonologisch voorbereide (maar nooit gemaakte) responsie lexicaal is, dan wanneer die niet-lexicaal is. Bovendien is er reden te voorspellen dat het verschil groter zal worden naarmate de fonetische afstand tussen de twee te verwisselen (maar nooit verwisselde) fonemen kleiner wordt. Beide effecten zijn gevonden. Deze resultaten kunnen niet goed verklaard worden zonder aan te nemen dat er inderdaad terugkoppeling is tussen het foneemniveau en het lexicale niveau. Dit is in overeenstemming met de opvattingen van Dell (1986), en van Stemberger (1985), en in strijd met de opvattingen van Levelt et al. (1999).

De vraag doet zich nu voor waarom, als er terugkoppeling tussen fonemen en lexemen bestaat, dit niet zou leiden tot lexicale voorkeur, zoals voorspeld uit het model van Dell. Of zouden we nu moeten aannemen dat er twee oorzaken zijn van lexicale voorkeur? Dat laatste is wellicht niet ondenkbaar, maar de structuur van de data maakt aannemelijk dat als dat zo zou zijn, het effect van de terugkoppeling relatief zwak is ten opzichte van het effect van de zelfbewaking. De lezer zal zich herinneren dat Levelt et al. de terugkoppeling vooral verwierpen omdat ze er geen enkele functie voor zagen en dus niet goed konden begrijpen waarom zo'n terugkoppeling ontstaan zou zijn. Als er dan toch terugkoppeling blijkt te bestaan, lijkt het niet onwaarschijnlijk dat die een terugkoppeling een neven-effect van iets anders. Ook is het dan denkbaar dat de kans op schadelijke effecten van die terugkoppeling, zoals het bevorderen van lexicale fonologische versprekingen, door de afstemming van het productiesysteem bestreden zouden worden. Dit zou bijvoorbeeld bereikt worden door het systeem zo af te stemmen dat competitie tussen twee lexemen alleen bij hoge uitzondering voorkomt. De vraag is nu nog wel waarvan terugkoppeling dan wel een neven-effect zou kunnen zijn.

Het model dat Levelt et al. voorstaan kent een productiesysteem met verschillende niveau's en een perceptiesysteem met corresponderende niveau's. In Levelt (1989) werd verondersteld dat de productie en perceptie geen andere verbindingen met elkaar hadden dan via de interne spraak aan de onderkant en de zelfbewaker aan de bovenkant. Levelt et al. (1999) waren echter door experimentele evidentie gedwongen om het model te wijzigen door op tenminste drie niveau's directe verbindingen aan te nemen tussen perceptie en productie, t.w. het niveau van lemma's (lexicale eenheden met hun morfo-syntactische en semantische eigenschappen), het niveau van lexemen (klankvormen), en het niveau van fonemen. Een directe verbinding betekent hier dat de productie-eenheden automatisch enigszins worden geactiveerd wanneer de corresponderende perceptie-eenheden worden geactiveerd. De zelfbewaker hoeft daar niet aan te pas te komen. We kunnen ons nu voorstellen dat het perceptiesysteem, luisterend naar de interne spraak, op grond van de fonologische invoer, perceptieve lexicale vormen activeert die op hun beurt weer de corresponderende productie-vormen activeren. Dit zou tot terugkoppeling tussen fonemen en lexemen leiden zonder dat een beroep hoeft te worden gedaan op een directe terugkoppeling tussen fonemen en lexemen binnen het eigenlijke productiesysteem, waarvoor geen onafhankelijke evidentie is. Een suggestie in deze richting is recentelijk gedaan door Roelofs (in druk, b). Zo gezien, zou terugkoppeling tussen foneemniveau en het lexicale niveau een potentieel schadelijk automatisch bij-effect kunnen zijn van de zelfbewaking die nu eenmaal gebruik maakt van het perceptiesysteem.

Literatuur:

Baars, B.J., Motley, M.T. & MacKay D. (1975). Output editing for lexical status from artificially elicited slips of the tongue. Journal of verbal learning and verbal behavior, 14, 382-391.

Dell, G.S. (1986). A spreading-activation theory of retrieval in sentence production. Psychological Review, 93, 283-321.

Dell, G.S. and Reich, P.A. (1980). Toward a unified model of slips of the tongue, In: V.A. Fromkin (Red.) Errors in linguistic performance: Slips of the tongue, ear, pen, and hand (pp. 273-286). New York: Academic Press .

Del Viso, S., Igoa, J.M. & Garcia-Albea, J.E. (1991). On the autonomy of phonological encoding: evidence from slips of the tongue in Spanish. Journal of Psycholinguistic Research 20, 161-185.

Garrett, M. F. (1976). Syntactic process in sentence production. In: Walker, R.J. Walker and E.C.T. Walker (Red.) New approaches to language mechanisms. Amsterdam: North-Holland Publishing Company (pp. 231-256).

Humphreys, K. (2002). Lexical bias in speech errors. Ongepubliceerde dissertatie, University of Illinois at Urbana-Champaign.

Levelt, W.J.M. (1989). Speaking: From intention to articulation. Cambridge Ma. The MIT Press.

Levelt, W.J.M., Roelofs, A. & Meyer, A.S. (1999). A theory of lexical access in speech production. Behavioral and Brain Sciences, 22, 1-75.

Nooteboom, S.G. (in druk). Listening to one-self: Monitoring speech production. To appear in R. Hartsuiker, Y. Bastiaanse, A. Postma en F, Wijnen (Red.), Phonological encoding and monitoring in normal and pathological speech, Hove: Psychology Press.

Roelofs, A. (1997). The WEAVER model of word-form encoding in speech production, Cognition, 64, 249-284.

Roelofs, A. (2002). Storage and computation in spoken word production. In: S. Nooteboom, F. Weerman and F. Wijnen (Eds.), Storage and computation in the language faculty (pp. 183- 216). Dordrecht, Boston, London: Kluwer Academic Publishers.

Roelofs, A. (in druk a). Spoken word planning, comprehending, and self-monitoring. To appear in R. Hartsuiker, Y. Bastiaanse, A. Postma, en F, Wijnen (Red.), Phonological encoding and monitoring in normal and pathological speech, Hove: Psychology Press.

Roelofs, A. (in press b). Goal-referenced selection of verbal action: modeling attentional control in the stroop task. Te verschijnen in Psychological Review.

Stemberger, J.P. (1985). An interactive activation model of language production. In: A.W. Ellis (Red.), Progress in the psychology of language (Vol. 1, pp 143-186). London: Erlbaum.

Wheeldon, L.R. & Levelt, W.J.M. (1995). Monitoring the time course of phonological encoding. Journal of Memory and Language 34, 311-334.

Eric Auer 2003-06-18