Piet schreef op maandag 29 september 2008, 15:43:
> Dus..... leg uit asjeblieft.
-Straffen (NEE) houdt in dat de proefpersoon een verkeerde keuze gemaakt heeft.
-Belonen (YES) brengt de informatie dat de keuze van de proefpersoon (een minimale mate van) juistheid bevatte.
1) motivatie
Je had het uiteraard bij het rechte eind met de gedachte dat zowel de YESers als NEEers in gelijke mate gemotiveerd zijn, dat ze als mensen-deelnemers aan een spelletje wéten dat het een spelletje is, maar dat maakt allemaal niets uit voor dit model omdat even aangenomen wordt dat de motivatie om de uiterste best te doen zowel via straffen als belonen bereikt kan worden (dat de motivatie bij strafregime onder 0 daalt zodra de baas even niet kijkt is een ander verhaal).
Dat belonen ook nog eens motiverend werkt, terwijl straffen demotiverende werking heeft staat dus naast dit betoog.
2) steekproef
Stel nou dat de deelnemers het zonder YES of NEE informatie zouden moeten stellen om iets te raden dan zou iedere keuzeronde als random steekproef gezien kunnen worden. Mee eens?
Het door de deelnemers raden wat de bedoeling is kan dus gezien worden als het doen van niet-random steekproeven, omdat er gestuurd wordt d.m.v. YES of NEE. (Meestal stelt men prijs op random steekproeven, maar een steekproef behoeft niet random te zijn om een steekproef te zijn

). Daarbij zijn het steekproeven van het type "zonder terugleggen" omdat iedere uitkomst technisch een informatie oplevert en dus de raadkans groter maakt. Maar hoeveel groter?
3) kansberekening
Een voldoende grote reeks steekproeven levert een uitkomstenverzameling op. Dat hoeft lang niet altijd zo'n mooie curve met uitzonderingsgebieden te zijn; het zou bijvoorbeeld kunnen dat alle uitkomsten even vaak voorkomen en de curve dus perfect vlak zou zijn. Echter, hoe dan ook kun je vanuit de resultaten van een dergelijke serie steekproeven een verwachtingspatroon of kansberekening opmaken.
4) stochasten
Om uitleg te verkorten, lees:
http://nl.wikipedia.org/wiki/StochastHet mag duidelijk zijn dat het raden een stochastische variabele oplevert, die gestuurd wordt door YES of NEE.
5) operanten
YES (r bij juiste uitkomst) en NEE (p bij onjuiste uitkomst) zijn beide operanten, die de uitkomstenruimte (omega) verkleinen (iedere raad-ronde levert dus een deelverzameling van mogelijke uitkomsten op).
6) uitkomstenruimte
Onze operanten verkleinen de uitkomstenruimte echter niet op identieke wijze, en daar gaat het in deze demo om.
Het bereik van de operanten verschilt sterk en daarmee de mate van sturing: terwijl YES theoretisch een score van 100% in 1 ronde kan hebben komt NEE nooit verder dan {omega minus verkeerde keus/keuzen}. Naarmate de uitkomstenruimte groter is zal NEE dus een kleinere invloed hebben dan YES (de grootte van de uitkomstenruimte is dus sterk van invloed op NEE, weinig van invloed op YES).
a) De kleinst mogelijke keuzemogelijkheid is die tussen 2 opties. In dit geval zal de kans tot de juiste keus te komen via YES of NEE even groot zijn. Immers, de eerste ronde geeft een slaagkans van 50% terwijl de operanten de uitkomstenruimte verkleinen tot de enig mogelijke, overgebleven juiste keus.
b) de grootst mogelijke opzet is die welke een continue stochastische variabele oplevert. Alleen YES zal hier de uitkomstenruimte verkleinen, NEE heeft geen enkele praktische invloed omdat de verkleining oneindig klein is.
Hieruit kan nmm geconcludeerd dat NEE een uitzonderingsgebied heeft waarin de efficientie even groot is als YES, voor de rest (veel) minder efficiënt zal zijn tot je aan de andere kant van de uitkomstencurve komt met een uitzonderingsgebied waarin NEE als operant nog slechts verwaarloosbare invloed heeft.
In andere woorden: bestraffen wat je niet wilt kan op zijn hoogst, in zeldzame gevallen zoals modelmatig hier beschreven onder 6a, even doelmatig zijn als belonen. Voor de rest ben je met bestraffen (als vaktechnische term p bedoelt, dit ten overvloede maar weer vermeld) niet erg slim bezig

Mensen, ik ben amateur en leek in dit soort dingen, hou me sterk aanbevolen voor verbeteringen of verduidelijking. Ik hoop dat ik alle terminologie goed gedaan heb. Zover ik kan overzien beschrijft bovenstaande precies wat Skinner in ontelbare proefnemingen al in praktijk gevonden heeft.