Sociale wetenschappen
Thema 1, week 2: Leertheorieën
Leerdoelen:
De DIO laat zien wat het verschil is tussen klassieke conditionering, operante conditionering, en
cognitief leren.
De DIO legt uit wat overeenkomsten en verschillen zijn tussen modellen die gedrag verklaren, en
modellen die gedrag veranderen.
De DIO analyseert het voedingsgedrag van een sporter of een client met COPD met behulp van de
kennis uit de leertheorieën.
De DIO past de kennis over leertheorieën toe in casuïstiek gericht op het bevorderen van gezond
gedrag.
Literatuur:
- Psychologie, een inleiding: H4
- Bekijk video’s behorende bij psychologie, een inleiding over klassieke en operante conditionering
- Bekijk de volgende filmpjes over COPD en de invloed van de ziekte op het leven van de patiënten
https://www.youtube.com/watch?v=bhTeZySVAt8 https://www.youtube.com/watch?
v=255W1TTlIEI
Leren
= een blijvende verandering in gedrag of mentale processen als gevolg van een bepaalde ervaring.
We hebben eenvoudige en complexe vormen van leren.
Bij een eenvoudige, reflexmatige reactie, zoals opspringen wanneer je een onverwacht hard geluid
hoort, is géén sprake van leren, omdat ze geen blijvende verandering produceert. Hoewel er een
verandering in gedrag mee gepaard gaat, is dat een reactie van voorbijgaande aard.
Sommige vormen van leren zijn tamelijk eenvoudig: habituatie en mere-exposure-effect.
Sommige vormen van leren zijn bijzonder complex:
Habituatie
= leren niet te reageren op de herhaalde aanbieding van een stimulus.
Als je bijvoorbeeld in de buurt van een drukke straat woont, leer je om het geluid van het verkeer te
negeren.
Mere-exposure-effect
= aangeleerde voorkeur voor stimuli waaraan we al eerder zijn blootgesteld.
Als je een liedje bijvoorbeeld al een aantal keer hebt gehoord, wordt je eerder aangetrokken tot het
liedje dan wanneer je het liedje voor de allereerste keer hoort.
Stimulus-respons-leren
= vormen van leren die we kunnen beschrijven in termen van stimuli en responsen, zoals klassieke en
operante conditionering.
Klassieke conditionering
= een elementaire vorm van leren waarbij een stimulus die een aangeboren reflex oproept, wordt
geassocieerd met een voorheen neutrale stimulus, die daarop het vermogen verwerft om dezelfde
respons op te roepen.
Deze vorm van leren bepaalt voor een groot deel wat we wel en niet prettig vinden.
Dankzij het proces van klassieke conditionering leren organismen welke signalen gevaar aangeven,
de aanwezigheid van voedsel, de mogelijkheid van seksuele interactie of andere zaken die de kans op
overleving vergroten.
De kernpunten van klassieke conditionering:
Eenvoudige, automatische responsen, ofwel reflexen zoals speekselafscheiding, de kniereflex en de
knipperreflex worden onder normale omstandigheden veroorzaakt door stimuli die biologisch gezien
belangrijk zijn. Zo vormt de knipperreflex een belangrijke bescherming voor de ogen en helpt de
speekselreflex bij de spijsvertering.
Echter ontdekte Pavlov dat deze reflexieve responsen gekoppeld konden worden aan nieuwe stimuli:
neutrale stimuli die daarvoor geen respons opleverden. Om te begrijpen hoe deze geconditioneerde
,reflexen ontstonden, gebruikte Pavlovs team een eenvoudige strategie. Eerst gespten ze een
ongetrainde hond in een tuigje, vervolgens lieten ze met tussenpozen een bepaald geluid klinken,
waarna de hond steeds een beetje voedsel kreeg. Eerst produceerde de hond alleen speeksel nadat
hij voedsel kreeg, een normale biologische reflex. Nadat het geluid en het voedsel herhaaldelijk waren
aangeboden, begon de hond echter ook als het geluid zonder voedsel werd aangeboden, speeksel te
produceren. Een neutrale stimulus (NS= een stimulus die van nature geen reactie oproept) koppelen
aan een reflex oproepende stimulus (zoals voedsel), zal ervoor zorgen dat na verloop van tijd een
aangeleerde respons (speekselproductie) zal oproepen die gelijk is aan de oorspronkelijke reflex.
Hetzelfde conditioneringsproces veroorzaakt bij mensen de associatie van bloemen of chocolade met
romantiek.
Klassieke conditionering begint altijd met een ongeconditioneerde stimulus (UCS= stimulus die zonder
conditionering een reflexieve respons oproept). In Pavlovs experiment was voedsel de UCS, omdat
het de reflex van speekselvorming opriep, wat in dit geval de ongeconditioneerde respons (UCR= de
respons die voorafgaande aan de verweringsfase wordt opgeroepen door een UCS). De verbinding
tussen UCS en UCR zit ingebakken en bestaat dus zonder leren.
Tijdens de verweringsfase, het eerste leerstadium in klassieke conditionering, wordt een neutrale
stimulus (bijvoorbeeld geluid van een bel) herhaaldelijk samen met de UCS aangeboden. Dit samen
aanbieden wordt in de klassieke conditionering contiguïteit (= het samen, of vlak na elkaar, aanbieden
van de NS en de UCS) genoemd. Na een aantal pogingen zal de neutrale stimulus in principe
dezelfde respons oproepen als de UCS. Zodra het geluid tot speekselafscheiding leidt, zeggen we dat
de oorspronkelijke neutrale stimulus is veranderd in een geconditioneerde stimulus (CS). Het geluid is
nu in staat dezelfde respons van speekselafscheiding op te roepen als de UCS. Hoewel de respons
op de CS in essentie dezelfde is als de speekselrespons die oorspronkelijk door de UCS werd
geproduceerd, noemen we hem nu de geconditioneerde respons (CR).
Net als bij het vertellen van een mop is timing essentieel in conditionering. In de meeste gevallen
moeten de CS en UCS snel na elkaar worden aangeboden, zodat het organisme het gewenste
verband kan leggen.
Stel dat het water je nog steeds in de mond loopt wanneer je de bel hoort van een school in de buurt,
als gevolg van je ervaring met de lunchbel op jouw middelbare school (klassieke conditionering). Blijft
deze geconditioneerde respons permanent onderdeel van je gedragsrepertoire? Nee, extinctie zorgt
ervoor dat dit niet zo is. Extinctie= de afname van een geconditioneerde associatie als gevolg van de
afwezigheid van een ongeconditioneerde stimulus of bekrachtiger. De geconditioneerde respons dooft
uit als we de CS herhaaldelijk aanbieden zonder UCS.
Extinctie betekent niet dat de respons voorgoed verdwenen is. Een angst voor kleine ruimtes kan
bijvoorbeeld plots de kop weer opsteken. Ben je heerlijk lang op vakantie geweest waar je alle ruimte
had en moet je ineens met het vliegtuig terug, dan kan deze angst ineens toch weer terugkomen. Dit
noemen we spontaan herstel. Spontaan herstel= het terugkeren van een uitgedoofde
geconditioneerde respons na een rustperiode. Dit spontane herstel vindt plaats wanneer de CR, na
extinctie en een daaropvolgende periode zonder blootstelling aan de CS, zich opnieuw voordoet als
reactie op de CS. Gelukkig is de CR in dat geval doorgaans minder sterk.
Als je bang bent voor spinnen, zul je waarschijnlijk op alle soorten en maten hetzelfde reageren. Dit
proces, waarbij je een geconditioneerde respons vertoont op stimuli die op de CS lijken, wordt
stimulusgeneralisatie genoemd. Stimulusgeneralisatie= de uitbreiding van een aangeleerde respons
naar stimuli die lijken op de geconditioneerde stimulus.
In het dagelijks leven komt generalisatie vaak voor bij mensen die angsten hebben opgelopen als
gevolg van traumatische gebeurtenissen. Stimulusgeneralisatie zorgt ervoor dat we aangeleerde
responsen toepassen in nieuwe situaties.
Stimulusdiscriminatie is het tegenovergestelde van generalisatie en wordt ook wel selectief leren
genoemd. Het doet zich voor als een organisme leert op een bepaalde stimulus te reageren, maar niet
op gelijksoortige stimuli. Stimulusdiscriminatie= het leren van een nieuwe respons op een specifieke
stimulus, maar niet op een andere daarop gelijkende stimuli.
Bij het bekijken van reclamecampagnes leren we ook een onderscheid te maken tussen merken, zoals
bijvoorbeeld advertentiestrijd tussen Apple en Samsung.
Evaluerende conditionering= een speciaal type klassieke conditionering dat veel van onze voorkeuren
beïnvloedt, dat waar we van leren te houden of juist niet.
, Operante conditionering
= een vorm van stimulus-respons-leren waarbij de kans op een respons verandert door de gevolg
ervan, oftewel door de stimuli die op de respons volgen.
In operante conditionering volgen op gedrag consequenties in de vorm van beloningen en straffen, die
de kans op herhaling van dat gedrag beïnvloeden.
‘Vrijwillige’ gedragingen worden in werkelijkheid aangestuurd door beloningen en straffen, en omdat
beloningen en straffen bij klassieke conditionering geen rol spelen, moet er een andere belangrijke
vorm van leren aan het werk zijn. Dit noemen we operante conditionering, een tweede vorm van
stimulus-respons-leren. Een operant is waarneembaar gedrag dat een organisme gebruikt om in zijn
omgeving te ‘opereren’, dat wil zeggen de omgeving te kunnen beïnvloeden. Als je dit boek leest om
een goed cijfer te halen voor je examen, is het lezen operant gedrag.
Je zou operante conditionering ook kunnen beschouwen als een vorm van leren waarbij de verwachte
consequenties van gedrag kunnen aanzetten tot een gedragsverandering.
Enkele veelgebruikte beloningen zijn geld, complimenten, voedsel of hoge cijfers. Ze zijn allemaal in
staat om het gedrag waarop ze volgen te versterken. Straffen als pijn, een boete of lage cijfers hebben
de neiging om het gedrag waarmee ze worden geassocieerd juist te ontmoedigen. Het concept van
operante conditionering heeft minstens twee sterke kanten. Ten eerste is operante conditionering van
toepassing op veel meer gedragstypen dan klassieke conditionering en ten tweede vormt het een
verklaring voor de manier waarop organismen nieuwe en complexe gedragingen leren, en niet
volkomen afhankelijk zijn van aangeboren reflexen.
De grondlegger van de operante conditionering, de Amerikaanse psycholoog B.F. Skinner, baseerde
zijn hele carrière op het idee dat de krachtigste invloeden op het gedrag de gevolgen zijn: datgene wat
onmiddellijk na het gedrag gebeurt. Dit was feitelijk niet door hemzelf bedacht. Het idee dat het gedrag
door beloningen en straffen wordt aangestuurd, had hij geleend van een andere Amerikaanse
psycholoog, die had aangetoond dat hongerige dieren ijverig werkten om een probleem door middel
van trial-and-error (het uitproberen en leren van fouten) op te lossen teneinde een voedselbeloning te
krijgen. Na opeenvolgende proeven verdwenen de foute reacties en werden effectieve reacties
aangeleerd. Trial-and-error= door middel van het uitproberen en leren van fouten een oplossing
vinden voor een probleem. Een begrip waarmee behavioristen het aanleren van nieuw gedrag
verklaren. Thorndike (de Amerikaanse psycholoog) noemde dit de wet van effect, = het idee dat
reacties die de gewenste resultaten produceren, worden geleerd, of dat leren wordt geleid door het
effect dat bepaald gedrag heeft. Volgens deze wet leidt gedrag van een dier tot plezierige of
onplezierige resultaten, en beïnvloeden die resultaten op hun beurt de kans dat het dier het gedrag
nogmaals zal vertonen.
De principes van operante conditionering:
In het dagelijks leven spreken we vaak over een ‘beloning’. Skinner verkoos de preciezere term
bekrachtiger. Hiermee bedoelde hij elke omstandigheid die op een respons volgt en die versterkt.
Bekrachtiger= een situatie (het aanbieden of verwijderen van een stimulus) die op een respons volgt
en die versterkt. Voor de meeste mensen zijn voedsel, seks en geld sterke bekrachtigers. Hetzelfde
geldt voor aandacht, complimenten en een glimlach. Dat zijn allemaal voorbeelden van positieve
bekrachtiging. Ze versterken een respons doordat ze na deze respons worden aangeboden en maken
het waarschijnlijker dat het gedrag zich herhaalt. Positieve bekrachtiging= het aanbieden van een
aangename stimulus na een respons, waardoor de kans dat die respons zich herhaalt toeneemt.
Er bestaat ook een andere vorm van bekrachtiging: het weghalen van een aversieve stimulus, zoals
kiespijn. Dit noemen we negatieve bekrachtiging, let wel op: negatief is hier gerelateerd aan het
verwijderen of weghalen; positief is gerelateerd aan toevoegen of aanbieden. Negatieve
bekrachtiging= het weghalen van een vervelende of aversieve stimulus na een respons, waardoor de
kans toeneemt dat die respons zich herhaalt.
Het gebruik van een paraplu als het regelt is aangeleerd gedrag dat in stand blijft door negatieve
bekrachtiging. Je gebruikt de paraplu immers om een aversieve stimulus (de regen) te vermijden.
Hetzelfde mechanisme zorgt ervoor dat de automobilist zijn gordel vastgespt: hij wil dat het irritante
piepje ophoudt. De negatieve bekrachtiging ontstaat dus door het verwijderen van het onprettige
geluid.
De timing en frequentie van bekrachtiging bepalen het effect ervan op gedrag. De meeste
universiteiten en hogescholen plannen slecht een paar keer per jaar een examenperiode, met als