Samenvatting testtheorie (hfst 1 t/m 5) van reader van Psychologie als Wetenschap (PAW)
64 views 10 purchases
Course
Psychologie Als Wetenschap
Institution
Universiteit Utrecht (UU)
Dit is een uitgebreide, van afbeeldingen voorziene samenvatting van de reader die bestudeerd moet worden voor het eindtentamen van PAW (Psychologie als Wetenschap, een vak dat gegeven wordt aan eerstejaars psychologie studenten aan de UU). Het bevat alle stof (hfst 1 t/m 5) waaronder: Klassieke tes...
H1. Klassieke testtheorie
De klassieke testtheorie is een theorie waarin de feilbaarheid van testscores centraal staat. Deze
theorie gaat er vanuit dat testscores niet alleen een afspiegeling zijn van datgene wat men probeert te
meten, maar ook van allerlei andere, niet bedoelde, factoren. Met andere woorden, als men een test
afneemt maakt men fouten in de meting. Men maakt onderscheid tussen twee soorten meetfouten:
1. de toevallige, onsystematische meetfout
fouten die niet met de test samenhangen, maar toevallig optreden. Ook wel random meetfout
genoemd. Hoe minder toevallige meetfouten er worden gemaakt, hoe hoger de
betrouwbaarheid van een test is. Of te wel, de betrouwbaarheid van een meting zegt iets over
de herhaalbaarheid van de test.
2. de systematische meetfout.
fouten die gerelateerd zijn aan de test. Elke keer als de test wordt afgenomen treden
dezelfde fouten weer op. Hoe minder systematische meetfouten er worden gemaakt, hoe
hoger de validiteit van de test is. Of te wel, hoe beter men datgene meet wat men ook wilde
meten. De systematische meetfout heeft geen invloed op de betrouwbaarheid van een
testscore. Anderzijds impliceert een lage betrouwbaarheid wel een lage validiteit.
de letter T (van True score) en het toevallige deel met de letter E (van Error). Het model voor
testscores (X) van de klassieke testtheorie ziet er dan als volgt uit:
X=T+E
Betrouwbaarheid
De betrouwbaarheid van een test zegt iets over de mate waarin er toevallige meetfouten van invloed
zijn op testscores en daarmee over de herhaalbaarheid van de testscores. Aangezien de toevallige
meetfout bij verschillende afnamen van een test bij dezelfde persoon onafhankelijk van elkaar zijn en
dus soms positief en soms negatief uitvallen, heffen ze elkaar bij een groot aantal metingen op. Aldus
zal de gemiddelde testscore gelijk zijn aan de ware score van de respondent. De afwijking van een
bepaalde testscore van dit gemiddelde is de toevallige meetfout. Hoe meer de testscores van
verschillende metingen bij dezelfde persoon van elkaar verschillen, hoe groter de toevallige
meetfouten en hoe lager de betrouwbaarheid.
De verdeling van de toevallige meetfouten heeft een standaardafwijking die gelijk is aan de
standaardafwijking van de geobserveerde scores. Deze standaardafwijking wordt de
standaardmeetfout (standard error of measurement) genoemd. De standaardmeetfout (SE) is een
maat voor de nauwkeurigheid van de meting. Hoe kleiner de standaardmeetfout hoe nauwkeuriger
men de ware score kan schatten.
Voor de populatie geldt:
In woorden betekent dit dat de betrouwbaarheid van een test gelijk is aan dat gedeelte van de totale
variantie van de testscores in de populatie dat door systematische invloeden is veroorzaakt. Het is het
aandeel van de ware score variantie van de testvariantie.
,Aangezien we in de praktijk alleen beschikken over de geobserveerde scores bij een groep
respondenten en nooit over de tweedeling in een systematisch en een toevallig deel, kunnen we de
betrouwbaarheid nooit precies bepalen.
De standaardmeetfout (SE) van een testscore is een maat voor de nauwkeurigheid van de meting van
het te meten begrip, belangrijk in de diagnostiek.
Schatting van betrouwbaarheid bij twee testafnames
1. Test-hertest methode
Omdat toevallige meetfout nergens mee correleert, geeft een
correlatiecoëfficiënt de samenhang aan tussen de
systematische delen van de testscores van de twee afnamen.
Hoe meer toevallige meetfouten er worden gemaakt, hoe
zwakker de correlatie en hoe lager de betrouwbaarheid.
In woorden betekent deze definitie dat de test-hertestbetrouwbaarheid, gedefinieerd als dat
gedeelte van de totale variantie dat door systematische invloeden wordt veroorzaakt, geschat
wordt met de correlatie tussen de testscores X en de hertestscores X'. De berekende
correlatie noemen we ook wel de stabiliteitscoëfficiënt of test-hertestcoëfficiënt. Een
probleem bij de schatting van de test-hertestbetrouwbaarheid is dat de eerste
meting niet van invloed mag zijn op de resultaten van de tweede meting. Dit is
praktisch onmogelijk (te snelle hertest? onthouden antwoorden, te lang na test? →
andere antwoorden).
2. parallelle methode
Tests die precies dezelfde inhoud dekken, maar uit verschillende testvragen (items) bestaan.
Voor parallelle tests geldt dat de items gelijkwaardig zijn, maar niet identiek. De twee tests
zijn dan inwisselbaar. Lost het tijdsprobleem bij test-hertest op. De betrouwbaarheid kan, net
als bij de test-hertestmethode, geschat worden door de correlatie tussen de testscore X en de
parallelle testscore X' te berekenen. Als de ene test een hoger gemiddelde heeft dan de
andere test zijn het niet strikt
parallelle tests (vaak een
onderschatting vd
betrouwbaarheid) De
berekende correlatie noemen
we ook wel de
equivalentiecoëfficiënt.
Schatting van betrouwbaarheid bij een testafname
1. Split-halfmethode
Bij de split-halfmethode wordt er eenmalig een test afgenomen bij alle respondenten, maar
voor de schatting van de betrouwbaarheid wordt de test in twee zoveel mogelijk op elkaar
gelijkende delen gesplitst. Tussen deze twee delen wordt dan de correlatie berekend waarbij
er gecorrigeerd wordt voor de testlengte. De verschillen tussen de beide testdelen moeten
geheel te wijten zijn aan toevallige meetfouten. Omdat de test vaak korter wordt gemaakt,
krijg je met deze methode vaak een onderschatting van de betrouwbaarheid.
, 2. Schatting van de betrouwbaarheid met Cronbach’s alfa
Cronbachs alfa is een schatting van de betrouwbaarheid die is gebaseerd op de interne
consistentie van de test. Met de interne consistentie van een test wordt de samenhang tussen
de items van een test bedoeld.
Als de items uit een test positief met elkaar
samenhangen (covariëren), verkrijgt men een hoge
Cronbachs alfa. Criteria voor de beoordeling van de
betrouwbaarheid staan in je schrift.
3. Schatting betrouwbaarheid bij dichotome items
Dichotome items kom je veel tegen bij tests die
kennis beogen meten. De voorgelegde vragen
worden dan met goed of fout beoordeeld of zijn
meerkeuze. Je gebruikt dan de KR-20. Het product
pg qg is de variantie van een dichotome itemscore
met de waarden 1 (= goed antwoord) en 0 (= foutief
antwoord). Zie voorbeelden in reader.
Invloeden op de betrouwbaarheid
Een drietal factoren, welke van invloed zijn op de betrouwbaarheid van een test, maar niet
samenhangen met de inhoud van de vragen:
1. Lengte van de test
2. Samenstelling van de respondenten
3. Tijdsduur waarbinnen de test moet worden ingevuld.
Hoe langer de test, hoe meer de betrouwbaarheid toe zal nemen. De invloed van de testverlenging
kan worden bepaald met de Spearman-Brownformule voor testverlenging en de verlengingsfactor v:
Samenstelling van de respondenten
Je kunt afleiden dat hoe meer heterogeen de groep met betrekking tot het kenmerk dat men wil
meten, hoe hoger de betrouwbaarheidschatting. Er is in een heterogene groep immers veel variantie
in de ware scores en dan is het aandeel van de variantie van de toevallige meetfout relatief klein.
Neemt men dezelfde test af bij een homogenere groep respondenten, dan blijft de variantie van de
toevallige meetfout hetzelfde. De variantie in ware scores neemt dan af en daarom is het aandeel van
de ware scores in de totale testvariantie kleiner en daaruit volgt dat de betrouwbaarheidschatting
lager zal zijn.
Tijdsduur
Als men de test-hertestmethode gebruikt voor een betrouwbaarheidsschatting dan is het gevolg van
de ontbrekende antwoorden (waaraan voor die respondenten dezelfde score wordt toegekend) een te
hoge correlatie tussen de vragen waaraan sommige respondenten niet zijn toegekomen. De
betrouwbaarheid van de hele test wordt dan overschat. Als respondenten de vragen waar men niet
aan toe komt willekeurig invullen (gokken) dan leidt dit tot een onderschatting van de
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Lisavankeulen1. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.86. You're not tied to anything after your purchase.