Samenvatting

Samenvatting Testtheorie - Drent & Sijtsma

Name: Testtheorie - Drent & Sijtsma
SKU: doc_19602
Rating: 3.55 (11 reviews)
Author: Lotharvh

11 beoordelingen

2176 keer bekeken 90 keer verkocht

Vak
Test- en toetstheorie

Instelling
Open Universiteit (OU)

Boek
Testtheorie

Testtheorie - Drent & Sijtsma

[Meer zien]

Laatste update van het document: 11 jaar geleden

Voorbeeld 7 van de 62 pagina's

Bekijk voorbeeld

Heel boek samengevat? Ja
Geupload op 4 december 2012
Bestand laatst geupdate op 3 februari 2013
Aantal pagina's 62
Geschreven in 2011/2012
Type Samenvatting

11 beoordelingen

Door: degruns • 4 jaar geleden

overzichtelijk

Door: lhmprinsen • 4 jaar geleden

Door: ninavgelderen • 4 jaar geleden

Door: thian • 6 jaar geleden

Door: lauraroeltje • 7 jaar geleden

Door: sophiehoving • 7 jaar geleden

Door: annelotolthoff • 7 jaar geleden

Bekijk meer beoordelingen

Volgen

Lotharvh Lid sinds 12 jaar 1699 documenten verkocht

TESTTHEORIE
Inleiding in de theorie van de psychologische test en zijn toepassingen
Vierde, herziene druk

Prof. dr. P.J.D. Drenth
Prof. dr. K. Sijtsma

,1 H ISTORISCHE ONTWIKKELING VAN HET TESTEN
In de historische ontwikkeling van het testen zijn 4 perioden te onderscheiden:

1.1 PERIODE TOT HET VERSCHIJNEN VAN DE BINET-SIMON-TEST (VÓÓR 1900)

E E R ST E O N T W I K K E L I N G SL I J N – P SY C H I A T R I E ( F R A N K R I J K & D U I T S L A N D )
Philippe Pinel (1794): Hij bevrijdde gevangenen uit de strafkerkers, door te verdedigen dat deze
mensen ziek waren en niet misdadig. Hij wordt beschouwd als vader van de moderne psychiatrie.
Jean Étienne Dominique Esquirol (1838): Legde de nadruk op het onderscheid tussen krankzinnigheid
en zwakzinnigheid. Idiotie is geen ziekte, maar is een gebrek aan intellectuele vaardigheiden.
Édouard Séguin (1848): Het trainen van zwakzinnige kinderen. Met name m.b.t. motorische en
sensorische functies. De test is bekend als het Séguin Form Board, later ging deze de ‘performance
test’ heten.
Andere bekende namen: Charcot, Janet, Ribot en uiteraard Binet.

Konrad Rieger (1885): Voorstel tot algemeen toepasbare methode voor intelligentieonderzoek.
Emil Kraepelin (1885): Pogingen tot diagnose krankzinnigheid.
Hermann Ebbinghaus (1897): Meten van psychische vermoeidheid met een test waarbij onvolledige
zinnen moesten worden aangevuld.
Theodor Ziehen (1897): Voorstel om de evaluatie van de antwoorden niet reeds vooraf te verrichten,
maar deze te laten afhangen van de prestaties van de geteste personen. Zo ontstond de behoefte om
de verschillen tussen geesteszieken en de verschillende gradaties in zwakzinnigheid te bepalen.

T W E E D E O N T W I K K E L I N G SL I J N – E X P E R I M E N T E L E P SY C H O L O G I E (D U I T SL A N D )
Stimulerende invloed: De waarde die werd gehecht aan de exacte beschrijving van de experimenteer
condities, de rigoureuze controle van de variabelen en de nauwkeurige verwerking van uitkomsten.
Remmende invloed: De verschillen tussen de proefpersonen werden ervaren als vervelend i.p.v.
boeiend. Ze werden toegeschreven aan fouten i.p.v. aan werkelijke verschillen in vaardigheid tussen
de proefpersonen.

Wilhelm Wundt (1879): Experimenteel laboratorium in Leipzig. Dit was de start van het systematisch
experimentele onderzoek op grootse wijze. Obstakels:
1) Het doel van het onderzoek was de generaliseerbaarheid van de wetten, terwijl afwijkingen
werden beschouwd als experimenteerfouten.
2) Het onderzoek bleef beperkt tot de primaire sensorische en motorische functies. Hogere
complexe cognitieve processen werden buiten beschouwing gelaten.

McKeen Catell (1890): Publicatie in het artikel Mind over individuele verschillen (in reactietijd).
Vanuit de genetica ontstond de aandacht voor verschillen in prestaties tussen personen.
Francis Galton (1882): Hij was een bioloog, de neef van Darwin en deed antropometrische
onderzoeken. Interesse in de lichamelijke, sensorische en geestelijke functies. In zijn onderzoekswijze
kwamen 3 elementen voor, die alle een pijler van het wetenschappelijk testonderzoek zouden gaan
vormen:
1) De wenselijkheid van het onderzoek van individuele verschillen.
2) De noodzaak van systematisering van de onderzoekstechnieken, omdat anders de verkregen
resultaten onvergelijkbaar zijn en de conclusies niet generaliseerbaar.
3) De poging van Galton om de resultaten van zijn onderzoeken uit te drukken in termen van
afwijkingen van het gemiddelde. Het ‘normatieve’ denken en het weergeven van
onderzoeksresultaten in statistische termen bleken nieuwe dimensies te openen voor zowel de
theoretische ontwikkeling als de praktische toepassing van de test.

1

, Karl Pearson: Correlatiecoëfficiënt, rangcorrelatie, multipele correlatie, factoranalyse, etc.

1.2 PERIODE TUSSEN HET VERSCHIJNEN VAN DE BINET-SIMON-TEST EN DE EERSTE WERELDOORLOG

Alfred Binet (1904): Kreeg het verzoek om een onderzoek in te stellen naar de mogelijkheid tot
differentiatie tussen luie en incapabele kinderen.
Binet-Simon-test: 30 opgaven die een steekproef vormden uit de verschillende complexe opgaven
waarvoor het kind zich in het dagelijks leven en de schoolpraktijk gesteld zag. Het benoemen van
objecten, het aanvullen van onvolledige zinnen, het begrijpen van verhaaltjes.
Mentale leeftijd – vanaf de 2e testversie (1908): Een indicatie van de geestelijke groei.

WAAROM WAS BINETS BENADERING NIEUW?
1) Dit lag in de accentuering van complexe i.p.v. eenvoudige mentale processen. Binet richtte de
aandacht op begrip, geheugen, het oplossen van problemen en verbeeldingskracht.
2) Het empirische uitgangspunt was nieuw.
3) Binet stelde een totaalscore voor om het intelligentieniveau weer te geven.

Édouard Claparède (1924): Bouwde voort op Binet. Jean-Jacques Rousseau Instituut (1912); gewijd
aan de ontwikkeling en toepassing van tests.
William Stern (1911): Vergeleek de mentale leeftijd met de werkelijke leeftijd van het kind.
Bobertag (1911): Vertaalde de Binet-Simon-test in het Duits
Goddard (1911): Vertaalde de Binet-Simon-test in het Engels. Later bewerkt door Terman (1916) en
Burt (1921).
Lewis Terman – Stanford-Binet: Zorgde voor de Amerikaanse versies van de test.
Bij zijn eerste versie (1916) werden aan 2 belangrijke testtechnische eisen voldaan:
1) Standaardinstructies, zodat vergelijkbaarheid van testscores mogelijk werd.
2) Er werden ook normen geconstrueerd, gebaseerd op een representatieve steekproef.
Mentale leeftijd
Intelligentieniveau = × 100
Chronologische leeftijd
Test voor individueel gebruik in de VS:
Terman-Merril (Stanford-Binet) en The Wechsler-series (WAIS, WISC).

Spearman – Two-factor-theory (1904): General (g-)factor & Specific (s-)factor
Intelligentie is de gemeenschappelijke factor die men kan extraheren uit een willekeurige serie van
intelligentietests.

Educational Achievement Tests – Burt & Thorndike: Men kon achtergebleven leerlingen zodanig
herkennen en de prestaties van verschillende scholen vergelijken.

Tekortkomingen van de ontwikkelde tests in deze periode:
1) Het ontbreken van de mogelijkheid om tests groepsgewijs af te nemen
2) Validatieonderzoek

1.3 PERIODE TUSSEN DE EERSTE WERELDOORLOG TOT DE TWEEDE WERELDOORLOG

Twee belangrijke veranderingen in de psychologie door WO I:
1) Het routinematig toepassen van testpsychologie in beslissingssituaties.
2) Het toepassen van psychologie buiten laboratoriumsituaties.

WO I is in Europa de aanleiding geweest tot de erkenning van de psychologische test als een
instrument dat een positieve bijdrage kan leveren in allerlei beslissingssituaties.

2

, Army Alpha Test: Schriftelijke test voor grootschalige selectie. Rekenopgaven, denksommen, het
aangeven van woordbetekenissen.

In Europa bleef de individuele diagnostiek populair. Dit kwam door het heersende filosofische
klimaat (Gestaltpsychologie), personalisme en fenomenologie. Door dit klimaat werd de wijze
waarop de proefpersoon de taak verricht even belangrijk bevonden als de prestatie zelf. Individuele
observatietesten werden bijzonder populair.

In Amerika kwam het accent steeds sterker te liggen op kwantitatief verwerkbare groepstests. Dit
kwam door de behavioristische-positivistische achtergrond, maar vooral vanuit praktische behoefte.

Actuarische wetenschap: Houdt zich bezig met het bepalen van kansen in de context van
verzekeringsrisico’s

Door de grote toestroom van immigranten kwam er steeds meer vraag naar tests die minder
afhankelijk waren van taal en cultuur.
Knox: Had voor WO I geëxperimenteerd met opgaven die non-verbaal van aard waren en een
‘performance’ karakter hadden.
Pintner & Paterson (1917): Een volledig non-verbale intelligentietest
Army Bèta Test (1918): Kon pantomimisch worden geïnstrueerd en deed geen beroep op taalkennis
of verbale vaardigheid.

Non-verbale tests waren belangrijk bij vergelijkend onderzoek tussen bevolkingsgroepen. Met name
die tussen de ontwikkelingsgebieden en de westerse cultuur. Deze tests kregen een meer specifiek
toepassingsterrein in het intelligentieonderzoek van gehandicapten (motorisch / perceptueel
gestoorden). De betrouwbaarheid was echter wel geringer.
De individuele test werd in de VS niet verdrongen door de schriftelijke test, hij was enkel minder
belangrijk, maar het aantal individuele tests overtrof dik het aantal in Europa.

Engeland nam een tussenpositie in. Er was veel aandacht voor objectieve evaluatie van
schoolprestaties, in tegenstelling tot andere Europese landen. Het ‘vrije antwoorden examen’ werd
vervangen door de Multiple Choice test.

Thurstone (1931): Stimuleerde de aandacht voor kritische evaluatie van de test zelf.
- Criteriumgedrag: gedrag buiten de testsituatie
- Verbal comprehension, word fluency, number facility, spacial visualization, associative
memory, perceptual speed en reasoning.

Thurstone, Guilford, Thomson, Holzinger & Harman: Intelligentie als een complex geheel van
groepsfactoren.

Drie afzonderlijke methoden kunnen m.b.t. het testen van persoonlijkheid worden onderscheiden:
1) Observatie (West-Europa). Bedoeld om inzicht te geven in kwalitatieve aspecten van de prestatie.
Persoonlijkheidsbeelden ontstonden langs de intuïtieve weg. De observatieproef was nauwelijks
gestandaardiseerd/objectief/betrouwbaar.
2) Persoonlijkheidsvragenlijsten. In feite op schrift gestelde psychiatrische interviews.
3) Projectietests. Vrije associatie d.m.v. een gegeven stimulus. Vooral gebruikt ter identificatie van
onbewuste motieven/behoeften. Sterk beïnvloed door de psychoanalyse. Er werd een sterke nadruk
gelegd op de inleving in de proefpersoon.
a. Rorschach (1921) – Inktvlekkentest
b. Morgan & Murray (1935) - Thematic Apperception Test [TAT] – Interpretatie van
afbeeldingen van situaties.

3

, 1.4 VAN HET BEGIN VAN DE T WEEDE WERELDOORLOG TOT HEDEN

O N T W I K K E L I N GE N I N D E V E R E N I GD E S T A T E N
Twee algemene tendensen in de testontwikkeling:
1) Het aantal beschikbare tests steeg enorm.
2) Er vond een kritische bezinning plaats op de methodologische grondslagen van het testgebruik.

Education Act (1944): Introductie van een meer formele toelatingspolitiek voor de verschillende
scholen voor vervolgonderwijs.
Army General Classification Test (AGCT): Intelligentietest, voor selectiedoeleinden.
Differentiële testbatterijen: Voor het bepalen van de structuur van vaardigheden.
Schoolvorderingentests: Vergelijkingen maken met resultaten van vooropleidingen
Opleiding- en kennistests: Voorspellen van toekomstige prestaties en evalueren van
opleidingsprogramma’s.
Individuele/groepsobservaties: Toegepast bij de samenstelling van bemanningen, bepaling
leiderschapskwaliteiten en psychiatrische keuring.
Persoonlijkheid/Biografische vragenlijst: Ter identificatie van psychiatrische patiënten en voor de
selectie van bepaalde functies (bv stressbestendigheid).

Drie aspecten waarin de belangstelling voor de testtheorie naar voren komt:
- Het oprichten van testinstituten, zoals; Educational Testing Service (1947) [ETS]: Tegemoetkomen
aan de behoeften van het Amerikaanse onderwijs- en opleidingsveld wat betreft de toelating tot en
de evaluatie van het onderwijs. Het is een non-profitorganisatie met psychologen,
onderwijskundigen, statistici en psychometrici. Belangrijk is dat er ruimte wordt overgelaten voor
fundamenteel psychometrisch onderzoek.
- Toename van communicatie m.b.t. tests en testonderzoek (tijdschriften).
- Het verschijnen van talrijke handboeken over testgebruik.

Generaliseerbaarheidstheorie: Cronbach, Gleser, Nanda & Rajaratnam (1972) en Brennan (2001).
Vraagonzuiverheid: Holland & Wainer (1993).
Rasch-model: Fischer & Molenaar (2002).
Non-parametrische testtheorie: Mokken (1971) en Sijtsma & Molenaar (2002).
Equivaleren: Kolen & Brennan.
Adaptief testen: Wainer (1990) en Van der Linden & Glas (2000).
Educational Measurement - Lindquist (1951), Cronbach (1964), Aiken (1971), Thorndike (1971) en
Nunnaly (1972): Test- en meettheorie.
Schooltoetsconstructie - Adkins (1961) en Ebel (1965): Vooral praktijkgericht.
Schaal- en beoordelingsmodellen - Torgerson (1958) en Coombs (1964): Het meten van voorkeuren
voor bepaalde stimuli via ontvouwings- en preferentiemodellen.
Scalogramanalyse – Guttman (1950): Het meten van attitudes.

O N T W I K K E L I N GE N I N E U R O P A , V O O R A L I N N E D E R L A N D
De ontwikkeling van de testtheorie in Nederland werd in de jaren 40 en 50 geremd door:
1) De oriëntatie van de psychologie op de intuïtie van de psycholoog.
2) Het ‘verstehen’.
3) De ontmoeting met de cliënt.

Kouwer en De Groot hadden volgens het algemene model voor psychologische
wetenschapsbeoefening in de jaren 50 grote invloed op het testgebruik in Nederland.

Vanaf de jaren 60 heeft de psychologische test definitief een wetenschappelijk verantwoorde plaats
veroverd in Nederland.

4

,2 D EFINITIE , KENMERKEN EN TOEPASSINGEN VAN DE TEST
2.1 WAT IS EEN TEST?

2.1.1 ONDERDELEN VAN EEN TEST
Testmateriaal: Dit varieert sterk met de soort van de test.
Testformulieren: Hier worden de antwoorden/reacties/gegevens verzameld waaruit conclusies
kunnen worden afgeleid.
Testhandleiding
o Een exacte testinstructie: Alles wat betrekking heeft op de gang van zaken tijdens het onderzoek.
o De verwerkingsprocedure: Richtlijnen voor toekenning van scores aan de antwoorden/reacties.
o De normtabellen: De vergelijking van prestaties met andere representatieve groepen.
o Wetenschappelijke kwaliteiten: De betrouwbaarheid en de betekenis van de test.

2.1.2 EERSTE OMSCHRIJVING
De bedoeling van testonderzoek is het doen van een uitspraak die een voorspelling, classificatie of
beschrijving m.b.t. het onderzochte individu behelst. Impliciet gaat het daarbij altijd om een
vergelijking met andere mensen.
Psychologische test: Een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde
vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
onderzochte in vergelijking met anderen.

2.1.3 KENMERKEN VAN EEN TEST
Indien de psychologische test een juister beeld oplevert dan het voorwetenschappelijk oordeel, of
een verbetering en aanvulling hierop kan betekenen en de kosten of ethische bezwaren niet
onoverkomelijk zijn, is het gebruik ervan gerechtvaardigd.

Met de volgende 6 kenmerken is een goede test in de meeste gevallen in het voordeel ten opzichte
van het voorwetenschappelijk oordeel:

EFFICIËNTIE
De schatting van intelligentie die voortkomt uit bijvoorbeeld cryptogrammen, prestaties op school,
etc, zijn inexact en arbitrair. De intelligentietest is speciaal gemaakt om intelligentie te meten.

STANDAARDISATIE
Door standaardisatie van de afname van de test worden min of meer de condities en invloeden op de
testresultaten (bij verschillende personen en verschillende tijdstippen van afname) gelijkgeschakeld,
waardoor de onderlinge vergelijkbaarheid van de testprestaties wordt verwezenlijkt.

NORMERING
In het normeringonderzoek wordt op zijn minst een rangorde vastgesteld van zeer slechte tot zeer
goede prestaties op de test. De testscore van de onderzochte persoon kan met deze rangorde
worden vergeleken en de hoogte van de bepaalde testscore kan worden geëvalueerd.
De benadering met een normaalverdeling doet men doorgaans als de steekproef uit een normaal
verdeelde populatie afkomstig is, en men de steekproeffouten wil ‘gladstrijken’. Het kiezen van
nieuwe verdelingskenmerken (gemiddelde, spreiding), doet men om een ‘handige’ schaal te krijgen.
Men kan volstaan met een ongenormeerde test in bijvoorbeeld experimenteel onderzoek, of bij
situaties waarin slechts binnen de onderzochte groep beslissingen moeten worden genomen.
De beschikbaarheid van normen is nodig bij alle soorten tests, ook bij observatie- en projectietests.

5

, OBJECTIVITEIT
Objectiviteit van de testinterpretatie houdt in dat de interpretatie onafhankelijk is van de persoon
die de test afneemt. Deze opvatting heeft twee gevolgen:
1) Bij objectief testonderzoek moet het niet uitmaken wie de beoordelaar is.
2) Objectiviteit impliceert openheid en reproduceerbaarheid van de test- en evaluatieprocedure.
Objectiviteit wordt omschreven in termen van het intersubjectiviteitprincipe. Hiermee is de mate van
objectiviteit te bepalen.
Onafhankelijkheid van de beoordelaars betekent dat zij niet overleggen of zelfs maar weet hebben
van elkaars oordelen. De mate van overeenstemming van de resultaten is uit te drukken in de
interbeoordelaarsbetrouwbaarheid. Indien twee onafhankelijke beoordelaars beiden een rangorde
produceren kan de interbeoordelaarsbetrouwbaarheid worden uitgedrukt in een rangcorrelatie
(Spearman of Kendall).
Indien de beoordelingen niet alleen een rangorde vormen, maar de afstanden tussen de plaatsen in
die rangorde betekenis hebben, kan de product-momentcorrelatie de mate van overeenstemming
uitdrukken.

De mate van overeenstemming tussen twee beoordelaars: Po - Pt
Po − Pt

=
I − Pt

Bij observatie- en projectietests neemt de objectiviteit af naarmate men zich verder verwijdert van
het descriptieniveau.
Er is bij echt objectieve verwerking van testgegevens geen mogelijkheid dat andere belangen een
interfererende rol spelen.

BETROUWBAARHEID
Als twee verschillende testmetingen bij dezelfde persoon bijzonder weinig verschillen, dan wordt de
test als betrouwbaar betiteld.
Door de rangordes met elkaar te vergelijken en bijvoorbeeld uit te drukken in een rangcorrelatie,
beschikken we tevens over een kwantitatieve maat voor deze betrouwbaarheid.

VALIDITEIT
De mate waarin een test meet, wat hij zou moeten meten.
Het praktisch voorspellend gebruik van een test moet altijd gebaseerd zijn op empirisch onderzoek,
waarin een veronderstelde samenhang is aangetoond.

2.2 METEN VAN EIGENSCHAPPEN DOOR MIDDEL VAN TESTS
In het spraakgebruik, zowel binnen als buiten de psychologie, worden de termen ‘meten’ en ‘testen’
vaak door elkaar gebruikt.

2.2.1 MEETNIVEAUS EN TOEGESTANE OPERATIES
Volgens Stevens (1951) is er sprake van meten zodra getallen volgens een consistente procedure aan
objecten worden toegekend. Dit leidt tot vier bekende meetniveaus:

NOMINALE SCHAAL
Het meten betreft hier het categoriseren en het geven van namen. Er zijn weinig berekeningen
mogelijk, Cohens Kappa kan wel.

ORDINALE SCHAAL
Deze schaal wordt gekenmerkt door het begrip rangorde. Er is altijd sprake van meer of minder.
Getallen worden hier wederom gebruikt om te categoriseren. En er zijn wederom weinig
berekeningen mogelijk, rangcorrelatie kan wel berekend worden.

6

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Lotharvh. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €3,98. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 66579 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen

Samenvatting

Samenvatting Testtheorie - Drent & Sijtsma

Document informatie

Onderwerpen

Gekoppeld boek

Meer samenvattingen voor studieboek

Geschreven voor

11 beoordelingen

Verkoper

Ontvangen beoordelingen

Voorbeeld van de inhoud

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Snel en makkelijk kopen

Focus op de essentie

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?