Summary

Samenvatting Testtheorie - Drent & Sijtsma

Name: Testtheorie - Drent & Sijtsma
SKU: doc_19602
Rating: 3.55 (11 reviews)
Author: Lotharvh

11 reviews

2176 views 90 purchases

Course
Test- en toetstheorie

Institution
Open Universiteit (OU)

Book
Testtheorie

Testtheorie - Drent & Sijtsma

[Show more]

Last document update: 11 year ago

Preview 7 out of 62 pages

View example

Summarized whole book? Yes
Uploaded on December 4, 2012
File latest updated on February 3, 2013
Number of pages 62
Written in 2011/2012
Type Summary

testtheorie
toetstheorie
test
toets
drenth
sijtsma
psychologie

Book Title:Testtheorie

Author(s):P.J.D. Drenth, K. Sijtsma

Edition:juli 2012
ISBN:9789031347476
Edition:4

Institution
Open Universiteit (OU)
Education
Psychologie
Course
Test- en toetstheorie

11 reviews

By: degruns • 4 year ago

Translated by Google

uncluttered

By: lhmprinsen • 4 year ago

By: ninavgelderen • 4 year ago

By: thian • 6 year ago

By: lauraroeltje • 7 year ago

By: sophiehoving • 7 year ago

By: annelotolthoff • 7 year ago

Show more reviews

Lotharvh

Member since 12 year 1699 documents sold

$4.30

Added

Add to cart

Add to wishlist

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

TESTTHEORIE
Inleiding in de theorie van de psychologische test en zijn toepassingen
Vierde, herziene druk

Prof. dr. P.J.D. Drenth
Prof. dr. K. Sijtsma

,1 H ISTORISCHE ONTWIKKELING VAN HET TESTEN
In de historische ontwikkeling van het testen zijn 4 perioden te onderscheiden:

1.1 PERIODE TOT HET VERSCHIJNEN VAN DE BINET-SIMON-TEST (VÓÓR 1900)

E E R ST E O N T W I K K E L I N G SL I J N – P SY C H I A T R I E ( F R A N K R I J K & D U I T S L A N D )
Philippe Pinel (1794): Hij bevrijdde gevangenen uit de strafkerkers, door te verdedigen dat deze
mensen ziek waren en niet misdadig. Hij wordt beschouwd als vader van de moderne psychiatrie.
Jean Étienne Dominique Esquirol (1838): Legde de nadruk op het onderscheid tussen krankzinnigheid
en zwakzinnigheid. Idiotie is geen ziekte, maar is een gebrek aan intellectuele vaardigheiden.
Édouard Séguin (1848): Het trainen van zwakzinnige kinderen. Met name m.b.t. motorische en
sensorische functies. De test is bekend als het Séguin Form Board, later ging deze de ‘performance
test’ heten.
Andere bekende namen: Charcot, Janet, Ribot en uiteraard Binet.

Konrad Rieger (1885): Voorstel tot algemeen toepasbare methode voor intelligentieonderzoek.
Emil Kraepelin (1885): Pogingen tot diagnose krankzinnigheid.
Hermann Ebbinghaus (1897): Meten van psychische vermoeidheid met een test waarbij onvolledige
zinnen moesten worden aangevuld.
Theodor Ziehen (1897): Voorstel om de evaluatie van de antwoorden niet reeds vooraf te verrichten,
maar deze te laten afhangen van de prestaties van de geteste personen. Zo ontstond de behoefte om
de verschillen tussen geesteszieken en de verschillende gradaties in zwakzinnigheid te bepalen.

T W E E D E O N T W I K K E L I N G SL I J N – E X P E R I M E N T E L E P SY C H O L O G I E (D U I T SL A N D )
Stimulerende invloed: De waarde die werd gehecht aan de exacte beschrijving van de experimenteer
condities, de rigoureuze controle van de variabelen en de nauwkeurige verwerking van uitkomsten.
Remmende invloed: De verschillen tussen de proefpersonen werden ervaren als vervelend i.p.v.
boeiend. Ze werden toegeschreven aan fouten i.p.v. aan werkelijke verschillen in vaardigheid tussen
de proefpersonen.

Wilhelm Wundt (1879): Experimenteel laboratorium in Leipzig. Dit was de start van het systematisch
experimentele onderzoek op grootse wijze. Obstakels:
1) Het doel van het onderzoek was de generaliseerbaarheid van de wetten, terwijl afwijkingen
werden beschouwd als experimenteerfouten.
2) Het onderzoek bleef beperkt tot de primaire sensorische en motorische functies. Hogere
complexe cognitieve processen werden buiten beschouwing gelaten.

McKeen Catell (1890): Publicatie in het artikel Mind over individuele verschillen (in reactietijd).
Vanuit de genetica ontstond de aandacht voor verschillen in prestaties tussen personen.
Francis Galton (1882): Hij was een bioloog, de neef van Darwin en deed antropometrische
onderzoeken. Interesse in de lichamelijke, sensorische en geestelijke functies. In zijn onderzoekswijze
kwamen 3 elementen voor, die alle een pijler van het wetenschappelijk testonderzoek zouden gaan
vormen:
1) De wenselijkheid van het onderzoek van individuele verschillen.
2) De noodzaak van systematisering van de onderzoekstechnieken, omdat anders de verkregen
resultaten onvergelijkbaar zijn en de conclusies niet generaliseerbaar.
3) De poging van Galton om de resultaten van zijn onderzoeken uit te drukken in termen van
afwijkingen van het gemiddelde. Het ‘normatieve’ denken en het weergeven van
onderzoeksresultaten in statistische termen bleken nieuwe dimensies te openen voor zowel de
theoretische ontwikkeling als de praktische toepassing van de test.

1

, Karl Pearson: Correlatiecoëfficiënt, rangcorrelatie, multipele correlatie, factoranalyse, etc.

1.2 PERIODE TUSSEN HET VERSCHIJNEN VAN DE BINET-SIMON-TEST EN DE EERSTE WERELDOORLOG

Alfred Binet (1904): Kreeg het verzoek om een onderzoek in te stellen naar de mogelijkheid tot
differentiatie tussen luie en incapabele kinderen.
Binet-Simon-test: 30 opgaven die een steekproef vormden uit de verschillende complexe opgaven
waarvoor het kind zich in het dagelijks leven en de schoolpraktijk gesteld zag. Het benoemen van
objecten, het aanvullen van onvolledige zinnen, het begrijpen van verhaaltjes.
Mentale leeftijd – vanaf de 2e testversie (1908): Een indicatie van de geestelijke groei.

WAAROM WAS BINETS BENADERING NIEUW?
1) Dit lag in de accentuering van complexe i.p.v. eenvoudige mentale processen. Binet richtte de
aandacht op begrip, geheugen, het oplossen van problemen en verbeeldingskracht.
2) Het empirische uitgangspunt was nieuw.
3) Binet stelde een totaalscore voor om het intelligentieniveau weer te geven.

Édouard Claparède (1924): Bouwde voort op Binet. Jean-Jacques Rousseau Instituut (1912); gewijd
aan de ontwikkeling en toepassing van tests.
William Stern (1911): Vergeleek de mentale leeftijd met de werkelijke leeftijd van het kind.
Bobertag (1911): Vertaalde de Binet-Simon-test in het Duits
Goddard (1911): Vertaalde de Binet-Simon-test in het Engels. Later bewerkt door Terman (1916) en
Burt (1921).
Lewis Terman – Stanford-Binet: Zorgde voor de Amerikaanse versies van de test.
Bij zijn eerste versie (1916) werden aan 2 belangrijke testtechnische eisen voldaan:
1) Standaardinstructies, zodat vergelijkbaarheid van testscores mogelijk werd.
2) Er werden ook normen geconstrueerd, gebaseerd op een representatieve steekproef.
Mentale leeftijd
Intelligentieniveau = × 100
Chronologische leeftijd
Test voor individueel gebruik in de VS:
Terman-Merril (Stanford-Binet) en The Wechsler-series (WAIS, WISC).

Spearman – Two-factor-theory (1904): General (g-)factor & Specific (s-)factor
Intelligentie is de gemeenschappelijke factor die men kan extraheren uit een willekeurige serie van
intelligentietests.

Educational Achievement Tests – Burt & Thorndike: Men kon achtergebleven leerlingen zodanig
herkennen en de prestaties van verschillende scholen vergelijken.

Tekortkomingen van de ontwikkelde tests in deze periode:
1) Het ontbreken van de mogelijkheid om tests groepsgewijs af te nemen
2) Validatieonderzoek

1.3 PERIODE TUSSEN DE EERSTE WERELDOORLOG TOT DE TWEEDE WERELDOORLOG

Twee belangrijke veranderingen in de psychologie door WO I:
1) Het routinematig toepassen van testpsychologie in beslissingssituaties.
2) Het toepassen van psychologie buiten laboratoriumsituaties.

WO I is in Europa de aanleiding geweest tot de erkenning van de psychologische test als een
instrument dat een positieve bijdrage kan leveren in allerlei beslissingssituaties.

2

, Army Alpha Test: Schriftelijke test voor grootschalige selectie. Rekenopgaven, denksommen, het
aangeven van woordbetekenissen.

In Europa bleef de individuele diagnostiek populair. Dit kwam door het heersende filosofische
klimaat (Gestaltpsychologie), personalisme en fenomenologie. Door dit klimaat werd de wijze
waarop de proefpersoon de taak verricht even belangrijk bevonden als de prestatie zelf. Individuele
observatietesten werden bijzonder populair.

In Amerika kwam het accent steeds sterker te liggen op kwantitatief verwerkbare groepstests. Dit
kwam door de behavioristische-positivistische achtergrond, maar vooral vanuit praktische behoefte.

Actuarische wetenschap: Houdt zich bezig met het bepalen van kansen in de context van
verzekeringsrisico’s

Door de grote toestroom van immigranten kwam er steeds meer vraag naar tests die minder
afhankelijk waren van taal en cultuur.
Knox: Had voor WO I geëxperimenteerd met opgaven die non-verbaal van aard waren en een
‘performance’ karakter hadden.
Pintner & Paterson (1917): Een volledig non-verbale intelligentietest
Army Bèta Test (1918): Kon pantomimisch worden geïnstrueerd en deed geen beroep op taalkennis
of verbale vaardigheid.

Non-verbale tests waren belangrijk bij vergelijkend onderzoek tussen bevolkingsgroepen. Met name
die tussen de ontwikkelingsgebieden en de westerse cultuur. Deze tests kregen een meer specifiek
toepassingsterrein in het intelligentieonderzoek van gehandicapten (motorisch / perceptueel
gestoorden). De betrouwbaarheid was echter wel geringer.
De individuele test werd in de VS niet verdrongen door de schriftelijke test, hij was enkel minder
belangrijk, maar het aantal individuele tests overtrof dik het aantal in Europa.

Engeland nam een tussenpositie in. Er was veel aandacht voor objectieve evaluatie van
schoolprestaties, in tegenstelling tot andere Europese landen. Het ‘vrije antwoorden examen’ werd
vervangen door de Multiple Choice test.

Thurstone (1931): Stimuleerde de aandacht voor kritische evaluatie van de test zelf.
- Criteriumgedrag: gedrag buiten de testsituatie
- Verbal comprehension, word fluency, number facility, spacial visualization, associative
memory, perceptual speed en reasoning.

Thurstone, Guilford, Thomson, Holzinger & Harman: Intelligentie als een complex geheel van
groepsfactoren.

Drie afzonderlijke methoden kunnen m.b.t. het testen van persoonlijkheid worden onderscheiden:
1) Observatie (West-Europa). Bedoeld om inzicht te geven in kwalitatieve aspecten van de prestatie.
Persoonlijkheidsbeelden ontstonden langs de intuïtieve weg. De observatieproef was nauwelijks
gestandaardiseerd/objectief/betrouwbaar.
2) Persoonlijkheidsvragenlijsten. In feite op schrift gestelde psychiatrische interviews.
3) Projectietests. Vrije associatie d.m.v. een gegeven stimulus. Vooral gebruikt ter identificatie van
onbewuste motieven/behoeften. Sterk beïnvloed door de psychoanalyse. Er werd een sterke nadruk
gelegd op de inleving in de proefpersoon.
a. Rorschach (1921) – Inktvlekkentest
b. Morgan & Murray (1935) - Thematic Apperception Test [TAT] – Interpretatie van
afbeeldingen van situaties.

3

, 1.4 VAN HET BEGIN VAN DE T WEEDE WERELDOORLOG TOT HEDEN

O N T W I K K E L I N GE N I N D E V E R E N I GD E S T A T E N
Twee algemene tendensen in de testontwikkeling:
1) Het aantal beschikbare tests steeg enorm.
2) Er vond een kritische bezinning plaats op de methodologische grondslagen van het testgebruik.

Education Act (1944): Introductie van een meer formele toelatingspolitiek voor de verschillende
scholen voor vervolgonderwijs.
Army General Classification Test (AGCT): Intelligentietest, voor selectiedoeleinden.
Differentiële testbatterijen: Voor het bepalen van de structuur van vaardigheden.
Schoolvorderingentests: Vergelijkingen maken met resultaten van vooropleidingen
Opleiding- en kennistests: Voorspellen van toekomstige prestaties en evalueren van
opleidingsprogramma’s.
Individuele/groepsobservaties: Toegepast bij de samenstelling van bemanningen, bepaling
leiderschapskwaliteiten en psychiatrische keuring.
Persoonlijkheid/Biografische vragenlijst: Ter identificatie van psychiatrische patiënten en voor de
selectie van bepaalde functies (bv stressbestendigheid).

Drie aspecten waarin de belangstelling voor de testtheorie naar voren komt:
- Het oprichten van testinstituten, zoals; Educational Testing Service (1947) [ETS]: Tegemoetkomen
aan de behoeften van het Amerikaanse onderwijs- en opleidingsveld wat betreft de toelating tot en
de evaluatie van het onderwijs. Het is een non-profitorganisatie met psychologen,
onderwijskundigen, statistici en psychometrici. Belangrijk is dat er ruimte wordt overgelaten voor
fundamenteel psychometrisch onderzoek.
- Toename van communicatie m.b.t. tests en testonderzoek (tijdschriften).
- Het verschijnen van talrijke handboeken over testgebruik.

Generaliseerbaarheidstheorie: Cronbach, Gleser, Nanda & Rajaratnam (1972) en Brennan (2001).
Vraagonzuiverheid: Holland & Wainer (1993).
Rasch-model: Fischer & Molenaar (2002).
Non-parametrische testtheorie: Mokken (1971) en Sijtsma & Molenaar (2002).
Equivaleren: Kolen & Brennan.
Adaptief testen: Wainer (1990) en Van der Linden & Glas (2000).
Educational Measurement - Lindquist (1951), Cronbach (1964), Aiken (1971), Thorndike (1971) en
Nunnaly (1972): Test- en meettheorie.
Schooltoetsconstructie - Adkins (1961) en Ebel (1965): Vooral praktijkgericht.
Schaal- en beoordelingsmodellen - Torgerson (1958) en Coombs (1964): Het meten van voorkeuren
voor bepaalde stimuli via ontvouwings- en preferentiemodellen.
Scalogramanalyse – Guttman (1950): Het meten van attitudes.

O N T W I K K E L I N GE N I N E U R O P A , V O O R A L I N N E D E R L A N D
De ontwikkeling van de testtheorie in Nederland werd in de jaren 40 en 50 geremd door:
1) De oriëntatie van de psychologie op de intuïtie van de psycholoog.
2) Het ‘verstehen’.
3) De ontmoeting met de cliënt.

Kouwer en De Groot hadden volgens het algemene model voor psychologische
wetenschapsbeoefening in de jaren 50 grote invloed op het testgebruik in Nederland.

Vanaf de jaren 60 heeft de psychologische test definitief een wetenschappelijk verantwoorde plaats
veroverd in Nederland.

4

,2 D EFINITIE , KENMERKEN EN TOEPASSINGEN VAN DE TEST
2.1 WAT IS EEN TEST?

2.1.1 ONDERDELEN VAN EEN TEST
Testmateriaal: Dit varieert sterk met de soort van de test.
Testformulieren: Hier worden de antwoorden/reacties/gegevens verzameld waaruit conclusies
kunnen worden afgeleid.
Testhandleiding
o Een exacte testinstructie: Alles wat betrekking heeft op de gang van zaken tijdens het onderzoek.
o De verwerkingsprocedure: Richtlijnen voor toekenning van scores aan de antwoorden/reacties.
o De normtabellen: De vergelijking van prestaties met andere representatieve groepen.
o Wetenschappelijke kwaliteiten: De betrouwbaarheid en de betekenis van de test.

2.1.2 EERSTE OMSCHRIJVING
De bedoeling van testonderzoek is het doen van een uitspraak die een voorspelling, classificatie of
beschrijving m.b.t. het onderzochte individu behelst. Impliciet gaat het daarbij altijd om een
vergelijking met andere mensen.
Psychologische test: Een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde
vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
onderzochte in vergelijking met anderen.

2.1.3 KENMERKEN VAN EEN TEST
Indien de psychologische test een juister beeld oplevert dan het voorwetenschappelijk oordeel, of
een verbetering en aanvulling hierop kan betekenen en de kosten of ethische bezwaren niet
onoverkomelijk zijn, is het gebruik ervan gerechtvaardigd.

Met de volgende 6 kenmerken is een goede test in de meeste gevallen in het voordeel ten opzichte
van het voorwetenschappelijk oordeel:

EFFICIËNTIE
De schatting van intelligentie die voortkomt uit bijvoorbeeld cryptogrammen, prestaties op school,
etc, zijn inexact en arbitrair. De intelligentietest is speciaal gemaakt om intelligentie te meten.

STANDAARDISATIE
Door standaardisatie van de afname van de test worden min of meer de condities en invloeden op de
testresultaten (bij verschillende personen en verschillende tijdstippen van afname) gelijkgeschakeld,
waardoor de onderlinge vergelijkbaarheid van de testprestaties wordt verwezenlijkt.

NORMERING
In het normeringonderzoek wordt op zijn minst een rangorde vastgesteld van zeer slechte tot zeer
goede prestaties op de test. De testscore van de onderzochte persoon kan met deze rangorde
worden vergeleken en de hoogte van de bepaalde testscore kan worden geëvalueerd.
De benadering met een normaalverdeling doet men doorgaans als de steekproef uit een normaal
verdeelde populatie afkomstig is, en men de steekproeffouten wil ‘gladstrijken’. Het kiezen van
nieuwe verdelingskenmerken (gemiddelde, spreiding), doet men om een ‘handige’ schaal te krijgen.
Men kan volstaan met een ongenormeerde test in bijvoorbeeld experimenteel onderzoek, of bij
situaties waarin slechts binnen de onderzochte groep beslissingen moeten worden genomen.
De beschikbaarheid van normen is nodig bij alle soorten tests, ook bij observatie- en projectietests.

5

, OBJECTIVITEIT
Objectiviteit van de testinterpretatie houdt in dat de interpretatie onafhankelijk is van de persoon
die de test afneemt. Deze opvatting heeft twee gevolgen:
1) Bij objectief testonderzoek moet het niet uitmaken wie de beoordelaar is.
2) Objectiviteit impliceert openheid en reproduceerbaarheid van de test- en evaluatieprocedure.
Objectiviteit wordt omschreven in termen van het intersubjectiviteitprincipe. Hiermee is de mate van
objectiviteit te bepalen.
Onafhankelijkheid van de beoordelaars betekent dat zij niet overleggen of zelfs maar weet hebben
van elkaars oordelen. De mate van overeenstemming van de resultaten is uit te drukken in de
interbeoordelaarsbetrouwbaarheid. Indien twee onafhankelijke beoordelaars beiden een rangorde
produceren kan de interbeoordelaarsbetrouwbaarheid worden uitgedrukt in een rangcorrelatie
(Spearman of Kendall).
Indien de beoordelingen niet alleen een rangorde vormen, maar de afstanden tussen de plaatsen in
die rangorde betekenis hebben, kan de product-momentcorrelatie de mate van overeenstemming
uitdrukken.

De mate van overeenstemming tussen twee beoordelaars: Po - Pt
Po − Pt

=
I − Pt

Bij observatie- en projectietests neemt de objectiviteit af naarmate men zich verder verwijdert van
het descriptieniveau.
Er is bij echt objectieve verwerking van testgegevens geen mogelijkheid dat andere belangen een
interfererende rol spelen.

BETROUWBAARHEID
Als twee verschillende testmetingen bij dezelfde persoon bijzonder weinig verschillen, dan wordt de
test als betrouwbaar betiteld.
Door de rangordes met elkaar te vergelijken en bijvoorbeeld uit te drukken in een rangcorrelatie,
beschikken we tevens over een kwantitatieve maat voor deze betrouwbaarheid.

VALIDITEIT
De mate waarin een test meet, wat hij zou moeten meten.
Het praktisch voorspellend gebruik van een test moet altijd gebaseerd zijn op empirisch onderzoek,
waarin een veronderstelde samenhang is aangetoond.

2.2 METEN VAN EIGENSCHAPPEN DOOR MIDDEL VAN TESTS
In het spraakgebruik, zowel binnen als buiten de psychologie, worden de termen ‘meten’ en ‘testen’
vaak door elkaar gebruikt.

2.2.1 MEETNIVEAUS EN TOEGESTANE OPERATIES
Volgens Stevens (1951) is er sprake van meten zodra getallen volgens een consistente procedure aan
objecten worden toegekend. Dit leidt tot vier bekende meetniveaus:

NOMINALE SCHAAL
Het meten betreft hier het categoriseren en het geven van namen. Er zijn weinig berekeningen
mogelijk, Cohens Kappa kan wel.

ORDINALE SCHAAL
Deze schaal wordt gekenmerkt door het begrip rangorde. Er is altijd sprake van meer of minder.
Getallen worden hier wederom gebruikt om te categoriseren. En er zijn wederom weinig
berekeningen mogelijk, rangcorrelatie kan wel berekend worden.

6

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller Lotharvh. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $4.30. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

66579 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling

Popular Universities in the United States

Popular books

Find notes and summaries for these qualifications

Summary

Samenvatting Testtheorie - Drent & Sijtsma

Document information

Subjects

Connected book

Written for

11 reviews

Seller

Reviews received

Content preview

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Quick and easy check-out

Focus on what matters

Frequently asked questions

What do I get when I buy this document?

Satisfaction guarantee: how does it work?

Who am I buying these notes from?

Will I be stuck with a subscription?

Can Stuvia be trusted?