Dit is een overzichtelijke, complete samenvatting van de hoofdstukken 2 t/m 7 van het vak Testtheorie uit het tweede jaar Pedagogische Wetenschappen aan de Rijksuniversiteit Groningen.
Samenvatting literatuur Testtheorie
Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen – Drenth &
Sijtsma
H2: Definitie, kenmerken en toepassingen van de test
2.1 Wat is een test?
2.1.1 Onderdelen van een test
Testmateriaal: bv. opgavenboekje, puzzels, tekenpapier afhankelijk van de soort test.
Testformulieren: om antwoorden, reacties of gedragsgegevens op te verzamelen, om
psychologische interpretatie of conclusies uit af te leiden.
Testhandleiding: richtlijnen voor de test, bevat vier onderwerpen:
o Exacte testinstructie: procedure, condities, aanwijzingen en uitleg etc.
o Verwerkingsprocedure: richtlijnen voor toekenning van numerieke scores aan
antwoorden of reacties op opgaven.
o Normtabellen: tabel om score van respondent te vergelijken met prestaties van meer of
minder representatieve normgroepen.
o Wetenschappelijke kwaliteiten van de test: indicatie van betrouwbaarheid, testbetekenis
en voorspellingen waarvoor de test gebruikt kan worden.
2.1.2 Eerste omschrijving
Doel van testonderzoek: uitspraak doen met een voorspelling, classificatie of beschrijving over
het onderzochte individu.
o Gaat vaak om vergelijking met anderen.
Test is een systematisch onderzoek van apart voor het testdoel geselecteerde gedragingen.
Oftewel: een test is een systematisch onderzoek van gedrag met behulp van speciaal
geselecteerde vragen f opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk
van de onderzochte in vergelijking met anderen.
2.1.3 Kenmerken van een test
Zes kenmerken van een goede test waardoor dit een voordeel heeft ten opzichte van een
voorwetenschappelijk oordeel:
o Efficiëntie: je bent niet afhankelijk van een gelegenheid die toevalligerwijs moet
plaatsvinden voor je oordeel.
o Standaardisatie: prestaties van respondenten worden vergelijkbaar met elkaar omdat
condities en invloeden op de testprestatie vergelijkbaar zijn.
o Normering: vastgestelde rangorde van zeer goede tot zeer slechte prestaties, om iemands
prestatie in deze rangorde te kunnen beoordelen voor de rangorde afhankelijk van een
groep proefpersonen waarop deze normen worden gebaseerd.
Verdeling van normscores kan benaderd worden met normaalverdeling.
o Objectiviteit: onafhankelijk van storende invloeden vanuit de onderzoeker(s).
Het maakt niet uit wie de testleider is en het onderzoek is repliceerbaar.
Interbeoordelaarsbetrouwbaarheid:
8+7+10
Po = kans dat twee beoordelaars het eens zijn = = .625.
40
Pt = kans dat twee beoordelaars het eens zijn op basis van toeval
12∗12
(berekend op basis van de verdeling per beoordelaar) = = 3.6,
40
16∗12 12∗16 3.6+4.8+ 4.8
= 4.8, = 4.8 ∗100 = .33.
40 40 40
Mate van overeenstemming: Po – Pt = .625 - .33 = .295.
, Cohen’s kappa: overeenstemming afzetten tegen maximale verschil dat
P o−P t
de beoordelaars zouden kunnen hebben (1 – .33 = .67) .
1−P t
Kan van een negatieve waarde (slechtere overeenstemming dan
op basis van toeval verwacht) tot 1.
o Betrouwbaarheid: twee metingen zullen leiden tot (zo goed als) dezelfde data.
o Validiteit: de test bevat de juiste indicaties voor het te meten gedrag/de te meten
eigenschap.
2.2 Meten van eigenschappen door middel van tests
2.2.1 Meetniveaus en toegestane operaties
Meten: getallen worden volgens een consistente procedure toegekend aan objecten.
Vier niveaus:
o Nominale schaal: personen of objecten worden verdeeld in groepen waaraan een getal
toegekend wordt (categorisering en naamgeving).
Geen rekenkundige operaties.
o Ordinale schaal: rangorde in getallen.
Geen rekenkundige operaties, wel rangcorrelaties.
o Intervalschaal: afstanden tussen posities hebben betekenis, geen absoluut maar arbitrair
nulpunt.
Lineaire transformatie mogelijk (T = a + bC), optellen en aftrekken (en daarmee
gemiddelden, varianties en correlaties).
o Verhoudingsschaal (ratio): absoluut nulpunt.
Alle rekenkundige operaties toegestaan, transformaties in de form van Y = bX
toegestaan.
2.2.2 Opvattingen over meten
Binnen de psychologie zijn theorieën en begrippen abstracter en diffuser en is gedrag van
proefpersonen moeilijker te manipuleren dan in de fysica er worden daarom vaak slechts
zwakke of matige verbanden gevonden en het onderzoek is moeilijker repliceerbaar.
Operationalisme: een meting is de uitkomst van een consistente procedure van het toekennen van
getallen aan objecten hierdoor bepaalt de procedure zelf dat er sprake is van een meting.
o Boring: intelligentie is datgene wat de test meet.
o Nauwelijks nog sprake van theorievorming en kennisvorming.
o Het lijkt alsof de constructie van tests alleen nog technologisch is zonder
wetenschappelijke bijdrage, maar de beschikbaarheid van valide meetinstrumenten
vergroot juist de kans op het zinvol toetsen (en verwerpen) van (onjuiste) theorieën.
Niet alleen in wetenschappelijk psychologisch onderzoek zijn tests en
vragenlijsten van belang, mar ook in de psychologische praktijk.
2.2.3 De gangbare procedure voor het meten van psychologische eigenschappen
Psychologische eigenschappen: eigenschappen die niet samenvallen met de operaties die men
moet verrichten om ze te meten (bv. intelligentie, extraversie).
o Intelligentie is dus niet datgene wat de test meet, maar de test is een poging om een
goede schatting te maken van de eigenschap intelligentie.
o Het toekennen van scores aan een testprestatie is nog geen meten er is pas een meting
als uit de scores een conclusie volgt over de eigenschap.
Stappen om te komen tot een meting:
o Identificatie van de te meten eigenschap: theorie(en) met betrekking tot de te meten
eigenschap in kaart brengen.
Soms is theorievorming matig ontwikkeld, onduidelijk of dubieus maakt
identificatie van de eigenschap moeilijk.
o Operationalisering van de eigenschap: specificatie van de operaties die nodig zijn om de
eigenschap te meten (vallen niet samen met de eigenschap).
, Domein van gedragingen die typisch zijn voor de eigenschap definiëren.
Domein van stimuli om een reactie van proefpersonen uit te lokken afstemmen
op het domein van gedragingen (= items).
o Onderzoek en kwantificering van reacties: antwoorden van proefpersonen zijn in eerste
instantie kwalitatief maar moeten omgezet worden in getallen.
Het ene antwoord op een item geeft een hoger niveau aan op de achterliggende
eigenschap dan het andere hogere niveau antwoorden krijgen een hogere
numerieke score dan lagere niveau antwoorden hogere score betekent hogere
positie op de eigenschap.
Gekwantificeerde gegevens uit een proefversie van de test worden geanalyseerd
om de hypothese te onderzoeken dat de items gezamenlijk dezelfde eigenschap
meten.
o Terugkoppeling naar de theorie: bij positieve uitkomst van statistische analyses is er een
goed meetinstrument ontwikkeld dat ook aanvullende evidentie voor de theorie biedt.
Ook negatieve uitkomst (maar succesvolle operationalisering) draagt bij aan
theorievorming.
Representational measurement: er kan alleen sprake zijn van meting, indien formele relaties
tussen meetwaarden (testscores) overeenkomen met de relaties die er in de empirie bestaan
tussen de ‘objecten’ waarover die meetwaarden iets zeggen.
o Bv. als de test aangeeft dan Jan een hogere score heeft op ruimtelijk inzicht dan Piet, moet
er in de empirie een aantoonbare relatie zijn tussen het ruimtelijk inzicht van Jan en Piet,
waaruit blijkt dat Jan een hoger niveau heeft dan Piet.
Gaat er dus vanuit dat de relatie en het niveau waarneembaar zijn zonder test,
maar in de psychologie komt dit nauwelijks voor.
2.3 Definitie van een test
Een test is een systematische classificatie- of meetprocedure, waarbij het moeilijk is een uitspraak
te doen over één of meer empirisch-theoretisch gefundeerde eigenschappen van de onderzochte
of over specifiek niet-testgedrag, door uit te gaan van een objectieve verwerking van reacties van
hem/haar, in vergelijking tot die van anderen, op een aantal gestandaardiseerde, zorgvuldig
gekozen stimuli.
2.4 Toepassingsmogelijkheden
2.4.1 Beoordeling van individuen
Voorspellingen over toekomstige prestatie; keuzemogelijkheid tussen meerdere opties
(differentiatie tussen alternatieven in de test); zwakke en sterke kanten van een individu
(ipsatieve scores: scores van een persoon worden met elkaar vergeleken i.p.v. met een externe
norm); ontwikkeling (testscore van een persoon vergelijken met scores die op een eerder of later
tijdstip zijn behaald); beschrijving van onderzochte; niet directieve vorm van therapie
(counseling).
2.4.2 Beoordeling van groepen
Verschillen tussen groepen (bv. intelligentie of persoonlijkheid).
o Cross-culturele psychologie.
Maakt het mogelijk individuele scores te vergelijken met een normscore van een relevante
normgroep.
2.4.3 Beoordeling van invloed van situaties en methoden
Vergelijken van effectiviteit van procedures (2 groepen proefpersonen om effectiviteit van beide
procedures te testen).
Averechtse diagnostiek: als een test correleert met een criterium is het niet alleen bruikbaar om
voorspellingen te doen over criteriumsucces, maar het werpt ook licht op het criterium zelf
(welke vaardigheden/kennis het meest van belang zijn om een criterium te halen).
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lidewijzilverberg. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.63. You're not tied to anything after your purchase.