Summary

Volledige en uitgebreide samenvatting Testtheorie (zelf een 9.5 gehaald!)

Name: Volledige en uitgebreide samenvatting Testtheorie (zelf een 9.5 gehaald!)
SKU: doc_2904319
Rating: 4.50 (4 reviews)
Author: sannehielkema

4 reviews

458 views 74 purchases

Course
Testtheorie en Testdiagnostiek (500216B5)

Institution
Tilburg University (UVT)

Hi!! Deze samenvatting bevat alle stof die je moet kennen voor het vak Testtheorie. Dit vak wordt gegeven in het tweede blok in het tweede jaar van de studie Psychologie aan Tilburg University. Alle hoorcolleges zijn tot in detail uitgewerkt en bevat veel voorbeelden en extra uitleg. Alle hoorcolle...

[Show more]

Preview 9 out of 73 pages

View example

Uploaded on June 15, 2023
Number of pages 73
Written in 2022/2023
Type Summary

testtheorie
betrouwbaarheid
statistiek
validiteit
item respons theorie
bias
jaar 2
scores
betrouwbare testen
spreiding
variantie
tilburg university

Institution
Tilburg University (UVT)
Education
Psychologie
Course
Testtheorie en Testdiagnostiek (500216B5)

4 reviews

By: jellevanbergen • 1 week ago

By: sannehielkema • 1 week ago

Translated by Google

Super nice! Thank you:)

By: odirinhandbal • 1 week ago

By: sannehielkema • 1 week ago

Translated by Google

Thank you so much! :)

By: rooskoppes • 1 year ago

By: sannehielkema • 1 year ago

Translated by Google

Super sweet! Thank you:)

By: kristiebouchee • 1 year ago

By: sannehielkema • 1 year ago

Translated by Google

Hi!! Would you like to tell us why you gave the summary 3 stars (before the course officially started), because then I can see if I can change that:)

sannehielkema

Member since 3 year 698 documents sold

$8.58

Also available in package deal from $13.40

Add to cart

Add to wishlist

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Also available in package deal (2)

Voordeelbundel Testtheorie + Toegepaste methoden en statistiek

$ 17.15 $ 13.40

9x sold

2 items

1. Summary - Volledige en uitgebreide samenvatting testtheorie (zelf een 9.5 gehaald!)
2. Class notes - Volledige en uitgebreide college aantekeningen toegepaste methoden en statistiek 2023...
Show more

Voordeelbundel Statistiekvakken voor studie Psychologie aan Tilburg University

$ 39.98 $ 30.04

2x sold

5 items

1. Class notes - Uitgebreide college aantekeningen correlationele onderzoeksmethoden 2022/2023 (zelf e...
2. Summary - Volledige en uitgebreide samenvatting experimentele onderzoeksmethoden 2022/2023
3. Summary - Beknopte samenvatting experimentele onderzoeksmethoden 2022/2023
4. Summary - Volledige en uitgebreide samenvatting testtheorie (zelf een 9.5 gehaald!)
5. Class notes - Volledige en uitgebreide college aantekeningen toegepaste methoden en statistiek 2023...
Show more

Inhoudsopgave
HC 1: Inleiding en basiskennis statistiek......................................................................................................... 3
Introductie............................................................................................................................................................3
Statistische basiskennis........................................................................................................................................4

HC 2: Eigenschappen van tests en items......................................................................................................... 7
Psychologische test..............................................................................................................................................7
Type tests.............................................................................................................................................................7
Testscores.............................................................................................................................................................8
Spreiding testscores.............................................................................................................................................9
Multiple-choice items...........................................................................................................................................9
Cohens kappa.....................................................................................................................................................11

HC 3: Bewerkte scores en normen................................................................................................................ 13
Bewerkte scores en normen...............................................................................................................................13
Transformaties van standaardscores (z-scores)................................................................................................15

HC 4: Betrouwbaarheid – Klassieke testtheorie............................................................................................ 16
Betrouwbaarheidsinterval (inleiding statistiek).................................................................................................16
Herhaalbaarheid van metingen.........................................................................................................................16
Klassieke Testtheorie..........................................................................................................................................17

HC 5: Betrouwbaarheid in de praktijk........................................................................................................... 19
Bepaling van de betrouwbaarheid.....................................................................................................................20
IC methodes........................................................................................................................................................22
Vergelijking van testscores.................................................................................................................................24

HC 6: Invloeden op de betrouwbaarheid...................................................................................................... 25
Invloeden op de betrouwbaarheid.....................................................................................................................25

HC 7: Betrouwbaarheid – verbeteren en gevolgen........................................................................................29
Item-restscore correlatie (standard power tests)..............................................................................................29
Gedichotomiseerde item-restscore correlatie (selectietest)..............................................................................30
Item-discriminatie index (dichotome items)......................................................................................................31
Attenuatie van correlaties..................................................................................................................................32

HC 8: Begripsvaliditeit.................................................................................................................................. 34
Twee vormen van validiteit................................................................................................................................35
Vijfhoek van begripsvaliditeit.............................................................................................................................35

HC 9: Criteriumvaliditeit............................................................................................................................... 41
Predictieve validiteit in de praktijk.....................................................................................................................42

, Testgebruik bij dichotome beslissingen.............................................................................................................46

HC 10: Introductie Item-responstheorie....................................................................................................... 49
Vooraf.................................................................................................................................................................49
Rasch model.......................................................................................................................................................53
Birnbaums twee-parameter (logistisch) model (2PLM).....................................................................................58

HC 11: IRT in de praktijk............................................................................................................................... 60
Herhaling Raschmodel en Birnbaums 2PLM......................................................................................................60
Verschil tussen KTT en IRT in hoe ze omgaan met de nauwkeurigheid van de meting.....................................61
Testconstructie op basis van een itembank.......................................................................................................63
Adaptieve tests...................................................................................................................................................65

HC 12: Test fairness & bias........................................................................................................................... 68
Vertekening testscore (construct bias)...............................................................................................................68
Item bias (differential item functioning)............................................................................................................70
Vertekende predicitie (= predictive bias)............................................................................................................71

LEGENDA:
- Rood = begrip
- Blauw = auteur, belangrijk persoon
- Groen = formule
- Schuingedrukt = voorbeeld
- Dikgedrukt = belangrijk woord (maakt het makkelijk om de tekst in 1x te begrijpen
wanneer je het al geleerd hebt)
- Plaatje = uitleg bij een foto

2

, HC 1: Inleiding en basiskennis statistiek
Introductie
Zorgen voor goede psychologische testen is essentieel:
- Zonder goede tests is psychologie nauwelijks wetenschap
- Zonder goede tests kan de psychologie weinig bijdragen aan de maatschappij
 Testtheorie = het vakgebied binnen de psychologie gewijd aan de vraag hoe we de kwaliteit van
tests kunnen onderzoeken en verbeteren

Voor het meten bij individuen gebruik je meestal een test met veel items  items gebruiken we als
indicatoren voor een construct (perfectionisme)
1. Aan antwoorden worden scores toegekend = itemscores
2. Itemscores worden verwerkt tot testscores  meestal optellen
3. Testscores worden geïnterpreteerd

Wat kun je zeggen over iemands perfectionisme op basis van de testscores?
- Zijn de testscores zinvol te interpreteren?
- Meet de test wel perfectionisme? Hoe kom je daar achter?
- Zijn de vragen/opdrachten wel van goede kwaliteit?
- Zijn er wel genoeg vragen in de test?
- Iemand heeft een score van 14 en een ander een score van 15. Is dit verschil groot genoeg om
te concluderen dat ze verschillen in perfectionisme?

Tests worden veel gebruikt om dingen te meten in de psychologie en meestal is het de handigste
manier om aan gegevens te komen. Als je goed en nauwkeurig een construct wilt meten heb je wel
een goede test nodig, anders is er sprake van sloppy science! Voor het maken van een goede test zijn
er helaas geen kant-en-klare regels. Het vereist voortdurend goed nadenken, goede kennis van de te
meten eigenschap en goed gebruik van statistische methoden
 Er zijn echter wel handvaten, en die worden behandeld in Testtheorie

Kennis van testtheorie is cruciaal voor je latere carrière, want psychologisch testen speelt overal een
belangrijke rol. Zowel voor een wetenschappelijke als niet-wetenschappelijke carrière is het één van
de meest relevante vakken uit je studie.

In de wetenschap gaat psychologisch onderzoek vaak over niet direct observeerbare eigenschappen
en zijn er dus tests nodig om deze eigenschappen te kunnen meten. Vrijwel alle psychologische
theorieën zijn tot stand gekomen dankzij testtheorie (Big Five, intelligentie)

In de praktijk maken de meeste beroepen in sociale wetenschappen gebruik van testresultaten en
neemt men vaak beslissingen aan de hand van psychologische tests. Aan het einde van deze cursus
moet je dus in staat zijn om:
- Een test zelf op waarde in kunnen schatten
- Zelf-ontwikkelde tests kritisch kunnen evalueren en verbeteren
- Kennis hebben van mogelijkheden en beperkingen van psychologische tests

3

,Statistische basiskennis
Gemiddelde en deviatiescore
1) 2)

Scores van 5 PPN op 3 tests

3)

4)

5)  Gemiddelde van de deviaties is
altijd 0, omdat gemiddeld gezien,
mensen niet afwijken van het
gemiddelde

4

,Variantie en standaarddeviatie
Variantie = de mate van spreiding  mate waarin mensen afwijken van het gemiddelde 
kwadrateren van deviatiescores
Sum of squares = optelsom van alle kwadraten = optelsom van variantie
Standaarddeviatie = gemiddelde afwijking van het gemiddelde  als je een random persoon pakt is
de kans gemiddeld zo groot dat diegene afwijkt van het gemiddelde
 In deze cursus gebruiken we alleen steekproeven  We gebruiken alleen N en niet n-1
1)

2)

Standaardscores (z-scores)
1) Z-score = gestandaardiseerde
standaarddeviaties

 Zy = -0..4 = -0.5
 Zw = -.1 = -1.41

2)
 Som van ze Z-scores is
wederom 0!

5

,Covariantie en correlatie
Covariantie = toe in hoeverre zijn de variabelen covariërend? Tot in hoeverre hangen ze samen?
1)

2)
XiYi = de keersom van x en y (xy)
- -2 x -0.2 = 0.40
- 1 x -0.2 = -0.2
- 2 x 0.8 = 1.6
 Alles optellen (je hebt de som nodig), en die
vervolgens delen door N

(xw) = -2 x -20 = 40  kolom x en w gebruiken
(yw) = -0.2 x -20 = 4  kolom y en w gebruiken

6

, HC 2: Eigenschappen van tests en items
Psychologische test
Wat is een psychologische test?  Cronbach: een psychologische test is een systematische
procedure voor het vergelijken van gedrag van twee of meer mensen
 Zo’n procedure kan vele vormen aannemen:
- Multiple choice vaardigheidstest
- Open-ended persoonlijkheidsvragenlijst
- Systematische gedragsobservatie (op een basisschool kijken naar het gedrag van leerlingen)
- Rorschach inktvlekkentest  interpretatietest

Er zijn drie cruciale eigenschappen van een psychologische test:
1. Gericht op gedragsmeting  observeerbaar
2. Systematisch  objectief
3. Vergelijken van verschillende personen of vergelijken van dezelfde personen over tijd

Type tests
In de psychologie wordt er een onderscheid gemaakt tussen prestatieniveau- en gedragswijzetests
(maximum performance test VS typical performance test)
- Prestatieniveautests voor het meten van vaardigheden (tentamen)
- Gedragswijzetests voor het meten van o.a. persoonlijkheidseigenschappen en attitudes
 Je zou kunnen zeggen dat zodra een test geen vaardigheden of prestaties meet, het een
gedragswijzetest is
 Geven een eerlijk en correct beeld van wat typisch voor jou is
- Grote verschillen voor de aanpak bij de testontwikkeling (type vragen is van een hele andere
kwaliteit), maar nauwelijks verschillen in de statistische analyse van testscores
 Twee type tests voor prestatieniveau:
1. Power tests = meten van vaardigheden zonder tijdsdruk  meer vaardige personen maken
meer vragen goed
2. Speed tests = meten prestaties onder zware tijdsdruk  vragen zijn van triviale moeilijkheid
(zijn niet lastig)  meer vaardige personen beantwoorden meer vragen

Voorbeeld speed test  Bourdon dot concentration test = je krijgt iedere keer snel een
plaatje te zien en dan moet je z.s.m. aangeven of het vier, of niet vier stippen zijn 
waarom zou je zo’n soort test afnemen?  het gaat om de snelheid waarmee mensen
informatie verwerken

Als laatste is er nog een onderscheid in niet zozeer de test zelf, maar meer over hoe je
de testscore gebruikt  normgerichte VS criteriumgerichte tests
- Normgerichte tests = vergelijken van personen met de rest van de populatie 
goede normgegevens over deze populatie zijn van groot belang (persoonlijkheid)
- Criteriumgerichte tests = vergelijken van personen met een absolute standaard  het
testcriterium staat van de voren al vast en het testoordeel staat los van prestatieniveau in de
populatie (tentamen testtheorie  het maakt niet uit of 40%, 60% of 20% het tentamen
haalt (populatie), de norm is vastgesteld en het gaat niet om het slagingspercentage)

7

,Wat hoort er bij een psychologische test?
- Testmateriaal = een set van stimuli die je aan je PPN aanbiedt
- Testformulieren = instrument om de antwoorden van de PPN op te noteren
- Testhandleiding = iedere test moet een duidelijke testhandleiding hebben  4 criteria:
1. Exacte testinstructie  objectief, zodat onderzoekers niet hun eigen invulling geven aan
het onderzoek (achterover leunen VS rechtop zitten bij een IQ test van kinderen heeft al
invloed op de scores)
2. Verwerkingsprocedure = hoe moet je de scores verwerken?
3. Normtabellen  heb je nodig om de scores te kunnen interpreteren
4. Bespreking van wetenschappelijke kwaliteiten  je moet de achtergrond en het doel
van een test weten

Testscores
Beoordeling = de stap van het omzetten van het antwoord (poes) op een item naar een score (poes =
1 (goed), hond = 0 (fout))  itemscores worden zo bepaald dat ze indicatief zijn voor het te meten
construct  hogere itemscore = ‘hoger’ op de eigenschap

Eigenschappen van de testscore:
- Testscore is vaak de optelsom van de itemscores
- Belangrijkste uitkomst van de test die gebruikt wordt
- Testhandleiding geeft instructies over hoe de score geïnterpreteerd moet worden (HC 3)
- Bij normgerichte tests zullen normgegevens geraadpleegd moeten worden

De testscore is een getal  de interpretatie van dit getal hangt af van het meetniveau van de testscore:
- Nominaal = benoemde categorieën met een naam (persoonlijkheidstypes)
- Ordinaal = gerangschikte categorieën  1e, 2e, 3e  geen gelijke afstanden tussen de rangen
(de 1e in een marathon kan veel eerder binnenlopen, terwijl nummer 2 en 3 bijna tegelijk
binnenlopen)
- Interval = even grote intervallen tussen de waarden, zonder een absoluut nulpunt (21℃ tot
26℃ heeft hetzelfde verschil als van 1℃ tot 6℃)
- Ratio = even grote intervallen tussen de waarden, met een absoluut nulpunt (een afstand
van 0 betekent dat je niet verplaatst bent)

 Scores zijn alleen van interval (of ratio) meetniveau als ze kwantitatief zijn = een toename van één
punt moet altijd dezelfde toename in de te meten eigenschap weerspiegelen
- Stel persoon A, B en C hebben een introversiescore van 10, 20 en 30  het scoreverschil
tussen A en B en tussen B en C is even groot, maar de werkelijke uiting van introversie kan
tussen de PPN totaal anders zijn  het is verre van vanzelfsprekend dat de verschillen in
introversie ook even groot zijn

Formeel gezegd zijn er geen testen van een intervalmeetniveau
- Testscores zijn de optelsom van itemscores
- Itemscores zijn dus duidelijk ordinaal
- Testscores zijn daarmee formeel ook ordinaal (n.a.v. het voorbeeld hierboven)
- Maar voor praktisch/statistisch gebruik doen we vaak alsof de testscore van interval
meetniveau is  alleen goed te verdedigen voor lange tests met een grote range aan scores

8

, Spreiding testscores
Spreiding als wenselijke eigenschap
- Testscores moeten verschillen tussen mensen blootleggen  kan dus alleen als mensen
verschillen in hun testscores
- Hoge mate van variatie in testscores is wenselijk
- Omdat de testscore is opgebouwd uit de itemscores:
 Hoge variantie op de itemscores ook wenselijk  iedere vraag die je stelt moet een
vraag zijn waarop je verwacht dat mensen onderling verschillende antwoorden geven
 Hoge covariantie tussen de itemscores wenselijk (covariantie is de mate waarin
verschillende itemscores met elkaar samenhangen  vragen horen hetzelfde te meten
 als je ‘ja’ zegt op de ene vraag, is de verwachting dat je ook ‘ja’ zegt op de andere
vraag

Uitbreiding met een voorbeeld van wat hierboven uitgelegd staat  de testscore X is opgebouwd uit de
itemscores van een test met twee vragen: X1 en X2  X = X1 + X2
2
 Wat beïnvloedt de testscore-variantie S X ? (formule)
- Uitleg  de itemscore-variantie van X1 telt positief mee, de
itemscore-variantie van X2 telt positief mee en de correlatie
tussen de itemscores (covariantie) telt ook positief mee
- De tweede formule (onderste) is een versimpelde formule van die erboven  om het te
verduidelijken kan je het ook in een matrix zetten
2
 Variantie = diagonaal ( X 1 x X 1 = S X ) 1

 Covariantie = buiten de diagonaal ( X 1 x X 2 = S X X )
1 2
2 2
 Je ziet dus 1x S X , 1x S X en 2x S X X  precies de versimpelde formule
1 2 1 2

 Doordat het de testscore bestaat uit twee vragen (X1 en X2), krijg je
een 2 x 2 tabel. Wanneer er drie vragen zijn krijg je een 3 x 3 tabel
enz.  de formule blijft hetzelfde, het blijft de optelsom van alle
waarden in de matrix, de formule wordt alleen langer

Testscore-variantie gaat omhoog als itemscore-variantie ook toeneemt
 Goede samenhang tussen items is dus ook belangrijk:
- Sommige mensen score hoog op vrijwel alle items
- Sommige mensen scoren laag op vrijwel alle items
 Daardoor is er dus meer spreiding op de testscore

Multiple-choice items
Multiple choice vragen worden dichotoom gescoord  goed = 1, fout = 0
- p-waarde van een item geeft de proportie correct aan = de proportie van de mensen die het
goed gemaakt hebben  dezelfde term als bij significantietesten, maar hier andere betekenis!!!
 p = gemiddelde itemscore (als 30% een 1 scoort (goed) en 70% een 0 (fout), dan is het
gemiddelde 0.30 en dat matcht precies met de ‘proportie correct’)
- q=1− p is proportie incorrecte antwoorden op het item
- Idealiter  p=q=0.5 ,want dan is er een maximale itemscore-variantie

Welke staat hoort niet tot de VS?
A. New Mexico
B. Washington
C. Ontario (goed)
D. Kentucky
 Item-respons is de selectie uit A, B, C en D

9

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller sannehielkema. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $8.58. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

50843 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling

Popular Universities in the United States

Popular books

Find notes and summaries for these qualifications

Seller

Summary

Volledige en uitgebreide samenvatting Testtheorie (zelf een 9.5 gehaald!)

Document information

Subjects

Written for

4 reviews

Seller

Reviews received

Content preview

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Quick and easy check-out

Focus on what matters

Frequently asked questions

What do I get when I buy this document?

Satisfaction guarantee: how does it work?

Who am I buying these notes from?

Will I be stuck with a subscription?

Can Stuvia be trusted?