Samenvatting Testtheorie en Testgebruik
Hoofdstuk 2: Definitie, kenmerken en toepassingen van de test
Onderdelen van een test:
1. Testmateriaal
2. Testformulieren; antwoorden, reacties of gedragsgegevens
3. Testhandleiding; uitvoerig boekwerk of beknopte richtlijnen, met minimaal:
- exacte testinstructie
- verwerkingsprocedure; toekenning richtlijnen numerieke scores
- normtabellen; zodat scores kunnen worden vergeleken met de scores van anderen.
- wetenschappelijke kwaliteiten test; indicatie betrouwbaarheid test (herhaalbaar),
bespreking testbetekenis (welke psychologische eigenschap meet de test) en voor welke
voorspellingen de test gebruikt kan worden.
Testonderzoek is het doen van een uitspraak die een voorspelling, classificatie of beschrijving met
betrekking tot het onderzochte individu omvat. Vrijwel altijd in vergelijking met anderen.
Kenmerken van een test:
1. Efficiëntie; Niet meer afhankelijk van de beschikbaarheid van alledaagse situaties, deze kun je nu
zelf samenstellen.
2. Standaardisatie; condities en mogelijke invloeden op de testprestatie moeten gelijk worden
gehouden.
3. Normering; Exactheid voor nodig om kleine verschillen vast te kunnen stellen. Genormeerde
psychologische test zijn hier veel beter toe in staat dan de praktijkbeoordeling. Hierin is een rangorde
vastgesteld, zodat proefpersonen een plaats in deze rangorde krijgen. Generaliseerbaarheid is
afhankelijk van de steekproef (grootte, randomisatie, etc.). In een enkel geval kan men volstaan met
een ongenormeerde test, bijvoorbeeld in een experimenteel onderzoek of in tests zonder
controlegroep.
4. Objectiviteit; onafhankelijkheid van de waarnemer of beoordelaar. Dit leidt tot openheid en
reduceerbaarheid van de testen. Dit kan doormiddel van;
- Interbeoordelaarsbetrouwbaarheid; mate van overeenstemming tussen meerdere
observatoren.
- Rangcolleratie; Indien twee onafhankelijke beoordelaars beiden een rangorde
produceren, kan de Interbeoordelaarsbetrouwbaarheid hierin worden uitgedrukt
(Spearmans, Kendalls tau).
- Statistische methode waarmee de overeenstemming tussen grote aantallen
afhankelijke beoordelaars kan worden gekwantificeerd; Kendalls coefficient of
concordance W.
- Product-momentcorrelatie; indien beoordeling niet alleen een rangorde vormt,
maar de afstanden ertussen ook een betekenis hebben.
STEL: 2 beoordelaars zijn het in 25 van 40 gevallen met elkaar eens over een diagnose.
De kans dat A en B bij een willekeurig gekozen kind het met elkaar eens zijn, is dan 25/40 X 100 =
0,625. Deze kans noemen we P0 (“o” van overeenstemming).
- Pt (de toevalkans van eens zijn); frequentieverdeling beoordelaar A x frequentieverdeling
beoordelaar B/ het aantal beoordelingen = % kans dat ze het met elkaar eens zijn.
- Mate van overeenstemming: P0 – Pt
- Cohens kappa:
,Bij observatietests en projectietests is het lastig om een hoge objectiviteit te bereiken. De
beoordelaar moet zich hierbij zoveel mogelijk richten op het direct waarneembare gedrag en niet
interpreteren.
- Echter gaat het bij deze tests vaak wel om interpretatie.
5. Betrouwbaarheid; Tussen twee metingen is weinig verschil merkbaar.
6. Validiteit; Of de test daadwerkelijk het construct meet wat het beoogt te meten. De betekenis van
een testprestatie moet altijd empirisch geverifieerd zijn.
Meetniveaus:
1. Nominaal; enkel categorisering en naamgeving, zoals het toekennen van rangnummers aan
voetballers. Cohens kappa
2. Ordinaal; gebruik gemaakt van een rangorde, getallen worden gebruikt om objecten en
categorieën te ordenen.
3. Interval; niet alleen rangorde maar ook de posities ertussen hebben een betekenis. Geen absoluut
nulpunt.
4. Verhoudingsschaal (ratio); bevat wel een nulpunt.
Een intelligentietest is een poging om van intelligentie een goede schatting te maken. De
eigenschappen vallen hierbij niet samen met de operaties die men moet verrichten om ze te meten.
Intelligentie is dus niet datgeen wat de test direct meet.
- Het gaat hierbij om een telling van het aantal goed/fout, meten kan past vanuit de conclusie
van de telling.
Er zijn een aantal stappen te onderscheiden om te komen tot een meting:
1. Identificatie van de te meten eigenschap; vaststellen wat de theorie is met betrekking tot de te
meten eigenschap. Hierbij wordt een theorie gekozen waarop men het meetinstrument uitkiest.
Het probleem met psychologische eigenschappen is dat de theorie vaak maar matig is ontwikkeld.
- Grootste probleem; categorie van eigenschappen met een theoretisch onduidelijk of
dubieuze status. Zonder theoretische onderbouwing is een zinvolle meting onmogelijk.
Zonder theorie valt de eigenschap wel samen met datgene wat de test meet.
2. Operationalisering van de eigenschap; de specificatie van de operaties die nodig zijn om de
eigenschap te meten. Operationalisering vereist: 1) definiëren van een typisch domein van
gedragingen, 2) het hierop afstemmen van een domein van stimuli die aan de proefpersoon wordt
gepresenteerd, deze worden in de testtheorie ‘items’ genoemd, zoals uitspraken, taken en vragen.
3. Onderzoek en kwantificering van reacties; reacties van proefpersonen zijn in eerste instantie
kwalitatief; personen formuleren hun antwoorden verbaal of laten gedragingen zien. Vanuit hier
ontstaat de kwantificering van de antwoorden.
Hierbij gaat men er vanuit dat een antwoord van een hoger niveau lijdt tot een hogere numerieke
waarde. Het gaat hierbij om een hypothese, die bij nadere toetsing juist of onjuist kan blijken te zijn.
In de constructiefase van een test worden kwantitatieve gegevens verzameld door de proefversie
van de test voor te leggen aan een steekproef van proefpersonen. Deze itemscores worden
geanalyseerd met behulp van statistische testmodellen waarin is gespecificeerd aan welke eisen de
gegevens dienen te voldoen, wil er sprake zijn van een meting.
, Wanneer er in de testgegevens wordt gevonden dat alle correlaties tussen itemscores positief en
ongeveer even groot zijn, dan wordt dit gezien als een ondersteuning van de hypothese dat de items
gezamenlijk één en dezelfde eigenschap meten.
4. Terugkoppeling naar de theorie; Als de uitkomst van de statistische analyses aangeeft dat de test
de bedoelde eigenschap meet, dan is er sprake van een goed meetinstrument en aanvullende
evidentie voor de theorie voor de achterliggende eigenschap.
Ook een niet-succesvolle testconstructies dragen bij aan theorievorming. Er kan aanleiding in worden
gevonden om de theorie te herzien of te kiezen voor één van de rivaliserende theorieën. Er moet dan
wel duidelijk zijn dat de operationalisering geslaagd was. De zojuist beschreven procedure voor het
meten van psychologische eigenschappen sluit goed aan bij de statistische methoden die worden
gebruikt om tests te construeren en hun meeteigenschappen vast te stellen. Dit zijn de klassieke
testtheorie en de item-responstheorie.
Representational measurement; gaat ervan uit dat er alleen sprake kan zijn van meting, indien de
formele relaties tussen meetwaarden (testscores) overeenkomen met de relaties die er in de empirie
bestaan tussen de ‘objecten’ waarover die meetwaarden iets zeggen. Met andere woorden, als Jan
een hogere testscore heeft dan Piet op een test over ruimtelijk inzicht, dan moet er in de empirie een
aantoonbare relatie bestaan tussen het ruimtelijk inzicht van Jan en Piet, waaruit we kunnen
concluderen dat Jan een hoger ruimtelijk inzicht heeft. Met psychologische hypotheses is dit concept
erg lastig, aangezien eigenschappen als ruimtelijk inzicht niet direct waarneembaar zijn.
Definitie van een test
Een test is een systematische classificatie- of meetprocedure, waarbij het mogelijk is een uitspraak te
doen over één of meer empirisch-theoretisch gefundeerde eigenschappen van de onderzochte of
over specifiek niet-testgedrag, door uit te gaan van een objectieve verwerking van reacties van
hem/haar, in vergelijking tot die van anderen, op een aantal gestandaardiseerde, zorgvuldig gekozen
stimuli.
Toepassingsmogelijkheden:
Onderscheiden drie toepassingen; het doen van uitspraken over een individu, groepen van mensen
en situaties en methoden.
1. Beoordeling van individuen:
Situatie 1: Hierbij wordt gekeken naar criteria – eisen waaraan men wel of niet kan voldoen.
Indien prestaties op een test een relatie blijkt te vertonen met dit criteriumgedrag, dan kan de
testprestatie worden gebruikt om een voorspelling te doen van het mogelijke succes voor bv. een
baan of beroep, op een moment dat iemand hier nog niet aan is begonnen.
Situatie 2: Sprake van een keuzemogelijkheid tussen ten minste twee opties die onderling
verschillen qua niveau of juist kwalitatief verschillen. Het kan hier bijvoorbeeld gaan om de beslissing
welke opleiding, studierichting of bedrijfsfunctie je moet kiezen.
Situatie 3: Indien met de zwakke en sterke kanten van een persoon wil bekijken. Het gaat om
een onderlinge vergelijking van de testscores van dezelfde persoon. Deze scores worden op elkaar en
niet op een externe norm betrokken; ipsatieve scores.
Situatie 4: Longitudinaal onderzoek; de scores op een test worden vergeleken met de scores
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller kimberlyfaassen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.37. You're not tied to anything after your purchase.