Een samenvatting van H2-9 van het boek + een aanvullend document 'Factor analysis' voor het vak Testtheorie en testgebruik aan de RUG. Deze heb ik gemaakt tijdens het lezen van de stof en bevat alle kernbegrippen die je moet kennen en andere belangrijke informatie.
Testtheorie en testgebruik
2 Definitie, kenmerken en toepassingen van de test
2.1 Wat is een test?
2.1.1 Onderdelen van een test
Testmateriaal: varieert sterk met de soort van test; in enkele gevallen niet in strikte zin
aanwezig.
Testformulieren: hierop worden de antwoorden, reacties of gedragsgegevens verzameld,
die vervolgens het materiaal vormen waaruit de psychologische interpretatie of conclusies
worden afgeleid.
Testhandleiding: varieert van een uitvoerig boekwerk tot beknopte richtlijnen. In een goede
handleiding komen 4 onderwerpen aan bod:
1) testinstructie: bevat al datgene wat betrekking heeft op de gang van zaken tijdens het
testonderzoek;
2) verwerkingsprocedure: bestaat voornamelijk uit richtlijnen voor de toekenning van
numerieke scores aan de antwoorden of de reacties op de opgaven;
3) normtabellen: hierin kan de behaalde score worden vergeleken met de prestaties van
meer of minder representatieve normgroepen.;
4) bespreking van de wetenschappelijke kwaliteiten van de test: hierbij gaat het om
gegevens die een indicatie geven van de betrouwbaarheid van de test, de
testbetekenis bespreken en de vraag voor welke voorspellingen de test gebruikt kan
worden.
2.1.2 Eerste omschrijving
Omschrijving psychologische test: ‘een systematisch onderzoek van gedrag m.b.v. speciaal
geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch
kenmerk van de onderzochte in vergelijking met anderen’.
2.1.3 Kenmerken van een (goede) test
1) Efficiëntie: het creëren van een testsituatie waarin bijkomstigheden en storende
invloeden zo veel mogelijk worden geweerd.
2) Standaardisatie: de vergelijkbaarheid van prestaties wordt bereikt door de condities
en invloeden die op de testprestatie kunnen inwerken zo veel mogelijk te
standaardiseren (standaardsituatie creëren waaronder de test voor iedere deelnemer
plaatsvindt).
3) Normering: in het normeringsonderzoek is op zijn minst een rangorde vastgesteld
van zeer goede tot zeer slechte prestaties, zodat iemands prestatie d.m.v. een
plaatsbepaling in deze rangorde kan worden beoordeeld.
4) Objectiviteit: opgevat als de onafhankelijkheid van storende invloeden vanuit de
persoon van de waarnemer, beoordelaar of interpretator. Hierdoor is het resultaat
van het onderzoek onafhankelijk van degene die de gegevens verzamelt of uitwerkt.
Het objectieve testonderzoek vereist controleerbaarheid, repliceerbaarheid en
mogelijkheden tot verificatie van de gedachtegang van de psycholoog.
5) Betrouwbaarheid: gaat om de herhaalbaarheid van de meetresultaten onder
dezelfde condities.
6) Validiteit: gaat om of de test het construct meet dat het moet meten.
,2.2 Meten van eigenschappen door middel van tests
2.2.1 Meetniveaus en toegestane operaties (van laag naar hoog niveau/minder naar meer informatie)
Volgens Stevens (1951) is er sprake van meten zodra getallen volgens een consistente
procedure aan objecten worden toegekend. (Dit wijst erop dat men alles met getallen kan
doen, maar dat het de betekenis van de getallen is, die bepaalt welke bewerkingen op die
getallen zijn toegestaan.) Dit leidt tot 4 bekende meetniveaus:
1) Nominale schaal: als we personen of objecten volgens een bepaald principe
verdelen in groepen en aan die groepen een getal ter identificatie toekennen.
(Cohens kappa: vaststellen in hoeverre beoordelaars het met elkaar eens zijn).
2) Ordinale schaal: wordt gekenmerkt door het begrip rangorde: getallen worden
gebruikt om categorieën of objecten te ordenen.
(rangcorrelatie: overeenstemming van verschillende rangordes uitdrukken).
3) Intervalschaal: op de intervalschaal zijn niet alleen de verschillende posities
geordend van minder naar meer, maar hebben bovendien de afstanden tussen de
verschillende posities betekenis; er is geen absoluut maar een arbitrair nulpunt (in de
fase waarin men de eigenschappen van een intervalschaal nog moet vaststellen, is
men vrij in de keuze van eenheid en nulpunt); typisch voor deze schaal is dat de
verhouding van de afstanden tussen de meetwaarden van vaste paren van objecten
constant blijft als men het nulpunt van de schaal over een afstand a zou verschuiven
en de eenheid met een factor b zou vermenigvuldigen (=lineaire transformaties).
4) Verhoudingsschaal (‘ratio scale’): deze schaal heeft eenheden waarmee afstanden
kunnen worden aangegeven, zoals bij de intervalschaal, en heeft bovendien een
absoluut nulpunt (bijv. lengte, gewicht, volume). Hierdoor zijn alle rekenkundige
bewerkingen toegestaan.
2.2.2 Opvattingen over meten
2.2.3 De gangbare procedure voor het meten van psychologische eigenschappen
De stappen die we kunnen onderscheiden om te komen tot een meting zijn:
1) Identificatie van de te meten eigenschap
2) Operationalisering van de eigenschap:
de specificatie van de operaties die nodig zijn om de eigenschap te meten. De
operationalisatie eist ten eerste dat een domein van gedragingen (theoretisch) wordt
gedefinieerd die typisch zijn voor de bedoelde eigenschap. De tweede stap is het op
het welomschreven gedragsdomein afstemmen van een domein van stimuli die aan
proefpersonen kunnen worden gepresenteerd om reacties uit te lokken die een
indicatie geven van de bedoelde eigenschap: items (zoals uitspraken, taken, vragen).
3) Onderzoek en kwantificering van reacties:
de reacties van personen op de items geven informatie over de eigenschap waarover
de test wat wil zeggen (=kwalitatief). Vervolgens moeten de antwoorden
gekwantificeerd worden. We gaan ervan uit dat bij een item het ene antwoord een
hoger niveau aangeeft op een achterliggende eigenschap dan het andere antwoord.
De reacties in de hogere categorie zullen in de kwantificering een hogere numerieke
waarde/score worden toegekend, wat betekent dat de persoon een hogere positie op
de eigenschap heeft. Belangrijk is dat het gaat om een hypothese, die bij nadere
toetsing met een statistisch testmodel juist of onjuist kan blijken te zijn. In deze
statistische test wordt gekeken naar de scores op de items van een steekproef van
proefpersonen verzameld door de proefversie van de test. Alle items zouden
, dezelfde eigenschap moeten meten. Vindt men in de testgegevens dat alle
correlaties tussen itemscores positief zijn en ongeveer even groot, dan is dit een
ondersteuning van de hypothese dat de items gezamenlijk dezelfde eigenschap
meten. Vindt men sterke variatie of dat sommige correlaties negatief zijn, dan is dit
een verwerping van de hypothese dat de items dezelfde eigenschap meten.
4) Terugkoppeling naar de theorie:
Blijkt de uitkomst inderdaad aan te geven dat de test de bedoelde eigenschap meet
en dat verder aan een aantal technische eisen voor een geslaagde meting is
voldaan, dan heeft men niet alleen een goed meetinstrument in handen maar is er
aanvullende evidentie gevonden voor de theorie van de achterliggende eigenschap
(die bestaat uit het nomologisch netwerk, een theorie ter verklaring van de
waarneembare verschijnselen waarbinnen de gemeten eigenschap een plaats heeft).
Bovenstaande procedure voor het meten van psychologische eigenschappen sluit goed aan
bij de statistische methoden die doorgaans worden gebruikt om tests te construeren en hun
meeteigenschappen vast te stellen. Dit zijn de klassieke testtheorie met nadruk op
betrouwbaarheid en de item-responstheorie met haar nadruk op hoe de testprestatie tot
stand komt. Ook is een derde, belangrijke opvatting over meten belangrijk: ‘representational
measurement’, dat ervan uitgaat dat er alleen sprake kan zijn van meting indien formele
relaties tussen meetwaarden/testscores overeenkomen met de relaties die er in de empirie
bestaan tussen de ‘objecten’ waarover die meetwaarden iets zeggen.
2.3 Definitie van een test
‘Een test is een systematische classificatie- of meetprocedure, waarbij het mogelijk is een
uitspraak te doen over één of meer empirisch-theoretisch gefundeerde eigenschappen van
de onderzochte of over specifiek niet-testgedrag, door uit te gaan van een objectieve
verwerking van reacties van hem/haar, in vergelijking tot die van anderen, op een aantal
gestandaardiseerde, zorgvuldig gekozen stimuli.’
2.4 Toepassingsmogelijkheden van de psychologische test
2.4.1 Beoordeling van individuen
Dankzij testonderzoek is er de mogelijkheid met grotere nauwkeurigheid en meer kans op
succes een uitspraak te doen over het gedrag van de onderzochte. Deze uitspraken vinden
plaats in zeer uiteenlopende situaties, die telkens de soort en de gebruikswijze van de meest
geschikte tests bepalen:
1) De situatie waarin voorspellingen worden gedaan over een veelal in de toekomst
gelegen prestatie - aangeduid met ‘criterium’- aan de eisen waarvan men al of niet
kan voldoen.
2) Een keuzemogelijkheid tussen ten minste twee opties die onderling kwantitatief of
kwalitatief kunnen verschillen.
3) Wat de zwakke en sterke kanten van een kandidaat zijn, of in welke gebieden een
cliënt meer of minder is geïnteresseerd. Omdat het hierbij gaat om de onderlinge
vergelijking/verhouding van testscores van dezelfde persoon worden ze ook met
elkaar (en niet op een externe norm) vergeleken (‘ipsatieve scores’).
4) Het vergelijken van resultaten van eenzelfde persoon die behaald zijn op
verschillende tijdsmomenten (longitudinaal onderzoek).
5) Een beschrijving van een onderzochte.
6) Een niet-directieve vorm van therapie/counseling.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller deleergierigepsycho. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.51. You're not tied to anything after your purchase.