Vaak gebruiken van een samengestelde variabele. Een aantal items die samen het gemeten
construct weergeven. Factoranalyse = beoordelen hoe goed we instaat zijn om een
verzameling van vragen die gaan over hetzelfde, te vervangen door een of twee nieuwe
variabele. De factoranalyse laat zien of dit kan en verantwoordt dit.
Doelen factoranalyse
1. Datareductie
a. Samenvatten van informatie van een aantal items in een klein(er) aantal
factoren.
b. Hierin is het aantal en de interpretatie factoren vooraf onbekend.
c. Hierdoor is de factoranalyse exploratief van aard.
d. De vraag die we in een exploratieve factoranalyse stellen is: hoeveel zinvolle
(statistische en inhoudelijke) factoren zijn voor een verzameling items te
onderscheiden?
2. Beoordelen van dimensionaliteit (inzetten voor schaalconstructie)
a. Het meten van indirect geobserveerde theoretische constructen.
b. Hierin is het aantal en de interpretatie van de factoren vooraf wel bekend.
c. Hierdoor is de factoranalyse confirmatief van aard.
d. De vraag die we hierbij stellen is: komt de in de data gevonden factorstructuur
overeen met het verwachte aantal factoren? Je zoekt dus naar een
ondersteuning van je verwachting.
Er zijn 2 factoranalysemodellen besproken:
→ Principale Componenten Analyse / hoofdcomponentenanalyse / PCA
→ Principal Axis Factoring / factoranalyse in enge zin / PAF
In dit hoorcollege bespreken we alleen PCA.
Datareductie (Factorstructuur = onbekend)
Vooraf is geen idee van de uiteindelijke factorstructuur. De data komt van 220 atleten die de
tienkamp doen. 10 items (prestaties van de tienkamp) waarvan de scores zijn bepaald. Hier
zijn de z-scores van berekend; het aantal standaardafwijkingen dat iemand afligt van het
gemiddelde (-4, 4).
Kunnen we de atleten typeren op basis van een gering aantal onafhankelijke factoren?
Factoren = clusters van onderdelen (items) waarop atleten goed/slecht presteren. Kijken of ze
allemaal andere vaardigheden hebben. (Kogelwerpen is anders dan hordelopen).
Onafhankelijk = geen samenhang tussen de scores op te onderscheiden factoren; een score op
factor A zegt niks over de score op factor B.
Stappenplan exploratieve factoranalyse
1. Zijn de items geschikt voor factoranalyse?
a. Item correlatiematrix
b. KMO
c. Bartlett’s test
2. Aantal factoren?
, a. Kaiser criterium
b. Knikcriterium
c. Jolliffe cirterium
3. Interpreteerbare oplossing?
a. Varimax rotatie
b. Oblimin rotatie
4. Nieuwe variabelen?
a. Bewaar factorscores
b. Bereken schaalscores
5. Betrouwbaarheid?
a. Cronbach’s Alpha
Exploratieve factoranalyse
Stap 1: items geschikt voor PCA?
Als eerste kijken naar de correlatiematrix; geeft samenhang tussen alle tien onderdelen.
Hiervoor geldt een criterium: voor elk item moet minimeel één correlatie zijn van >0.3 of <-
0.3.
→ Alle items voldoen aan dit criterium. Als dit niet geld, verwijder dan de items die niet aan
het criterium voldoen.
Twee andere criteria: KMO vuistregel en de Bartlett test.
KMO → Redelijk
Bartlett’s test → significant
, Stap 2: Aantal factoren?
Hoeveel zinvolle achterliggende factoren zijn er binnen de verzameling van de 10
onderdelen? De criteria zijn hiervoor gebaseerd op de eigenwaarden van de factoren =
verklaarde variantie in alle items door een factor. De verklaarde variantie is gelijk aan 1,
verdeeld over de 10 items. Elke factor probeert iets van die verklaarde variantie te verklaren.
De mate waarin zo’n factor daartoe in staat is wordt uitgedrukt in de eigenwaarde.
Drie criteria voor het kiezen van het aantal statistisch zinvolle achterliggende factoren voor de
verzameling van 10 onderdelen:
1. Kaisercriterium
Kiezen voor de factoren met een eigenwaarde > 1. 10 components (de 10 items) worden
gegeven met 10x een getalletje (total) van de eigenwaarde erachter.
Hier worden dus 3 zinvol te onderscheiden factoren gegeven → alle drie een eigenwaarde
groter dan 1. Vuistregel: alle factoren die een eigenwaarde hebben die groter is dan 1 zijn een
initiële factor.
2. Knikcriterium
Het aantal factoren boven de knik in de screeplot (met eigenwaarden). 10 componenten
worden op de x-as gegeven, die getalletjes corresponderen met de 10 rijen van de 10 factoren.
De eigenwaarden staan in dit plaatje in een grafiek weergegeven. De eerste factor verklaart de
meeste variantie, met dus de grootste eigenwaarden.