theory construction and statistical modeling 200300125
theory construction and statistical modeling
Written for
Universiteit Utrecht (UU)
Algemene Sociale Wetenschappen
Theory Construction and Statistical Modeling
All documents for this subject (5)
1
review
By: StijnBeekhuis • 5 year ago
Seller
Follow
tessawijsman1
Reviews received
Content preview
Lecture 2 factor en component analysis
Een latente variabelen is iets was niet direct te observeren is. Maar wel wanneer we een combinate
van geobserveerde variabelen gebruiken die allemaal een apart aspect van de latente variabel
‘aanraken’.
Wanneer is een construct goed geoperatonaliseerd is? Dat we meten wat we denken dat we meten.
Hoogte meten van een persoon, het is goed geoperatonaliseerd wanneer je meetlint hebt en
daarmee meet.
Indicators en geobserveerde variabelen zijn hetzelfde.
Net als latent en factor.
Variances niet iedereen hef dezelfde score maar
we zeggen dat het verklaard kan worden, residual is
het overgebleven deel wat niet verklaard is.
Een factorlading is het directe efect van een factor
naar de indicator = pijl = regressielijn in pathmodel.
De covariance is de variante tussen de factoren/
componenten/ onafankelijke variabelen.
Factor analyse PCA en EFA
Er zijn twee soorten Exploratory factor Analysis (EFA) en Principal Components Analysis (PCA)
Ze zijn allebei gerelateerd aan elkaar:
- Gebruiken zelfde SPSS window
- Allebei beschreven als een type van factor analyse
- Gaat beide om een set van geobserveerde variabelen te bundelen en in een kleine set te
maken, terwijl de informate nog steeds bewaard blijf, zoveel mogelijk informate.
- Data-driven approaches: je gaat kijken naar data en weet daaruit niet hoeveel factors je gaat
over houden, daarom is het exploratory.
De methodes verschillen alleen in wat ze goede informate vinden.
Er zijn drie verschillende stappen die je doorloopt bij het gebruiken van EFA en PCA:
1. Ontwikkeling van een meetnstrument of test voor de latente variabel (persoonlijkheid,
intelligente, depressie)
a. Een vragenlijst maken met een groot aantal items over het onderwerp
b. Die in laten vullen
c. Aantal factors afezen
d. Verwijder of voeg items toe afankelijk van de factor
e. Doe stap b, c, d opnieuw
f. Test de validiteit van de factors voorspel toekomstge cijfers bijvoorbeeld.
2. De dimensies van de test items onderzoeken
3. Data reducte, ook wel dimension reducton de groepen die gemaakt moeten worden en
het oplossen van multcollinearity in lineaire regressie (twee items die heel erg met elkaar
correleren verklaren ongeveer hetzelfde en dit kun je oplossen door te verkleinen naar een
kleinere set.
, Het verschil tussen PCA en FA is dat ze andere doelen hebben.
- PCA is wanneer we geïnteresseerd zijn in een data reducte en wel de zo groot mogelijke
variante wilt hebben als mogelijk in de dataset.
- EFA verondersteld/ wil een theoretsch model van latente factoren te testen die veroorzaakt
worden door geobserveerde variabele. Het model zegt dat de geobserveerde covariances er
zijn, omdat alle variabelen worden veroorzaakt door de niet geobserveerde factor. Je
gebruikt het ook als je niet precies weet hoeveel factors of welke factoren zorgt voor welke
variabel bewijzen dat een latente structuur goed is.
PCA verklaard zoveel mogelijk variantie en EFA zo veel mogelijk covariantie.
Het plaatje hierboven geef dit weer, links EFA en rechts PCA. De cirkels staan voor de totale
variante. Bij EFA is er een groot stuk rood, dit is het onverklaarde = error = unieke variante. Het
blauwe deel is wat meegenomen wordt voor het doen van de factor analyse, de covariante =
common/shared variance.
Principal Components Analysis
Geobserveerde variabelen moeten zoveel mogelijk samenhangen met één factor en dus niet
correleren met anderen, daarvoor kun je gebruik maken van rotate. De eerste component verklaart
de meeste variante en de tweede het twee na meeste enzovoort.
Y¹ en Y² zijn allemaal losse observates.
Dimensies van de data set y1 en y2 zoals hierboven grafsch weergegeven ->
willen zoveel mogelijk in één dimensie hebben en maken
dus een dimensie waar zoveel punten in kunnen als
mogelijk. Zitten zoveel mogelijk om die lijn, en daarom
blauw lijn. Zie links.
Er moet een 90 graden afwijkende lijn doorheen, omdat
het niet correlerend mag zijn. Heef minder variante
(minder puntjes, maar omdat de eerst blauwe lijn niet
perfect was, is de nieuwe lijnen erbij gekomen die ook wat (punten) meeneemt.
De nieuwe informate zet je recht. Zo heb je zoveel mogelijk punten op de lijnen
staan en vang je het meeste van de variante (je wilt zoveel mogelijk verklaren).
Zo krijg je de afeelding rechts.
Exploratory factor Analysis
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller tessawijsman1. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.26. You're not tied to anything after your purchase.