Samenvatting voor eindtoets MTS4.
Uitgebreide aantekeningen van de hoorcolleges, samenvatting van het boek van Field & belangrijke info uit practica en instructie colleges. De volgende thema's zijn besproken:
- Datamanagement
- Factoranalyse
- Multiple regressie
- Mediatie/moderatie analyse
- Log...
Week 4 – Datamanagement (1)
Data editor: waar je de data kan zien en bewerken (dus gewoon alle antwoorden op je survey bv. in
SPSS waar al je variabelen ook staan).
Dialog box: elk scherm waarin je informatie moet verschaffen of een reactie moet voorzien.
File: data, grafieken of outputs opslaan/printen, openen voorgaande opgeslagen bestanden.
Edit: kopiëren en plakken van data, nieuwe variabele toevoegen, skippen naar bepaalde rij/kolom.
View: system specificaties, dus wat voor soort lijnen in data editor of het weergeven van value labels.
Data: aanpassen van de data in data editor. Bv. split file, analyse alleen voor bepaalde sample van de
data (selected cases)
Transform: aanpassen van variabelen in data editor. Bv. hercoderen in zelfde/andere variabele
Analyze: onder andere beschrijvende statistieken, GLM, correlatie, regressie etc.
Graphs: toegang tot chart builder om histogrammen/grafieken/boxplots te maken
Window: switchen van window naar window (van output naar dataset)
= naar specifieke case (rij) in data editor gaan
= naar specifieke variabele in data editor
= informatie over elke variabele (met value labels etc.)
= beschrijvende statistiek tabel van variabele waar je op geklikt staat met je muis
= zoeken naar woorden/nummers in data editor/viewer.
= split file
= select cases (bepaald deel van data analyseren)
= switchen tussen value labels als weergave en nummers voor die categorie (bv. je ziet ‘man’
of ‘1’.
Wide format: elke rij vertegenwoordigt data van één entiteit (bv. 1 participant) en elk kolom
vertegenwoordigt een variabele.
Long format: scores op uitkomstvariabele verschijnen in een enkele kolom en rijen
vertegenwoordigen een combinatie van de atributie van die scores. Hier komen scores van 1
participant voor over meerdere rijen.
Label: uitleg wat variabele precies inhoudt
Values: nummers geven aan groepen (bv. man = 1, vrouw = 2)
String variabele bestaat uit letters in plaats van cijfers (bv. naam van iemand) altijd nominaal
aangeven als meetniveau. Moet string variabelen converteren naar numerieke variabelen.
Groeps variabelen zijn numerieke variabelen, maar altijd nominaal (ordinaal als het betekenisvolle
volgorde heeft) als meetniveau want bevatten eigenlijk namen (geslacht bv.).
Bij een system missing value ontbreekt er een waarde voor een variabele in het databestand.
Hiervoor wordt voor een numerieke variabele in het databestand een ‘.’ genoteerd, bij een
alfanumerieke variabele blijft de cel geheel leeg. Een user missing value wordt door jezelf toegekend.
Je geeft in SPSS aan welke numerieke codes beschouwd moeten worden als missing. System missings
worden door SPSS net zo behandeld als missing values; optie 1 (system missings gewoon laten staan)
1
,en optie 2 (een missing value (bv. 99) geven) komen wat dat betreft dus op hetzelfde neer. Optie 2
waarbij je een numerieke code geeft, gebruik je vooral voor de situatie waarbij een antwoord heeft
gegeven waar je in de analyse geen gebruik van wilt maken. Denk aan de optie ‘niet van toepassing’
of ‘weet niet’. Optie 3 (de waarde 0 geven, bv. omdat persoon geen FB vrienden heeft) heeft als
nadeel dat je dan geen onderscheid meer maakt tussen personen met Facebook, maar zonder
vrienden en personen zonder Facebook.
Aantal posities van variabele kiezen door te kijken naar aantl cijfers van het grootste getal in de dat
(bv. waarde 1006, dus: F4.0).
2
, Week 5 – Factoranalyse (5)
Factoranalyse: Beoordelen hoe goed we in staat zijn om een verzameling van vragen die gaan over
hetzelfde te vervangen voor 1 of 2 nieuwe variabelen. Factoranalyse geeft soort argument om dit
inderdaad te doen.
Latente variabele: iets meten wat niet direct gemeten kan worden (heeft meerdere aspecten).
Doelen factoranalyse:
Datareductie: samenvatten informatie van aantal items in klein(er) aantal factoren (nieuwe
variabelen). Aantal en interpretatie factoren vooraf onbekend. Exploratief van aard. Hoeveel
zinvolle (statistische en inhoudelijk) factoren zijn voor een verzameling item te onderscheiden?
Beoordelen dimensionaliteit (schaalconstructie): meten van indirect geobserveerde
theoretische constructen. Aantal en interpretatie factoren vooraf bekend. Confirmatief. Komt de
in data gevonden factorstructuur overeen met verwachte aantal factoren? eigenlijk
beoordelen van validiteit van je structuur
Factoranalysemodellen:
Principale Componenten Analyse, hoofcomponentenanalyse, PCA
PCA: probeert de maximale hoeveelheid van de totale variatie (total variance) te verklaren in een
correlatiematrix door originele variabelen te transformeren in lineaire componenten.
Voorspellen van componenten van de gemeten variabelen. Heeft geen error term. PCA geldt
alleen voor jouw eigen steekproef in het onderzoek, niet generaliseerbaar naar populatie.
Factoranalyse, Principal Axis Factoring, PAF
Factor analyse: verklaart maximale hoeveelheid gemeenschappelijke variatie (common variance)
in een correlatiematrix met behulp van het kleinste aantal verklarende constructen (latente
variabelen/factoren die cluster variabelen vertegenwoordigen die sterk met elkaar correleren).
Voorspellen van gemeten variabele van de onderliggende factoren. Heeft een error term.
Dus PCA verandert bestaande gemeten variabele, terwijl factor analyse nieuwe niet gemeten
variabelen maakt (van 3 correlerende variabelen, maak je 1 nieuwe die alle 3 representeert).
3 belangrijke toepassingen factor analyse + principal component analyse (PCA):
Structuur van verschillende variabelen begrijpen
Vragenlijst opstellen om een onderliggende variabele te meten
Dataset beperken tot een beter beheersbare grootte met behoud van zoveel mogelijk originele
informatie
Ze zorgen ervoor om dataset te verkleinen naar minder factoren/componenten
In dit college beperken we ons tot PCA > laten verschil tussen deze 2 modellen buiten beschouwing!
De betrouwbaarheid van de factoranalyse hangt af van de grootte van de steekproef. In kleine
steekproeven schommelen de correlaties veel. Dus grotere steekproef is betrouwbaarder.
Z-sores: hoever het afligt van het gemiddelde
R-matrix: correlatie tussen variabelen in een tabel
Totale variantie voor een variabele in de R-matrix heeft 2 componenten:
Een deel ervan wordt gedeeld met andere variabelen of metingen = common variance hier is
factor analyse geïnteresseerd in
Een deel ervan zal specifiek zijn voor die ene meting (betrouwbaar) = unique variance
Random variance = variantie die specifiek is voor één meting, maar niet betrouwbaar.
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper melissadb. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.