Week 1:
Hoorcollege 1: Variabelen, meetniveaus en hypothesen
Variabelen
- unit of analysis: datgene waarover je info verzamelt (horizontaal)
- individuen, bedrijven, landen, scholen
- Variabelen: Kolommen in je dataset
- gemeten kenmerken van een unit of analysis
- Values: individuele scores
- wat is 0 en wat is 1: value label
(on) afhankelijke variabelen
- onafhankelijke variabelen: de vermoedelijke oorzaak, de predictor. Noemen we X
- heeft invloed op iets anders
- afhankelijke variabelen: Het vermoedelijke gevolg, de outcome. Noemen we Y
- wordt beïnvloed door iets anders
- per analyse vaak één afhankelijke, mar mogelijk meerdere onafhankelijk
- afhankelijke is vaak het concept dat je wil onderzoeken
- Theorie en je hoofdvraag zijn bepalend
- Hoe beïnvloedt het lidmaatschap van een studentenvereniging sociaal
kapitaal?
- wel of niet lid zijn = afhankelijk
- sociaal kapitaal = onafhankelijk
- Wat is het effect van sociaal kapitaal op politiek vertrouwen
- sociaal kapitaal = onafhankelijk
- politiek vertrouwen = afhankelijk
Oefen tentamenvraag
Het ging zojuist steeds over data met individuen als unit of analysis. Verzin een
onderzoeksvraag waarbij landen de unit of analyse zijn?
- Heeft het werkloosheidspercentage van een land invloed op het geluksniveau?
Meetniveaus
- categoriaal (je zit in groepen A. B, of C, politieke partij)
- Binair: 2 categorieën, Man/Vrouw →Nominal
- Nominaal: meer dan 2 categorieën, Man/Vrouw/Non binair óf politiek partij
→ Nominal
- Ordinaal: inherente ordening, logische ordening in de groepen,
opleidingsniveau, leeftijd in categorieën (van minder naar meer), nooit,
zelden, soms, vaak → Ordinal
- Continu (het is een schaal, leeftijd zelf invullen)
- interval: verschillen op schaal zijn betekenisvol → Scale
- ratio: Er is een betekenisvol nupunt (graden Celcius) → Scale
,Likert scale:
- tot 7 point likert scale = ordinal
- 7 point likert scale = vanaf dat moment is het een interval = scale
Waarom zijn meetniveaus belangrijk?
- als je dit niet goed snapt kun je later in de knoop raken
- meetniveaus bepaalt welke statistische toets mogelijk is
- voor een afhankelijke variabele is scale het beste
- vaak meerdere likert-scale samengevoegd
- meetniveaus niet vaststaand: antwoordopties van een vraag bepalen het meetniveau
van een variabele!
Oefententamen Vraag
- wat is het meetniveau van onderstaande vraag/variabele?
- hoeveel uur per dag besteed u achter de laptop (ORDINAAL)
- 0-3 uur
- 3-6 uur
- 6-9 uur
Ken uw data
- centrummaten
- mediaan
- modus
- gemiddelde: som getallen / aantal
- spreidingsmaten
- range
- standaarddeviatie: gemiddelde afwijking van het gemiddelde
Wat zegt de standaarddeviatie
- de spreiding in de data
- een maat voor de error/afwijking in de data
- Hoe representatief het gemiddelde is voor de data
- Een kleine standaarddeviatie is niet ‘beter’, maar een kleine spreiding is voor je
model beter omdat het een betere verklaring geeft
Hypothesen
- van vraag idee naar een kwantitatief toetsbare hypothese:
- precies: specifieke eigen formulering per toets
- toetsbaar met data: verwachte relatie tussen twee variabelen
- Potentieel falsifieerbaar: goed of fout, niets er tussen in
- H1: er is wel een effect (dat wat je verwacht op basis van je idee)
- H0: er is geen effect (ontkenning van je idee)
Doorgaans 2 typen
- verschil tussen twee of meer groepen
- Mannen en vrouwen verschillen wat betreft hun mening over abortus
(tweezijdig)
, -Gamma studenten zijn extraverter dan alfa en bèta studenten (eenzijdig)
- afhankelijk = extraverter
- onafhankelijk = wel of geen gamma student
- nominaal
- samenhang tussen twee variabelen
- Roken hangt samen met gezondheidsklachten (tweezijdig)
- Er is een positieve relatie tussen leeftijd en conservatisme (eenzijdig)
- eenzijdig of tweezijdig toetsen:
- eenzijdig: je hebt een vermoeden over de richting van het verband
- tweezijdig: je hebt geen vermoeden over de richting van het verband
- Dit heeft invloed op hoe je toetst: overschrijdingskans (komt nog)
Waartoe dient dit alles?
- hypothese: idee over de populatie dat je gaat toetsen dmv een steekproef om zo iets
over de hele populatie te zeggen
- In de steekproef vind je altijd een (klein) effect of verschil. Het gaat erom de kans te
bepalen dat je een effect in de steekproef vindt, terwijl dat effect er in de populatie
niet is.
- Hoe groot is de kans in de steekproef deze waarden te vinden terwijl eigen de H0
waar is in de populatie (het effect wat je vindt afzetten tegen geen effect)
- Als de kans groot is, verwerpen we de H1: het effect is niet significant
- Als de kans klein is, nemen we de H1 aan: het effect is significant
- Wat betekent significant?
Hoe groot is de kans = p-waarde < 0,05 verschil is significant
Waar hangt die kans van af
- groot van het gevonden effect
- aantal respondenten
- standaarddeviatie
- grote spreiding is minder snel significant effect
SYNTAX
*als je dit aangeeft leest de syntax het niet als code
- is handig om structuur te brengen aan je syntax
Frequentieverdeling van een variabelen
= hoe vaak elke score voorkomt
skew = afwijking naar of de ene kant of andere
kant
- linkse afwijking is positive skew (leeftijd
universiteit, inkomen)
, - rechts afwijking is negative skew (tentamencijfers)
Kurtosis = geeft de relatieve piekvorm of vlakheid van een verdeling aan in vergelijking met de
normale verdeling. Een positieve kurtosis wijst op een verdeling met een relatief hoge piek. Een
negatieve kurtosis wijst op een relatief vlakke verdeling.
lepto kurtic: leeftijd in de hoorcollegezaal
platykurtuc: leeftijd in nederland
Bell curve = waarmee we de normaalverdeling aanduiden
- de normaalverdeling: →
- vb. 68,27% is gemiddelde +/- 1 SD etc.
standaard normale verdeling en Z scores
- gemiddelde = 0 & SD = 1 = sigma
- Z-scores = de waarde van de observatie uitgedrukt in eenheden standaarddeviatie:
of het aantal standaarddeviaties dat een bepaalde waarde van een observatie
verwijderd is van het gemiddelde
- je standaardiseert de score ten opzichte van de andere scores
- de verdeling van z-scores heeft een gemiddelde van 0 en een standaarddeviatie van
1
- Z = (x(aantal) - (gemiddelde)) / standaarddeviatie
- hoe goed iemand scort t.o.v de rest
normaalverdeling standaardiseren
- als je voor al je observaties de z-score zou berekenen, creëer je hiermee een nieuwe
verdeling met een gemiddelde van 0 en een SD van 1
De Z-tabel
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper sachahofstee. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,06. Je zit daarna nergens aan vast.