Week 1:
Hoorcollege 1: Variabelen, meetniveaus en hypothesen
Variabelen
- unit of analysis: datgene waarover je info verzamelt (horizontaal)
- individuen, bedrijven, landen, scholen
- Variabelen: Kolommen in je dataset
- gemeten kenmerken van een unit of analysis
- Values: individuele scores
- wat is 0 en wat is 1: value label
(on) afhankelijke variabelen
- onafhankelijke variabelen: de vermoedelijke oorzaak, de predictor. Noemen we X
- heeft invloed op iets anders
- afhankelijke variabelen: Het vermoedelijke gevolg, de outcome. Noemen we Y
- wordt beïnvloed door iets anders
- per analyse vaak één afhankelijke, mar mogelijk meerdere onafhankelijk
- afhankelijke is vaak het concept dat je wil onderzoeken
- Theorie en je hoofdvraag zijn bepalend
- Hoe beïnvloedt het lidmaatschap van een studentenvereniging sociaal
kapitaal?
- wel of niet lid zijn = afhankelijk
- sociaal kapitaal = onafhankelijk
- Wat is het effect van sociaal kapitaal op politiek vertrouwen
- sociaal kapitaal = onafhankelijk
- politiek vertrouwen = afhankelijk
Oefen tentamenvraag
Het ging zojuist steeds over data met individuen als unit of analysis. Verzin een
onderzoeksvraag waarbij landen de unit of analyse zijn?
- Heeft het werkloosheidspercentage van een land invloed op het geluksniveau?
Meetniveaus
- categoriaal (je zit in groepen A. B, of C, politieke partij)
- Binair: 2 categorieën, Man/Vrouw →Nominal
- Nominaal: meer dan 2 categorieën, Man/Vrouw/Non binair óf politiek partij
→ Nominal
- Ordinaal: inherente ordening, logische ordening in de groepen,
opleidingsniveau, leeftijd in categorieën (van minder naar meer), nooit,
zelden, soms, vaak → Ordinal
- Continu (het is een schaal, leeftijd zelf invullen)
- interval: verschillen op schaal zijn betekenisvol → Scale
- ratio: Er is een betekenisvol nupunt (graden Celcius) → Scale
,Likert scale:
- tot 7 point likert scale = ordinal
- 7 point likert scale = vanaf dat moment is het een interval = scale
Waarom zijn meetniveaus belangrijk?
- als je dit niet goed snapt kun je later in de knoop raken
- meetniveaus bepaalt welke statistische toets mogelijk is
- voor een afhankelijke variabele is scale het beste
- vaak meerdere likert-scale samengevoegd
- meetniveaus niet vaststaand: antwoordopties van een vraag bepalen het meetniveau
van een variabele!
Oefententamen Vraag
- wat is het meetniveau van onderstaande vraag/variabele?
- hoeveel uur per dag besteed u achter de laptop (ORDINAAL)
- 0-3 uur
- 3-6 uur
- 6-9 uur
Ken uw data
- centrummaten
- mediaan
- modus
- gemiddelde: som getallen / aantal
- spreidingsmaten
- range
- standaarddeviatie: gemiddelde afwijking van het gemiddelde
Wat zegt de standaarddeviatie
- de spreiding in de data
- een maat voor de error/afwijking in de data
- Hoe representatief het gemiddelde is voor de data
- Een kleine standaarddeviatie is niet ‘beter’, maar een kleine spreiding is voor je
model beter omdat het een betere verklaring geeft
Hypothesen
- van vraag idee naar een kwantitatief toetsbare hypothese:
- precies: specifieke eigen formulering per toets
- toetsbaar met data: verwachte relatie tussen twee variabelen
- Potentieel falsifieerbaar: goed of fout, niets er tussen in
- H1: er is wel een effect (dat wat je verwacht op basis van je idee)
- H0: er is geen effect (ontkenning van je idee)
Doorgaans 2 typen
- verschil tussen twee of meer groepen
- Mannen en vrouwen verschillen wat betreft hun mening over abortus
(tweezijdig)
, -Gamma studenten zijn extraverter dan alfa en bèta studenten (eenzijdig)
- afhankelijk = extraverter
- onafhankelijk = wel of geen gamma student
- nominaal
- samenhang tussen twee variabelen
- Roken hangt samen met gezondheidsklachten (tweezijdig)
- Er is een positieve relatie tussen leeftijd en conservatisme (eenzijdig)
- eenzijdig of tweezijdig toetsen:
- eenzijdig: je hebt een vermoeden over de richting van het verband
- tweezijdig: je hebt geen vermoeden over de richting van het verband
- Dit heeft invloed op hoe je toetst: overschrijdingskans (komt nog)
Waartoe dient dit alles?
- hypothese: idee over de populatie dat je gaat toetsen dmv een steekproef om zo iets
over de hele populatie te zeggen
- In de steekproef vind je altijd een (klein) effect of verschil. Het gaat erom de kans te
bepalen dat je een effect in de steekproef vindt, terwijl dat effect er in de populatie
niet is.
- Hoe groot is de kans in de steekproef deze waarden te vinden terwijl eigen de H0
waar is in de populatie (het effect wat je vindt afzetten tegen geen effect)
- Als de kans groot is, verwerpen we de H1: het effect is niet significant
- Als de kans klein is, nemen we de H1 aan: het effect is significant
- Wat betekent significant?
Hoe groot is de kans = p-waarde < 0,05 verschil is significant
Waar hangt die kans van af
- groot van het gevonden effect
- aantal respondenten
- standaarddeviatie
- grote spreiding is minder snel significant effect
SYNTAX
*als je dit aangeeft leest de syntax het niet als code
- is handig om structuur te brengen aan je syntax
Frequentieverdeling van een variabelen
= hoe vaak elke score voorkomt
skew = afwijking naar of de ene kant of andere
kant
- linkse afwijking is positive skew (leeftijd
universiteit, inkomen)
, - rechts afwijking is negative skew (tentamencijfers)
Kurtosis = geeft de relatieve piekvorm of vlakheid van een verdeling aan in vergelijking met de
normale verdeling. Een positieve kurtosis wijst op een verdeling met een relatief hoge piek. Een
negatieve kurtosis wijst op een relatief vlakke verdeling.
lepto kurtic: leeftijd in de hoorcollegezaal
platykurtuc: leeftijd in nederland
Bell curve = waarmee we de normaalverdeling aanduiden
- de normaalverdeling: →
- vb. 68,27% is gemiddelde +/- 1 SD etc.
standaard normale verdeling en Z scores
- gemiddelde = 0 & SD = 1 = sigma
- Z-scores = de waarde van de observatie uitgedrukt in eenheden standaarddeviatie:
of het aantal standaarddeviaties dat een bepaalde waarde van een observatie
verwijderd is van het gemiddelde
- je standaardiseert de score ten opzichte van de andere scores
- de verdeling van z-scores heeft een gemiddelde van 0 en een standaarddeviatie van
1
- Z = (x(aantal) - (gemiddelde)) / standaarddeviatie
- hoe goed iemand scort t.o.v de rest
normaalverdeling standaardiseren
- als je voor al je observaties de z-score zou berekenen, creëer je hiermee een nieuwe
verdeling met een gemiddelde van 0 en een SD van 1
De Z-tabel
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur sachahofstee. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €7,06. Vous n'êtes lié à rien après votre achat.