Samenvatting WO statistiek
HC1: Beschrijvende statistiek
- Beschrijvende statistiek: samenvatten kenmerken van dataset
- Inferentiële statistiek: A met B vergelijken, waarnemingen halen uit dataset
Typen variabelen:
Categorisch / discreet:
- Nominaal (Binair): verschillende klassen (geslacht, kleur, etc)
- Ordinaal: volgorde in (strakke) klassen (ervaring: slecht, goed, heel goed, etc)
Continu:
- Ratio: 0 tot 100 met natuurlijk nulpunt (tentamencijfer, etc)
- Interval: Intervallen tussen waarden (volgorde met vaste afstand, geen nulpunt
Beschrijvende statistiek:
- Scatterplot (puntenwolk)
- Barchart (staaf voor iedere aanwezige waarde)
- Histogram (staaf voor iedere mogelijke groep)
Normaalverdeling: —>
Testen gaan vaak uit van normaalverdeling.
Andere verdelingen: links, rechts, hoog, plat
Metrics:
Gemiddelde: (alle waarden opgeteld / n)
Mediaan: middelste getal (1,4,5,7,10), even aantal (1,5,7,10) gemiddelde van middelste 2 (6)
Modus: meest voorkomende getal (1,2,2,5,7,10) = 2
Afwijking groep meten:
- SS (Sum of Squares): totale afwijking v. gemiddelde. 𝚺(Xi - gemiddelde)2
- Variantie (s2): SS / n-1
- Standaardeviatie (s): 𝑠2
, Z-score
Berekenen afwijking van 1 punt t.o.v. groep
Aanname: normaalverdeling populatie
𝑋( 𝑙𝑜𝑠𝑠𝑒 𝑠𝑐𝑜𝑟𝑒) − 𝐺𝑒𝑚𝑖𝑑𝑑𝑒𝑙𝑑𝑒 𝑔𝑟𝑜𝑒𝑝 (𝑧𝑜𝑛𝑑𝑒𝑟 𝑋 𝑚𝑒𝑒𝑔𝑒𝑡𝑒𝑙𝑑!!)
𝑧 = 𝑠 (𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑑𝑒𝑣𝑖𝑎𝑡𝑖𝑒)
Bereken ‘larger’ of ‘smaller’ portion via tabel. X is hierbij groter dan (larger portion * 100)%
van de populatie).
Voor een significant verschil:
- Bij one-tailed: smaller portion moet kleiner zijn dan α (vaak 0.05)
- Bij two-tailed: smaller portion moet kleiner zijn dan α/2 (vaak 0.025)
HC2: Hypothese testen & assumpties
Hypothese: testbare voorspelling
Opstellen: Van theorie naar hypothese.
Stel H0 (nulhypothese, voor als er niets gebeurt / geen effect is) en Ha (alternatieve
hypothese, voor als de nulhypothese niet waar is) op.
Bevat: variabelen, relatie & methode.
Data verzamelen:
Steekproef:
𝑠
σ (𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑒𝑟𝑟𝑜𝑟) =
𝑛
Aanname: 30 waarden in steekproef => vaak normaalverdeling
Statistical test finder
Kijk naar variabelen: aantal en type; en onderzoeksopzet: between / within subject
Assumpties
- Normaalverdeling => test met qqplot of Shapiro-Wilk test (p-waarde onder α (0.05):
geen normaalverdeling)
- Homogeniteit van variantie =? test met Levene’s test (p-waarde onder α (0.05):
verschil in variantie)
Hypothese testen:
P-waarde (tussen 0 en 1): kans dat nulhypothese waar is.
Opstellen kritieke grens (vaak α = 0. 05)
Te hoog: neem je te snel een verband aan (Type I)
Te laag: mis je misschien een verband (Type II)
Effect grootte: hoe groot is het effect (verklaarde variantie)
r2: proportie verklaarde variantie (