College 1
Herhaling blok 1.3
Meetniveaus:
1. Nominaal → onderdelen in groepen, categorieën (niet meer of beter, appel en peer)
2. Ordinaal → logische ordening aan te brengen in de groepen (bv. SES, laag/midden/hoog),
maar de verschillen tussen de groepen zijn niet even hoog
3. Interval → logische ordening, afstanden tussen de categorieën zijn even groot (8→10→12 of
graden Celsius, kan onder 0)
4. Ratio → logische ordening, afstanden tussen categorieën zijn even groot én er is een absoluut
nulpunt (gewicht, lengte, snelheid, inkomen; kan niet negatief worden)→iets van 0 is helemaal
geen lengte
Als iets een vaststaand nulpunt heeft, kan je zeggen dat iets 2x zo groot is als iets anders
Voorbeeld temperatuur (interval); je kan zeggen dat 10 naar 12 graden evenveel scheelt als 20 naar 22
graden, maar je kan niet zeggen dat 20 graden twee keer zo veel is als 10 graden. (die uitspraken kan
je alleen doen met een absoluut nulpunt, dus met ratio)
Frequentieverdeling:
- Symmetrisch
- Scheef naar links
- Scheef naar rechts
Denk aan naaldhakken: waar wijst de neus naartoe.
Centrummaten:
• Modus: meest voorkomende score
• Mediaan: middelste score, evenveel mensen onder als boven
• Mean/Gemiddelde: de som van alle scores gedeeld door het aantal
∑𝑛
𝑖=1 𝑥𝑖
𝑥̅ = 𝑛
je telt de scores op en deelt het door het aantal mensen in je steekproef.
Spreidingsmaten:
Spreiding: zitten de waarden van een variabele dichtbij elkaar of ver van elkaar af?
Standaarddeviatie: gemiddelde spreiding rond het gemiddelde
➔ Waarom doe je de SD in het kwadraat?
Als je alle afwijkingen van het gemiddelde optelt, dan kom je anders op 0 uit. (+ en – valt
tegen elkaar weg)
➔ Waarom doe je n-1?
Je wil niet dat je variatie afhangt van hoe groot je steekproef is. (niet: hoe meer mensen, hoe
groter het getal)
∑𝑁
𝑖=1(𝑥𝑖 −𝑥̅ )
2 𝑠𝑢𝑚 𝑜𝑓 𝑠𝑞𝑢𝑎𝑟𝑒𝑠 𝑆𝑆
𝑣𝑎𝑟𝑖𝑎𝑛𝑡𝑖𝑒 = 𝑠 2 = 𝑁=1
= 𝑁−1
= 𝑁−1
𝑆𝐷 = √𝑠 2 = 𝑠
Standaardscores (Z-scores)
Z-score: het aantal SD’s dat een score X verwijderd is van het gemiddelde
Het maakt niet uit welke data we hebben, we kunnen ze terugvertalen naar de
standaardnormaalverdeling, dan kun je de tabel in het boek gebruiken om te kijken of de score
zeldzaam of extreem is. →is iets wat we vinden wel/niet opmerkelijk?
(𝑥−𝑥̅ )
𝑧 − 𝑠𝑐𝑜𝑟𝑒 = 𝑧 = 𝑆𝐷
De normale verdeling
Normaalverdeling: als je weet hoeveel standaarddeviaties iets hoger is, kan je de percentages erbij
berekenen. Je kan precies bepalen of iets wel of niet extreem is.
,Voorbeeld hierbij
IQ-scores zijn normaal verdeeld met een gemiddelde van 100 en een standaarddeviatie van 15. Welk
percentage heeft een IQ-score tussen de 85 en 115?
P(X>85 en X<115)
= 1-P(X<85 en X>115)
Z(X=85) → (85-100)/15 = -1
Z(X=115)→(115-100)/15= 1
Dus het is nu vertaald naar: Wat is de kans dat de z-score tussen -1 en 1 ligt? P(Z<-1 of Z>1)
Tabel A→1.00 geeft een kans van 0.8413, dus 1-0.8413=0.1587
Hij is perfect symmetrisch, dus aan de andere kant heb je ook een kans van 0.1587
Samen 0.32 kans dat P(Z<-1 of Z>1), dus 1-0.32 = 0.68
68% heeft een IQ-score tussen 85 en 115.
,BLOK 2.2 = Inferentiële statistiek
Inferentiele statistiek: kijken of iets extreem is of niet
Stappen van de empirische cyclus van De Groot
1. Vraag, idee, veronderstelling, hypothese
2. Dat vertaal je naar iets wat je kan toetsen
3. Je gaat het toetsen
4. Uit die toetsing komt iets: conclusie/evaluatie, die beantwoordt je oorspronkelijke vraag
5. Conclusie beantwoordt de vraag (antwoord) en kan zelf weer dienen als observatie die een
nieuwe vraag oplevert
Voorbeeld:
1. Idee: Is kauwgom van invloed op prestaties? Dit is te algemeen, dus kan je nog niet toetsen.
(veronderstelling: met kauwgum presteer je beter)
2. Vertalen in H0: er is geen verschil, beide groepen gelijk (kauwgum kauwers scoren hetzelfde
als mensen die geen kauwgum kauwen)
Ha: er is wel verschil, beide groepen zijn niet gelijk
3. Je toetst altijd de H0, want bewijzen dat iets bestaat kan niet. Je kan wel aantonen dat iets niet
bestaat(falsificeren). Je geeft de ene helft wel en de andere helft geen kauwgum. Je krijgt twee
gelijkwaardige groepen, met random sampling. (waarom niet gewoon zelf indelen? → niet
representatief, want je kan ze alleen indelen op wat je wel van ze weet. De groepen kunnen
dan erg verschillen op basis van iets anders)
Je toetst, omdat je eigenlijk nooit de hele groep kan onderzoeken.
➔ Het maken van twee gelijkwaardige groepen = randomiseren
➔ Onafhankelijke variabele = welke groep
➔ Afhankelijke variabele = prestaties
4. Hoe extreem moet een uitkomst zijn voordat je de H0 verwerpt?
Ga uit van H0=6.9 en Ha≠6.9
Je trekt een steekproef en die steekproef heeft een gemiddelde van 7.5
Die 7.5 is niet gelijk aan 6.9, maar is het zó veel hoger dan 6.9 dat je moet concluderen dat
kauwgumkauwen werkt? Om dat te bepalen, ga je kijk hoe extreem deze bevinding is.
Hoe groot is de kans op een 7.5 of hoger? Is die kan heeeel klein (α<0.05) is, dan verwerp je
de H0 want dan is het onaannemelijk dat je die 7.5 vindt als H0 klopt, dus verwerp je het
5. H0 verwerpen in dit geval, want α<0.05
Je toetst altijd de H0, omdat het onmogelijk is om iets te bewijzen met 100% zekerheid. Je kan wel
falsificeren: bewijzen dat iets niet zo is.
Voorbeeld koe: als je wil bewijzen dat paarse koeien bestaan zou je bij elke koeiengeboorte ter wereld
aanwezig moeten zijn. Dat is niet mogelijk, dus bewijzen dat het bestaat kan niet. Het
tegenovergestelde wel; als je 1 ding ziet wat het tegenspreekt, weet je al genoeg.
Stappen
1. Formuleer de H0 en Ha (eenzijdig of tweezijdig!)
2. Analyseprocedure(Z-toets) en beslisregel(significantieniveau=0.05, tweezijdig) kiezen
3. Trek een steekproef
4. Referentieverdeling (is niet de verdeling van individuele scores in je populatie, ook niet de
verdeling van individuele scores van je steekproef, het is wel de gemiddelde score)
Berekenen van de toetsingsgrootheid uit de data
5. (Z-toets doen→Z-score→P-waarde berekenen (bijv. 0.0045)
P-waarde bepalen
6. Beslissen, p-waarde<significantieniveau (hier: 0.0045<0.025) dus verwerpen H0
Dus kauwgum werkt.
,De stappen met ons voorbeeld:
1. H0: μkauwgum = μgeen_kauwgum = 6.9
Ha: μkauwgum ≠ 6.9
2. Analyseprocedure is de z-toets
Beslisregel is het significantieniveau, dat is 0.05 en tweezijdig (dus als de kans op de H0 5% of
minder is, dan is je steekproef zo onaannemelijk dat je H0 verwerpt)
3. In de populatie μ=6.9 en σ=2.3
In de steekproef 𝑥̅ obs=7.5 en sobs=2.1
Werkt kauwgum nu echt?
4. Hoe groot is de kans op een gemiddelde van 7.5 of hoger, als H0 waar is?
De referentieverdeling is belangrijk (niet de verdeling van individuele scores in je populatie
EN niet de verdeling van individuele scores in je steekproef)→gaat om gemiddeldes.
Je weet wat het gemiddelde moet zijn→6.9
𝜎 2.3
Je weet ook de standaarddeviatie: 𝜎𝑥̅ = 𝑁 = 100 = 0.23 van de verdeling van
√ √
steekproefgemiddelden
1. Bepaal de positie op de referentieverdeling (bereken gemiddelde en SD)
𝑥̅ −𝜇 7.5−6.9
2. Bereken de toetsingsgrootheid 𝑧 = 𝑜𝑏𝑠𝜎 𝑥̅ = 0.23 = 2.61
̅
𝑥
3. Je zoekt de kans op die bij die waarde hoort→=0.0045
5. Bereken de p waarde
𝑝 = 𝑃[𝑍 ≥ 2.61|𝐻0 ] = 0.0045 (𝑒𝑒𝑛𝑧𝑖𝑗𝑑𝑖𝑔)
6. Beslissing: p-waarde<significantieniveau (0.025), dus je verwerpt H0
Conclusie voor populatieniveau: er is genoeg bewijs dat kauwgum werkt.
Voordeel eenzijdig toetsen: meer kans om iets te vinden
Nadeel eenzijdig toetsen: als je aan de verkeerde kant kijkt, dan mis je het hele resultaat
Dus kies altijd tweezijdig (veiliger), tenzij je hypothese alleen stijging of daling bevat.
,College 2 – hoofdstuk 8 MMC
Statistische Schatting
Statement: De lucht is blauw
- Is dit waar of niet? Hoe check je dit?
H0: er is GEEN verschil in groepsgemiddelden / gemiddelde is gelijk aan nul
De referentieverdeling gaat niet om individuele scores van steekproef, ook niet de populatiescores,
maar het gaat om gemiddelde scores. Het is een verdeling van alle mogelijke gemiddeldes die je zou
kunnen krijgen als je dezelfde soort steekproef als die je nu hebt uit de populatie trekt.
(als uit elke steekproef het gemiddelde berekent en dan die gemiddeldes gaat plotten, dan krijg je de
referentieverdeling.). Het gemiddelde van die referentieverdeling is gelijk aan het gemiddelde van de
populaltie.
In praktijk werk je niet met populaties, dat is veel te veel werk.
Als je deze grenzen uitrekent, kun je bepalen hoe
dichtbij het steekproefgemiddelde zit bij het
populatiegemiddelde (hoe nauwkeurig is het
steekproefgemiddelde als schatter voor het
populatiegemiddelde?)
, 95% confidence interval
Doe je nou veel steekproeven, en bereken je van elke het gemiddelde en daar doe je twee keer de
stadaarderror bij optellen en aftrekken. Doe je dat voor elke steekproef, dan zal 95% van al die
intervallen de ware populatiewaarde bevatten.
(de standaarderror ligt vast door de referentieverdeling, die verandert niet per steekproef)
Het algemene idee: de steekproefverdeling van 𝑥̅ vertelt ons hoe dichtbij μ waarschijnlijk bij het
steekproefgemiddelde 𝑥̅ zal liggen.
Het niveau C betrouwbaarheidsinterval voor een parameter heeft twee delen:
1. Een interval met de vorm ‘schatting ± margin of error’ (𝑚 = 𝑧 ∗ 𝜎/√𝑛)
2. Betrouwbaarheidsniveau C, waar C de kans is dat het interval de ware parameterwaarde zal
vangen in herhaalde steekproeftrekkingen. Het betrouwbaarheidsniveau is een soort mate van
succes voor de methode.
Hoe smaller je interval, hoe nauwkeuriger je aan het meten bent.
Bepalen van de steekproefgrootte
Het betrouwbaarheidsinterval voor een populatiegemiddelde zal een bepaalde (maximale) margin of
error m hebben, als de steekproefgrootte als volgt wordt bepaald:
(hoe groot moet je steekproef zijn om met een bepaalde precisie te kunnen meten?)
Steekproefverdeling van één steekproefproportie
Als je in veel steekproeven de proportie uitrekent en die plot, dan heb je weer een referentiedistributie,
die Normaal verdeeld is.
Op basis van 1 steekproef kan je bepalen hoe die verdeling er uit ziet.
De standaarderror bepaal je ook op basis van 1 steekproef, dat doe je met
Betrouwbaarheidsinterval voor een proportie
CI=schatting ± margin of error’
Je schatting is nu je steekproefproportie (ipv steekproefgemiddelde)
𝑚 = 𝑧 ∗ 𝜎/√𝑛
de standaard error is nu:
De kritieke z-waarde die je kiest, hangt er van af
hoeveel van mijn verschillende confidence intervallen
ook echt de echt waarde bevatten.