College 1: Steekproevenverdeling en Hypothesetoetsing
Stappenplan voor hypothesetoetsing
1. Hypothese → Afleiden van de hypothese
2. Steekproevenverdeling → Vaststellen van de steekproevenverdeling
3. Toetsstatistiek → Uitrekenen van de toetsstatistiek
4. Verwerpingsgebied → Bepalen van het verwerpingsgebied of -grens
5. Statistische conclusie → Trekken van een statistische conclusie
6. Inhoudelijke conclusie → Neerzetten van een inhoudelijke conclusie
Eén meting is niet voldoende voor een antwoord, er moeten meerdere metingen plaatsvinden voor
je een oordeel kan maken.
Een hypothese is een uitspraak over parameters.
De Nulhypothese stelt dat er in een populatie geen verschil en/of geen relatie bestaat. Dit is het
startpunt van het stappenplan.
De Alternatieve hypothese stelt dat er een verandering, een verschil of een relatie bestaat in de
populatie (groter of kleiner dan).
Hypothese toets is een statistische methode die gegevens uit een steekproef gebruikt om een
hypothese te evalueren (de nulhypothese wordt wel of niet verworpen). Als de nulhypothese niet
wordt verworpen, is de nulhypothese dan waar?
Rechtszijdige alternatieve hypothese → H a : μ>9 → Je kijkt naar de rechtse (onderste) 5% van de
data. Het verwerpingsgebied ligt in één staart van de verdeling.
Linkszijdige alternatieve hypothese → H a : μ<9 → Je kijkt naar de linkse (bovenste) 5% van de data.
Het verwerpingsgebied ligt in één staart van de verdeling.
De keuze voor een 1-zijdige of 2-zijdige alternatieve hypothese is mede afhankelijk van kennis en
verwachting vooraf over het steekproefresultaat. De keuze moet altijd gemaakt worden VOORDAT
de data wordt verzameld.
Tweezijdige alternatieve hypothese → H a : μ≠ 9 → Bij een tweezijdige alternatieve hypothese (bij
een significantieniveau van 5%) kijk je naar de bovenste en onderste 2.5% van de data die je
verwerpt. Het verwerpingsgebied ligt dat in beide staarten van de verdeling.
We verwachten een verschil, nog geen idee welke kant op.
Newman-Pearson: We accepteren H 0.
Fisher: We kunnen H 0 niet verwerpen, het resultaat blijft onbeslist.
Jones Turkey: De nulhypothese is sowieso niet waar, het is alleen nog niet bewezen. Dit is een hele
nieuwe manier. Pearson-Fisher is de traditionele manier die wij leren.
Steekproevenverdeling is de verdeling van gemiddelden. Een verdeling van een statistiek, verkregen
uit alle mogelijke steekproeven van een bepaalde grootte (n) uit een populatie. Hoe meer
steekproeven er worden gedaan, hoe meer scores op een normaalverdeling gaan lijken. Als
,gemiddelden normaal verdeeld zijn, zijn de gestandaardiseerde gemiddelden standaard normaal
verdeeld en volgen zij de standaard normaalverdeling N(0,1), de z-verdeling.
Een steekproefverdeling is een verdeling van individuele scores.
Toetsstatistiek is een getal dat berekend wordt uit steekproefgegevens en dat wordt gebruik voor het
vergelijken van een steekproefstatistiek en een populatieparameter. Als H 0 waar is, dan ligt z dicht
bij nul. Als H 0 niet waar is, dan ligt z ver van de nul.
Het verwerpingsgebied of -grens: Hoe onwaarschijnlijk moet de waarde van onze steekproefstatistiek
zijn, om te mogen concluderen dat de statistiek niet tot de H 0 verdeling behoort?
Het significantieniveau of alpha (α ) is een kans die gebruikt wordt om het concept van
onwaarschijnlijkheid aan te duiden in een hypothesetoets. Het verwerpingsgebied bevat, gegeven
dat de nulhypothese waar is, alle extreme, onwaarschijnlijke steekproefstatistieken. Meestal is de
alpha 5% of 0.05. We gaan de toetsstatistiek dan vergelijken met deze alpha.
- Z is een waarde op een as
- Alpha is een oppervlakte
Dit doen we door middel van twee methodes:
1) Verwerpingsgebied → Bepaal het verwerpingsgebied p dat hoort bij toetsstatistiek z. Als
p<α dan verwerpen we de nulhypothese.
2) Verwerpingsgrens → Bepaal de grenswaarde die hoort bij het verwerpingsgebied α . Als
z > z α dan verwerpen we de nulhypothese.
α
Bij tweezijdig toetsen .
2
Mits we aan de juiste kant toetsen. Vaak wordt bij de eenzijdige toets de nulhypothese vaker
verworpen dan bij de tweezijdige toets.
Als een kans (p) kleiner is dan .05 (α ), is er sprake van een statistisch verschil → Verwerp de
nulhypothese indien p ≤ α .
Conclusie
Type 1 fout (kans=α ): Verwerpen van de nulhypothese, terwijl deze waar is. De onderzoeker
concludeert dat een ingreep effect heeft, terwijl dat in werkelijkheid niet zo is.
Type 2 fout (kans= β ): De nulhypothese wordt niet verworpen, terwijl deze niet waar is. De
onderzoeker heeft een echt effect niet ontdekt, terwijl dat effect er in werkelijkheid wel is.
Power: Als β de kans is dat we de nulhypothese niet verwerpen, terwijl de alternatieve hypothese
waar is, dan is 1.0−β de kans dat we de nulhypothese wel verwerpen terwijl de alternatieve
hypothese waar is. Voor een onderzoeker is power de kans op het vinden van een effect, wanneer er
ook daadwerkelijk een effect is. Een power van 80% vindt men acceptabel.
Variability duet o chance/error variance: Verwachtte variabiliteit van sample-to-sample. Als het
gemiddelde van een bepaalde steekproef anders is dan die van de populatie (dit is natuurlijk).
Sampling error is de natuurlijke discrepantie of toeval fluctuatie, tussen een steekproefstatistiek en
zijn corresponderende populatieparameter (het verschil tussen je steekproef en de populatie).
, In onderzoek is het altijd de vraag of het verschil tussen twee groepen afhangt van de variabele die
wordt onderzocht. Het kan namelijk door sampling error komen. → hypothese testing. Hypothese
testen: doe je als de data tweeledig is.
Voorbeeld: Als het verschil van resultaten tussen een grote en een kleine klas heel groot is, zou je dit
kunnen toeschrijven aan de grootte van de klas. Als dit verschil heel klein is, dan is de oorzaak
waarschijnlijk toe te schrijven aan random error. Maar hoe groot is groot en wanneer is klein klein?
Hiervoor doe je een hypothese toets; om de keuze te maken over deze kans. Wat is de grens om iets
toe te schrijven aan de variabele of om het verschil toe te schrijven aan de verschillen in groepen.
Sampling distributie: Vertelt ons hoeveel sample-to-sample variabiliteit we kunnen verwachten.
Standaard error is een standaard deviatie tussen de verschillen van de sample. De sampling
distributie van verschillen tussen gemiddelden is de distributie van verschillen tussen gemiddelden
van een oneindig aantal paren van random samples onder bepaalde specifieke voorwaarden.
1) Populatieverdeling → Verdeling in de populatie met parameters σ en μ.
2) Steekproefverdeling → Verdeling in een steekproef. Statistiek x́ en s.
3) Steekproevenverdeling → De verdeling van x uit alle mogelijke steekproeven van gelijke
grootte. Parameters μ x en σ x .
Beslissingen maken over de nulhypothese → Stel je vindt van de 10.000 trials, 6 keer een bepaalde
score. De kans hierop is dan dus .0006. We hanteren bij dit voorbeeld een significantieniveau van 5%
(.05). .0006 < .05 dus we verwerpen de nulhypothese.
Rejection level/significantie level: Waarden als .05 en .01. De hoogste (en/of laagste) 5% wordt dan
beschouwd als kritische waarde. Het zijn de waardes van X die de grens of grenzen laten zien.
Wanneer de waarschijnlijkheid onder de nulhypothese kleiner of gelijk is aan je significantieniveau,
dan verwerp je hem. Het valt dat onder het verwerpingsgebied, dit noemen we verwerpingsgebied α
.
De effectgrootte is een statistische maat voor hoe sterk het effect van een handeling op een
populatie is, waarbij vergeleken wordt met een andere populatie waarop die handeling wordt
toegepast (‘’controlegroep’’). De effectgrootte is een dimensieloos getal. Het getal ligt rond de nul als
er niet of nauwelijks een effect van handeling is. Het getal hoort niet af te hangen van de gebruikte
meeteenheid of omvang van de groep.
Hoorcollege 2: Basisconcepten van waarschijnlijkheid
Een random variabele is een variabele met (numerieke) waarden verkregen uit een steekproef of uit
een ander random proces.
Er zijn twee soorten random variabelen:
1. Discreet: Variabelen met een eindig aantal mogelijke waarden. Bijvoorbeeld: mogelijke
uitkomsten van een dobbelsteenworp.
2. Continu: Variabelen met een oneindig aantal mogelijkheden. Bijvoorbeeld: dagelijkse
middagtemperatuur in Leiden.
Meestal gaat het om discrete random variabelen.
Basisregels voor kansen:
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper justinejonker. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.