College 1: Steekproevenverdeling en Hypothesetoetsing
Stappenplan voor hypothesetoetsing
1. Hypothese → Afleiden van de hypothese
2. Steekproevenverdeling → Vaststellen van de steekproevenverdeling
3. Toetsstatistiek → Uitrekenen van de toetsstatistiek
4. Verwerpingsgebied → Bepalen van het verwerpingsgebied of -grens
5. Statistische conclusie → Trekken van een statistische conclusie
6. Inhoudelijke conclusie → Neerzetten van een inhoudelijke conclusie
Eén meting is niet voldoende voor een antwoord, er moeten meerdere metingen plaatsvinden voor
je een oordeel kan maken.
Een hypothese is een uitspraak over parameters.
De Nulhypothese stelt dat er in een populatie geen verschil en/of geen relatie bestaat. Dit is het
startpunt van het stappenplan.
De Alternatieve hypothese stelt dat er een verandering, een verschil of een relatie bestaat in de
populatie (groter of kleiner dan).
Hypothese toets is een statistische methode die gegevens uit een steekproef gebruikt om een
hypothese te evalueren (de nulhypothese wordt wel of niet verworpen). Als de nulhypothese niet
wordt verworpen, is de nulhypothese dan waar?
Rechtszijdige alternatieve hypothese → H a : μ>9 → Je kijkt naar de rechtse (onderste) 5% van de
data. Het verwerpingsgebied ligt in één staart van de verdeling.
Linkszijdige alternatieve hypothese → H a : μ<9 → Je kijkt naar de linkse (bovenste) 5% van de data.
Het verwerpingsgebied ligt in één staart van de verdeling.
De keuze voor een 1-zijdige of 2-zijdige alternatieve hypothese is mede afhankelijk van kennis en
verwachting vooraf over het steekproefresultaat. De keuze moet altijd gemaakt worden VOORDAT
de data wordt verzameld.
Tweezijdige alternatieve hypothese → H a : μ≠ 9 → Bij een tweezijdige alternatieve hypothese (bij
een significantieniveau van 5%) kijk je naar de bovenste en onderste 2.5% van de data die je
verwerpt. Het verwerpingsgebied ligt dat in beide staarten van de verdeling.
We verwachten een verschil, nog geen idee welke kant op.
Newman-Pearson: We accepteren H 0.
Fisher: We kunnen H 0 niet verwerpen, het resultaat blijft onbeslist.
Jones Turkey: De nulhypothese is sowieso niet waar, het is alleen nog niet bewezen. Dit is een hele
nieuwe manier. Pearson-Fisher is de traditionele manier die wij leren.
Steekproevenverdeling is de verdeling van gemiddelden. Een verdeling van een statistiek, verkregen
uit alle mogelijke steekproeven van een bepaalde grootte (n) uit een populatie. Hoe meer
steekproeven er worden gedaan, hoe meer scores op een normaalverdeling gaan lijken. Als
,gemiddelden normaal verdeeld zijn, zijn de gestandaardiseerde gemiddelden standaard normaal
verdeeld en volgen zij de standaard normaalverdeling N(0,1), de z-verdeling.
Een steekproefverdeling is een verdeling van individuele scores.
Toetsstatistiek is een getal dat berekend wordt uit steekproefgegevens en dat wordt gebruik voor het
vergelijken van een steekproefstatistiek en een populatieparameter. Als H 0 waar is, dan ligt z dicht
bij nul. Als H 0 niet waar is, dan ligt z ver van de nul.
Het verwerpingsgebied of -grens: Hoe onwaarschijnlijk moet de waarde van onze steekproefstatistiek
zijn, om te mogen concluderen dat de statistiek niet tot de H 0 verdeling behoort?
Het significantieniveau of alpha (α ) is een kans die gebruikt wordt om het concept van
onwaarschijnlijkheid aan te duiden in een hypothesetoets. Het verwerpingsgebied bevat, gegeven
dat de nulhypothese waar is, alle extreme, onwaarschijnlijke steekproefstatistieken. Meestal is de
alpha 5% of 0.05. We gaan de toetsstatistiek dan vergelijken met deze alpha.
- Z is een waarde op een as
- Alpha is een oppervlakte
Dit doen we door middel van twee methodes:
1) Verwerpingsgebied → Bepaal het verwerpingsgebied p dat hoort bij toetsstatistiek z. Als
p<α dan verwerpen we de nulhypothese.
2) Verwerpingsgrens → Bepaal de grenswaarde die hoort bij het verwerpingsgebied α . Als
z > z α dan verwerpen we de nulhypothese.
α
Bij tweezijdig toetsen .
2
Mits we aan de juiste kant toetsen. Vaak wordt bij de eenzijdige toets de nulhypothese vaker
verworpen dan bij de tweezijdige toets.
Als een kans (p) kleiner is dan .05 (α ), is er sprake van een statistisch verschil → Verwerp de
nulhypothese indien p ≤ α .
Conclusie
Type 1 fout (kans=α ): Verwerpen van de nulhypothese, terwijl deze waar is. De onderzoeker
concludeert dat een ingreep effect heeft, terwijl dat in werkelijkheid niet zo is.
Type 2 fout (kans= β ): De nulhypothese wordt niet verworpen, terwijl deze niet waar is. De
onderzoeker heeft een echt effect niet ontdekt, terwijl dat effect er in werkelijkheid wel is.
Power: Als β de kans is dat we de nulhypothese niet verwerpen, terwijl de alternatieve hypothese
waar is, dan is 1.0−β de kans dat we de nulhypothese wel verwerpen terwijl de alternatieve
hypothese waar is. Voor een onderzoeker is power de kans op het vinden van een effect, wanneer er
ook daadwerkelijk een effect is. Een power van 80% vindt men acceptabel.
Variability duet o chance/error variance: Verwachtte variabiliteit van sample-to-sample. Als het
gemiddelde van een bepaalde steekproef anders is dan die van de populatie (dit is natuurlijk).
Sampling error is de natuurlijke discrepantie of toeval fluctuatie, tussen een steekproefstatistiek en
zijn corresponderende populatieparameter (het verschil tussen je steekproef en de populatie).
, In onderzoek is het altijd de vraag of het verschil tussen twee groepen afhangt van de variabele die
wordt onderzocht. Het kan namelijk door sampling error komen. → hypothese testing. Hypothese
testen: doe je als de data tweeledig is.
Voorbeeld: Als het verschil van resultaten tussen een grote en een kleine klas heel groot is, zou je dit
kunnen toeschrijven aan de grootte van de klas. Als dit verschil heel klein is, dan is de oorzaak
waarschijnlijk toe te schrijven aan random error. Maar hoe groot is groot en wanneer is klein klein?
Hiervoor doe je een hypothese toets; om de keuze te maken over deze kans. Wat is de grens om iets
toe te schrijven aan de variabele of om het verschil toe te schrijven aan de verschillen in groepen.
Sampling distributie: Vertelt ons hoeveel sample-to-sample variabiliteit we kunnen verwachten.
Standaard error is een standaard deviatie tussen de verschillen van de sample. De sampling
distributie van verschillen tussen gemiddelden is de distributie van verschillen tussen gemiddelden
van een oneindig aantal paren van random samples onder bepaalde specifieke voorwaarden.
1) Populatieverdeling → Verdeling in de populatie met parameters σ en μ.
2) Steekproefverdeling → Verdeling in een steekproef. Statistiek x́ en s.
3) Steekproevenverdeling → De verdeling van x uit alle mogelijke steekproeven van gelijke
grootte. Parameters μ x en σ x .
Beslissingen maken over de nulhypothese → Stel je vindt van de 10.000 trials, 6 keer een bepaalde
score. De kans hierop is dan dus .0006. We hanteren bij dit voorbeeld een significantieniveau van 5%
(.05). .0006 < .05 dus we verwerpen de nulhypothese.
Rejection level/significantie level: Waarden als .05 en .01. De hoogste (en/of laagste) 5% wordt dan
beschouwd als kritische waarde. Het zijn de waardes van X die de grens of grenzen laten zien.
Wanneer de waarschijnlijkheid onder de nulhypothese kleiner of gelijk is aan je significantieniveau,
dan verwerp je hem. Het valt dat onder het verwerpingsgebied, dit noemen we verwerpingsgebied α
.
De effectgrootte is een statistische maat voor hoe sterk het effect van een handeling op een
populatie is, waarbij vergeleken wordt met een andere populatie waarop die handeling wordt
toegepast (‘’controlegroep’’). De effectgrootte is een dimensieloos getal. Het getal ligt rond de nul als
er niet of nauwelijks een effect van handeling is. Het getal hoort niet af te hangen van de gebruikte
meeteenheid of omvang van de groep.
Hoorcollege 2: Basisconcepten van waarschijnlijkheid
Een random variabele is een variabele met (numerieke) waarden verkregen uit een steekproef of uit
een ander random proces.
Er zijn twee soorten random variabelen:
1. Discreet: Variabelen met een eindig aantal mogelijke waarden. Bijvoorbeeld: mogelijke
uitkomsten van een dobbelsteenworp.
2. Continu: Variabelen met een oneindig aantal mogelijkheden. Bijvoorbeeld: dagelijkse
middagtemperatuur in Leiden.
Meestal gaat het om discrete random variabelen.
Basisregels voor kansen:
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller justinejonker. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.06. You're not tied to anything after your purchase.