Toetsende statistiek
Statistiek hoorcollege 1: Steekproefverdelingen en hypothese toetsing
H0= 0 hypothese > gemiddelde
Altijd geformuleerd als er is niks aan de hand
Ha= alternatieve hypothese
Er is iets aan de hand met de populatie
3 keuzes:
- Eenzijdig : groter dan/kleiner dan
- Tweezijdig: hangt af van de kennis en verwachting (Keuze heeft invloed op je
toets gegevens)
0- hypothese moet je verwerpen en de alternatieve aannemen als correct.
Statistische uitspraak: gemiddelde en variantie zijn hiervoor nodig.
Statistisch toetsen: je gaat een steekproef vergelijken met een steekproeven verdeling
(steekproeven altijd even groot, hoe groter je steekproef hoe smaller de
steekproefverdeling).
Steekproevenverdeling: een verdeling van een bepaalde statistiek van alle mogelijke
steekproeven van een bepaalde grootte van een populatie .
- Het is altijd een vaste steekproefgrote
- Het zijn observaties onder de 0 hypothese
- 0 hypothese is altijd waar.
Steekproevenverdeling: meerdere steekproeven: wat is de verdeling over al deze
verdelingen?
Steekproefverdeling: 1 steekproef: wat is de verdeling?
P-waarde: op basis hiervan wordt een conclusie getrokken, kan de 0-hypothese worden
verworpen? (De kans om iets te vinden dat hetzelfde of nog extremer is gegeven dat de 0
hypothese waar is)
De kans om een resultaat te vinden dat zo extreem is als het resultaat van je steekproef als
de 0 hypothese waar is.
Als de 0 hypothese waar zou zijn is dit de verdeling van mijn steekproeven, wat is dan de
kans om een gemiddelde te vinden van een bepaalde score of groter?
- De p waarde laat de sterkte zien van je bewijs, hoe kleiner de p-waarde hoe meer
je de 0 hypothese kan verwerpen
- Fisher: het is een continue maat en laat het bewijs tegen de 0 hypothese zien.
P-waarde: <0.05= criterium grens van wel of niet significant.
0.03= significant (hoe groter de steekproef, hoe groter de kans is om een kleine p-
waarde te halen).
- Neyman-Pearson: we kunnen beslissen of de 0 hypothese of de
alternatieve hypothese beter is. (wel/niet uitspraak)
,Hypothesetest: een statistische methode die steekproef gebruikt om de 0hypothese te
evalueren.
De alfa waarde die wij hanteren is vaak 0.05 maar dit kan veranderd worden. Het heeft
te maken met de grootte van de steekproef.
P-waarde kleiner dan de alfa waarde > nulhypothese wordt verworpen
Kritieke waarde: als het gemiddelde van de steekproef groter of gelijk is als de waarde van
de alfa, wordt de nulhypothese verworpen.
Significantieniveau> we zien het als sterkte van bewijs
Rejection> verwerpen we de hypothese of niet?
Errors: fouten bij een statistische conclusie
- Type 1 fout (alfa): We concluderen dat er een effect is terwijl dat niet waar is (de
0 hypothese wordt verworpen terwijl die eigenlijk wel waar is> verkeerde alfa is
gekozen: 0.5).
- Type 2 fout (bèta): We missen een effect die eigenlijk meespeelt (het niet
kunnen verwerpen van een 0 hypothese terwijl deze hypothese niet waar is).
Het hangt af van de power van je test om een significant resultaat te behalen.
Praktische relevantie> is het ook relevant?
- Berekenen van een effectgrootte > hoe groot is het effect dat er is gevonden
Hypothese testing:
1. Hypothese: Combinatie van 0 hypothese en alternatieve hypothese
2. Sampling distributie: Hoe is het met de steekproefverdeling? Bepalen van
de steekproefverdeling tot een teststatistiek
3. Test statistic: sample statistic > teststatistiek
4. Rejection: bij een bepaalde alfa waarde wordt bepaald of je in het kritieke gebied
zit of niet.
- Kritieke waarde is de verticale lijn
- Verwerpingsgebied is 0.5 dus rechts van de lijn.
5. Statistische conclusie: wordt de 0hypothese wel of niet verworpen
6. Substantiële conclusie: antwoordt op de vraag in woorden
0 hypothese: gebeurt niks> gelijk aan elkaar
Alternatieve hypothese> er gebeurt wel wat> niet gelijk aan elkaar of vergelijken
(mannen of vrouwen hebben een hoger IQ)
TRUCJES OM TE CHECKEN OF EEN HYPOTHESE METING KLOPT:
- Er moeten altijd Griekse letters staan
- H0 is altijd een =
- Bij Ha alleen
- Gaat altijd over een populatie
- Hypothese gaat nooit over een steekproefstatistiek
- Hypothese moet alles dekken
De p-waarde is de kans dat je een bepaalde waarde vindt gegeven dat H0 waar is, als deze
5% of lager is het wel significant en wordt hij verworpen> hoger dan 5% is niet significant
en de 0 hypothese wordt wel verworpen.
A waarde> criterium stel je van tevoren vast > 0,05 (alfa waarde=
verwerpingscriterium), vergelijk je de p-waarde mee.
B-waarde> Power
Bij eenzijdig kijk je alleen naar de hoogste OF laagste 5 procent
Bij tweezijdig pak je de hoogste 2,5% EN de laagste 2,5%
, Aantekeningen werkgroep 2: Basisconcepten en waarschijnlijkheid
Disjunct: A en B kunnen niet tegelijkertijd plaatsvinden, dus het is wederzijds uitsluitend.
Voorbeeld: je kan niet fietsen en in de trein gelijk zitten
Disjuncte gebeurtenissen zijn altijd afhankelijk van elkaar! Aan de hand van informatie over
het een kan je iets zeggen over het ander.
Onafhankelijk: er is geen samenhang/relatie tussen A en B, er is geen correlatie en geen
afhankelijkheid.
Afhankelijkheid = relatie, Aan de hand van de informatie over x zeg je iets over y
(fietsvoorbeeld met trein)
OF= een kans + de andere kans (A+B) = De kans wordt groter
EN= een kans x de andere kans (AxB) = maakt de kans kleiner, want de kans is kleiner dat
dingen samen gebeuren (zeldzamer)
De Conditie wordt altijd na de streep gezet
KRUISTABELLEN: TENTAMENVRAAG
Gezamenlijke kans> Gaat over EN (wat is de kans dat je deelnemer bent en een hoog IQ
hebt)
Conditionele kans/voorwaardelijke kans> geeft een conditie aan, (gegeven die conditie
wat is de kans op A> gegeven b, wat is de kans op a) conditie geeft de groep mensen
aan waardoor je deelt> totaalaantal. HET IS EEN GEGEVEN KANS (ervan uit
gaande dat)
Marginale kans> simpele kans, gaat over maar één variabele (wat is de kans dat je een
hoog IQ hebt)> Wordt alleen maar gekeken naar de marges
Pi= kans op het gegeven antwoordt
x= gemiddelde
Bij ongecorreleerde variabelen is het variantie van X + de variantie van Y
ALS DE CONDITIONELE KANSEN NIET STEEDS GELIJK ZIJN, DAN IS ER SPRAKE VAN
AFHANKELIJKHEID (EN VERSCHILLEN VAN MARGINALE KANS)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller julietterozendaal. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.35. You're not tied to anything after your purchase.