Toetsende statistiek
Statistiek hoorcollege 1: Steekproefverdelingen en hypothese toetsing
H0= 0 hypothese > gemiddelde
Altijd geformuleerd als er is niks aan de hand
Ha= alternatieve hypothese
Er is iets aan de hand met de populatie
3 keuzes:
- Eenzijdig : groter dan/kleiner dan
- Tweezijdig: hangt af van de kennis en verwachting (Keuze heeft invloed op je
toets gegevens)
0- hypothese moet je verwerpen en de alternatieve aannemen als correct.
Statistische uitspraak: gemiddelde en variantie zijn hiervoor nodig.
Statistisch toetsen: je gaat een steekproef vergelijken met een steekproeven verdeling
(steekproeven altijd even groot, hoe groter je steekproef hoe smaller de
steekproefverdeling).
Steekproevenverdeling: een verdeling van een bepaalde statistiek van alle mogelijke
steekproeven van een bepaalde grootte van een populatie .
- Het is altijd een vaste steekproefgrote
- Het zijn observaties onder de 0 hypothese
- 0 hypothese is altijd waar.
Steekproevenverdeling: meerdere steekproeven: wat is de verdeling over al deze
verdelingen?
Steekproefverdeling: 1 steekproef: wat is de verdeling?
P-waarde: op basis hiervan wordt een conclusie getrokken, kan de 0-hypothese worden
verworpen? (De kans om iets te vinden dat hetzelfde of nog extremer is gegeven dat de 0
hypothese waar is)
De kans om een resultaat te vinden dat zo extreem is als het resultaat van je steekproef als
de 0 hypothese waar is.
Als de 0 hypothese waar zou zijn is dit de verdeling van mijn steekproeven, wat is dan de
kans om een gemiddelde te vinden van een bepaalde score of groter?
- De p waarde laat de sterkte zien van je bewijs, hoe kleiner de p-waarde hoe meer
je de 0 hypothese kan verwerpen
- Fisher: het is een continue maat en laat het bewijs tegen de 0 hypothese zien.
P-waarde: <0.05= criterium grens van wel of niet significant.
0.03= significant (hoe groter de steekproef, hoe groter de kans is om een kleine p-
waarde te halen).
- Neyman-Pearson: we kunnen beslissen of de 0 hypothese of de
alternatieve hypothese beter is. (wel/niet uitspraak)
,Hypothesetest: een statistische methode die steekproef gebruikt om de 0hypothese te
evalueren.
De alfa waarde die wij hanteren is vaak 0.05 maar dit kan veranderd worden. Het heeft
te maken met de grootte van de steekproef.
P-waarde kleiner dan de alfa waarde > nulhypothese wordt verworpen
Kritieke waarde: als het gemiddelde van de steekproef groter of gelijk is als de waarde van
de alfa, wordt de nulhypothese verworpen.
Significantieniveau> we zien het als sterkte van bewijs
Rejection> verwerpen we de hypothese of niet?
Errors: fouten bij een statistische conclusie
- Type 1 fout (alfa): We concluderen dat er een effect is terwijl dat niet waar is (de
0 hypothese wordt verworpen terwijl die eigenlijk wel waar is> verkeerde alfa is
gekozen: 0.5).
- Type 2 fout (bèta): We missen een effect die eigenlijk meespeelt (het niet
kunnen verwerpen van een 0 hypothese terwijl deze hypothese niet waar is).
Het hangt af van de power van je test om een significant resultaat te behalen.
Praktische relevantie> is het ook relevant?
- Berekenen van een effectgrootte > hoe groot is het effect dat er is gevonden
Hypothese testing:
1. Hypothese: Combinatie van 0 hypothese en alternatieve hypothese
2. Sampling distributie: Hoe is het met de steekproefverdeling? Bepalen van
de steekproefverdeling tot een teststatistiek
3. Test statistic: sample statistic > teststatistiek
4. Rejection: bij een bepaalde alfa waarde wordt bepaald of je in het kritieke gebied
zit of niet.
- Kritieke waarde is de verticale lijn
- Verwerpingsgebied is 0.5 dus rechts van de lijn.
5. Statistische conclusie: wordt de 0hypothese wel of niet verworpen
6. Substantiële conclusie: antwoordt op de vraag in woorden
0 hypothese: gebeurt niks> gelijk aan elkaar
Alternatieve hypothese> er gebeurt wel wat> niet gelijk aan elkaar of vergelijken
(mannen of vrouwen hebben een hoger IQ)
TRUCJES OM TE CHECKEN OF EEN HYPOTHESE METING KLOPT:
- Er moeten altijd Griekse letters staan
- H0 is altijd een =
- Bij Ha alleen
- Gaat altijd over een populatie
- Hypothese gaat nooit over een steekproefstatistiek
- Hypothese moet alles dekken
De p-waarde is de kans dat je een bepaalde waarde vindt gegeven dat H0 waar is, als deze
5% of lager is het wel significant en wordt hij verworpen> hoger dan 5% is niet significant
en de 0 hypothese wordt wel verworpen.
A waarde> criterium stel je van tevoren vast > 0,05 (alfa waarde=
verwerpingscriterium), vergelijk je de p-waarde mee.
B-waarde> Power
Bij eenzijdig kijk je alleen naar de hoogste OF laagste 5 procent
Bij tweezijdig pak je de hoogste 2,5% EN de laagste 2,5%
, Aantekeningen werkgroep 2: Basisconcepten en waarschijnlijkheid
Disjunct: A en B kunnen niet tegelijkertijd plaatsvinden, dus het is wederzijds uitsluitend.
Voorbeeld: je kan niet fietsen en in de trein gelijk zitten
Disjuncte gebeurtenissen zijn altijd afhankelijk van elkaar! Aan de hand van informatie over
het een kan je iets zeggen over het ander.
Onafhankelijk: er is geen samenhang/relatie tussen A en B, er is geen correlatie en geen
afhankelijkheid.
Afhankelijkheid = relatie, Aan de hand van de informatie over x zeg je iets over y
(fietsvoorbeeld met trein)
OF= een kans + de andere kans (A+B) = De kans wordt groter
EN= een kans x de andere kans (AxB) = maakt de kans kleiner, want de kans is kleiner dat
dingen samen gebeuren (zeldzamer)
De Conditie wordt altijd na de streep gezet
KRUISTABELLEN: TENTAMENVRAAG
Gezamenlijke kans> Gaat over EN (wat is de kans dat je deelnemer bent en een hoog IQ
hebt)
Conditionele kans/voorwaardelijke kans> geeft een conditie aan, (gegeven die conditie
wat is de kans op A> gegeven b, wat is de kans op a) conditie geeft de groep mensen
aan waardoor je deelt> totaalaantal. HET IS EEN GEGEVEN KANS (ervan uit
gaande dat)
Marginale kans> simpele kans, gaat over maar één variabele (wat is de kans dat je een
hoog IQ hebt)> Wordt alleen maar gekeken naar de marges
Pi= kans op het gegeven antwoordt
x= gemiddelde
Bij ongecorreleerde variabelen is het variantie van X + de variantie van Y
ALS DE CONDITIONELE KANSEN NIET STEEDS GELIJK ZIJN, DAN IS ER SPRAKE VAN
AFHANKELIJKHEID (EN VERSCHILLEN VAN MARGINALE KANS)
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper julietterozendaal. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.