Dit is een samenvatting voor het vak statistiek 2, gedoceerd door Prof Theuns. Het omvat de theorie van de slides en het boek. (foutje op p33 wanneer df toeneemt neigt het meer naar een normaalverdeling)
Statistiek 2
Inhoudsopgave
HOOFDSTUK 6: INLEIDING TOT INFERENTIE: Z-TEST ......................................................................................... 2
6.1 SCHATTEN MET BETROUWBAARHEID......................................................................................................... 3
6.2 SIGNIFICANTIETOETSEN ......................................................................................................................... 4
6.3 GEBRUIK EN MISBRUIK VAN TOETSEN ........................................................................................................ 5
6.4 ONDERSCHEIDINGSVERMOGEN EN INFERENTIE ALS BESLISSING ........................................................................ 5
6.4.1 Onderscheidingsvermogen (Power) ........................................................................................ 5
6.4.2 Onderscheidingsvermogen vergroten ..................................................................................... 7
HOOFDSTUK 7: INFERENTIE VOOR VERDELINGEN: T-TEST ................................................................................ 9
7.1 INFERENTIE OVER VERWACHTING VAN 1 POPULATIE ...................................................................................... 9
7.1.1 De t-verdelingen .................................................................................................................... 9
7.1.2 1-steekproef t betrouwbaarheidsinterval ............................................................................. 11
7.1.3 1- steekproef t-test .............................................................................................................. 11
7.1.4 t toetsen voor gekoppelde paren.......................................................................................... 12
7.1.5 Robuusheid van t procedures ............................................................................................... 14
7.2 VERGELIJKEN VAN 2 VERWACHTINGEN .................................................................................................... 16
7.2.1 Vergelijken van 2-steekproef gemiddelden ........................................................................... 16
7.2.2 Twee steekproeven t procedures .......................................................................................... 16
7.2.3 Robuustheid van t procedures voor onafhankelijke steekproeven ......................................... 18
7.2.4 Gepoelde (Pooled) 2-steekproeven t procedures ................................................................... 19
7.3 EXTRA TOPICS VER HET VERGELIJKEN VAN VERDELINGEN .............................................................................. 20
7.3.1 Inferentie voor populatie spreiding ...................................................................................... 20
7.3.2 De F test voor gelijkheid van spreidingen.............................................................................. 20
7.3.3 Onderscheidingsvermogen van de 2-steekproeven t-test ...................................................... 20
HOOFDSTUK 8: INFERENTIE VOOR FRACTIES (PROPORTIES EN PERCENTAGES) .............................................. 21
8.1 INFERENTIE VOOR EEN ENKELE PROPORTIE (=FRACTIE)................................................................................. 21
8.2 TWEE PROPORIES/ FRACTIES VERGELIJKEN ................................................................................................ 23
HOOFDSTUK 15: NIET-PARAMETRISCHE TOETSEN .......................................................................................... 27
15.1 WILCOXON RANK SUM TEST (RANGSOMTEST) = MANN-WHITNEY U-TEST ...................................................... 27
15.1.1 Rang transformatie ............................................................................................................. 28
15.1.2 Wilcoxon Rangsom Test = u-test .......................................................................................... 28
15.2 WILCOXON SIGNED RANK TEST (RANGTEKENTEST) ..................................................................................... 30
15.3 KRUSKAL- WALLIS TEST ...................................................................................................................... 31
HOOFDSTUK 9: ANALYSE VAN 2-WEGS TABELLEN OF CONTINGENTIE TABELLEN............................................ 32
9.3 GOODNESS OF FIT (AANPASSINGSTOETS) ................................................................................................. 33
9.1 INFERENTIE VOOR CONTINGENTIETABELLEN (2-WEGS TABELLEN) VERGELIJKEN VAN 2 OF MEER ONAFHANKELIJKE
STEEKPROEVEN ............................................................................................................................................... 35
,Hoofdstuk 6: Inleiding tot inferentie: Z-test
• Doel van statistische inferentie is het trekken van conclusies uit gegevens.
o Bij formele inferentie ligt de nadruk op het onderbouwen van onze conclusies met
kansberekeningen. (gebaseerd op steekproefverdelingen)
§ Dankzij de kansrekening kunnen we rekening houden met toevallige varieties
en op deze wijze onze beoordeling aan de hand van berekeningen corrigeren
§ Als u statistische inferentie gebruikt, handelt u alsof de gegevens afkomstig
zijn uit een aslecte steekproef of een random experiment.
• Twee soorten steekproeven
o Between subjects design
§ Vb zijn mannen sneller dan vrouwen
§ Het zijn onafhankelijke/ niet gepaarde/ niet gekoppelde steekproeven
§ = unpaired samples
o Within subjects design
§ Is Jennifer sneller na het nemen van EPO
§ Afhankelijke/ gepaarde/ gekoppelde steekproeven
§ = paired samples à 2 herhaalde metingen
• Inductieve technieken : 2 doelen
o Schatten (betrouwbaarheidsintervallen): op basis van een steekproef
o Toetsen (significantietoetsen): komt een bepaald resultaat door toeval tot stand?
• Statistisch schatten
o Puntschatting
o Intervalsschatting
2
,6.1 Schatten met betrouwbaarheid
• Het steekproefgemiddelde x is de natuurlijke schatter van de onbekende
populatieverwachting µ. Wat nog belangrijker is, de wet van de grote aantallen zegt dat het
steekproefgemiddelde moet naderen tot de populatieverwachting als de steekproefomvang
toeneemt.
• Betrouwbaarheidsinterval (Confidence level)
o Het doel van een BI is een schatting te geven van een onbekende parameter, met
een indicatie van de mate van nauwkeurigheid van de schatting en van de mate
vertrouwen die men in de correctheid van het resultaat mag hebben
o Een betrouwbaarheidsinterval van niveau C voor een parameter is een interval dat is
berekend uit de steekproefdata, volgens een methode die kans C heeft om een
interval op te leveren dat de werkelijke waarde van de parameter bevat.
§ 95% betrouwbaarheidsinterval is een omgeving rondom het resultaat van 1
replicatie zodat in 95% van de replicaties een interval wordt gevonden dat de
echte populatiewaarde van de onderzochte variabele (het resultaat op
papulatie niveau) bevat.
§ Als u de methode 1 maal toepast kunt u niet weten of uw interval een juiste
waarde gaf (dit gebeurt in 95% van de gevallen) of niet (dit gebeurt in 5% van
de gevallen)
o Steekproefgemiddelde varieert met elke steekproef
o Betrouwbaarheidsinterval voor µ = (schatter ± formarge) zal bij C% van de
steekproeven de onbekende populatieparameter µ “vangen”.
§ C% is het algemene vangpercentage à a
1
§ 𝑓𝑜𝑢𝑡𝑚𝑎𝑟𝑔𝑒 (𝑚 ) = 𝑧 ∗ .
√3
§ Hierbij is z* de waarde voor de stanaardnormale curve met oppervlakte C
tussen de kritieke punten -z* en z*. Het niveau C betrouwbaarheidsinterval
voor µ is [ x ± m ]
§ Dit interval is exact correct als de populatieverdeling normaal is en is in
andere gevallen voor grote n bij benadering correct
o Steekproefomvang bij een gewenste foutmarge:
§ Het betrouwbaarheidsinterval voor een populatiegemiddelde zal een
gespecificeerde foutmarge m hebben als de steekproefomvang gelijk is aan
6∗.1 8
§ 𝑛=5 3
7
• Gedrag van de betrouwbaarheid
o Een klein BI (betrouwbaarheidsinterval) impliceert: hoge betrouwbaarheid DUS een
kleine foutenmarge
§ Gebruik een lager betrouwbaarheidsniveau (kleiner dan C; meestal
gebruiken wij 95%)
§ Grotere steekproef
§ Kleinere s
• Waarschuwing ivm schatters
o Formules voor schatters gelden enkel onder de voorwaarde dat de gegevens
bekomen zijn uit een Enkelvoudige Aselecte Steekproef (de mate waarin hieraan is
voldaan moet geëvalueerd worden)
o Voor specifieke meer complexe steekproefmodelle bestaan aangepaste formules
o Voor “gemakkelijkheidshalve” of ad hoc steekproeven met een vertekening (bias)
van onbekende omvang is er geen methode voor correcte inferentie
3
, o Bij kleine steekproeven worden betrouwbaarheidsintervallen wellicht te klein
geschat
o s moet gekend zijn
6.2 Significantietoetsen
• Een significantietoets is een formele procedure om waargenomen data te vergelijken met
een hypothese waarvan we willen beoordelen of hij waar is. (de hypothese is een bewering
over de parameters in een populatie of model)
o Een significantietoets meet de kans dat een resultaat wordt verkregen dat even
extreem is als of meer extreem dan het feitelijk waargenomen resultaat (extreem
betekent ver af van wat we zouden verwachten als H0 juist zou zijn)
• Het doel van significantietoetsen is om een populatieparameter te schatten. Het ander doel
is; het beoordelen van het door de data verschafte bewijsmateriaal ten gunste van de een of
andere bewering omtrent de populatie
o Een significantietoets is een formele procedure om waargenomen data te vergelijken
met een hypothese waarvan we willen beoordelen of hij waar is. De hypothese is
een bewering over de parameters in een populatie of model.
o Het beoordeelt het door de data aangedragen bewijsmateriaal tegen een
nulhypothese ten gunste van een alternatieve hypothese
• De cruciale vraag bij significantie toetsen:
o Hoe groot is de kans dat het resultaat van mijn onderzoek tot stand zou zijn
gekomen indien de nulhypothese waar zou zijn?
• Significantietoets in 4 stappen
o Formuleer de nul-en alternatieve hypothesen
§ Nulhypothese is de bewering die in een significantietoets wordt getoetst. De
significantietoets is ontworpen om de sterkte van het bewijs tegen de
nulhypothese vast te stellen. Gewoonlijk is de nulhypothese een bewering
van de vorm “geen effect” of “geen verschil”
o Bepaal de waarde van de toetsingsgrootheid
§ De toetsingsgrootheid is een maat voor de mate waarin de nulhypothese en
de gegevens op elkaar aansluiten. We gebruiken deze voor de
waarschijnlijkheidsberekening die we nodig hebben voor de
significantietoets. Het gaat om een stochastische variabele met een bekende
verdeling.
9:;<==>?@;ABC=;>=D9:;> E<<?F>
§ 𝑧 = 9=<3F<<?F<GEDHID3J K<3 F> 9:;<==>?
§ De z- toets veronderstelt een EAS van omvang n, een bekende
standaardafwijking s voor de populatie, en ofwel een normale populatie
ofwel een grote steekproef. Overschrijdingskansen worden berekend uit de
normale verdeling. Vaste a- toetsen gebruiken de tabel van
standaardnormale kritieke waarden
o Bepaal de overschrijdingskans p voor de data
§ De kans, berekend onder de aanname dat H0 waar is, dat de
toetsingsgrootheid een waarde zou aannemen die even extreem is als of nog
extremer is dan de feitelijke waargenomen uitkomst, wordt de
overschrijdingskans of p- waarde van een toets genoemd. Hoe kleiner de
overschrijdingskans, hoe sterker het door de data tegen H0 geleverde bewijs.
§ Statistische significantie: als de overschrijdingskans kleiner dan of gelijk is
aan a, zeggen we dat de data statistisch significant zijn op niveau a
o Formuleer de conclusie in APA-stijl
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper claudinestynen. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.