Samenvatting Hulp nodig voor het theorie gedeelte van statistiek 2?
239 views 15 purchases
Course
Statistiek II
Institution
Vrije Universiteit Brussel (VUB)
Book
Statistiek in de praktijk Theorieboek
Dit is een samenvatting voor het vak statistiek 2, gedoceerd door Prof Theuns. Het omvat de theorie van de slides en het boek. (foutje op p33 wanneer df toeneemt neigt het meer naar een normaalverdeling)
Statistiek 2
Inhoudsopgave
HOOFDSTUK 6: INLEIDING TOT INFERENTIE: Z-TEST ......................................................................................... 2
6.1 SCHATTEN MET BETROUWBAARHEID......................................................................................................... 3
6.2 SIGNIFICANTIETOETSEN ......................................................................................................................... 4
6.3 GEBRUIK EN MISBRUIK VAN TOETSEN ........................................................................................................ 5
6.4 ONDERSCHEIDINGSVERMOGEN EN INFERENTIE ALS BESLISSING ........................................................................ 5
6.4.1 Onderscheidingsvermogen (Power) ........................................................................................ 5
6.4.2 Onderscheidingsvermogen vergroten ..................................................................................... 7
HOOFDSTUK 7: INFERENTIE VOOR VERDELINGEN: T-TEST ................................................................................ 9
7.1 INFERENTIE OVER VERWACHTING VAN 1 POPULATIE ...................................................................................... 9
7.1.1 De t-verdelingen .................................................................................................................... 9
7.1.2 1-steekproef t betrouwbaarheidsinterval ............................................................................. 11
7.1.3 1- steekproef t-test .............................................................................................................. 11
7.1.4 t toetsen voor gekoppelde paren.......................................................................................... 12
7.1.5 Robuusheid van t procedures ............................................................................................... 14
7.2 VERGELIJKEN VAN 2 VERWACHTINGEN .................................................................................................... 16
7.2.1 Vergelijken van 2-steekproef gemiddelden ........................................................................... 16
7.2.2 Twee steekproeven t procedures .......................................................................................... 16
7.2.3 Robuustheid van t procedures voor onafhankelijke steekproeven ......................................... 18
7.2.4 Gepoelde (Pooled) 2-steekproeven t procedures ................................................................... 19
7.3 EXTRA TOPICS VER HET VERGELIJKEN VAN VERDELINGEN .............................................................................. 20
7.3.1 Inferentie voor populatie spreiding ...................................................................................... 20
7.3.2 De F test voor gelijkheid van spreidingen.............................................................................. 20
7.3.3 Onderscheidingsvermogen van de 2-steekproeven t-test ...................................................... 20
HOOFDSTUK 8: INFERENTIE VOOR FRACTIES (PROPORTIES EN PERCENTAGES) .............................................. 21
8.1 INFERENTIE VOOR EEN ENKELE PROPORTIE (=FRACTIE)................................................................................. 21
8.2 TWEE PROPORIES/ FRACTIES VERGELIJKEN ................................................................................................ 23
HOOFDSTUK 15: NIET-PARAMETRISCHE TOETSEN .......................................................................................... 27
15.1 WILCOXON RANK SUM TEST (RANGSOMTEST) = MANN-WHITNEY U-TEST ...................................................... 27
15.1.1 Rang transformatie ............................................................................................................. 28
15.1.2 Wilcoxon Rangsom Test = u-test .......................................................................................... 28
15.2 WILCOXON SIGNED RANK TEST (RANGTEKENTEST) ..................................................................................... 30
15.3 KRUSKAL- WALLIS TEST ...................................................................................................................... 31
HOOFDSTUK 9: ANALYSE VAN 2-WEGS TABELLEN OF CONTINGENTIE TABELLEN............................................ 32
9.3 GOODNESS OF FIT (AANPASSINGSTOETS) ................................................................................................. 33
9.1 INFERENTIE VOOR CONTINGENTIETABELLEN (2-WEGS TABELLEN) VERGELIJKEN VAN 2 OF MEER ONAFHANKELIJKE
STEEKPROEVEN ............................................................................................................................................... 35
,Hoofdstuk 6: Inleiding tot inferentie: Z-test
• Doel van statistische inferentie is het trekken van conclusies uit gegevens.
o Bij formele inferentie ligt de nadruk op het onderbouwen van onze conclusies met
kansberekeningen. (gebaseerd op steekproefverdelingen)
§ Dankzij de kansrekening kunnen we rekening houden met toevallige varieties
en op deze wijze onze beoordeling aan de hand van berekeningen corrigeren
§ Als u statistische inferentie gebruikt, handelt u alsof de gegevens afkomstig
zijn uit een aslecte steekproef of een random experiment.
• Twee soorten steekproeven
o Between subjects design
§ Vb zijn mannen sneller dan vrouwen
§ Het zijn onafhankelijke/ niet gepaarde/ niet gekoppelde steekproeven
§ = unpaired samples
o Within subjects design
§ Is Jennifer sneller na het nemen van EPO
§ Afhankelijke/ gepaarde/ gekoppelde steekproeven
§ = paired samples à 2 herhaalde metingen
• Inductieve technieken : 2 doelen
o Schatten (betrouwbaarheidsintervallen): op basis van een steekproef
o Toetsen (significantietoetsen): komt een bepaald resultaat door toeval tot stand?
• Statistisch schatten
o Puntschatting
o Intervalsschatting
2
,6.1 Schatten met betrouwbaarheid
• Het steekproefgemiddelde x is de natuurlijke schatter van de onbekende
populatieverwachting µ. Wat nog belangrijker is, de wet van de grote aantallen zegt dat het
steekproefgemiddelde moet naderen tot de populatieverwachting als de steekproefomvang
toeneemt.
• Betrouwbaarheidsinterval (Confidence level)
o Het doel van een BI is een schatting te geven van een onbekende parameter, met
een indicatie van de mate van nauwkeurigheid van de schatting en van de mate
vertrouwen die men in de correctheid van het resultaat mag hebben
o Een betrouwbaarheidsinterval van niveau C voor een parameter is een interval dat is
berekend uit de steekproefdata, volgens een methode die kans C heeft om een
interval op te leveren dat de werkelijke waarde van de parameter bevat.
§ 95% betrouwbaarheidsinterval is een omgeving rondom het resultaat van 1
replicatie zodat in 95% van de replicaties een interval wordt gevonden dat de
echte populatiewaarde van de onderzochte variabele (het resultaat op
papulatie niveau) bevat.
§ Als u de methode 1 maal toepast kunt u niet weten of uw interval een juiste
waarde gaf (dit gebeurt in 95% van de gevallen) of niet (dit gebeurt in 5% van
de gevallen)
o Steekproefgemiddelde varieert met elke steekproef
o Betrouwbaarheidsinterval voor µ = (schatter ± formarge) zal bij C% van de
steekproeven de onbekende populatieparameter µ “vangen”.
§ C% is het algemene vangpercentage à a
1
§ 𝑓𝑜𝑢𝑡𝑚𝑎𝑟𝑔𝑒 (𝑚 ) = 𝑧 ∗ .
√3
§ Hierbij is z* de waarde voor de stanaardnormale curve met oppervlakte C
tussen de kritieke punten -z* en z*. Het niveau C betrouwbaarheidsinterval
voor µ is [ x ± m ]
§ Dit interval is exact correct als de populatieverdeling normaal is en is in
andere gevallen voor grote n bij benadering correct
o Steekproefomvang bij een gewenste foutmarge:
§ Het betrouwbaarheidsinterval voor een populatiegemiddelde zal een
gespecificeerde foutmarge m hebben als de steekproefomvang gelijk is aan
6∗.1 8
§ 𝑛=5 3
7
• Gedrag van de betrouwbaarheid
o Een klein BI (betrouwbaarheidsinterval) impliceert: hoge betrouwbaarheid DUS een
kleine foutenmarge
§ Gebruik een lager betrouwbaarheidsniveau (kleiner dan C; meestal
gebruiken wij 95%)
§ Grotere steekproef
§ Kleinere s
• Waarschuwing ivm schatters
o Formules voor schatters gelden enkel onder de voorwaarde dat de gegevens
bekomen zijn uit een Enkelvoudige Aselecte Steekproef (de mate waarin hieraan is
voldaan moet geëvalueerd worden)
o Voor specifieke meer complexe steekproefmodelle bestaan aangepaste formules
o Voor “gemakkelijkheidshalve” of ad hoc steekproeven met een vertekening (bias)
van onbekende omvang is er geen methode voor correcte inferentie
3
, o Bij kleine steekproeven worden betrouwbaarheidsintervallen wellicht te klein
geschat
o s moet gekend zijn
6.2 Significantietoetsen
• Een significantietoets is een formele procedure om waargenomen data te vergelijken met
een hypothese waarvan we willen beoordelen of hij waar is. (de hypothese is een bewering
over de parameters in een populatie of model)
o Een significantietoets meet de kans dat een resultaat wordt verkregen dat even
extreem is als of meer extreem dan het feitelijk waargenomen resultaat (extreem
betekent ver af van wat we zouden verwachten als H0 juist zou zijn)
• Het doel van significantietoetsen is om een populatieparameter te schatten. Het ander doel
is; het beoordelen van het door de data verschafte bewijsmateriaal ten gunste van de een of
andere bewering omtrent de populatie
o Een significantietoets is een formele procedure om waargenomen data te vergelijken
met een hypothese waarvan we willen beoordelen of hij waar is. De hypothese is
een bewering over de parameters in een populatie of model.
o Het beoordeelt het door de data aangedragen bewijsmateriaal tegen een
nulhypothese ten gunste van een alternatieve hypothese
• De cruciale vraag bij significantie toetsen:
o Hoe groot is de kans dat het resultaat van mijn onderzoek tot stand zou zijn
gekomen indien de nulhypothese waar zou zijn?
• Significantietoets in 4 stappen
o Formuleer de nul-en alternatieve hypothesen
§ Nulhypothese is de bewering die in een significantietoets wordt getoetst. De
significantietoets is ontworpen om de sterkte van het bewijs tegen de
nulhypothese vast te stellen. Gewoonlijk is de nulhypothese een bewering
van de vorm “geen effect” of “geen verschil”
o Bepaal de waarde van de toetsingsgrootheid
§ De toetsingsgrootheid is een maat voor de mate waarin de nulhypothese en
de gegevens op elkaar aansluiten. We gebruiken deze voor de
waarschijnlijkheidsberekening die we nodig hebben voor de
significantietoets. Het gaat om een stochastische variabele met een bekende
verdeling.
9:;<==>?@;ABC=;>=D9:;> E<<?F>
§ 𝑧 = 9=<3F<<?F<GEDHID3J K<3 F> 9:;<==>?
§ De z- toets veronderstelt een EAS van omvang n, een bekende
standaardafwijking s voor de populatie, en ofwel een normale populatie
ofwel een grote steekproef. Overschrijdingskansen worden berekend uit de
normale verdeling. Vaste a- toetsen gebruiken de tabel van
standaardnormale kritieke waarden
o Bepaal de overschrijdingskans p voor de data
§ De kans, berekend onder de aanname dat H0 waar is, dat de
toetsingsgrootheid een waarde zou aannemen die even extreem is als of nog
extremer is dan de feitelijke waargenomen uitkomst, wordt de
overschrijdingskans of p- waarde van een toets genoemd. Hoe kleiner de
overschrijdingskans, hoe sterker het door de data tegen H0 geleverde bewijs.
§ Statistische significantie: als de overschrijdingskans kleiner dan of gelijk is
aan a, zeggen we dat de data statistisch significant zijn op niveau a
o Formuleer de conclusie in APA-stijl
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller claudinestynen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.49. You're not tied to anything after your purchase.