Basic Statistics: Chapter 2- Exploring Data with Graphs and Numerical Summaries
Basic Statistics: Chapter 1- The Art and Science of Learning from Data
All for this textbook (5)
Written for
Hogeschool van Amsterdam (HvA)
sociaal wetenschappelijk onderzoek
Statistiek 2
All documents for this subject (1)
Seller
Follow
lparker
Content preview
H9 Statistical inference: significance tests about hypotheses
De significantietest (significance test) is de tweede grootste methode voor het uitvoeren van
statistische conclusies over een populatie. De significantietest gebruikt kans om te
kwantificeren hoe waarschijnlijk de waarde van een parameter is terwijl deze controle
uitvoert over de kans van een incorrecte schatting.
9.1 Stepts for performing a significance test
Hypothese: in de statistiek is het een statement over een populatie, die beweert dat een
populatie parameter een bepaalde numerieke waarde heeft of in een bepaalde range van
waarden valt.
Significantie test (of ‘test’ in het kort) is een methode voor het gebruik van data, om het
bewijs voor een hypothese samen te vatten.
Voordat je een significantietest uitvoert identificeren we de gemeten variabele en de
populatie parameter waarin we geïnteresseerd zijn.
- Voor een categorische variabele is de parameter over het algemeen een proportie.
- Voor een kwantitatieve variabele is de parameter over het algemeen het gemiddelde.
De stappen van een significantie test:
1. Aannames (assumptions)
De aannames hebben betrekking op de methode van de dataproductie (randomisatie), de
steekproefomvang en de vorm van de populatie verdeling.
2. Hypothesen
Elke significantietest heeft twee hypothesen over de populatie parameter:
De nulhypothese: H0, een statement dat de parameter een specifieke waarde heeft (bevat
slechts 1 waarde). Deze waarde vertegenwoordigt een geen effect.
De alternatieve hypothese: Ha, stelt dat de parameter in een alternatieve range van
waarden valt. Vertegenwoordigt dat er een effect is (van welke soort dan ook). Is een range
van waarden (interval).
→ In een significantietest wordt veronderstelt dat de nulhypothese waar is, tenzij
de data sterk bewijs leveren tegen deze hypothese. Het is aan de onderzoeker te
bewijzen dat de alternatieve hypothese waar is.
3. Teststatistiek (test statistic)
De teststatistiek meet de afstand tussen de puntschatting van de parameter en de waarde
van zijn nulhypothese, meestal door het aantal standaard errors (SE) dat tussen hen ligt.
4. P-waarde
De P-waarde is de kans (probability) dat een teststatistiek gelijk is aan de geobserveerde
waarde of aan een meer extreme waarde. Hij wordt berekend door te veronderstellen dat
H0 waar is.
De P-waarde is een staartkans (tail probability), voorbij de geobserveerde waarde van de
,teststatistiek als we veronderstellen dat H0 waar is.
→ Hoe kleiner de P-waarden hoe sterker het bewijs tegen H0
5. Conclusie
Rapporteer en interpreteer de P-waarde in de context van de studie.
Gebaseerd op de P-waarde, besluit je of je H0 wel of niet afwijst.
9.2 significance test about proportions.
,Significantie test voor properties:
Stap 1: Aannames:
- De variabele is categoriaal.
- De data wordt verkregen door randomisatie. (Wanneer er geen gebruik is gemaakt
van randomisatie, dan is de validiteit van de resultaten twijfelachtig. Een onderzoek
zou gebruik moeten maken van willekeurige steekproeven. )
- De steekproefomvang is groot genoeg, zodat de steekproefverdeling van de
steekproefproportie ongeveer normaal is. Hiervoor moeten het aantal
successen (np ≥ 15) en het aantal mislukkingen n(1- p) ≥15 beiden
minstens 15 zijn, waarbij de waarde van de nulhypothese wordt gebruikt
voor p.
Voorbeeld; wanneer er 116 pogingen zijn gedaan bij een onderzoek en H0 waar is wanneer
p=1/3 , verwachten we 116(⅓)= 38.7= 39 juiste pogingen en 116(⅔)= 77.3= 77 onjuiste.
Beide zijn boven de 15 dus groot genoeg.
Stap 2: Hypothesen
- De nulhypothese van een test over een proportie ziet er als volgt uit H0: p = p0
- Waarbij p0 staat voor een specifieke proportie waarde tussen 0 en 1.
- De alternatieve hypothese verwijst naar een alternatieve waarde van de parameter
dan het getal in de nulhypothese.
- Mogelijkheden voor alternatieve hypotheses:
Ha: p >p0 (right – tail probability) Dit wordt gebruikt wanneer een test wordt
ontworpen om te achterhalen of p groter is dan de het getal in de nulhypothese. Dit is
een enkelzijdige alternatieve hypothese (one-sided test), omdat de waarden slechts
aan een kant van de waarde van de nulhypothese vallen.
Ha: p <p0 (left - tail probability) Wanneer een test wordt onderworpen om te
achterhalen of p groter is dan het getal in de nulhypothese. Dit is een enkelzijdige
alternatieve hypothese (one-sided test).
Ha: p ≠ p0 (Two - tail probability)Dit is een tweezijdige alternatieve hypothese. Dit
bevat alle andere mogelijke waarden, zowel onder als boven de waarde P0 in H0.
Het betekent dat de populatie proportie anders is dan de nulhypothese.
, Stap 3: Test statistiek
- De teststatistiek meet hoe ver de steekproefproportie valt van de nulhypothese
waarde (p0), in verhouding tot wat we verwachten als H0 waar zou zijn.
- De steekproefverdeling van de steekproefproportie heeft een gemiddelde dat gelijk is
aan de populatieproportie p en een standaard deviatie die gelijk is aan:√(p (1 –
p) /n)
- Wanneer H0 waar is, p = p0, dan heeft de steekproefverdeling het gemiddelde p0 en
de standaard error se0= √(p0 (1 –p0) / n). (We gebruiken hier de nul om aan te
geven dat we in de se de waarde van p0 en niet die van voor het schatten van p
in de standaard error, omdat we veronderstellen dat H0 waar is in het uitvoeren van
de test.
- De teststatistiek is: Z=
→ Deze z-score meet het aantal standaard errors tussen de steekproefproportie
en de waarde van de nulhypothese p0.
Voorbeeld;
Bij het testen van H0: p= ⅓ voor het experiment en n= 116 pogingen, de standaard error is
= 0.0438
De onderzoekers hadden gelijk bij 40 van de 116 verwachtingen, een steekproefproportie
van 40/116 = 0,345. De test statistiek is
Dit betekent dat de steekproefproportie van 0,345 maar 0,26 standaard errors boven de
nulhypothese van ⅓ ligt.
Stap 4: P-waarde
- De P-waarde vat het bewijs samen. Het beschrijft hoe onwaarschijnlijk de data
zouden zijn als H0 waar zou zijn.
- De P-waarde is de kans dat de test statistiek een waarde heeft zoals de observeerde
test statistiek of een extremere waarde.
- De p-waarde kan gevonden worden in de z-tabel.
- Ha: p > p0 (right – tail probability), Ha: p < p0 (left - tail probability), Ha:p
≠ p0 (Two-tail probability)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lparker. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $11.18. You're not tied to anything after your purchase.