Toetsen revisted en de T-verdeling
Methodologie gaat over het proces tussen de wetenschappelijke vraag en het antwoord daarop.
- Met een goed design optimaliseer je de afweging.
- Met een goede analyse objectiveer je de conclusie.
Een wetenschappelijke beslissing wordt vaak genomen obv een statistische analyse. Hierbij wordt
vaak gebruik gemaakt van een toets omdat deze ongenuanceerd (ja/nee antwoord), gebaseerd is op
een tegen intuïtieve p-waarde en gebaseerd op een nulhypothese. Een statistische toets is een
objectieve procedure om op grond van beperkt aantal gegeven met behulp van modellen door
middel van kansuitspraken te beslissen of hypothese over populatie wel/niet door gegevens
ondersteund wordt.
De hypothese gaat altijd over een populatie!
Toets = NulHypothese Significantie Toetsen (NHST)
VB. Is Clair helderziend? Binomiale toets waarbij er 20% of meer van de 20 kaarten goed geraden
moet worden.
Statistische hypothese:
- H0: 𝜋≤0.2
- Ha: 𝜋>0.2
Toetsingsgrootheid: getal dat je uit je waarnemingen distilleert en waarop als mogelijke uitkomst van
het model onder H0 de (overschrijdings)kans kan worden berekend.
Pr(𝑋≥8│𝑋~Bin(𝑛=20;𝜋=0.2) ) = 0.032
Ofwel: wat is de kans om 8 of meer goede kaarten te raden, gegeven dat het aantal goed geraden
kaarten een Binomiale verdeling volgt met 20 herhalingen en een kans van 20% op succes per
herhaling.
De gevonden p-waarde is kleiner dan 5% dus mag de H 0 verworpen worden Clair is helderziend.
Een p-waarde laat zien dat het gerealiseerde resultaat ook toevallig kan worden gevonden. De toets-
structuur forceert een statistische beslissing want daarvoor is een afweging tegen andere informatie
nodig. Een betrouwbaarheidsinterval geeft inzicht in relevantie van het gevonden effect. Een
betrouwbaarheidsinterval is dus een interval van waarden voor een populatieparameter, gebaseerd
op steekproefuitkomsten, die op grond daarvan aannemelijk zijn.
- Het interval ligt rondom de steekproefparameter.
- De standaardfout wordt gebruikt als schatting voor de variabiliteit van deze parameter.
- Het percentage betrouwbaarheid bepaalt de capture rate (= het percentage van alle
mogelijke te verkrijgen intervallen dat de populatieverwachting inderdaad omvat).
Standaardformule voor betrouwbaarheidsinterval:
- Numeriek: BI 95 % ( μ )=x ±t 95 % × se kwantitatief
- Dichotoom: BI 95 % ( π )= p ± z 95 % ×σ p dichotoom
Procedures met de T-verdeling
Bij een toetskeuze moet er gelet worden op het aantal steekproeven, of de variabelen afhankelijk of
onafhankelijk zijn, het soort gegevens (nominaal, ordinaal, numeriek), het al dan niet herhaalde
waarnemingen en de vraagstelling.
, Voorwaarde gebruikt bij t-procedures:
1. Gegevens moeten onafhankelijk zijn. Dit is gegarandeerd bij toevals-steekproeven. Geen
clustering!
2. Gemiddelde van waarnemingen trekken uit normale verdeling. Als de n groot genoeg is is er
vaak sprake van een centrale limietstelling (hoe groter de n hoe meer de gegevens mogen
afwijken van de normale verdeling).
1-steekproef t-toets
Vraagstelling: verschilt continue populatieparameter van veronderstelde standaardwaarde?
x−μ0
Aanpak: bereken eerst de toetsingsgrootheid met de formule t= en kijk in de table met met
sd / √ n
de vrijheidsgraden welke p-waarde erbij hoort. Vanuit hier kan je dan concluderen of de H 0
verworpen wordt.
Gepaarde t-toets
Vraagstelling: is er een systematisch verschil tussen gematchte paren?
Aanpak: bereken eerst vanuit de voor- en nameting een verschilscore. Analyseer de verschilscores
met een 1-steekproef.
- H0: verschil = 0
- Ha: verschil = geen 0
DT
Bereken hierna de toetsingsgrootheid met de formule t= en kijk vervolgens weer in de table
sd / √ n
welke p-waarde erbij past om een uitspraak te doen over de H 0.
2-steekproef t-toets
Vraagstelling: is er een systematisch verschil tussen twee groepen?
( x T −x A )−( μT −μ A )0
Aanpak: bereken de toetsingsgrootheid met de formule t= maar er kan maar 1
s.e.
se ingevuld worden terwijl we 2 steekproeven hebben gepoolde variantie (gewogen gemiddelde
( nT −1 ) sd 2T + ( n A −1 ) sd 2A
van varianties) sd p=
1 1
√ nT + n A−2
en om van se sd te gaan vullen we deze formule
nog in se=sd p
√ + . onder H0 zijn de populatievarianties gelijk, maar dat is een gevaarlijk
nT n A
uitgangspunt als we al twijfelen aan juistheid H 0 (waarom zouden we anders een toets doen?) om
deze reden bestaan er 2 varianten van de 2-steekproef t-toets: voor gelijke en ongelijke varianties.
De gelijke varianties bereken je zoals hierboven beschreven. Voor de ongelijke varianties wordt de
sd 2T sd 2A
sep anders berekent: se p , ongelijk =
√ nT
+
nA
. Sep, ongelijk > sep, gelijk, want meer onzekerheid.
De vrijheidsgraden moeten ook apart berekent worden:
- Gelijk = n1 + n2 – 2
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller sweerstand. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.90. You're not tied to anything after your purchase.