Toetsen revisted en de T-verdeling
Methodologie gaat over het proces tussen de wetenschappelijke vraag en het antwoord daarop.
- Met een goed design optimaliseer je de afweging.
- Met een goede analyse objectiveer je de conclusie.
Een wetenschappelijke beslissing wordt vaak genomen obv een statistische analyse. Hierbij wordt
vaak gebruik gemaakt van een toets omdat deze ongenuanceerd (ja/nee antwoord), gebaseerd is op
een tegen intuïtieve p-waarde en gebaseerd op een nulhypothese. Een statistische toets is een
objectieve procedure om op grond van beperkt aantal gegeven met behulp van modellen door
middel van kansuitspraken te beslissen of hypothese over populatie wel/niet door gegevens
ondersteund wordt.
De hypothese gaat altijd over een populatie!
Toets = NulHypothese Significantie Toetsen (NHST)
VB. Is Clair helderziend? Binomiale toets waarbij er 20% of meer van de 20 kaarten goed geraden
moet worden.
Statistische hypothese:
- H0: 𝜋≤0.2
- Ha: 𝜋>0.2
Toetsingsgrootheid: getal dat je uit je waarnemingen distilleert en waarop als mogelijke uitkomst van
het model onder H0 de (overschrijdings)kans kan worden berekend.
Pr(𝑋≥8│𝑋~Bin(𝑛=20;𝜋=0.2) ) = 0.032
Ofwel: wat is de kans om 8 of meer goede kaarten te raden, gegeven dat het aantal goed geraden
kaarten een Binomiale verdeling volgt met 20 herhalingen en een kans van 20% op succes per
herhaling.
De gevonden p-waarde is kleiner dan 5% dus mag de H 0 verworpen worden Clair is helderziend.
Een p-waarde laat zien dat het gerealiseerde resultaat ook toevallig kan worden gevonden. De toets-
structuur forceert een statistische beslissing want daarvoor is een afweging tegen andere informatie
nodig. Een betrouwbaarheidsinterval geeft inzicht in relevantie van het gevonden effect. Een
betrouwbaarheidsinterval is dus een interval van waarden voor een populatieparameter, gebaseerd
op steekproefuitkomsten, die op grond daarvan aannemelijk zijn.
- Het interval ligt rondom de steekproefparameter.
- De standaardfout wordt gebruikt als schatting voor de variabiliteit van deze parameter.
- Het percentage betrouwbaarheid bepaalt de capture rate (= het percentage van alle
mogelijke te verkrijgen intervallen dat de populatieverwachting inderdaad omvat).
Standaardformule voor betrouwbaarheidsinterval:
- Numeriek: BI 95 % ( μ )=x ±t 95 % × se kwantitatief
- Dichotoom: BI 95 % ( π )= p ± z 95 % ×σ p dichotoom
Procedures met de T-verdeling
Bij een toetskeuze moet er gelet worden op het aantal steekproeven, of de variabelen afhankelijk of
onafhankelijk zijn, het soort gegevens (nominaal, ordinaal, numeriek), het al dan niet herhaalde
waarnemingen en de vraagstelling.
, Voorwaarde gebruikt bij t-procedures:
1. Gegevens moeten onafhankelijk zijn. Dit is gegarandeerd bij toevals-steekproeven. Geen
clustering!
2. Gemiddelde van waarnemingen trekken uit normale verdeling. Als de n groot genoeg is is er
vaak sprake van een centrale limietstelling (hoe groter de n hoe meer de gegevens mogen
afwijken van de normale verdeling).
1-steekproef t-toets
Vraagstelling: verschilt continue populatieparameter van veronderstelde standaardwaarde?
x−μ0
Aanpak: bereken eerst de toetsingsgrootheid met de formule t= en kijk in de table met met
sd / √ n
de vrijheidsgraden welke p-waarde erbij hoort. Vanuit hier kan je dan concluderen of de H 0
verworpen wordt.
Gepaarde t-toets
Vraagstelling: is er een systematisch verschil tussen gematchte paren?
Aanpak: bereken eerst vanuit de voor- en nameting een verschilscore. Analyseer de verschilscores
met een 1-steekproef.
- H0: verschil = 0
- Ha: verschil = geen 0
DT
Bereken hierna de toetsingsgrootheid met de formule t= en kijk vervolgens weer in de table
sd / √ n
welke p-waarde erbij past om een uitspraak te doen over de H 0.
2-steekproef t-toets
Vraagstelling: is er een systematisch verschil tussen twee groepen?
( x T −x A )−( μT −μ A )0
Aanpak: bereken de toetsingsgrootheid met de formule t= maar er kan maar 1
s.e.
se ingevuld worden terwijl we 2 steekproeven hebben gepoolde variantie (gewogen gemiddelde
( nT −1 ) sd 2T + ( n A −1 ) sd 2A
van varianties) sd p=
1 1
√ nT + n A−2
en om van se sd te gaan vullen we deze formule
nog in se=sd p
√ + . onder H0 zijn de populatievarianties gelijk, maar dat is een gevaarlijk
nT n A
uitgangspunt als we al twijfelen aan juistheid H 0 (waarom zouden we anders een toets doen?) om
deze reden bestaan er 2 varianten van de 2-steekproef t-toets: voor gelijke en ongelijke varianties.
De gelijke varianties bereken je zoals hierboven beschreven. Voor de ongelijke varianties wordt de
sd 2T sd 2A
sep anders berekent: se p , ongelijk =
√ nT
+
nA
. Sep, ongelijk > sep, gelijk, want meer onzekerheid.
De vrijheidsgraden moeten ook apart berekent worden:
- Gelijk = n1 + n2 – 2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper sweerstand. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,49. Je zit daarna nergens aan vast.