Dit is een samenvatting van Statistiek II, van de studie criminologie op de VU. Het omvat alle onderwerpen. Het is een combinatie van het boek en de hoorcolleges, waarbij er informatie wordt gegeven, en alle toetsen en onderwerpen worden in eigen woorden omschreven om het duidelijker te maken.
Bij een vergelijking van twee gemiddelden (independent sample t-toets) gaat het erom om
gemiddelden van twee verschillende groepen te vergelijken. Elke groep wordt als een aselecte
steekproef gekozen uit dezelfde of een andere populatie. Belangrijk is dat de reacties in de ene groep
onafhankelijk zijn van de reacties in de andere groep (dat is de eerste voorwaarde).
Twee-steekproevengegevens kunnen statistisch weergegeven worden als een rug-aan-rug
stamdiagram (kleinere steekproeven) of zij-aan-zij boxplots (grotere steekproeven). Om de effecten te
zien van kleine verschillen zijn grote steekproeven nodig. De verwachting voor het verschil X1 – X2 is
gelijk aan het verschil µ1 - µ2. Daarom mag je een van beide wanneer je gaat rekenen voor de t-toets
weglaten.
Onafhankelijke steekproeven uit één populatie:
- trek steekproef (n proefpersonen)
- verdeel proefpersonen at random over twee groepen
- geef elke groep zijn eigen interventie
- meet het gemiddelde voor elke groep
- toets het verschil tussen de gemiddelden
Onafhankelijke steekproeven uit twee populaties:
- trek 2 steekproeven, één uit elke populatie
- meet het gemiddelde voor elke groep
- toets het verschil tussen de gemiddelden
1. Nulhypothese
Verschil tussen populatiegemiddelden is onbekend, we gaan uit van de nulhypothese dat μ1-
μ2=0
2. Toetsstatistiek
Het verschil tussen gemiddelden omgezet in ‘standaard’ toetsstatistiek t-score
3. Kritieke waarde
Is het verschil tussen verschil ‘μ1-μ2’ en ‘0’ significant? Hoe groot verschil is genoeg om de
nulhypothese te verwerpen?
4. Beslissing
Bij een significant verschil veronderstellen we dat de gemiddelden uit verschillende
populaties komen
Een andere voorwaarden voor een t-toets voor twee onafhankelijke steekproeven is dat de varianties
gelijk verdeeld zijn (=homogeniteitsassumptie). Daar ga je vanuit omdat een verdeling vaak normaal
verdeeld is (equal variances assumed). Als dit het geval is voer je de t-toets als volgt uit: als de
varianties nagenoeg gelijk zijn maak je één schatter, de zogenaamde s2 pooled (samengestelde
schatter van o2). Hij combineert dus de informatie uit beide steekproeven. Die bereken je als volgt:
n1-1 * s1 + n2-1 * s2 / n1 + n2 – 2. Om met de s2pooled vervolgens Sx1-x2 te berekenen doe je
√s2pooled(1/n1+1/n2). Als je dan x1-x2 deelt door Sx1-x2 heb je je t-waarde. De df bereken je in dit
geval n1 + n2 -2 te doen. Je kan de tabel nu aflezen.
Een t-toets voor onafhankelijke steekproeven werkt als volgt, als de varianties van elkaar verschillen:
je doet x1 – x2 / √s1/n1 + s2/n2. Dit gebruik je wanneer de varianties significant van elkaar verschillen
, (equal variances not assumed). Dat bereken je met de F-toets (komt later). Als je dit uitgerekend
hebt, heb je de Sx1-x2 (standaardafwijking van de twee waardes). Om de t-waarde te berekenen doe
je X1 – X2 / Sx1-x2. Het getal wat je daaruit krijgt is je t-waarde. Je df voor je kritieke t-waarde
bereken je in dit geval als volgt: de laagste uitkomst van n1-1 of n2-1. Dus als n1 40 is en n2 50 dan is
je df 39. Dit noem je conservatieve inferentieprocedures.
Deze kan je vervolgens aflezen in de tabel en conclusies kan je trekken via de normale gang van
zaken, het zelfde als bij bijvoorbeeld de paired samples t-test. Dus als je gevonden Tcv 2,50 is en je t-
waarde 2, dan is het verschil niet significant en moet je H0 niet verwerpen. Is je Tcv 2,50 en je t-
waarde 4, dan is het verschil (zeer) significant en moet H0 verwerpen. Er is dan een duidelijk verschil
tussen de twee gemiddelden. Als iets significant is, hoeft het nog niet relevant te zijn, dit is het
onderscheidingsvermogen. Dat is de kans dat je de nulhypothese terecht verwerpt.
Dit druk je uit in effect size (d). D bereken je als volgt: X1 – X2 / √s2 pooled. Je kan de uitkomst als
volgt interpreteren: 0.25 is klein, 0.50 is middelmatig en >1 is groot. Dit zijn geen harde cijfers.
De twee steekproef t-procedures zijn robuuster dan de t-methoden voor enkelvoudige steekproeven.
De kansen die je berekend zijn behoorlijk nauwkeurig.
Om te berekenen of de varianties significant van elkaar verschillen kan je een F-toets uitvoeren. De F-
toets is buitengewoon gevoelig voor niet-normale verdelingen en is dus niet robuust. Je H0 is dan o1
= o2. De F-verdelingen is een familie verdeling met twee parameters; de vrijheidsgraden en de
steekproefvarianties. Het is een rechtsscheve verdeling. Om de f-toets te doen deel je de grootste s
door de kleinste s. De uitkomst dient groter dan 1 te zijn. De df is n-1 voor de teller (numerator),
gebruik hierbij de grootste N, en ook n-1 voor de noemer (denominator). Lees je kritieke Fwaarde af.
Trek daarna je conclusie.
Week 2
De Chi-kwadraat toets (X2 toets). Deze toets gebruik je om het verband te toetsen tussen twee
nominale of ordinale (categorische) variabelen. Een gewone t-toets kan je niet doen omdat het
meetniveau te laag is.
Je hebt twee typen:
- Toets op homogeniteit (= toets voor onafhankelijkheid).
In dit geval wordt de Chi toets gebruikt om te bepalen of er een verband tussen twee variabelen is.
Je toets dus eigenlijk in dit geval (het is altijd een kruistabel) of er een verschil is tussen de rijvariabele
en de kolomvariabele.
Je toets de nulhypothese dat er geen verband is tussen 2 variabelen, en de alternatieve hypothese
dat er wel een verband is (deze geeft overigens geen richting voor positief of negatief verband). Voor
deze hypothese is er geen formule, je mag hem in woorden formuleren. Je kijkt hierbij naar een
kruistabel. De frequenties die in de tabel staan zijn de geobserveerde frequenties en dit noem je O of
fo. De verwachte frequenties duidt je aan met E of f e. Je gaat dus toetsen of er verschil zit tussen O en
E.
In deze toets zijn er geen assumpties ten opzichte van de frequentieverdeling. Dat noem je niet
parametisch. Als het meetniveau geschikt is mag je deze toets altijd uitvoeren. Nadeel daarbij is dat
er bij deze toets minder power is. Er is wel een voorwaarde, namelijk dat niet meer dan 20% van de
cellen een verwachte frequentie van <5 heeft, want dan kan je deze toets niet meer uitvoeren. Als je
dat hebt moet je categorieën gaan samenvoegen.
Formule voor de Chi-kwadraat toets op homogeniteit:
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper hannahvu. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,99. Je zit daarna nergens aan vast.