Applied Statistics II - International Student Edition
Duidelijke samenvatting van de hoorcolleges gegeven door Robbie van Aerts in 2022 en de boeken van Warner (Applied Statistics I & II). Het bevat foto's van SPSS tabellen ter verduidelijking en er is een SPSS handleiding voor de SPSS toets bijgevoegd.
Alleen de behandelde hoofdstukken uit warner i en warner ii zijn samengevat
31 mei 2022
1 juni 2022
39
2021/2022
Samenvatting
Onderwerpen
juliasistermans
julia sistermans
tiu
tilburg universiteit
university of tilburg
experimentele
spss
statistiek
mto
applied statistics
robbie van aert
uvt
experimentele onderzoeksmethode
Gekoppeld boek
Titel boek:
Auteur(s):
Uitgave:
ISBN:
Druk:
Meer samenvattingen voor studieboek
Statistiek 3, Klinische Leerlijn VU (Tentamencijfer (9,5)
Samenvatting Statistiek 3 Klinische leerlijn
Alles voor dit studieboek (3)
Geschreven voor
Tilburg University (UVT)
Psychologie
Experimentele Onderzoeksmethoden (424534B5)
Alle documenten voor dit vak (28)
Verkoper
Volgen
juliasistermans
Ontvangen beoordelingen
Voorbeeld van de inhoud
Hoorcollege 1
Beschrijvende statistiek
Beschrijvende statistiek: samenvatten van data.
Data: numerieke gegevens van populatie of steekproef.
Populatie Steekproef
Alle leden van een gedefinieerde groep Deelverzameling van leden van een
gedefinieerde groep.
Parameters zijn maten voor eigenschappen Steekproefgrootheden (statistics) zijn maten
van de scores in de populatie. voor eigenschappen van de scores in de
steekproef.
Griekse letters geven parameters weer (µ, σ). Latijnse letters geven steekproefgrootheden
weer ( X , s).
Beschrijvende statistiek helpt om de data samen te vatten, er zijn twee manieren om dit te
doen:
1. Het maken van een verdeling van scores: data samenvatten door het groeperen van
data met dezelfde score (bv. frequentieverdeling of histogram).
2. Steekproefgrootheden: data samenvatten door kenmerkende eigenschappen van de
verdeling van de data.
Centrale tendentie: meest kenmerkende score van de verdeling (bv.
gemiddelde, mediaan en modus).
Spreiding: hoeveel wijken scores af van de meest kenmerkende score (bv. range,
N
variantie en standaarddeviartie), variantie: SS
∑ ( X i−X ) 2
S2 = = i=1
N−1 N −1
Inferentiële statistiek
Beschrijvende statistiek volstaat als wel data hebben van de hele populatie, maar vaak
hebben we alleen data van een steekproef en niet van de populatie, omdat: te duur, kost te
veel tijd en soms onmogelijk.
Met inferentiële statistiek kunnen we op basis van een steekproef een uitspraak proberen te
doen over de populatie.
Er zijn drie procedures in de inferentiële statistiek:
1. Hypothese toetsen
2. Puntschatten
3. Intervalschatten (betrouwbaarheidsinterval)
Hypothese toetsen
Vraag: wat is het gemiddelde van de populatie waaruit een steekproef van N=50 is getrokken?
Bij hypothese toetsen ga je na of het gemiddelde in de populatie gelijk is aan een bepaalde
waarde of niet hypothesen zijn uitsluitend en uitputtend (bv. H 0 : μ=2,5 en H 1 :μ ≠ 2,5 ¿.
Er is sprake van een tweezijdige toets als er bij H 1 staat: ≠, en een eenzijdige toets als er bij H1
staat: < of >.
Je toetst H0, die je kunt verwerpen of niet. Als je H 0 verwerpt concludeer je H1 juist is.
Vuistregels hypothesen opstellen:
o H0 bevat “=” (gaat altijd op).
o H1 bevat de verwachting van de onderzoeker (gaat bijna altijd op).
Stappen bij hypothese toetsen:
o Stap 1: formuleren van hypothesen (bv. H 0 : μ=2,5 en H 1 :μ ≠ 2,5 ¿.
o Stap 2: beslissingsregel bepalen wanneer een resultaat statistisch significant is ( p ≤ α ) .
1
, o Stap 3: p-waarden bepalen uit de SPSS output.
o Stap 4: beslissing over significantie en inhoudelijke conclusie
Logica toetsen:
o Je maakt een aannamen over de waarde van een bepaalde parameter de
nulhypothese (stap 1).
o Gegeven dat de waarde juist is bepaal je de verdeling van de mogelijke waarden die de
steekproefgrootheid kan aannemen bij een simple random sample (enkelvoudige
toevallige steekproef) van N cases.
2
o Het gemiddelde van de steekproefverdeling is µ en de variantie
σ .
N
o Met deze verdeling bepaal je de kans (p-waarde) dat de waarde van X of nog extremer
optreedt.
o In stap 3 bepaal je de positie van X in de verdeling en bepaal je dus ook de p-waarde.
o Als de p-waarde kleiner is dan α verwerp je H0.
o Je gaat hier uit van simple random sample, is dit niet het geval mag je de toets eigenlijk
niet gebruiken. Simple random sample houdt in dat alle cases een gelijke kans hebben
om in de steekproef te komen en de cases onafhankelijk van elkaar geselecteerd
worden.
Eénzijdig vs. tweezijdig toetsen
Puntschatten
Je geeft antwoord op de vraag: wat is de beste gok voor de parameter (dus: welke waarde
ligt het dichtst bij de waarde in de populatie)?
In het geval van het gemiddelde µ is de beste gok X .
In het geval van de variantie σ 2 is de beste gok s2.
Intervalschatten
Je beantwoordt de vraag: wat is het interval waarbinnen de waarde van de parameters zich
met 95% zekerheid bevindt?
95% CI voor µ: in 95% van de keren dat ik een steekproef trek van bv. N=50 zal het CI de ware
waarde van µ bevatten.
s
Het CI bereken je met: X ± t cv ×
√N
SPSS geeft het 95% CI van het verschil, wanneer je hiermee het gewone CI wil berekenen
moet je de test value (H0) erbij optellen.
Relatie tussen CI’s en toetsen:
o Je kunt een CI gebruiken om tweezijdige hypothesen te toetsen.
o Beslissingsregel: tweezijdige toets met significatieniveau α:
Als μ H in het CI ( 1−α ) ×100 % interval ligt verwerp je H0 niet.
0
2
, Als μ H niet in het CI ( 1−α ) ×100 % interval ligt verwerp je H0 wel.
0
o Alternatieve interpretatie CI in relatie tot hypothese toetsen: het CI 95 geeft alle
mogelijke hypothetische waarden voor µ die niet verworpen worden door de
steekproefgegevens (gegeven α).
Overzicht toetsen gemiddelde
We hebben 5 toetsen gezien voor het gemiddelde:
Eén populatie:
o H 0 : μ=μ0 ,σ bekend (z-toets)
o H 0 : μ=μ0 ,σ onbekend (z-toets)
Twee populaties
o H 0 : μ1=μ2 , σ 1=σ 2 en onbekend, onafhankelijke steekproeven (t-toets)
o H 0 : μ1=μ2 , σ 1 ≠ σ 2 en onbekend, onafhankelijke steekproeven (t-toets)
o H 0 :δ=μ1−μ2 =0 , σ D onbekend, afhankelijke steekproeven (t-toets)
steekproefgrootheid −parameter X−μ
Er geldt altijd: Toestgrootheid= , oftewel: t=
standaardfout s
Wanneer je data over een t-toest uit SPSS wilt interpreteren is het belangrijk dat je eerst kijkt
naar de Levene’s test, wanneer het significantie niveau van de Levene’s test niet significant is
(>α) gebruik je de bovenste rij van de tabel (equal variances assumed), wanneer deze wel
significant is gebruik je de onderste rij (equal variances not assumed).
Hoorcollege 2
Onderscheidend vermogen/power van een toets
Als we toetsen willen we de juiste beslissing nemen:
o Als H0 waar is, H0 niet verwerpen.
o Als H1 waar is, H0 verwerpen.
Het onderscheidend vermogen (power) van een toets is de kans
op het verwerpen van H0 als H0 niet waar is.
Een groot onderscheidend vermogen is dus wenselijk, want het impliceert een hoge kans op
het terecht verwerpen van H0.
Power van een z-toets (stappenplan)
Stap 1: bepaal de Zcv onder H0 (bij gegeven α en richting van de toets).
o Gebruik hiervoor tabel B.2, kijk in de kolom van de gegeven α en de laatste rij (∞)
Stap 2: bepaal het steekproefgemiddelde X cv dat bij Zcv hoort onder H0.
σ
o Bereken σ x met σ x =
√N
o Bereken X cv met cv X =μ H + Z cv ×σ x
0
Stap 3: bereken kritieke grenswaarde X cv om naar de ZH1-waarde onder H1.
X cv −μ H
o Gebruik Z H = 1
1
σx
Stap 4: het onderscheidend vermogen is gelijk aan de kans: P(Z ≥ Z H 1∨H 1) .
o P( Z ≥ Z H 1∨H 1) vind je in tabel B.1
We willen dat de kans op het maken van de juiste beslissing zo hoog mogelijk is, hiervoor hebben we
nodig:
Een kleine α.
Een hoge power (1-β)
3
, Vier factoren die power beïnvloeden
α: grotere α geeft een grotere power.
( )
X−μ
Z=
N: grotere N geeft een grotere power σ .
√N
( )
X−μ
Z= .
σ: een grotere σ geeft een kleinere power σ
√N
De ‘ware µ’ in de alternatieve hypothese (µ H1): het effect wat we verwachten.
Effectgrootte (effect size)
Wanneer op basis van een hypothese toets H0 verworpen word (en H1 aangenomen) dan
krijgen wetenschappelijke claims het predicaat ‘significant’.
Maar ‘significant’ betekent niet: het is onomstotelijk bewezen dat er een systematisch effect
is (want we hebben te maken met steekproeffluctuaties), en het betekent ook niet dat het
praktisch/klinisch relevant is (zelfs een heel klein niet praktisch verschil kan significant zijn in
een hele grote steekproef).
Een maat voor de effect grootte is wenselijk, het is ook wenselijk om dit te vermelden bij je
resultaten van je onderzoek in je artikel.
Twee belangrijke maten voor effectgrootte bij het vergelijken van gemiddelde:
o Cohen’s d: hoe groot is het relatieve verschil in groepen.
o (partiele) verklaarde variantie η2: hoeveel variantie wordt door groepslidmaatschap
verklaard.
Vuistregels interpreteren effectgrootte (moet je kennen)
d η2
Klein 0,2 0,01
Middelgroot 0,5 0,06
Groot 0,8 0,14
Rekenformules effectgrootte
Eén groep: d=t
Twee groepen:
√ 1
N
o
2
d=t
√
1 1
t2
+
n1 n2
o η= 2
t + df w
df w zijn de vrijheidsgraden, bij twee groepen: df w =n1 +n2−2
Eén-weg variantieanalyse (ANOVA)
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper juliasistermans. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,98. Je zit daarna nergens aan vast.