Applied Statistics II - International Student Edition
Duidelijke samenvatting van de hoorcolleges gegeven door Robbie van Aerts in 2022 en de boeken van Warner (Applied Statistics I & II). Het bevat foto's van SPSS tabellen ter verduidelijking en er is een SPSS handleiding voor de SPSS toets bijgevoegd.
Alleen de behandelde hoofdstukken uit warner i en warner ii zijn samengevat
May 31, 2022
June 1, 2022
39
2021/2022
Summary
Subjects
juliasistermans
julia sistermans
tiu
tilburg universiteit
university of tilburg
experimentele
spss
statistiek
mto
applied statistics
robbie van aert
uvt
experimentele onderzoeksmethode
Connected book
Book Title:
Author(s):
Edition:
ISBN:
Edition:
More summaries for
Samenvatting Statistiek 3 Klinische leerlijn
All for this textbook (1)
Written for
Tilburg University (UVT)
Psychologie
Experimentele Onderzoeksmethoden (424534B5)
All documents for this subject (28)
Seller
Follow
juliasistermans
Reviews received
Content preview
Hoorcollege 1
Beschrijvende statistiek
Beschrijvende statistiek: samenvatten van data.
Data: numerieke gegevens van populatie of steekproef.
Populatie Steekproef
Alle leden van een gedefinieerde groep Deelverzameling van leden van een
gedefinieerde groep.
Parameters zijn maten voor eigenschappen Steekproefgrootheden (statistics) zijn maten
van de scores in de populatie. voor eigenschappen van de scores in de
steekproef.
Griekse letters geven parameters weer (µ, σ). Latijnse letters geven steekproefgrootheden
weer ( X , s).
Beschrijvende statistiek helpt om de data samen te vatten, er zijn twee manieren om dit te
doen:
1. Het maken van een verdeling van scores: data samenvatten door het groeperen van
data met dezelfde score (bv. frequentieverdeling of histogram).
2. Steekproefgrootheden: data samenvatten door kenmerkende eigenschappen van de
verdeling van de data.
Centrale tendentie: meest kenmerkende score van de verdeling (bv.
gemiddelde, mediaan en modus).
Spreiding: hoeveel wijken scores af van de meest kenmerkende score (bv. range,
N
variantie en standaarddeviartie), variantie: SS
∑ ( X i−X ) 2
S2 = = i=1
N−1 N −1
Inferentiële statistiek
Beschrijvende statistiek volstaat als wel data hebben van de hele populatie, maar vaak
hebben we alleen data van een steekproef en niet van de populatie, omdat: te duur, kost te
veel tijd en soms onmogelijk.
Met inferentiële statistiek kunnen we op basis van een steekproef een uitspraak proberen te
doen over de populatie.
Er zijn drie procedures in de inferentiële statistiek:
1. Hypothese toetsen
2. Puntschatten
3. Intervalschatten (betrouwbaarheidsinterval)
Hypothese toetsen
Vraag: wat is het gemiddelde van de populatie waaruit een steekproef van N=50 is getrokken?
Bij hypothese toetsen ga je na of het gemiddelde in de populatie gelijk is aan een bepaalde
waarde of niet hypothesen zijn uitsluitend en uitputtend (bv. H 0 : μ=2,5 en H 1 :μ ≠ 2,5 ¿.
Er is sprake van een tweezijdige toets als er bij H 1 staat: ≠, en een eenzijdige toets als er bij H1
staat: < of >.
Je toetst H0, die je kunt verwerpen of niet. Als je H 0 verwerpt concludeer je H1 juist is.
Vuistregels hypothesen opstellen:
o H0 bevat “=” (gaat altijd op).
o H1 bevat de verwachting van de onderzoeker (gaat bijna altijd op).
Stappen bij hypothese toetsen:
o Stap 1: formuleren van hypothesen (bv. H 0 : μ=2,5 en H 1 :μ ≠ 2,5 ¿.
o Stap 2: beslissingsregel bepalen wanneer een resultaat statistisch significant is ( p ≤ α ) .
1
, o Stap 3: p-waarden bepalen uit de SPSS output.
o Stap 4: beslissing over significantie en inhoudelijke conclusie
Logica toetsen:
o Je maakt een aannamen over de waarde van een bepaalde parameter de
nulhypothese (stap 1).
o Gegeven dat de waarde juist is bepaal je de verdeling van de mogelijke waarden die de
steekproefgrootheid kan aannemen bij een simple random sample (enkelvoudige
toevallige steekproef) van N cases.
2
o Het gemiddelde van de steekproefverdeling is µ en de variantie
σ .
N
o Met deze verdeling bepaal je de kans (p-waarde) dat de waarde van X of nog extremer
optreedt.
o In stap 3 bepaal je de positie van X in de verdeling en bepaal je dus ook de p-waarde.
o Als de p-waarde kleiner is dan α verwerp je H0.
o Je gaat hier uit van simple random sample, is dit niet het geval mag je de toets eigenlijk
niet gebruiken. Simple random sample houdt in dat alle cases een gelijke kans hebben
om in de steekproef te komen en de cases onafhankelijk van elkaar geselecteerd
worden.
Eénzijdig vs. tweezijdig toetsen
Puntschatten
Je geeft antwoord op de vraag: wat is de beste gok voor de parameter (dus: welke waarde
ligt het dichtst bij de waarde in de populatie)?
In het geval van het gemiddelde µ is de beste gok X .
In het geval van de variantie σ 2 is de beste gok s2.
Intervalschatten
Je beantwoordt de vraag: wat is het interval waarbinnen de waarde van de parameters zich
met 95% zekerheid bevindt?
95% CI voor µ: in 95% van de keren dat ik een steekproef trek van bv. N=50 zal het CI de ware
waarde van µ bevatten.
s
Het CI bereken je met: X ± t cv ×
√N
SPSS geeft het 95% CI van het verschil, wanneer je hiermee het gewone CI wil berekenen
moet je de test value (H0) erbij optellen.
Relatie tussen CI’s en toetsen:
o Je kunt een CI gebruiken om tweezijdige hypothesen te toetsen.
o Beslissingsregel: tweezijdige toets met significatieniveau α:
Als μ H in het CI ( 1−α ) ×100 % interval ligt verwerp je H0 niet.
0
2
, Als μ H niet in het CI ( 1−α ) ×100 % interval ligt verwerp je H0 wel.
0
o Alternatieve interpretatie CI in relatie tot hypothese toetsen: het CI 95 geeft alle
mogelijke hypothetische waarden voor µ die niet verworpen worden door de
steekproefgegevens (gegeven α).
Overzicht toetsen gemiddelde
We hebben 5 toetsen gezien voor het gemiddelde:
Eén populatie:
o H 0 : μ=μ0 ,σ bekend (z-toets)
o H 0 : μ=μ0 ,σ onbekend (z-toets)
Twee populaties
o H 0 : μ1=μ2 , σ 1=σ 2 en onbekend, onafhankelijke steekproeven (t-toets)
o H 0 : μ1=μ2 , σ 1 ≠ σ 2 en onbekend, onafhankelijke steekproeven (t-toets)
o H 0 :δ=μ1−μ2 =0 , σ D onbekend, afhankelijke steekproeven (t-toets)
steekproefgrootheid −parameter X−μ
Er geldt altijd: Toestgrootheid= , oftewel: t=
standaardfout s
Wanneer je data over een t-toest uit SPSS wilt interpreteren is het belangrijk dat je eerst kijkt
naar de Levene’s test, wanneer het significantie niveau van de Levene’s test niet significant is
(>α) gebruik je de bovenste rij van de tabel (equal variances assumed), wanneer deze wel
significant is gebruik je de onderste rij (equal variances not assumed).
Hoorcollege 2
Onderscheidend vermogen/power van een toets
Als we toetsen willen we de juiste beslissing nemen:
o Als H0 waar is, H0 niet verwerpen.
o Als H1 waar is, H0 verwerpen.
Het onderscheidend vermogen (power) van een toets is de kans
op het verwerpen van H0 als H0 niet waar is.
Een groot onderscheidend vermogen is dus wenselijk, want het impliceert een hoge kans op
het terecht verwerpen van H0.
Power van een z-toets (stappenplan)
Stap 1: bepaal de Zcv onder H0 (bij gegeven α en richting van de toets).
o Gebruik hiervoor tabel B.2, kijk in de kolom van de gegeven α en de laatste rij (∞)
Stap 2: bepaal het steekproefgemiddelde X cv dat bij Zcv hoort onder H0.
σ
o Bereken σ x met σ x =
√N
o Bereken X cv met cv X =μ H + Z cv ×σ x
0
Stap 3: bereken kritieke grenswaarde X cv om naar de ZH1-waarde onder H1.
X cv −μ H
o Gebruik Z H = 1
1
σx
Stap 4: het onderscheidend vermogen is gelijk aan de kans: P(Z ≥ Z H 1∨H 1) .
o P( Z ≥ Z H 1∨H 1) vind je in tabel B.1
We willen dat de kans op het maken van de juiste beslissing zo hoog mogelijk is, hiervoor hebben we
nodig:
Een kleine α.
Een hoge power (1-β)
3
, Vier factoren die power beïnvloeden
α: grotere α geeft een grotere power.
( )
X−μ
Z=
N: grotere N geeft een grotere power σ .
√N
( )
X−μ
Z= .
σ: een grotere σ geeft een kleinere power σ
√N
De ‘ware µ’ in de alternatieve hypothese (µ H1): het effect wat we verwachten.
Effectgrootte (effect size)
Wanneer op basis van een hypothese toets H0 verworpen word (en H1 aangenomen) dan
krijgen wetenschappelijke claims het predicaat ‘significant’.
Maar ‘significant’ betekent niet: het is onomstotelijk bewezen dat er een systematisch effect
is (want we hebben te maken met steekproeffluctuaties), en het betekent ook niet dat het
praktisch/klinisch relevant is (zelfs een heel klein niet praktisch verschil kan significant zijn in
een hele grote steekproef).
Een maat voor de effect grootte is wenselijk, het is ook wenselijk om dit te vermelden bij je
resultaten van je onderzoek in je artikel.
Twee belangrijke maten voor effectgrootte bij het vergelijken van gemiddelde:
o Cohen’s d: hoe groot is het relatieve verschil in groepen.
o (partiele) verklaarde variantie η2: hoeveel variantie wordt door groepslidmaatschap
verklaard.
Vuistregels interpreteren effectgrootte (moet je kennen)
d η2
Klein 0,2 0,01
Middelgroot 0,5 0,06
Groot 0,8 0,14
Rekenformules effectgrootte
Eén groep: d=t
Twee groepen:
√ 1
N
o
2
d=t
√
1 1
t2
+
n1 n2
o η= 2
t + df w
df w zijn de vrijheidsgraden, bij twee groepen: df w =n1 +n2−2
Eén-weg variantieanalyse (ANOVA)
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller juliasistermans. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.38. You're not tied to anything after your purchase.