Statistische Analyse
Bestanden importeren;
File→ import → excel → values invullen
Hercoderen (van letter naar nummer):
Transform→recode into different variables → invullen → change → old and new values →
old value;… & new value;… + value labels + decimals invullen → add → continue
Explore (kentallen & spreidingsmaten berekenen);
Analyse → descriptive statistics → explore → dependent list; variabele → statistics;
kentallen aangeven (bv BI aanvinken) → plots
Frequencies;
Analyse → descriptive statistics → frequencies → variable ; waar je table van wilt maken →
statistics; extra kentallen → charts; extra grafieken → ok
Boxplots;
Graphs → legacy dialogs → boxplot → simple → variable → category axis → ok
Staafdiagrammen;
- Graphs → legacy dialogs→ bar → simple → category axis → ok
- Gemiddelde; Graphs → legacy dialogs→ bar → simple → other statistics→ variable
→ category axis → spreidingsmaat; options → display error bars → standard
deviation; 1.0 multiplyer
Data splitsen;
- Data → split file → organize output by groups → group based on → ok → explore →
dependent list
- Splitsing opheffenn; data → split file → analyze → all cases → ok
Selectie maken;
- Data → select cases → if condition is satisfied → if → variabele = 1
- Filter uitzetten; data → select cases → all cases
Compute variable (rekenen met verschillende variabelen):
- Transform → compute variable → nieuwe variabele maken → target variable →
numeric expression (rekenmachine gebruiken) → ok (laatste kolom in data bestand)
Betrouwbaarheidsinterval;
- Er kan met …% zekerheid gezegd worden dat …
- Analyze→ descriptive statistics → explore → dependent list → statistics → ok
Baltaltman plot (validatie meetmethode);
- Transform → compute variable → target variable → numeric expression; gem maken
(=som/n) & verschil maken (a-b) → scatterplot → x-axis; gem → y-axis; verschil → ok
, → dubbelklik grafiek → add fitline at total → mean of y → apply → close → gem
verschil a en b (=y op de lijn)
- BI berekenen: explore → verschil; dep list → dubbelklik reference line → position
y=0 → apply → close → dubbel klik → reference line → position y=ondergrens BI →
apply → close → dubbelklik → reference line → position y = bovengrens BI → apply
→ close
Variabele view:
- Name: moet aan elkaar
- Label: naam variabele netjes uitschrijven (bv. Voor mooie grafieken)
- Measure:
o Uitkomst 0 of 1: nominale variabele → values: value labels: 0 = … en 1= ….
Importeren: file → import data excel
Hercoderen van variabelen = veranderen van variabelen; recode into different variables→
bv.: M=>0 en V=>1 , verander ook de labels (value labels in variable view)
- Nummers moeten letters worden
Explore = kentallen en spreidingsgetallen laten berekenen; analyse → descriptive statistics
→ explore;
- Dependent list: variabelen waarvan je wilt onderzoeken wat de kentallen zijn
- Factor list en label cases by gebruiken we vaak niet
- Statistics : betrouwbaarheidsinterval
- Plots
• Bovenste tabel: hoeveel cases je meegenomen hebt= total N
• Descriptives: alle kentallen, gemiddelde, mediaan, etc.
• Grafieken:
o Boxplot: mediaan, 1e kwartiel, 2e kwartiel, etc
Frequencies = frequentie tabel maken (nominale / ordinale variabelen); analyse →
descriptive statistics → frequencies
- Statistics
- Charts
Boxplots; graphs→ legacy dialogs → boxplot → simple ;
- Variable
- Categorie axis: ordinale/nominale variabele
- Rest leeg laten
• Overzichtstabel
• Boxplot: median, kwartielen, outliers, getallen = casenummer
,Staafdiagrammen; graphs → legacy dialogs → bar → simple & summery for groups and
cases;
- Bars represent: N of cases / other
statistics(gemiddelde→spreidingsmaat;options→standaard deviatie→
multiplier=1,0)
- Staafdiagram: bovenkant = gemiddelde, error bars = een standaardeviatie naar
beneden en een naar boven
Data set splitsen; data → split file → organize output by groups→ explore=output
verzamelen
- Splitsing opheffen; data → split file → analyse all cases, do not
Selectie maken: data → select cases → if →
- Selectie uitzetten: data → select cases→ all cases
Compute variable = rekenen met verschillende variabelen; transform→ compute variable →
target variable: nieuwe variabele → numeric expression : vergelijking
Betrouwbaarheidsinterval ; explore→ analyse→ descriptive statistics → explore →
dependent list→ statistics: betrouwbaarheidsinterval aan te passen
Toets op gemiddelde; stel hypothese op → een-/tweezijdige toets? → controleer de
voorwaarden (willekeurig gekozen en gemiddelde normaal verdeeld→ voldaan aan
voorwaarde) ; analyse → compare means → one-sample t-test → test variabele → test
value
- 1e tabel: algemene waarden
- 2e tabel: t-test; p waarde (=sig.) → overschreidingskans → vergelijk met alpha →
steekproef uitkomst kritiek gebied? Dan h0 verwerpen
- 3e tabel: negeren
• Conclusie: toets op gemiddelde; uit de one sample t toets (t = …, p=…, n=…) volgt dat
de reactietijd van …. (gemiddelde … +- s (SD)) Significant verschilt met de reactietijd
bij …. (gemiddelde …s)
Hypothese toets:
- Power = correct verwerpen van H0; hoge power is weinig overlap of sample size
verhogen
Binominale verdeling:
- Fractie (0 tot 1): p = populatiefractie, p(met dakje) = steekproeffractie
- Codeer met 0 of 1
- Gemiddelde van de waarde = fractie met code 1
- Binominale verdeling = 2 mogelijke uitkomsten, kansverdeling op aantal successen in
een steekproef van grootte n, als per experiment kans op succes p is.
- Fractie successen x = k//n
, - Binominale verdeling: Bin (n,p)
Betrouwbaarheidsinterval: voor populatiefactor p;
1. Ga na of je normale benadering mag gebruiken → stel dan 95%
betrouwbaarheidsinterval op
2. Toetsingsgrootheid: x = fractie mensen dat drager is van het virus
3. Controleren voorwaarden:
a. Aantal successen: n*p =
b. Aantal niet successen: n*(1-p)
4. Als aan voorwaarden wordt voldaan, dan normale benadering: p = deel/geheel en
𝑝(1−𝑝)
𝜎𝑥 =√ 𝑛
5. Betrouwbaarheidsinterval: 95% →𝓏1
2
6. Marge: 𝓏1 ∗ 𝜎𝑥
2
7. 95% BI voor p : …<p<…
8. Met 95% zekerheid ligt het percentage in de populatie tussen …% en …%
Steekproefomvang berekenen:
1. Betrouwbaarheidsinterval is maximaal 0,5 punt breed ⟹ marge maximaal 0,25 punt
breed (er vanuit gaand dat de steekproefomvang tenminste 30 wordt)
2. Berekenen met de formules op formuleblad (er vanuit gaand dat de
steekproefomvang tenminste 30 wordt):
𝑧0,5𝛼∙𝑠 /a)2 1,96∙0,950 2 𝑎 0,25
𝑛≥( = =55,47
De minimale steekproefomvang moet dus gelijk zijn aan 56 personen.
Bland-Altmann plot:
- Verschil berekenen, BI berekenen→ als 0 niet in BI voor gemiddelde verschil ligt, dan
verschillen de twee meetmethoden significant van elkaar
1. Variabelen berekenen die op de assen komen te staan= gemiddelde a en b & verschil
a en b;
a. transform→ compute variable →target variable: gemiddelde_A_B_ →
numeric expression (A + B)/2
b. transform→ compute variable →target variable: verschil_A_B_ → numeric
expression (A – B)
2. scatterplot; graphs → legacy dialogs → scatter →
a. x-as ; gemiddelde → y-as ; verschhol → lijnen toevoegen: dubbelklik op
grafiek→ optie; add fitline at total → gemiddelde y → apply → lijn =
gemiddelde verschil tussen A en B (y=..)
b. BI berekenen; analyse → descriptive statistics → explore → dependent list;
verschil tussen a en b
c. Dubbelklik→ lijnen toevoegen; reference line → position = 0 → position =
ondergrens interval → position = bovengrens interval
3. Importeren
4. Conclusie bij validatie methodes; de lijn y=0 light binnen het BI voor µ𝑣 (met 𝜈𝒾 is
methode A – methode B voor monster 𝒾)
a. → gemiddelde verschil wijkt niet significant af van 0
Bestanden importeren;
File→ import → excel → values invullen
Hercoderen (van letter naar nummer):
Transform→recode into different variables → invullen → change → old and new values →
old value;… & new value;… + value labels + decimals invullen → add → continue
Explore (kentallen & spreidingsmaten berekenen);
Analyse → descriptive statistics → explore → dependent list; variabele → statistics;
kentallen aangeven (bv BI aanvinken) → plots
Frequencies;
Analyse → descriptive statistics → frequencies → variable ; waar je table van wilt maken →
statistics; extra kentallen → charts; extra grafieken → ok
Boxplots;
Graphs → legacy dialogs → boxplot → simple → variable → category axis → ok
Staafdiagrammen;
- Graphs → legacy dialogs→ bar → simple → category axis → ok
- Gemiddelde; Graphs → legacy dialogs→ bar → simple → other statistics→ variable
→ category axis → spreidingsmaat; options → display error bars → standard
deviation; 1.0 multiplyer
Data splitsen;
- Data → split file → organize output by groups → group based on → ok → explore →
dependent list
- Splitsing opheffenn; data → split file → analyze → all cases → ok
Selectie maken;
- Data → select cases → if condition is satisfied → if → variabele = 1
- Filter uitzetten; data → select cases → all cases
Compute variable (rekenen met verschillende variabelen):
- Transform → compute variable → nieuwe variabele maken → target variable →
numeric expression (rekenmachine gebruiken) → ok (laatste kolom in data bestand)
Betrouwbaarheidsinterval;
- Er kan met …% zekerheid gezegd worden dat …
- Analyze→ descriptive statistics → explore → dependent list → statistics → ok
Baltaltman plot (validatie meetmethode);
- Transform → compute variable → target variable → numeric expression; gem maken
(=som/n) & verschil maken (a-b) → scatterplot → x-axis; gem → y-axis; verschil → ok
, → dubbelklik grafiek → add fitline at total → mean of y → apply → close → gem
verschil a en b (=y op de lijn)
- BI berekenen: explore → verschil; dep list → dubbelklik reference line → position
y=0 → apply → close → dubbel klik → reference line → position y=ondergrens BI →
apply → close → dubbelklik → reference line → position y = bovengrens BI → apply
→ close
Variabele view:
- Name: moet aan elkaar
- Label: naam variabele netjes uitschrijven (bv. Voor mooie grafieken)
- Measure:
o Uitkomst 0 of 1: nominale variabele → values: value labels: 0 = … en 1= ….
Importeren: file → import data excel
Hercoderen van variabelen = veranderen van variabelen; recode into different variables→
bv.: M=>0 en V=>1 , verander ook de labels (value labels in variable view)
- Nummers moeten letters worden
Explore = kentallen en spreidingsgetallen laten berekenen; analyse → descriptive statistics
→ explore;
- Dependent list: variabelen waarvan je wilt onderzoeken wat de kentallen zijn
- Factor list en label cases by gebruiken we vaak niet
- Statistics : betrouwbaarheidsinterval
- Plots
• Bovenste tabel: hoeveel cases je meegenomen hebt= total N
• Descriptives: alle kentallen, gemiddelde, mediaan, etc.
• Grafieken:
o Boxplot: mediaan, 1e kwartiel, 2e kwartiel, etc
Frequencies = frequentie tabel maken (nominale / ordinale variabelen); analyse →
descriptive statistics → frequencies
- Statistics
- Charts
Boxplots; graphs→ legacy dialogs → boxplot → simple ;
- Variable
- Categorie axis: ordinale/nominale variabele
- Rest leeg laten
• Overzichtstabel
• Boxplot: median, kwartielen, outliers, getallen = casenummer
,Staafdiagrammen; graphs → legacy dialogs → bar → simple & summery for groups and
cases;
- Bars represent: N of cases / other
statistics(gemiddelde→spreidingsmaat;options→standaard deviatie→
multiplier=1,0)
- Staafdiagram: bovenkant = gemiddelde, error bars = een standaardeviatie naar
beneden en een naar boven
Data set splitsen; data → split file → organize output by groups→ explore=output
verzamelen
- Splitsing opheffen; data → split file → analyse all cases, do not
Selectie maken: data → select cases → if →
- Selectie uitzetten: data → select cases→ all cases
Compute variable = rekenen met verschillende variabelen; transform→ compute variable →
target variable: nieuwe variabele → numeric expression : vergelijking
Betrouwbaarheidsinterval ; explore→ analyse→ descriptive statistics → explore →
dependent list→ statistics: betrouwbaarheidsinterval aan te passen
Toets op gemiddelde; stel hypothese op → een-/tweezijdige toets? → controleer de
voorwaarden (willekeurig gekozen en gemiddelde normaal verdeeld→ voldaan aan
voorwaarde) ; analyse → compare means → one-sample t-test → test variabele → test
value
- 1e tabel: algemene waarden
- 2e tabel: t-test; p waarde (=sig.) → overschreidingskans → vergelijk met alpha →
steekproef uitkomst kritiek gebied? Dan h0 verwerpen
- 3e tabel: negeren
• Conclusie: toets op gemiddelde; uit de one sample t toets (t = …, p=…, n=…) volgt dat
de reactietijd van …. (gemiddelde … +- s (SD)) Significant verschilt met de reactietijd
bij …. (gemiddelde …s)
Hypothese toets:
- Power = correct verwerpen van H0; hoge power is weinig overlap of sample size
verhogen
Binominale verdeling:
- Fractie (0 tot 1): p = populatiefractie, p(met dakje) = steekproeffractie
- Codeer met 0 of 1
- Gemiddelde van de waarde = fractie met code 1
- Binominale verdeling = 2 mogelijke uitkomsten, kansverdeling op aantal successen in
een steekproef van grootte n, als per experiment kans op succes p is.
- Fractie successen x = k//n
, - Binominale verdeling: Bin (n,p)
Betrouwbaarheidsinterval: voor populatiefactor p;
1. Ga na of je normale benadering mag gebruiken → stel dan 95%
betrouwbaarheidsinterval op
2. Toetsingsgrootheid: x = fractie mensen dat drager is van het virus
3. Controleren voorwaarden:
a. Aantal successen: n*p =
b. Aantal niet successen: n*(1-p)
4. Als aan voorwaarden wordt voldaan, dan normale benadering: p = deel/geheel en
𝑝(1−𝑝)
𝜎𝑥 =√ 𝑛
5. Betrouwbaarheidsinterval: 95% →𝓏1
2
6. Marge: 𝓏1 ∗ 𝜎𝑥
2
7. 95% BI voor p : …<p<…
8. Met 95% zekerheid ligt het percentage in de populatie tussen …% en …%
Steekproefomvang berekenen:
1. Betrouwbaarheidsinterval is maximaal 0,5 punt breed ⟹ marge maximaal 0,25 punt
breed (er vanuit gaand dat de steekproefomvang tenminste 30 wordt)
2. Berekenen met de formules op formuleblad (er vanuit gaand dat de
steekproefomvang tenminste 30 wordt):
𝑧0,5𝛼∙𝑠 /a)2 1,96∙0,950 2 𝑎 0,25
𝑛≥( = =55,47
De minimale steekproefomvang moet dus gelijk zijn aan 56 personen.
Bland-Altmann plot:
- Verschil berekenen, BI berekenen→ als 0 niet in BI voor gemiddelde verschil ligt, dan
verschillen de twee meetmethoden significant van elkaar
1. Variabelen berekenen die op de assen komen te staan= gemiddelde a en b & verschil
a en b;
a. transform→ compute variable →target variable: gemiddelde_A_B_ →
numeric expression (A + B)/2
b. transform→ compute variable →target variable: verschil_A_B_ → numeric
expression (A – B)
2. scatterplot; graphs → legacy dialogs → scatter →
a. x-as ; gemiddelde → y-as ; verschhol → lijnen toevoegen: dubbelklik op
grafiek→ optie; add fitline at total → gemiddelde y → apply → lijn =
gemiddelde verschil tussen A en B (y=..)
b. BI berekenen; analyse → descriptive statistics → explore → dependent list;
verschil tussen a en b
c. Dubbelklik→ lijnen toevoegen; reference line → position = 0 → position =
ondergrens interval → position = bovengrens interval
3. Importeren
4. Conclusie bij validatie methodes; de lijn y=0 light binnen het BI voor µ𝑣 (met 𝜈𝒾 is
methode A – methode B voor monster 𝒾)
a. → gemiddelde verschil wijkt niet significant af van 0