Samenvatting GAO workshops 1
1 NOMINAAL EN NON-PARAMETRISCHE TOETSEN
1.1 HYPOTHESEN
Onderzoeksvraag = vraag. Wanneer er uit de literatuur geen eenduidige verwachtingen kunnen worden
afgevormd
Bv. Wat is de impact van humoristische advertenties op de attitude ten aanzien van de advertentie?
Hypothese = toetsbare bewering. Een verwachting die voortvloeit uit de literatuur
Bv. De attitude ten aanzien van de advertentie zal positiever zijn wanneer deze advertentie humor bevat dan
wanneer deze geen humor bevat.
Nulhypothese (H0) Alternatieve hypothese (Ha)
= de hypothese waartegen we bewijsmateriaal = de hypothese waarvoor we bewijs proberen te
proberen vinden; die we willen verwerpen vinden; waarvan we vermoeden dat ze waar is
H0 = ‘geen verschil’ of ‘geen effect’ Ha = bepalen eenzijdig of tweezijdig alternatief
Vb. H0 = er is geen verschil tussen mannen en Vb. Ha = er is wél een verschil tussen mannen en
vrouwen wat betreft hun reclamewijsheid voor vrouwen wat betreft hun reclamewijsheid voor
product placement product placement (tweezijdig)
OF
Significantietoets: sterkte van bewijs tegen H0 Vb. Ha = vrouwen hebben meer reclamewijsheid
voor pp dan mannen (eenzijdig)
Telkens obv substantiële, theoretische gronden.
Indien geen theoretisch gefundeerd vermoeden van
richting à tweezijdig
SPSS OUTPUT
Telkens 2 zaken interpreteren:
1. De schatting / parameter (vb. gemiddelde, t-waarde, F-waarde, etc.)
2. Significantieniveau (vb. p = .03, p < .001, etc.)
Drempel: p = .05 (soms p = .01 of p = .001)
à Sig. moet altijd < .05 om statistisch te bewijzen dat we meer dan 95% zeker zijn van ons resultaat
(verwerping Ho)
1.2 METHODES NOMINAAL NIVEAU
,Samenvatting GAO workshops 2
2
Chi-kwadraat (χ )
Vergelijking van 2 of meer onafhankelijke groepen voor een nominale variabele
Bepalen of er een significante samenhang is tussen 2 nominale variabelen
Percentagetoets
Vergelijking van twee percentages
Mc Nemar/ Cohrans Q (NK)
Vergelijking van 2 of meer afhankelijke groepen voor een nominale variabele (gaan wij niet bekijken)
1.3 CHI-KWADRAAT
= vergelijking van 2 of meer onafhankelijke groepen voor een nominale variabele
= bepalen of er een significante samenhang of afhankelijkheid is tussen 2 nominale variabelen in de kruistabel
Vb. Is er een samenhang tussen werksituatie en het hebben van een smartphone?
Vb. Is er een verschil tussen mannen en vrouwen wat betreft het hebben van een smartphone (‘ja’ of ‘neen’)
= chi²-toets (χ²)
Voorwaarden
1. Max. 20% van de cellen hebben een expected count (Fe) < 5
2. Minimum expected count is 1
SPSS geeft significatie, ongeacht of aan voorwaarden voldaan is
Aan beide voorwaarden moet voldaan zijn om de χ²-waarde en de significantie te mogen interpreteren
Indien niet aan voldaan: kolommen of rijen samenvoegen àmeer waarnemingen in de cellen
• Kijken welke cellen een kleine expected count hebben en deze rijen of kolommen samenvoegen
• Geen aparte cellen samenvoegen!!
• Altijd goed opletten of het inhoudelijk wel klopt (bv. niet ‘ja’ en ‘neen’ samenvoegen van ‘hebt u thuis
een internetverbinding?’, anders heeft dit geen betekenis meer)
à Analyze à Descriptive statistics à Crosstabs à Statistics: chi-square à Cells: observed + expected
OEFENING
Is er een verband tussen of mensen thuis al dan niet een internetverbinding hebben (‘Internet’) en hun beroep
(‘Beroep’)?
CROSSTABS
/TABLES=Internet BY Beroep
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED ROW
/COUNT ROUND CELL.
Maar: onderaan: “6 cells (33,3%) have expected count less than 5. Minimum expected count is 1,33 à aan voorwaarde
1 niet voldaan à chi-kwadraattoets is onbetrouwbaar à kijken wat kan samengevoegd worden
,Samenvatting GAO workshops 3
Wat is oorzaak waardoor verwachte frequentie laag is? à marginale freq kolom x rij
Laag aantal (huisvrouw, werkzoekenden, studenten…) x klein getal àlogisch dat Fe laag is à rijen of
kolommen samennemen (rijen samennemen gaat niet)
• WN en kaderlid in de openbare sector = WN openbare sector
• WN en kaderlid in de private sector = WN private sector
• Zelfstandige/vrij beroep blijft
• (brug)gepensioneerde, werkzoekend, student & huisman/huisvrouw = niet actief
VARIABELEN HERCODEREN
à Transform à Recode into Different Variables
RECODE Beroep (1=1) (3=1) (2=2) (4=2) (5=3) (6=4) (7=4) (8=4) (9=4) (MISSING = SYSMIS) INTO Beroep1.
EXECUTE.
Oefening opnieuw maken
“1 cells (12,5%) have expected count less than 5. The minimum expected count is 3,58” à aan voorwaarden
voldaan à chikwadraattoets vertrouwen
H0 = er is geen verband tussen rij en kolom
e
Aangezien p = .000 à H0 verwerpen (= fout van 2 soort)
STANDARDIZED RESIDUALS
Wanneer significant verband à “cells” > standardized
Resultaten interpreteren om rij van “std. residual”
> 2 = significant oververtegenwoordigd
< -2 = significant ondervertegenwoordigd
Vb: 3,6 bij “nee, ik heb geen internet” x “niet actief” à
significante oververtegenwoordiging (meer dan
verwacht) à “mensen die niet beroepsmatig actief
zijn hebben een grotere kans om geen internet te
hebben”
2 X 2 CORRECTIE
Is er een verband tussen geslacht (man vs vrouw) en
het hebben van een internetverbinding (ja vs neen)?
à 2 (man vs vrouw) x 2 (ja vs neen)
2
à Correctie (automatisch in output bij Chi )
e
à Kijken naar 2 lijn (continuity connection)
2 X 2 FISHER
Wanneer n < 20
Bij te lage verwachte frequenties bij een 2x2-tabel
e
à Kijken naar 4 lijn (Fisher’s Exact Test)
OEFENING
Is er een verband tussen geslacht (‘Geslacht’) en of mensen al dan niet thuis beschikken over een tablet (‘Tablet’)?
Wat is het correcte significantieniveau?
CROSSTABS
/TABLES=Tablet BY Geslacht
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED ROW
/COUNT ROUND CELL.
e
Aangezien 2x2 à kijken naar 2 lijn. Significantie = .091 >.05 à niet significant
, Samenvatting GAO workshops 4
1.4 PERCENTAGETOETS
Vergelijkingshypothesetoets
Nagaan of het verschil tussen 2 populatiepercentages (afkomstig van 2 onafh populaties) aan een bepaalde
constante gelijk is: H0: π1 - π2 = 0 of π 1 = π 2
Als grote SP’en: π1 en π2 vervangen door p1 en p2 omdat we onze SP representatief achten voor de populatie:
populatieparameter = SPparameter
Aanvaardbaarheidsinterval (AI) voor p1 – p2 (percentageverschil):
Z: als je z voor 95% wil zoeken, niet .9500 in tabel zoeken maar (95% + (5%/2)) à 97,5% of .9750
• C = 90% à z = 1.645
• C = 95% à z = 1.960
• C = 99% à z = 2.576
OEFENINGEN
Is er een verschil tussen het percentage mannelijke en vrouwelijke studenten dat dagelijks de krant leest?
H0 = π1 - π2 = 0 à geen sign verschil tussen % mannelijke en vrouwelijke studenten dat dagelijks krant lezen
α = 5% (.05) à z = 1.96
Gegevens:
Dagelijks krant Niet-dagelijks krant Totaal
Man 292 (= .73) 108 (= .27) 400
Vrouw 356 (= .64) 144 (= .36) 400
Totaal 800
𝑝1 ∗ 1 − 𝑝1 𝑝2 ∗ 1 − 𝑝2
𝐴𝐼 = 𝑝1 − 𝑝2 0 ± 𝑧 ∗ +
𝑛1 𝑛2
0,73 ∗ (1 − 0,73) 0,64 ∗ (1 − 0,64)
= 0 ± 1,96 ∗ +
400 400
0,73 ∗ 0,27 0,64 ∗ 0,36
= 0 ± 1,96 ∗ +
400 400
= 0 ± .0641
Het AI voor p1- p2 is [-0,064 ; 0,064] en p1- p2 = (0,73 - 0,64) = 0,09
0,09 ∉ [-.064;.064](ligt niet in AI)à H0 verwerpen à er is een significant verschil tussen het % mannen en het %
vrouwen dat dagelijks een krant leest. Er zijn meer mannen die dagelijks de krant lezen dan vrouwen.
Is er een verschil tussen het percentage ongehuwde arbeiders/bedienden/ambtenaren en het percentage ongehuwde
zelfstandigen/vrij beroep?
H0 = π1 - π2 = 0 à geen sign verschil
α = 5% (.05) à z = 1.96
1.5 NON-PARAMETRISCHE TOETSEN
Mann-Whitney
Vergelijking van 2 onafhankelijke groepen voor een ordinale variabele
Kruskal-Wallis
Vergelijking van meer dan 2 onafhankelijke groepen voor een ordinale variabele
Wilcoxon Rangtekentoets
Vergelijking van gerelateerde groepen (gekoppelde paren) voor een ordinale variabele