1
Statistische Modellen voor Communicatieonderzoek – College 1
Kansvariabele (= sample statistic): het kenmerk van de steekproef waarin je
geïnteresseerd bent.
→ Verschilt van steekproef op steekproef, vandaar de naam ‘kansvariabele’
Significantieniveau (𝜶 = 0,05): de kans dat je H0 verwerpt terwijl hij waar is
Significantie (p): uitkomst van de toets, als p < α, dus: als p < 0,05 → statistisch significant
Parameter = een kenmerk van de populatie
Hoofdstuk 1
Doel van inferentiële statistiek = uitspraken doen over zo groot mogelijke groep met zo
weinig mogelijk data (want data verzamelen is duur)
Sampling space: verzameling van alle mogelijke uitkomsten, bijv. in een zakje met 10
snoepjes is de sampling space van gele snoepjes 0 t/m 10.
Sampling distribution = steekproefverdeling = steekproef van steekproeven
→ Steekproevenverdeling = kansverdeling, ALS er op de verticale as
proporties/percentages (relatieve frequenties) staan ipv absolute frequenties.
→ Discrete kansverdeling: beperkt aantal uitkomsten mogelijk, bijv. bij zakje met 10
snoepjes: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 of 10 gele snoepjes mogelijk
→ Oppervlakte onder steekproevenverdeling weerspiegelt kansen
Expected value: gemiddelde van de steekproevenverdeling
→ Als de expected value = populatiewaarde → sample statistic = unbiased estimator
Kansen zijn bij elkaar opgeteld altijd 1.
Hoofdstuk 2
Hoe krijg je een steekproevenverdeling?
1. Bootstrappen: Trek meerdere steekproeven (bijv. 5000) uit 1 steekproef
→ Daadwerkelijk 5000 samples trekken is niet praktisch
→ Bootstrap sample moet even groot zijn als initiële steekproef: steekproef met
teruglegging → units kunnen meerdere keren in steekproef komen
→ In empirisch onderzoek, samplen we altijd zonder teruglegging (2x dezelfde
respondent is nutteloos)
→ Limitatie: initiële steekproef moet min of meer representatief zijn voor
populatie (variabelen ongeveer gelijk verdeeld in steekproef en populatie).
Anders: bias.
→ Met bootstrappen kun je mediaan van de steekproevenverdeling vinden
2. Exact approaches
Als we (denken te) weten hoe de populatie
verdeeld is, kunnen we exact de kans berekenen
dat een steekproef van 10 snoepjes 1, 2, 3 of 10
gele snoepjes bevat.
→ Kan alleen met categorische
kansvariabelen, omdat alle mogelijke
uitkomsten bekend moeten zijn.
, 2
3. Theoretical approach
Theoretische kansverdelingen lijken op bekende wiskundige functies, bijv. een
normaalverdeling lijkt op een bell-shape
SPSS gebruikt automatisch deze benadering
Voorwaarden voor een theoretische benadering (bijv. normaalverdeling) niet
voldaan? → Exact / Bootstrap
Independent samples t-test betreft verschillende onderzoekseenheden
Bijv. het gewicht van rode en gele snoepjes vergelijken
Paired samples t-test betreft dezelfde onderzoekseenheden
Bijv. de kleurintensiteit van snoepjes vóór zonlicht vergeleken met snoepjes na zonlicht
Hoofdstuk 3
Estimation
→ Point estimate: de sample statistic = de populatiewaarde
o Werkt alleen wanneer de sample statistic = unbiased estimator
o Heel precies, maar waarschijnlijk onjuist. Hele kleine kans dat het gemiddelde
gewicht in de populatie en steekproef precies 2.5518 gram is.
→ Interval estimate: interval dat met bepaalde zekerheid de populatiewaarde bevat
o Precision: breedte van het interval
o Confidence level (95%) wordt niet veranderd, omdat je er niets aan hebt om
een preciezere uitspraak te kunnen doen met minder zekerheid dat deze klopt
o Grotere steekproef → smaller interval → preciezere schatting
Standard Error (SE) = SDsteekproevenverdeling = grootte van fout die we maken als we zeggen
‘sample statistic = populatiewaarde’
→ Grotere steekproef → kleinere SE → kleinere foutmarge → hoe meer sample statistic
lijkt op populatiewaarde → hoe preciezer ons interval → hoe groter de kans op
significante resultaten
→ Standaardiseren:
z = 0 = gemiddelde
z = 1 = gemiddelde + 1 SE
z = 1.96 = gemiddelde + 2 SE = limiet
Bijv. bij een 95%CI voor een gemiddelde:
Ondergrens = M - 1.96 * SE
Bovengrens = M + 1.96 * SE
Hoofdstuk 4
Onderzoekshypothesen: uitspraken over populaties, bijv. alle huishoudens in Nederland
Statistische hypothesen: verwijzen naar gemiddelden/properties/varianties/correlaties
→ Nulhypothesen (H0) specificeren één waarde voor de populatiewaarde,
Bijv. ‘In de populatie is het gemiddelde 5.5’
→ Alternatieve hypothesen (HA) omvat alle situaties die H0 niet omvat
Bijv. ‘In de populatie is het gemiddelde niet 5.5