,Inhoudsopgave
College 1a ............................................................................................................................................. 2
Statistical Methods for the social sciences, 4.4 en 4.5 .......................................................... 4
College 1b, Betrouwbaarheidsintervallen .................................................................................... 5
Statistical Methods for the social sciences, 5.1, 5.2 en 5.3 .................................................. 7
College 2a afronden t-verdeling. Significantietoetsen (begin) ............................................... 8
Statistical Methods for the social sciences, 5.4, 6.1 en 6.2 ................................................ 11
College 2b significantietoetsen ..................................................................................................... 12
Statistical methods for the social sciences, 6.3 & 6.4 .......................................................... 14
College 3a ........................................................................................................................................... 14
Statistical methods for the social sciences, 6.5, 6.6 & 6.7 .................................................. 16
College 3b soorten fouten en power, gebruik tabel b ............................................................. 17
College 4a vergelijken van twee groepen .................................................................................. 19
College 4b kruistabellen ................................................................................................................. 21
Statistical methods for the social sciences, 7.3 & 7.4 .......................................................... 24
Statistical methods for the social sciences, 8.1, 8.2 & 8.3 .................................................. 24
College 5b regressive en correlatie ............................................................................................. 25
Statistical methods for the social sciences, 9.1, 9.2 & 9.3 .................................................. 28
Statistical methods for the social sciences, 9.4 & 9.5 .......................................................... 28
Formuleblad ....................................................................................................................................... 29
1
,College 1a
Statistische modellen 1: Inferentiële statistiek
• Houdt zich bezig met generaliseren uitkomsten
• Veel onderzoeken gebaseerd op steekproeven
• Toch vaak uitspraken over grotere groep
Thema’s in statistische modellen 1
• Hoe moet dat generaliseren?
• Welke technieken zijn er (en wanneer gebruik je welke?)?
• Hoe kan SPSS helpen bij dit generaliseren?
• Doen onderzoekers het zelf wel altijd goed?
• Wat zijn valkuilen?
• Dus:
- Technische vaardigheden voor eigen onderzoek
- Kritische houden ten opzichte van bestaand onderzoek
• Steekproevenverdeling
• Betrouwbaarheidsintervallen
• Significantietoetsen
• T-toetsen
- Voor gemiddelden
- Voor proporties
• Samenhang tussen twee categorische variabelen
• Regressieanalyse
Terminologie (herhaling)
• Populatie: groep waarvan onderzoeker eigenschappen wil weten
• Parameter: numerieke samenvatting van eigenschap in populatie
• Steekproef: subgroep uit populatie die onderzocht wordt
• Statistic: numerieke samenvatting van eigenschap in steekproef
Waarom is kansrekening relevant voor ons?
• Gaat uit van random gebeurtenissen
• Voorspelt regelmaat op lange termijn random gebeurtenissen
- 4 kinderen: hoeveel meisjes → random
- Heel vaak 4 kinderen: kansverdeling →
Kansverdeling
• Geeft aan wat er op de lange duur gebeurt
• Steekproeftrekking ook een random gebeurtenis!
• Kansrekening gebruikt om hierover kansuitspraken te doen
• “Wat als ik zelf een steekproef zou trekken?”
4.4 sampling distributions (steekproefverdeling)
• Kansverdeling voor steekproeven
• Oftewel: Wat is de verdeling als ik heel vaak een steekproef zou trekken? Wat voor waardes
kunnen er allemaal uitkomen?
Voorbeeld
Stel: je bent geintresseerd in het deel van de amerikanen dat in 2020 voor Biden zou stemmen
Stel: in werkelijkheid was dit aantal 51.3%
• We nemen een steekproef van 50 mensen. Uitkomst 1: 58%, steekproef 2: 48% etc.
Iedere steekproef (net) andere uitkomst – uitkomst dus een random variabelen
Steekproevenverdeling
• Verzameling van veel van die uitkomsten
• Steekproevenverdeling: kansverdeling die een kans
aangeven voor iedere mogelijke uitkomst
2
, Andere steekproeven verdeling (proportie)
• Kansen per staafje in principe “los” uit te rekenen (later)
• Val je iets op aan de verdeling?
4.5 steekproevenverdeling voor gemiddeldes
• Steekproevenverdeling kan voor iedere “statistic”
• Proportie, maar ook voor gemiddelde
Na vele steekproeven….
mannelijke studenten
300
250
Steekproef- Steekproef-
aantal gemiddelden in interval
nummer (n=10) Gemiddelde 200
1 8.5
2 8.7 150
3 9.2
4 8.4 100
5 8.7
… … 50
Steekproefgemiddelde varieert over steekproeven, zijn zelf random variabelen met verdeling →
0
8.4 8.5 8.6 8.7 8.8 8.9 9 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8
steekproefgemiddelde
steekproevenverdeling van gemiddelde
Stel, je trekt
heel vaak een steekproef uit een populatie, dan de volgende bevindingen:
1. steekproefgemiddelden variëren minder dan de losse scores in populatie
(voorbeeld: komt later)
2. verdeling van steekproefgemiddelden is ‘meer’ normaal verdeeld dan de losse scores in de
populatie
(voorbeeld: komt later)
We zien:
a. verdeling van steekproefgemiddelden NIET zelfde als verdeling van
scores in pop.
b. Variantie van steekproefgemiddelden is KLEINER dan variantie van
Scores is pop.
c. Gemiddelde van steekproefgemiddelden is ZELFDE als gemiddelde
van scores is pop.
… dit is geen toeval, maar geldt algemeen…
Algemeen geldt:
Gemiddelde van steekproefgemiddelden is HETZELFDE als gemiddelde
van scores in pop. (dus gemiddelde is “unbiased”
Daarnaast: naarmate je n groter woredt, lijkt de verdeling van de steekproeven steeds meer op een
normale verdeling = centrale limietstelling (Central limit theorem)
Waarom is dat zo?
Intuïtief: je trekt heel veel steekproeven, sommige gemiddelden hoger dan populatiegemiddelde,
andere lager, gemiddelde van al die steekproefgemiddelden komen op populatiegemiddelde
Overzicht: y
= en =
y y n
1 formule: het gemiddelde van steekproefgemiddelde is het populatie gemiddelde
e
2e formule: hoeveel steekproeven van elkaar verschillen (standaarddeviaties van steekproeven) is de
verschillen in de populatie (standaarddeviatie populatie) delen door de wortel van alle mensen
Altijd geldt: als de populatie exact normaal verdeeld is, is steekproefgemiddelde exact normaal
verdeeld
Als populatie niet normaal verdeeld is en n groot, dan is steekproefgem. Ongeveer normaal verdeeld
(Centrale limietstelling)
Herhaling
• Steekproef 1 uitkomst (statistic)
- Bv: 25 gooien met muntje, 15 kop
- 50 studenten, drinken gem. 9.2 biertjes/week
- Spreiding binnen groep: standaarddeviatie (sigma/s)
3