statistiek 2023
Inhoud
Week 1............................................................................................................................................................................ 3
Centrale tendentie......................................................................................................................................................3
Spreiding.....................................................................................................................................................................3
Vorm(normaalverdeling).............................................................................................................................................4
Werkgroep 1................................................................................................................................................................4
Oefening docenten variabelen................................................................................................................................4
Week 2............................................................................................................................................................................ 6
Z-scores....................................................................................................................................................................... 6
Betrouwbaarheidsinterval...........................................................................................................................................6
Betrouwbaarheidsinterval bepalen.........................................................................................................................6
Drie betrouwbaarheidsinterval formules................................................................................................................6
Week 3: spearman’s rho..................................................................................................................................................7
Samenhang.................................................................................................................................................................. 7
Associatie maten.....................................................................................................................................................7
Lambda........................................................................................................................................................................ 7
Voorbeeld................................................................................................................................................................8
Spearman’s rho...........................................................................................................................................................8
Formule Spearman’s rho.........................................................................................................................................9
Pearson’s r.................................................................................................................................................................11
Formule Pearson’s r...............................................................................................................................................11
Week 4: pearson’s r.......................................................................................................................................................12
Inferentiële statistiek.................................................................................................................................................12
Steekproef naar populatie.....................................................................................................................................12
Steekproefverdeling en centrale limietstelling..........................................................................................................12
Centrale limietstelling: stelling 1...........................................................................................................................12
Centrale limietstelling 2.........................................................................................................................................13
Centrale concepten van hypotheses toetsen............................................................................................................13
Hypotheses toetsen...............................................................................................................................................13
Type I en Type II fout.............................................................................................................................................14
Alpha, p-waarde en statistische significantie.........................................................................................................14
De logica van hypotheses toetsen.............................................................................................................................14
1. Assumpties en selecteren van juiste toets.........................................................................................................15
2. Formuleren van de hypotheses.........................................................................................................................15
3. Bepaal het kritieke gebied: Zkritiek of Zcritical..................................................................................................15
4. Bereken de toets-statistiek: Zverkregen of Zobtained.......................................................................................15
5. Beslissing over hypothese en (inhoudelijke) conclusie......................................................................................15
Week 5.......................................................................................................................................................................... 15
1
, T-test met één steekproef.........................................................................................................................................15
1. Assumpties t-toets voor 2 gemiddelden............................................................................................................16
2. Hypothese..........................................................................................................................................................16
3. Bepaald kritieke gebied.....................................................................................................................................16
4. Bepaald de Toets-statistiek (Z-obtained)...........................................................................................................16
5. Conclusie plaatje................................................................................................................................................17
t-verdeling.............................................................................................................................................................17
t-verdeling.............................................................................................................................................................17
T-test met twee steekproeven..................................................................................................................................17
Formule Z-waarde steekproefverdeling................................................................................................................18
Belangrijk om te weten..........................................................................................................................................19
Week 6.......................................................................................................................................................................... 20
Aanvullende zaken over toetsing...............................................................................................................................20
Statistische significantie en samenhang................................................................................................................20
Het duiden van statistische significantie................................................................................................................20
Chi-kwadraat toets....................................................................................................................................................20
Formule chi-kwadraat toets..................................................................................................................................20
Chi-kwadraat verdeling..........................................................................................................................................21
Voorbeeld met zelfde vijf stappen van hypothese toetsen...................................................................................21
Associatiematen op basis van chi kwadraat..............................................................................................................22
X2 en samenhang...................................................................................................................................................22
Vuistregels voor interpretatie Phi & Cramer’s V....................................................................................................22
Associatiemaat op basis van Chi-kwadraat vs. Lambda.........................................................................................22
Week 7.......................................................................................................................................................................... 22
Significantie toets voor spearman’s rho en Pearson’s r.............................................................................................22
Formule voor significantie toets rho en r..............................................................................................................22
Voorbeeld met 5 stappen hypotheses...................................................................................................................23
2
,Week 1
Statistiek is de methodiek en de techniek van het verzamelen, bewerken, interpreteren en presenteren van
gegevens. Er zijn drie verschillende soorten
- Beschrijvende statistiek: het kenmerk(‘variabele’)van een groep(‘steekproef’)van onderzoekseenheden
beschrijven door inzicht te geven in de structuur en patronen op basis van beschikbare data
1. Centrale tendentie: Hoe ziet een typische observatie er uit?
2. Spreiding: in hoeverre bestaan er verschillen tussen e verschillende observaties?
3. Vorm: in hoeverre voldoet de steekproef aan de kenmerken van de normaalverdeling?
- Verklarende statistiek: verbanden(‘samenhang’) tussen twee of meer kenmerken van onderzoekseenheden
- Inferentiële statistiek: generaliserende uitspraken oen over populaties op basis van een steekproef
Centrale tendentie
Gemiddelde: alle waarden van de variabele optellen en delen door het aantal variabele
- Formule gemiddelde: X =
∑ Xi
N
X staat voor gemiddelde
∑ X i Staat voor de som van alle individuele waarde gedeeld door het aantal
N
Modus: de meest voorkomende score van een bepaalde variabele in de steekproef
Mediaan: de middelste score van een variabele in de steekproef. Je moet de variabele hiervoor ordenen van de
kleinste waarde naar de grootste waarde
- Zijn altijd bepalend voor welke statistische maten, coëfficiënten, toetsen
o Nominaal: kun je geen waarden onderscheiden, je kan ze niet in een logische volgorde ordenen
o Ordinaal: kan je wel beetje waarden onderscheiden, namelijk ordenen
Likertschaal: helemaal oneens t/m helemaal eens
o Interval: stappen zijn gelijk
o Ratio: stappen zijn ook gelijk, maar heeft een absoluut nulpunt en interval niet
- Bij statistiek worden interval-ratio samen genomen. Het maakt voor nu namelijk geen verschil. SPSS scale niveau
Spreiding
Wat is het belang van spreiding, waarom is centrale tendentie niet voldoende? Het kan zo zijn dat het gemiddelde
van een groep een 7 is, omdat ze allemaal een 7 hebben gehaald. Het kan ook zo zijn dat het gemiddelde van een
groep een 7 is, maar de helft heeft een 4 gehaald en de andere helft een 7. Dit verschil zou ons ontgaan, als we
alleen maar naar centrale tendentie kijken
- Bij beschrijvende statistiek, dien je dus altijd in te gaan op de spreiding
- Frequentie: Hoe vaak komen scores voor in de steekproef? Dit kan worden gedaan in frequentie tabel
o Wanneer er erg veel waarden zijn, kan frequentietabel onoverzichtelijk zijn, dus is het handig om dicht bij
elkaar liggende waarden te clusteren nominaal, ordinaal, interval-ratio
- Bereik: Hoogste score min de laagste score Ordinaal, interval-ratio
- Variantie: de mate van variabiliteit rondom het gemiddelde. Zijn er veel verschillen rondom het gemiddelde, of
relatief weinig? interval-ratio
Formule: V = ∑
2
( X i− X)
o Er wordt gekwadrateerd, omdat we alleen in absolute waarden geïnteresseerd
N
zijn. Hoe groter de waarde van V, hoe meer variabiliteit rondom het gemiddelde
- Standaarddeviatie: wortel van variantie. Veel gebruikte maat voor spreiding, want SD drukt variantie uit in
dezelfde eenheid als de variabele gemeten is. interval-ratio
o Formule: SD=
√ ∑ (X i −X )2
N
3
, Vorm(normaalverdeling)
- Vooral nuttig om naar vorm te kijken bij meetniveau interval-ratio. In hoeverre voldoet deze verdeling aan de
kenmerken van een normaal verdeling? Dit doe je door histogram te maken
o Histogram: visualisering van een frequentietabel, waarbij op x-as de mogelijk waarden van een variabele en
op y-as, de frequentie.
- 5 kenmerken normaal verdeling. Is niet iets empirisch, maar theoretisch?
1. Gemiddelde = mediaan = modus, de 3 mate van centrale tendentie is exact gelijk
2. Klokvorm(perfecte vorm)
3. Uni modaal (1 piek)
4. Symmetrisch, niet scheef
5. Oneindigheid, dus de curve raakt niet de x-as. De extreem hoge en lage waarden kunnen ver gaan, zolang het
maar symmetrisch is
- Een empirische verdeling, voldoet vrij wel nooit helemaal aan normaal verdeling, dus er is een bepaalde mate
van scheefheid in welke richting leunt een bepaalde verdeling
o Positieve scheefheid extreme hoge waarden trekken het gemiddelde omhoog, naar rechts
Gemiddelde > Mediaan > Modus
o Negatieve scheefheid: extreme lage waarden trekken het gemiddelde omlaag, naar links
Gemiddelde< Mediaan < Modus
- Waarom is normaalverdeling zo belangrijk? Veel statistische toepassingen(beschrijvend en Inferentiële), zijn
gebaseerd op normaliteit. We weten vaak dat een verdeling niet helemaal aan normale verdeling voldoet, maar
nadert wel. Zo kunnen we wel bepaalde statistische handelingen verrichten
o Beschrijvende statistiek: gedetailleerde uitspraken kunnen doen
o Inferentiële statistiek: op basis van steekproef conclusies kunnen trekken, door assumpties van normaliteit
- Als we zien dat een steekproef voldoende voldoet aan de principes van normaliteit, kunnen we aan het hand van
gemiddelde(centrale tendentie) en standaarddeviatie(spreiding) veel te weten komen over de statistieken
Standaardafwijkingen en normaalverdeling
- Voor elke normaalverdeling is er een standaardafwijking, een exacte verdeling. Zo wordt bepaald welk
percentage zich waar op de verdeling bevindt
- 99,72% wordt afgerond naar 99% om de oneindigheid aan te duiden, want er kan ook afwijking zijn, verder dan 3
standaardafwijkingen
Werkgroep 1
- Interval-ratio niveau is het meest nuttig bij statistiek: gelijke afstand tussen waarden
o Bij meer dan 7 of 7 waarden(ook al is het eigenlijk ordinaal)mag je het ook als interval –ratio
beschouwen , omdat er steeds een beetje hetzelfde tussen zit
- Ordinaal: er zit niet dezelfde afstand tussen en er zijn niet veel verschillende waarden. Wel een logische
volgorde of rangschikking
- Nominaal: ongeordende waarden
Oefening docenten variabelen
- Centrale tendentie: modus, gemiddelde, gemiddelde, mediaan, modus, mediaan
4