Beknopte samenvatting statistiek
Inhoudsopgave
Hoofdstuk 1: Verdeling van gegevens (één variabele) ............................................................................ 4
1.1 Types van variabelen ..................................................................................................................... 4
1.2 Het beschrijven van één variabele ................................................................................................ 4
1.2.1 Tabellen .................................................................................................................................. 4
1.2.2 Beschrijven aan de hand van kengetallen .............................................................................. 5
1.2.3 Weergeven in figuren ............................................................................................................. 8
1.2.4 Combinatie van figuur en kengetallen: boxplot ..................................................................... 9
1.3 Normale verdelingen ..................................................................................................................... 9
Hoofdstuk 2: Relaties tussen 2 variabelen ............................................................................................ 10
2.1 Tabellen (kwalitatieve/ordinale variabelen) ............................................................................... 10
2.1.1 Rijvariabele en kolomvariabele ............................................................................................ 10
2.1.2 Gezamenlijke, marginale en totale frequentie..................................................................... 10
2.1.3 Relatieve frequenties ........................................................................................................... 11
2.1.4 Cumulatieve en relatieve cumulatieve frequenties ............................................................. 11
2.1.5 Aflezen van samenhang uit kruistabel ................................................................................. 11
2.1.6 Samenhang en voorspelbaarheid ......................................................................................... 12
2.2 Figuren ......................................................................................................................................... 12
2.2.1 Figuren voor twee kwalitatieve variabelen .......................................................................... 12
2.2.2 Figuren voor één kwalitatieve en één kwantitatieve variabele ........................................... 12
2.2.3 Figuren voor twee kwantitatieve variabelen ....................................................................... 13
2.3 Kengetallen (correlaties) ............................................................................................................. 13
2.3.1 De weg tot de Pearson product-moment correlatiecoëfficiënt ........................................... 13
2.3.2 Interpretatie van de product-moment correlatiecoëfficiënt ............................................... 15
2.3.3 Misverstanden in verband meet de product-moment correlatiecoëfficiënt ....................... 15
2.3.4 Alternatieve maten van samenhang of overeenkomst ........................................................ 16
Hoofdstuk 4: Kansrekening ................................................................................................................... 16
4.1 Toeval .......................................................................................................................................... 16
4.2 Kansmodellen .............................................................................................................................. 16
4.2.1 Belangrijke begrippen........................................................................................................... 16
4.2.2 Basisregels voor kansen ....................................................................................................... 17
4.2.3 Algemene optelregel ............................................................................................................ 17
4.2.4 Algemene productregel ........................................................................................................ 17
4.2.5 Boomdiagrammen ................................................................................................................ 18
4.2.6 Theorema van Bayes ............................................................................................................ 18
1
, 4.3 Binomiale kansen ........................................................................................................................ 19
4.3.1 Binomiale situatie ................................................................................................................. 19
4.3.2 Binomiale kansen berekenen ............................................................................................... 19
4.4 Stochastische variabelen ............................................................................................................. 19
4.4.1 Definitie stochastische variabelen........................................................................................ 20
4.4.2 Types van stochastische variabelen ..................................................................................... 20
4.5 Verwachting en variantie van stochastische variabelen ............................................................. 20
4.5.1 Definities en formules voor een discrete stochastische variabele....................................... 20
4.5.2 Toepassing bij een normaal verdeelde stochastische variabele .......................................... 21
4.5.3 Regels ................................................................................................................................... 21
4.5.4 De wet van de grote aantallen ............................................................................................. 21
Hoofdstuk 5: Steekproevenverdelingen................................................................................................ 22
5.1 Steekproevenverdeling van gemiddelde ..................................................................................... 22
5.1.1 Populatie is normaal verdeeld.............................................................................................. 22
5.1.2 Populatie is niet normaal verdeeld ...................................................................................... 23
5.1.3 Steekproevenverdelingen van het gemiddelde samengevat ............................................... 23
5.2 Steekproevenverdeling van aantal .............................................................................................. 23
5.3 Steekproevenverdeling van proportie ........................................................................................ 23
5.3.1 SPVD aantal en proportie samengevat................................................................................. 24
5.4 Zuiverheid en betrouwbaarheid .................................................................................................. 24
5.4.1 Kwaliteit van een schatter? .................................................................................................. 24
5.4.2 Zuiverheid en betrouwbaarheid bij SPVD van gemiddelde.................................................. 25
5.4.3 Zuiverheid en betrouwbaarheid bij SPVD van aantal en proportie ..................................... 25
Hoofdstuk 6: Inleiding tot inferentie ..................................................................................................... 25
6.1 Betrouwbaarheidsintervallen voor schatten van waarde van populatieparameter................... 26
6.1.1 Schatten van parameter op basis van steekproefgrootheid ................................................ 26
6.2 Significantietoetsen voor beoordelen van bewijs voor bewering............................................... 27
6.2.1 Algemeen: nulhypothese en alternatieve hypothese .......................................................... 27
6.2.2 Toets aan de hand van z* ..................................................................................................... 28
6.2.3 Toets aan de hand van overschrijdingskans p ...................................................................... 29
6.2.4 Opmerkingen ........................................................................................................................ 29
6.3 Gebruik en misbruik van toetsen ................................................................................................ 30
6.4 Twee soorten fouten ................................................................................................................... 30
6.4.1 Fout van de eerste soort = type 1 fout ................................................................................. 30
6.4.1 Fout van de tweede soort – onderscheidingsvermogen ...................................................... 30
Hoofdstuk 7: Inferentie voor verdelingen ............................................................................................. 31
7.1 Inferentie voor verwachting van populatie ................................................................................. 31
7.2 Vergelijking van twee verwachtingen ......................................................................................... 33
2
, 7.2.1 z-toets voor 2 EAS bij een bekende 𝝈 .................................................................................. 33
7.2.2 t-toets voor 2 EAS bij een onbekende 𝝈 .............................................................................. 33
7.2.3 t-toets voor 2 EAS bij een onbekende en gelijke 𝝈 .............................................................. 34
7.3 Facultatieve onderwerpen bij vergelijken van verdelingen ........................................................ 34
7.3.1 Robuustheid van normale inferentieprocedures ................................................................. 34
7.3.2 Inferentie voor populatieverspreiding ................................................................................. 35
Hoofdstuk 9: Analyse van kruistabellen ................................................................................................ 35
9.1 Notatie en voorstelling van de gegevens .................................................................................... 36
9.2 Inferentie voor samenhang tussen 2 kwalitatieve variabelen .................................................... 36
9.3 Opmerkingen ............................................................................................................................... 37
9.3.1 Voorwaarden ........................................................................................................................ 37
9.3.2 Paradox van simpson............................................................................................................ 37
9.3.3 Goodness-of-fit ..................................................................................................................... 37
3
, Hoofdstuk 1: Verdeling van gegevens (één variabele)
1.1 Types van variabelen
Onafhankelijk: input, verklarende, predictoren Afhankelijk: output, respons, criteria
Continu: tussen elke twee waarden kan een Discreet: natuurlijke getallen
derde gevonden worden. cfr. reële getallen • Dicotoom: slechts 2 waarden mogelijk
• Trichotoom: slechts 3 waarden mogelijk
• Polytoom: 3 of meer waarden mogelijk
Kwalitatief: getallen verwijzen slechts naar Kwantitatief: getallen toegekend zodanig dat
gelijkheden en ongelijkheden tussen de afstanden tussen getallen overeenkomen met
onderzoekselementen. Getal is een “naam” of afstanden tussen onderzoekselementen. Getal
“label”, rekenen is niet zinvol. is een echt getal, rekenen is zinvol.
Speciaal type: ordinaal: getallen kunnen naar
grote vergeleken worden (volgorde), maar
rekenen is niet zinvol.
1.2 Het beschrijven van één variabele
Op onderstaande manieren:
1. Via tabellen
a. Frequentietabellen
b. Kwalitatieve gegevens
c. Stamdiagrammen
2. Beschrijven aan de hand van kengetallen
a. Percentielen
b. Centrum
c. Spreiding
d. Scheefheid
3. Weergeven in figuren
a. Histogrammen
b. Staafdiagrammen
c. Taartdiagrammen
d. Eerlijke figuren
1.2.1 Tabellen
1.2.1.1 Frequentietabellen
Frequentie (van score X) = het aantal keer dat deze score voorkomt.
Frequentieverdeling (van X) wordt genoteerd als f(X) = de absolute frequentie
4
Inhoudsopgave
Hoofdstuk 1: Verdeling van gegevens (één variabele) ............................................................................ 4
1.1 Types van variabelen ..................................................................................................................... 4
1.2 Het beschrijven van één variabele ................................................................................................ 4
1.2.1 Tabellen .................................................................................................................................. 4
1.2.2 Beschrijven aan de hand van kengetallen .............................................................................. 5
1.2.3 Weergeven in figuren ............................................................................................................. 8
1.2.4 Combinatie van figuur en kengetallen: boxplot ..................................................................... 9
1.3 Normale verdelingen ..................................................................................................................... 9
Hoofdstuk 2: Relaties tussen 2 variabelen ............................................................................................ 10
2.1 Tabellen (kwalitatieve/ordinale variabelen) ............................................................................... 10
2.1.1 Rijvariabele en kolomvariabele ............................................................................................ 10
2.1.2 Gezamenlijke, marginale en totale frequentie..................................................................... 10
2.1.3 Relatieve frequenties ........................................................................................................... 11
2.1.4 Cumulatieve en relatieve cumulatieve frequenties ............................................................. 11
2.1.5 Aflezen van samenhang uit kruistabel ................................................................................. 11
2.1.6 Samenhang en voorspelbaarheid ......................................................................................... 12
2.2 Figuren ......................................................................................................................................... 12
2.2.1 Figuren voor twee kwalitatieve variabelen .......................................................................... 12
2.2.2 Figuren voor één kwalitatieve en één kwantitatieve variabele ........................................... 12
2.2.3 Figuren voor twee kwantitatieve variabelen ....................................................................... 13
2.3 Kengetallen (correlaties) ............................................................................................................. 13
2.3.1 De weg tot de Pearson product-moment correlatiecoëfficiënt ........................................... 13
2.3.2 Interpretatie van de product-moment correlatiecoëfficiënt ............................................... 15
2.3.3 Misverstanden in verband meet de product-moment correlatiecoëfficiënt ....................... 15
2.3.4 Alternatieve maten van samenhang of overeenkomst ........................................................ 16
Hoofdstuk 4: Kansrekening ................................................................................................................... 16
4.1 Toeval .......................................................................................................................................... 16
4.2 Kansmodellen .............................................................................................................................. 16
4.2.1 Belangrijke begrippen........................................................................................................... 16
4.2.2 Basisregels voor kansen ....................................................................................................... 17
4.2.3 Algemene optelregel ............................................................................................................ 17
4.2.4 Algemene productregel ........................................................................................................ 17
4.2.5 Boomdiagrammen ................................................................................................................ 18
4.2.6 Theorema van Bayes ............................................................................................................ 18
1
, 4.3 Binomiale kansen ........................................................................................................................ 19
4.3.1 Binomiale situatie ................................................................................................................. 19
4.3.2 Binomiale kansen berekenen ............................................................................................... 19
4.4 Stochastische variabelen ............................................................................................................. 19
4.4.1 Definitie stochastische variabelen........................................................................................ 20
4.4.2 Types van stochastische variabelen ..................................................................................... 20
4.5 Verwachting en variantie van stochastische variabelen ............................................................. 20
4.5.1 Definities en formules voor een discrete stochastische variabele....................................... 20
4.5.2 Toepassing bij een normaal verdeelde stochastische variabele .......................................... 21
4.5.3 Regels ................................................................................................................................... 21
4.5.4 De wet van de grote aantallen ............................................................................................. 21
Hoofdstuk 5: Steekproevenverdelingen................................................................................................ 22
5.1 Steekproevenverdeling van gemiddelde ..................................................................................... 22
5.1.1 Populatie is normaal verdeeld.............................................................................................. 22
5.1.2 Populatie is niet normaal verdeeld ...................................................................................... 23
5.1.3 Steekproevenverdelingen van het gemiddelde samengevat ............................................... 23
5.2 Steekproevenverdeling van aantal .............................................................................................. 23
5.3 Steekproevenverdeling van proportie ........................................................................................ 23
5.3.1 SPVD aantal en proportie samengevat................................................................................. 24
5.4 Zuiverheid en betrouwbaarheid .................................................................................................. 24
5.4.1 Kwaliteit van een schatter? .................................................................................................. 24
5.4.2 Zuiverheid en betrouwbaarheid bij SPVD van gemiddelde.................................................. 25
5.4.3 Zuiverheid en betrouwbaarheid bij SPVD van aantal en proportie ..................................... 25
Hoofdstuk 6: Inleiding tot inferentie ..................................................................................................... 25
6.1 Betrouwbaarheidsintervallen voor schatten van waarde van populatieparameter................... 26
6.1.1 Schatten van parameter op basis van steekproefgrootheid ................................................ 26
6.2 Significantietoetsen voor beoordelen van bewijs voor bewering............................................... 27
6.2.1 Algemeen: nulhypothese en alternatieve hypothese .......................................................... 27
6.2.2 Toets aan de hand van z* ..................................................................................................... 28
6.2.3 Toets aan de hand van overschrijdingskans p ...................................................................... 29
6.2.4 Opmerkingen ........................................................................................................................ 29
6.3 Gebruik en misbruik van toetsen ................................................................................................ 30
6.4 Twee soorten fouten ................................................................................................................... 30
6.4.1 Fout van de eerste soort = type 1 fout ................................................................................. 30
6.4.1 Fout van de tweede soort – onderscheidingsvermogen ...................................................... 30
Hoofdstuk 7: Inferentie voor verdelingen ............................................................................................. 31
7.1 Inferentie voor verwachting van populatie ................................................................................. 31
7.2 Vergelijking van twee verwachtingen ......................................................................................... 33
2
, 7.2.1 z-toets voor 2 EAS bij een bekende 𝝈 .................................................................................. 33
7.2.2 t-toets voor 2 EAS bij een onbekende 𝝈 .............................................................................. 33
7.2.3 t-toets voor 2 EAS bij een onbekende en gelijke 𝝈 .............................................................. 34
7.3 Facultatieve onderwerpen bij vergelijken van verdelingen ........................................................ 34
7.3.1 Robuustheid van normale inferentieprocedures ................................................................. 34
7.3.2 Inferentie voor populatieverspreiding ................................................................................. 35
Hoofdstuk 9: Analyse van kruistabellen ................................................................................................ 35
9.1 Notatie en voorstelling van de gegevens .................................................................................... 36
9.2 Inferentie voor samenhang tussen 2 kwalitatieve variabelen .................................................... 36
9.3 Opmerkingen ............................................................................................................................... 37
9.3.1 Voorwaarden ........................................................................................................................ 37
9.3.2 Paradox van simpson............................................................................................................ 37
9.3.3 Goodness-of-fit ..................................................................................................................... 37
3
, Hoofdstuk 1: Verdeling van gegevens (één variabele)
1.1 Types van variabelen
Onafhankelijk: input, verklarende, predictoren Afhankelijk: output, respons, criteria
Continu: tussen elke twee waarden kan een Discreet: natuurlijke getallen
derde gevonden worden. cfr. reële getallen • Dicotoom: slechts 2 waarden mogelijk
• Trichotoom: slechts 3 waarden mogelijk
• Polytoom: 3 of meer waarden mogelijk
Kwalitatief: getallen verwijzen slechts naar Kwantitatief: getallen toegekend zodanig dat
gelijkheden en ongelijkheden tussen de afstanden tussen getallen overeenkomen met
onderzoekselementen. Getal is een “naam” of afstanden tussen onderzoekselementen. Getal
“label”, rekenen is niet zinvol. is een echt getal, rekenen is zinvol.
Speciaal type: ordinaal: getallen kunnen naar
grote vergeleken worden (volgorde), maar
rekenen is niet zinvol.
1.2 Het beschrijven van één variabele
Op onderstaande manieren:
1. Via tabellen
a. Frequentietabellen
b. Kwalitatieve gegevens
c. Stamdiagrammen
2. Beschrijven aan de hand van kengetallen
a. Percentielen
b. Centrum
c. Spreiding
d. Scheefheid
3. Weergeven in figuren
a. Histogrammen
b. Staafdiagrammen
c. Taartdiagrammen
d. Eerlijke figuren
1.2.1 Tabellen
1.2.1.1 Frequentietabellen
Frequentie (van score X) = het aantal keer dat deze score voorkomt.
Frequentieverdeling (van X) wordt genoteerd als f(X) = de absolute frequentie
4