Samenvatting Statistiek
Inhoudsopgave
Week 1: Beschrijvende statistiek ...................................................................................................................... 2
Deel 1: Achtergrond en opzet ............................................................................................................................. 2
Deel 2: Centrale tendentie .................................................................................................................................. 2
Deel 3: Spreiding ................................................................................................................................................. 3
Deel 4: Vorm (normaalverdeling) ....................................................................................................................... 3
Week 2: samenhang bij verschillende meetniveau’s ........................................................................................ 5
Deel 1: samenhang ............................................................................................................................................. 5
Deel 2: Lambda (nominaal niveau) ..................................................................................................................... 6
Deel 3: Spearman’s rho (ordinaal niveau) .......................................................................................................... 7
Deel 4: Pearson’s r (interval/ratio niveau).......................................................................................................... 8
Week 3: begin inferentiële statistiek en betrouwbaarheidsinterval ............................................................... 10
Deel 1: gebruik van Z-waardes in de normaalverdeling ................................................................................... 10
Deel 2: Introductie inferentie ............................................................................................................................ 12
Deel 3: Theorie van inferentiële statistiek ........................................................................................................ 12
Deel 4: Betrouwbaarheidsinterval .................................................................................................................... 13
Week 5: Hypotheses toetsen .......................................................................................................................... 15
Deel 1: Centrale concepten van hypotheses toetsen ........................................................................................ 15
Deel 2: Logica van hypotheses toetsen............................................................................................................. 16
Deel 3: Hypothese toetsen: één steekproef (vs. populatie) .............................................................................. 17
Deel 4: Hypothese toetsen: twee steekproeven ............................................................................................... 19
Week 6: Chi-kwadraat en associatiematen ..................................................................................................... 20
Deel 1: Introductie chi-kwadraat ...................................................................................................................... 21
Deel 2: Chi-kwadraat significantietoets voor onafhankelijkheid ...................................................................... 21
Deel 3: Voorbeeld: chi-kwadraat significantietoets voor onafhankelijkheid .................................................... 22
Deel 4: Associatiematen gebaseerd op chi- kwadraat ..................................................................................... 23
Week 7: Statistische significantie toets voor Spearman’s rho en Pearson’s R ................................................. 25
Deel 1: Statistische significantie toets voor Spearman’s rho en Pearson’s R ................................................... 25
Deel 2: Voorbeeld: Statistische significantie toets voor Pearson’s r ................................................................. 25
,Week 1: Beschrijvende statistiek
Deel 1: Achtergrond en opzet
Is statistiek altijd betrouwbaar? Denk na over:
• Hoe is de informatie verzameld? Hoe is dat gemeten?
o Welke keuzes en definities liggen ten grondslag?
o Op welke groep onderzoekseenheden is het onderzoek gebaseerd?
o Vooroordelen/bias of meetfouten/measurement error die resultaten vertekenen?
(Er bestaat geen een perfecte meting, er zit vaak een bias in wanneer informatie
wordt verzameld)
• Hoe is de informatie geanalyseerd, geïnterpreteerd en of gepresenteerd
o Welke statistische maat kies je? (Is een 7 goed of niet, welke waarde mensen eraan
koppelen)
o Welke conclusie verbind je aan een getal?
o Hoe visualiseer je de resultaten? (door bijvoorbeeld de y-as niet op 0 te starten. Dit
creëert een effect waardoor het lijkt alsof er een heel groot verschil is)
Soorten statistiek
Statistiek: de methodiek en de techniek van het verzamelen, bewerken, interpreteren en
presenteren van gegevens.
• Beschrijvende statistiek: 1 kenmerk van onderzoekseenheden beschrijven
• Verklarende statistiek: meerdere kernmerken van een onderzoeksobject in verband brengen
en kijken wat de ene doet met de ander, de verbanden/samenhang weergeven.
• Inferentiele statistiek: in hoeverre en met hoeveel zekerheid kunnen we de uitspraken
generaliseren naar de populatie (totale groep van eenheden). Generaliserende uitspraken
doen over populaties op basis van een steekproef.
Deel 2: Centrale tendentie
Hoe kun je een bepaalde groep het beste karakteriseren. Wat is een typische onderzoekseenheid. En
hoeveel verschil is er tussen deze onderzoekseenheden.
Vraag: hoe zou je de centrale tendentie van deze groep karakteriseren?
• Gemiddelde
Wanneer je een gemiddelde kan berekenen is dat bijna altijd heel interessant want.
• Is de balans tussen alle scores,
• De variatie rond het gemiddelde is het kleinste
• Wordt bepaald door alle scores (modus bv niet) (maar dat maakt het gemiddelde wel
gevoelig voor extreme waarden)
• De modus: de meest voorkomende waarde in een bepaalde groep.
• De mediaan: de middelste waarde (2 middelste: gemiddelde van de 2)
Meetniveau's
• Interval/ratio: numerieke schaal. Intervallen zijn gelijk van grootte.
• Ordinaal: wel randorde, maar het verschil tussen iedere trede is niet gelijk. Bv
eens/oneens/helemaal oneens schaal. Rekenkundig beperkingen.
• Nominaal: categorieën waar bij je bij een groep hoort. Geen randorde. Bv kleuren.
Interval/ratio is eigenlijk het beste als dit kan.
, Deel 3: Spreiding
Centrale tendentie is heel informatief, maar de informatie over de spreiding is ook cruciaal.
Spreiding: Hoeveel verschil bestaat er in de groep onderzoekseenheden
• Bereik (range): Hoogste score min de laagste score
- Interval/ratio en ordinaal
• Interkwartielafstand: Het bereik van de middelste 50% scores: 1e kwartiel tot 3e kwartiel Q =
Q3 – Q1 (handig want externe waarden worden niet meegenomen).
- Interval/ratio en ordinaal
• Frequentie (frequency): Hoe vaak komen scores voor in de steekproef? (Je kan dit ook met
intervalen doen, maar dit is minder accuraat en concreet)
- Nominaal, ordinaal (en interval/ratio)
• Variantie (variance): hoever zitten individuele scores van gemiddelde af. Hoge variatie is veel
spreiding.
- Interval/ratio
• Standaarddeviatie (standard deviation): wortel van variantie
- Interval/ratio
Formules:
Gemiddelde Variantie Standaarddeviatie
Deel 4: Vorm (normaalverdeling)
Visualisering van hoe vaak bepaalde scores voorkomen.
Inhoudsopgave
Week 1: Beschrijvende statistiek ...................................................................................................................... 2
Deel 1: Achtergrond en opzet ............................................................................................................................. 2
Deel 2: Centrale tendentie .................................................................................................................................. 2
Deel 3: Spreiding ................................................................................................................................................. 3
Deel 4: Vorm (normaalverdeling) ....................................................................................................................... 3
Week 2: samenhang bij verschillende meetniveau’s ........................................................................................ 5
Deel 1: samenhang ............................................................................................................................................. 5
Deel 2: Lambda (nominaal niveau) ..................................................................................................................... 6
Deel 3: Spearman’s rho (ordinaal niveau) .......................................................................................................... 7
Deel 4: Pearson’s r (interval/ratio niveau).......................................................................................................... 8
Week 3: begin inferentiële statistiek en betrouwbaarheidsinterval ............................................................... 10
Deel 1: gebruik van Z-waardes in de normaalverdeling ................................................................................... 10
Deel 2: Introductie inferentie ............................................................................................................................ 12
Deel 3: Theorie van inferentiële statistiek ........................................................................................................ 12
Deel 4: Betrouwbaarheidsinterval .................................................................................................................... 13
Week 5: Hypotheses toetsen .......................................................................................................................... 15
Deel 1: Centrale concepten van hypotheses toetsen ........................................................................................ 15
Deel 2: Logica van hypotheses toetsen............................................................................................................. 16
Deel 3: Hypothese toetsen: één steekproef (vs. populatie) .............................................................................. 17
Deel 4: Hypothese toetsen: twee steekproeven ............................................................................................... 19
Week 6: Chi-kwadraat en associatiematen ..................................................................................................... 20
Deel 1: Introductie chi-kwadraat ...................................................................................................................... 21
Deel 2: Chi-kwadraat significantietoets voor onafhankelijkheid ...................................................................... 21
Deel 3: Voorbeeld: chi-kwadraat significantietoets voor onafhankelijkheid .................................................... 22
Deel 4: Associatiematen gebaseerd op chi- kwadraat ..................................................................................... 23
Week 7: Statistische significantie toets voor Spearman’s rho en Pearson’s R ................................................. 25
Deel 1: Statistische significantie toets voor Spearman’s rho en Pearson’s R ................................................... 25
Deel 2: Voorbeeld: Statistische significantie toets voor Pearson’s r ................................................................. 25
,Week 1: Beschrijvende statistiek
Deel 1: Achtergrond en opzet
Is statistiek altijd betrouwbaar? Denk na over:
• Hoe is de informatie verzameld? Hoe is dat gemeten?
o Welke keuzes en definities liggen ten grondslag?
o Op welke groep onderzoekseenheden is het onderzoek gebaseerd?
o Vooroordelen/bias of meetfouten/measurement error die resultaten vertekenen?
(Er bestaat geen een perfecte meting, er zit vaak een bias in wanneer informatie
wordt verzameld)
• Hoe is de informatie geanalyseerd, geïnterpreteerd en of gepresenteerd
o Welke statistische maat kies je? (Is een 7 goed of niet, welke waarde mensen eraan
koppelen)
o Welke conclusie verbind je aan een getal?
o Hoe visualiseer je de resultaten? (door bijvoorbeeld de y-as niet op 0 te starten. Dit
creëert een effect waardoor het lijkt alsof er een heel groot verschil is)
Soorten statistiek
Statistiek: de methodiek en de techniek van het verzamelen, bewerken, interpreteren en
presenteren van gegevens.
• Beschrijvende statistiek: 1 kenmerk van onderzoekseenheden beschrijven
• Verklarende statistiek: meerdere kernmerken van een onderzoeksobject in verband brengen
en kijken wat de ene doet met de ander, de verbanden/samenhang weergeven.
• Inferentiele statistiek: in hoeverre en met hoeveel zekerheid kunnen we de uitspraken
generaliseren naar de populatie (totale groep van eenheden). Generaliserende uitspraken
doen over populaties op basis van een steekproef.
Deel 2: Centrale tendentie
Hoe kun je een bepaalde groep het beste karakteriseren. Wat is een typische onderzoekseenheid. En
hoeveel verschil is er tussen deze onderzoekseenheden.
Vraag: hoe zou je de centrale tendentie van deze groep karakteriseren?
• Gemiddelde
Wanneer je een gemiddelde kan berekenen is dat bijna altijd heel interessant want.
• Is de balans tussen alle scores,
• De variatie rond het gemiddelde is het kleinste
• Wordt bepaald door alle scores (modus bv niet) (maar dat maakt het gemiddelde wel
gevoelig voor extreme waarden)
• De modus: de meest voorkomende waarde in een bepaalde groep.
• De mediaan: de middelste waarde (2 middelste: gemiddelde van de 2)
Meetniveau's
• Interval/ratio: numerieke schaal. Intervallen zijn gelijk van grootte.
• Ordinaal: wel randorde, maar het verschil tussen iedere trede is niet gelijk. Bv
eens/oneens/helemaal oneens schaal. Rekenkundig beperkingen.
• Nominaal: categorieën waar bij je bij een groep hoort. Geen randorde. Bv kleuren.
Interval/ratio is eigenlijk het beste als dit kan.
, Deel 3: Spreiding
Centrale tendentie is heel informatief, maar de informatie over de spreiding is ook cruciaal.
Spreiding: Hoeveel verschil bestaat er in de groep onderzoekseenheden
• Bereik (range): Hoogste score min de laagste score
- Interval/ratio en ordinaal
• Interkwartielafstand: Het bereik van de middelste 50% scores: 1e kwartiel tot 3e kwartiel Q =
Q3 – Q1 (handig want externe waarden worden niet meegenomen).
- Interval/ratio en ordinaal
• Frequentie (frequency): Hoe vaak komen scores voor in de steekproef? (Je kan dit ook met
intervalen doen, maar dit is minder accuraat en concreet)
- Nominaal, ordinaal (en interval/ratio)
• Variantie (variance): hoever zitten individuele scores van gemiddelde af. Hoge variatie is veel
spreiding.
- Interval/ratio
• Standaarddeviatie (standard deviation): wortel van variantie
- Interval/ratio
Formules:
Gemiddelde Variantie Standaarddeviatie
Deel 4: Vorm (normaalverdeling)
Visualisering van hoe vaak bepaalde scores voorkomen.