Inleiding Statistiek
Module 1:
Beschrijvende statistiek: Een grote groep met data heel makkelijk beschrijven en
samenvatten (gemiddelden, spreiding etc.)
Inferentiële statistiek: Een hypothese toetsen en verbanden proberen te trekken over data
en deze generaliseren naar de populatie. Je wilt dus eigenlijk iets onderzoeken over een
bredere populatie aan de hand van de data van de steekproef.
In de statistiek worden vaak normaalverdelingen gebruikt om data weer te geven. Veel
dingen zoals extraversie zijn normaal verdeeld (middelste plaatje). Soms is dat anders en zijn
de verdelingen links scheef (rechterplaatje) of rechts scheef (linkerplaatje).
Soorten variabelen:
- Discrete variabelen: categorieën (geslacht, oogkleur), aantal huisdieren (er is geen
waarde tussen 1 en 2)
- Continue variabelen: kun je heel precies bepalen en liggen meer op een schaal
(lengte, inkomen)
Soorten schalen:
- Nominale schaal: er is geen nulpunt en er wordt geen onderscheid gemaakt tussen
categorieën (geslacht)
- Ordinale schaal: er is geen nulpunt, de afstand tussen plek 1 en 2 is niet gelijk aan de
afstand tussen plek 2 en 3 (rangschikking: PSV 1e plek, Feyenoord 2de plek, Ajax 3de
plek)
- Intervalsschaal: er is geen nulpunt, maar afstand tussen 1 en 2 is hetzelfde als afstand
tussen 2 en 3 (temperatuur: 0 graden betekent niet geen temperatuur)
- Ratioschaal: er is een absoluut nulpunt en afstand tussen 1 en 2 is hetzelfde als
afstand tussen 2 en 3 (aantal huisdieren)
,Frequentieverdelingstabel:
Aantal huisdieren (x) Frequentie (f)
0 2
1 5
2 4
3 1
n=12
Je leest dit als: 2 personen hebben 0 huisdieren, 5 personen hebben 1 huisdier etc…
Gegroepeerde frequentieverdeling:
Inkomen (x) Frequentie (f)
Laag (0-2500) 30
Midden (2501-5000) 50
Hoog (2501+) 20
n=100
Gegroepeerde frequentieverdelingen worden gemaakt omdat er anders heel veel
verschillende waarden zijn. Door de categorieën te maken blijft het overzichtelijk.
Een aantal waarden waarmee je moet rekenen:
Proefpersoonnummer Aantal honden (x) Aantal honden (y)
1 1 2
2 2 2
3 1 0
∑x (dit houdt in som, alle waarden van x bij elkaar opgeteld)
Voorbeeld hieronder: ∑x = 1+2+1 = 4
∑xy (dit is de som van alle waarden x keer y en die bij elkaar opgeteld
Voorbeeld hieronder ∑xy = 1×2 + 2×2 + 1×0 = 6
Module 2:
Waarden in een frequentietabel:
∑x
Steekproefgemiddelde (M):
n
∑X
Populatiegemiddelde (µ):
N
Gemiddelde: Som van scores bij elkaar opgeteld (∑x) delen door het totaal aantal scores (n)
, Modus: De waarde met de hoogste frequentie. Bij 2 of meer modussen spreken we van een
bimodale verdeling.
Mediaan: De waarde die in het midden ligt
Data: 10, 32, 6, 13, 46
Eerst sorteren: 6, 10, 13, 32, 46
Middelste getal/mediaan: 13
Data 10, 32, 6, 13, 27, 46
Eerst sorteren: 6, 10, 13, 27, 32, 46
Er is nu geen getal in het midden, dus je pakt het gemiddelde van de 2 middelste getallen
13+27
Mediaan: = 20
2
Variabiliteit/spreiding = maximale score – minimale score
Afwijkingsscore/deviatie/deviation = x - µ (Je berekent hier van elke score het verschil met
het gemiddelde)
SS (Sum of Squares) = ∑ (x - µ)2 (Je kwadrateert alle deviaties en telt deze dan bij elkaar op)
Variantie =
SS
- In populatie (σ2):
N
SS
- In steekproef (s2): (In de steekproef moet je altijd corrigeren, omdat deze
n−1
biased kan zijn en haal je dus 1 van de n af)
Standaardafwijking/Standard deviation =
- In populatie (σ):
N√
SS
- In steekproef (s):
√
SS
n−1
Voorbeeld:
PPN Punt voor statistiek
1 7
2 8
3 4
4 6
7+8+ 4+6
Gemiddelde = = 6.25
4