Week 1 (h1 en 2)
H1 BASISELEMENTEN
Statistiek is het samenvattend beschrijven van de variabelen van
een groep onderzoekseenheden.
Let op:
X=onafhankelijk=de variabele die invloed uitoefent
Y=afhankelijk= de variabele die beïnvloed wordt
datamatrix
In de supermarkt sta je in de rij achter elkaar, niet boven elkaar. De
rij is dus links naar rechts, en de kolom boven naar onder. In de
eerste kolom staan de onderzoekseenheden en in de eerste rij staan
de variabelen. Je zou de variabelen ook een variabelennaam kunnen
geven, zoals V1, maar dan moet je er wel een variabelenlabel bij
zetten. Ook moet je er een valuelabel bij zetten, dat aangeeft wat
de getalletjes in de tabel weergeven (1=man, 2=vrouw).
Meetniveaus
Nominaal: de waarden zijn betekenisloos, er is geen rangorde en
geen waarde van de intervallen (cola is niet 3 keer bier). Andere
voorbeelden zijn geslacht, favoriete kledingwinkel.
1=bier
2=rosé
3=cola
Ordinaal: de volgorde is belangrijk, maar er zijn geen gelijke
intervallen (vwo is niet drie keer vmbo). Andere voorbeelden zijn
leeftijdscategorieën (let op: het draait om 1, 2, 3 hier dan en niet om
55-60, 60-70 etc!).
1=vmbo
2=havo
3=vwo
Interval: rangorde, vaste meeteenheid (gelijke verschillen) maar er
is geen vast (arbitrair) nulpunt. Andere voorbeelden zijn
geboortejaar en “hoe hoog is uw inkomen” met gelijke grootte
groepen!
5 tot 10 graden
10 tot 15 graden
ratio: er is een rangorde, vaste meeteenheid en vast nulpunt. Hierbij
hoort leeftijd, hoe vaak je facebook checkt en hoeveel hoorcolleges
je hebt gevolgd.
-continue meetschaal -> alles mogelijk
-discrete meetschaal -> alleen ronde getallen, vaste eenheden (niet
3.6 kinderen)
dichotome variable: maar 2 opties bijvoorbeeld:
1=goed ik stem op:
2= fout pvv=0 groenlinks=1 pvda=0
, Frequentietabellen
(turven, handig in % weergaven.) dit is altijd univariaat. Hierin kun
je de modus en de mediaan aflezen (het hoogste percentage en bij
cumulatief het getal dat het dichtst bij 50% ligt, maar wel boven de
50) let op! De mediaan is niet het percentage, maar het getal in de
rangorde (bijvoorbeeld 3, en niet 55%)
H2 CENTRUMMATEN
-het gemiddelde: x met een streepje erboven bij steekproef, mu bij
populatie en M (mean) bij gemiddelde van een wetenschappelijk
artikel. De (sigma) betekent: tel bij elkaar op. Als je dit deelt door
n, kom je bij het gemiddelde.
Als je niet x1+x2 etc wilt uitschrijven, kun je ook Xj Fj neerzetten (j
betekent de hele groep, f betekent frequentie), namelijk er komt 10
keer waarde 10 voor, x1 * x1 en zo verder. Dit gebruik je als je heel
veel waarden hebt.
n
∑ x 1+ x 2+ x 3
i=1
-de mediaan: het middelste getal in een rangorde, het meest
geschikt voor ordinaal. Je zet de getallen in volgorde en pakt het
middelste getal, of telt de middelste twee op en deelt ze.
-de modus: het getal dat het meest voorkomt.
Keuze voor centrummaat (als het even kan, kies dan de meest
rechtste)
Nominaal: modus
Ordinaal: modus, mediaan
Interval en ratio: modus, mediaan, gemiddelde