Onderzoeks- en Interventiemethodologie B
Hoorcollege 1
Conceptuele achtergronden
Initiële observatie -> theorie -> hypothese -> dataverzameling -> analyse -> uitspraak
(inference)
Stappen in de statistiek:
- identificeren van de afhankelijk variabelen (wat wil ik verklaren, attitude-meting)
- bepalen van de mate van spreiding in de scores (variantie)
- op zoek naar factoren die de spreiding kunnen verklaren, afhankelijk zijn van de
afhankelijke variabele
- model opstellen die de spreiding zoveel mogelijk kan wegnemen
Type gegevens/data
Kwalitatieve gegevens (categorisch)
- nominaal meetniveau (geslacht, nationaliteit)
- ordinaal meetniveau = rangorde van laag naar hoog (opleidingsniveau)
Kwantitatieve gegevens (continue)
- interval meetniveau (IQ, temperatuur)
- ratio meetniveau, nulpunt, afstanden hebben een betekenis (inkomen, leeftijd)
De frequentieverdeling
Laat zien:
- welke scores zijn er mogelijk
- hoe vaak komen deze scores voor
Eigenschappen van data
- centrale tendentie: gemiddelde, mediaan, modus
- spreiding: bereik, kwartiel afstand, variantie, standaarddeviatie
- vorm: scheefheid, spitsheid
Eigenschappen van data: centrale tendentie
Maat Populatie Steekproef Type data
Modus = de meest Mode Mode N, o, i, r
voorkomende
waarneming
Mediaan = de M m O, i, r
middelste
waarneming als je ze
ordent van laag naar
hoog
Gemiddelde = alle U X I, r
scores / totaal N
,Eigenschappen van data: variantie
Maat Populatie Steekproef Type data
Bereik (range) = Range Range O, i, r
maximum -
minimum
Interkwartiel range = IQR IQR O, i, r
Q3 – Q1
Variantie O2 S2 I, r
Standaarddeviatie O S I, r
Spreiding: interkwartiel range
1) maat voor spreiding in de middelste 50% van de waarnemingen (rondom de mediaan)
2) verdeelt data in vier kwarten
3) interkwartiel afstand = Q3 – Q1
Spreiding: standaarddeviatie
Maat Populatie Steekproef Type data
Bereik O, i, r
Interkwartiel range IQR IQR O, i, r
Variantie O2 S2 I, r
Standaarddeviatie O S I, r
Standaarddeviatie berekenen:
1) bereken het gemiddelde
2) kijk hoeveel de scores van het gemiddelde afliggen = deviatie van het gemiddelde (hiervan
is de som 0)
3) kwadrateer de afwijkingen
4) resultaat hiervan deel je door N – 1 = variantie
5) neem de wortel (wortel S2) = standaarddeviatie
Betekenis standaarddeviatie: empirische regel van Gaussian distribution
Bij een normale verdeling (heuvelvormig en symmetrisch):
- gemiddelde + -1o en gemiddelde + 1o = 68 % waarden
- gemiddelde + -2o en gemiddelde + 2o = 95 % waarden
- gemiddelde + -3o en gemiddelde + 3o = 99,7 % waarden
Z = hoever ligt een score af van het gemiddelde / standaarddeviatie
Eigenschappen van data: vorm scheefheid
Maat = scheefheid (skewness). Gemiddelde kan meegetrokken worden door extreme scores
- links-scheef = gemiddelde -> mediaan -> modus
- symmetrisch = gemiddelde -> mediaan -> modus
- rechts scheef = modus -> mediaan -> gemiddelde
, Eigenschappen van data: vorm spitsheid
Maat = kurtosis
Idee = inschatten of spreiding van variabele adequaat is (voor het toepassen van statistische
procedures)
- leptokurtic = te weinig spreiding (te spitse verdeling)
- platykurtic = te veel spreiding (data concentreert zich nergens, te weinig centrale
tendentie)
Werken met normale verdeling
- klokvormig, symmetrisch
- gemiddelde, mediaan en modus zijn ongeveer gelijk
- heeft een oneindige range
Z = (x – u) / o