Onderzoeks- en Interventiemethodologie B, Athena samengevat
Hoorcollege 1 – Basisbeginselen & beschrijvende statistiek
Inleidende statistiek
- Beschrijvende statistiek
- Centrale limietstelling betrouwbaarheidsintervallen
- Hypothesetoetsing
Verklarende/toetsende statistiek:
- T-toetsen (verschillen tussen 2 groepen)
- Variantieanalyse (vergelijken meerdere groepen, experimenten)
- Analyse van samenhang (kruistabelanalyse, covariantie en correlatie)
- Regressieanalyse (!!)
o Enkelvoudige lineaire regressie
o Multipele lineaire regressie
Statische analyse stappenplan:
1. Identificeren van de afhankelijke variabele
2. Variantie bepalen (mate van spreiding)
3. Factoren zoeken die de spreiding kunnen verklaren
4. Modellen opstellen die deze spreiding kunnen wegnemen/verklaren
Beschrijvende statistiek kijkt naar de volledige populatie en heeft geen onzekerheid
Verklarende statistiek: aselecte steekproeven
,4 meetniveaus:
1. Nominaal: getallen zonder verhoudingen (bussen)
2. Ordinaal: rangorde, geen verhouding (opleidingsniveau, medailles)
3. Interval: rangorde, verhouding, geen nulpunt (temperatuur)
4. Ratio: rangorde, verhouding, nulpunt (leeftijd)
Nominaal/ordinaal: kwalitatieve of categorische gegevens
Interval/ratio: kwantitatieve of continue gegevens
Geldigheid: of een instrument meet wat het wil meten
Betrouwbaarheid: of een instrument consistent is in verschillende situaties
Manieren om na te gaan in welke mate een meetinstrument valide is:
- Inhoudsvaliditeit: goede afspiegeling van het gemeten begrip
- Criteriumvaliditeit: of je kunt vaststellen dat een instrument meet wat het beweert te
meten oor vergelijking met objectieve criteria (voorspelbaarheid)
o Concurrente validiteit: tegelijk wordt er een andere waarneming gedaan
o Predictieve/voorspellende validiteit: gegevens van het nieuwe instrument
voor nieuwe waarnemingen voorspellen
Test-hertestbetrouwbaarheid: een betrouwbaar instrument zal op een later tijdstip
vergelijkbare scores opleveren
3 eigenschappen van kwantitatieve data:
1. De mate van centrale tendentie (locatie op de x-as)
a. Gemiddelde (mean)
b. Modus: meest voorkomende waarde
c. Mediaan: middelste meting wanneer de scores zijn gerangschikt
2. De mate van spreiding (variantie, hoe de piek er uit ziet(stijlheid))
a. Bereik (min en max)
b. Interkwartiel range (4 kwarten, de middelste 2)
c. Variantie
d. Standaarddeviatie
3. De vorm van spreiding (vorm van de piek)
a. Rechtsscheef (piek links)
b. Symmetrisch
c. Linksscheef (piek rechts)
Spitsheid van de grafiek:
- Leptokurtic: weinig spreiding, heel spits en hoog
- Mesokurtic: idealiter de gemiddelde situatie
- Platykutic: te veel spreiding en te weinig centrale tendentie
Standaarddeviatie = (X – gemiddelde) / √n
Variantie = (x – gemiddelde) / √(n-1)
Z-score = (x-gemiddelde) / standaarddeviatie
T-toets = (gemiddelde – x) / (standaarddeviatie / √(n-1))
Hoeveel standaarddeviaties lift de waarde van het gemiddelde af? -> Z-score
Kansberekening -> Z-score -> opzoeken in de tabel -> percentage
, Hoorcollege 2 – betrouwbaarheidsintervallen
Uniforme verdeling = verdeling waarbij de kans op elke x even groot is
Standaardfout van het gemiddelde = de standaardafwijking van alle mogelijke
steekproefgemiddelden. Geeft de mate van spreiding van de verschillende gemiddelden
weer en is niet afhankelijk van n maar van de spreiding.
SE (standard error) = standaarddeviatie / √n
2 eigenschappen van de steekproevenverdeling van het gemiddelde:
1. Zuiverheid: gemiddelde steekproevenverdeling is gelijk aan populatiegemiddelde
2. Efficiëntie: het steekproefgemiddelde ligt dichter bij het populatiegemiddelde dan
elke andere schattingsmethode
Betrouwbaarheidsinterval/intervalschatting = hoe dicht bij de schatter bij de onbekende
populatieparameter ligt.
Lower en upper bound van een betrouwbaarheidsinterval berekenen:
X = gemiddelde +- Z-waarde x standaardafwijking
Bij een kleine steekproef gebruik je de t-toets
Betrouwbaarheidsniveaus:
- 99% (α=0,01)
- 95% (α=0,05)
- 90% (α=0,10)
Z-waarde bij grote steekproef (n >= 30)
- Wanneer de standaarddeviatie van de totale populatie onbekend is, mag de
standaarddeviatie van de steekproef (s) gebruikt worden
T-waarde bij een kleine steekproef (n<30)
- Populatie moet normaal verdeeld zijn
Als de alternatieve hypothese al een richting geeft aan het verschil mag je éénzijdig toetsen.
Als je vooraf geen verwachting hebt over de richting van het verschil moet je twee-zijdig
toetsen.
Voorbeeld 1:
0,8/√100 = 0,08
14,01 +- 0,08 x 1,64 =
14,01+- 0,1312 = [13,88 , 14,14]
Voorbeeld 2:
8/√25 = 1,6
50 +- 1,6 x 2,06 =
50 +- 3,296 = [46,70 , 53,30]