Inhoudsopgave
Hoorcollege 1 ........................................................................................................................... 2
Hoofdstuk 2 .................................................................................................................................... 2
Hoofdstuk 3 .................................................................................................................................... 9
Hoorcollege 2 ......................................................................................................................... 15
Hoofdstuk 4 Betrouwbaarheidsanalyse ....................................................................................... 15
Hoofdstuk 5 .................................................................................................................................. 22
Hoofdstuk 6: Kansverdelingen ...................................................................................................... 24
Hoorcollege 3 ......................................................................................................................... 29
Steekproevenverdeling ................................................................................................................. 29
Hoorcollege 3 uitbreiding en HC 4 ........................................................................................... 38
Hoofdstuk 8 (betrouwbaarheidsintervallen) ................................................................................ 38
Hoofdstuk 9: Hypothesetoetsing .................................................................................................. 45
Hoofdstuk 10: het vergelijken van groepen ................................................................................. 58
Hoorcollege 4 en 5 - regressie uitbreiding................................................................................ 70
Statistiek plus college ............................................................................................................. 92
Factoranalyse ................................................................................................................................ 92
Mediatie analyse......................................................................................................................... 104
Moderatie-analyse...................................................................................................................... 111
, Hoorcollege 1
• 6x Hoorcolleges + 3x SPSS-practicum (drie SPSS-opdrachten)
• Iedere week zijn er BIS oefenvragen als zelftest.
• Drie deeltoetsen: eerste deeltoets is vrijdag 22 feb
• Stof deeltoetsen: meerkeuzevragen over zowel SPSS als het boek en collegestof
• Stof deeltoets 1: SPSS practicum opdracht 1 & stof van colleges 1 en 2 (en 2+)
• Rekenmachine niet vergeten!!
• Geen tentamen; alleen drie deeltoetsen. Gemiddeld minstens een 5,5 halen.
Hoorcollege introductie
Beschrijvende statistiek: samenvatting van de verkregen data.
Inferentiële statistiek: uitspraken en voorspellingen doen over hele populatie op basis van de
verkregen data (steekproef).
• To infer = concluderen uit/opmaken uit
• Terminologie: het boek heeft het over “sample statistic” en “population parameter”.
Niet significant: als je een andere doelgroep zou nemen, zou de uitkomst veranderen. (in het
voorbeeld ziekteverzuim tussen jongeren en ouderen)
Hoofdstuk 2
Samenvatting van één variabele (= univariaat).
• meetniveau van variabelen (dit bepaald wat we met de data kunnen doen)
• centrale tendentie (gemiddelde, mediaan, modus)
• verdeling (histogram, barchart)
• spreidingsmaten (standaarddeviatie, variantie)
• z-score
• overige maten / manieren om data te beschrijven.
Beschrijvende statistiek: samenvatting van de verkregen data
➔ Het verzamelen, ordenen en presenteren van gegevens
➔ Vaak op basis van populatiegegevens
Inferentiële statistiek: uitspraken en voorspellingen doen over de hele populatie op basis van de
verkregen data (steekproef)
To infer: concluderen uit/opmaken uit
Terminologie: het boek heeft het over “sample statistic” en “population parameter”
Beschrijvende univariate statistiek:
- Samenvatting van één variabele (univariaat)
Variabelen: Ofwel het kenmerk (of de kenmerken) waarnaar je onderzoek doet.
Categorische variabelen: hebben als waarden geen getallen, maar alleen kenmerken of categorieën.
Bijvoorbeeld: geslacht, nationaliteit, religie of opleidingsniveau. Categorische variabelen kunnen
weer onderverdeel worden in twee soorten: nominaal en ordinaal.
- Nominaal (nominal): geen rangordening mogelijk (de ene variabele is niet beter dan de
andere). De variabele heeft meerdere groepen, maar geen randordening. Je kunt de
verschillende groepen aanduiden met een kleur, letter of symbool. Maar ook met een getal.
, De waarde van de nominale variabelen zijn puur kwalitatieve gegevens. Met deze gegevens
kun je geen wiskundige berekeningen doen. Voorbeeld: nationaliteit, religie, studierichting.
(SPSS waarschuwt je hier niet voor!)
o Een speciaal geval van een nominale variabele is “dichotoom” (dummy variabele):
0/1 kenmerk.
▪ Bijvoorbeeld geslacht. Je kunt alle variabelen altijd terugbrengen tot een 0/1
dichotomie.
- Ordinaal (ordinal): wel rangordening mogelijk. De groepen hebben een rangordening, maar
geen vaste afstand of de stappen dezelfde afstand hebben?. Kwalitatieve gegevens die te
ordenen zijn. (Echte berekeningen kun je hier niet mee doen, maar je kunt wel een zekere
ordening aangeven; bijvoorbeeld wat is beter of wat komt eerder). Gemiddelde kan je lastig
uitrekenen, maar wordt toch wel vaak gedaan.
o Bijvoorbeeld rangen in het leger, opleidingsniveau (vmbo, havo, vwo), van volledig
mee oneens tot volledig mee eens
o Ordinale variabelen worden soms voor het gemak als kwantitatief behandeld (niet
helemaal verantwoord, je weet niet of er binnen de rangorde dezelfde afstanden
geldt). 11
Kwantitatieve variabelen (in SPSS “scale”): variabelen die als waarde getallen aannemen.
Bijvoorbeeld: leeftijd, gewicht en inkomen.
➔ Bryman noemt deze variabelen interval/ratio.
o De waarden van deze schaal zijn kwantitatieve gegevens. Verschillen tussen waarden
van deze schaal hebben een betekenis (optellen en aftrekken is mogelijk).
Verhoudingen hebben geen betekenis (je kunt niet vermenigvuldigen of delen). Dit
heeft te maken met het feit dat variabelen op een intervalschaal geen vast nulpunt
hebben.
➔ Onderverdelen in twee soorten:
o Discreet: variabele waarbij slechts bepaalde (gehele) waarden kunnen voorkomen en
tussenliggende waarden niet mogelijk zijn.
▪ Bijvoorbeeld: alleen hele getallen (0,1,2,3 etc.). Aantal kinderen, aantal
huisdieren. Rangorde, de afstand tussen variabelen is even lang. Je kan geen
3,5 kinderen hebben.
o Continu: variabelen waarbij oneindig veel mogelijkheden zijn in waarde, zoals tijd,
afstand, gewicht. Kunnen alle waarden aannemen binnen een bepaald interval.
▪ Bijvoorbeeld: de tijdsduur van dit college = 44,999999 minuten en lengte.
(kan je aangeven met 100 getallen achter de komma)
, Centrummaten
➔ Een maat die het centrum van gegevens weergeeft
➔ Geeft een idee over het centrum of midden van waarden
➔ Het zegt echter niets over hoeveel alle waarden op elkaar lijken
Gemiddelde (mean) (M) (X’par): totaal van observaties / aantal observaties
Een andere belangrijke benaming van het gemiddelde:
verwachting, verwachte waarde ofwel verwachtingswaarde.
Het gemiddelde is beste gok over een waarneming, als je
verder (nog) niets weet. Gemiddelde is een benchmark voor
andere statistische analyses -> voorspelling.
Het gemiddelde is nogal gevoelig voor extreme waarden
(een of twee hoge waarden kunnen het gemiddelde sterk
omhoog of omlaag drijven). Het gemiddelde kan alleen bij
gegevens op interval- en ratioschaal berekend worden.
In deze cursus gaan we de voorspelling steeds beter maken door middel van andere meetniveaus.
Mediaan (Md): het middelpunt van de observaties als je ze van laag naar hoog ordent.
Mediaan is handig om te gebruiken wanneer er grote uitschieters in de te berekenen waarde zitten,
ofwel grote variantie tussen de waardes.
➔ Wanneer er bij grote uitschieters het gemiddelde wordt berekend, geeft dit geen eerlijk
beeld.
➔ Wordt minder sterk beinvloed door outliers.
➔ Wanneer er niet één getal in het midden zit neem je van de twee middelste getallen het
gemiddelde.
➔ Bij ordinaal gebruiken we de mediaan: middelste waarneming.
➔ Ordinale variabelen worden soms voor het gemak als kwantitatief behandeld, we gebruiken
in de praktijk vaak het gemiddelde
Modus: de waarde die het meest/vaakst voorkomt (de grootste categorie).
Dia 29 welke maat voor centrale tendentie gebruiken we?
Analyse-eenheden: hoeveel observaties/cases er zijn
(respondenten als voorbeeld). In deze dia 5 observaties: 5
personen.
Variabele 1: modus kan hierbij gebruikt worden (niet het
gemiddelde, en niet de mediaan)
Variabele 2: Officieel niet het gemiddelde (alleen mediaan
en modus) maar in de praktijk wordt het gemiddelde toch
ook nog gebruikt.