2022 – 2023
Statistiek 2
Hoofdstuk 0: Herziening statistiek 1
dinsdag 20 september 2022 Hoorcollege 1
0.1 Variabelen operationaliseren en meten
Operationaliseren: variabelen meetbaar maken
➔ Variabelen: kenmerken vd proefpersoon, zoals het geslacht en haarkleur.
Variabelen kunnen … zijn:
- Kwantitatief of kwalitatief
- Continu of discreet
- Opgedeeld in verschillende meetniveaus (nominaal, ordinaal, interval, ratio)
- Onafhankelijk of afhankelijk
Twee voorwaarden voor meten:
• Betrouwbaarheid – hoe goed meet de test wat we willen meten?
• Validiteit – meet de test wat we willen meten?
0.1.1 Kwantitatief of kwalitatief
Kwantitatieve variabele: de waarden bestaan uit getallen/scores.
Kwalitatieve variabele: een indeling in categorieën, zoals de militaire rangen in het leger.
0.1.2 Continu of discreet
Continu: geleidelijk, de temperatuur veranderd doorheen de dag.
Discreet: sprongsgewijs, geen cijfers na de komma, niet 1,5 kind.
0.1.3 Meetniveaus - NOIR
Nominaal: verschillende categorieën waar mensen in geplaatst worden. Zoals een jongen (1) en een
meisje (2). Deze cijfers hebben geen getalswaarde.
➔ Geen rangorde, geen meeteenheid en geen nulpunt
Ordinaal: categorieën hebben een bepaalde volgorde, een rangordening. Zoals hoogst behaalde diploma
(lager onderwijs/lager secundair/hoger secundair/bachelor/master)
➔ Wel rangorde, geen meeteenheid, geen nulpunt
Interval: het verschil tussen 2 opeenvolgende waarden is gelijk. Zoals bij IQ-punten.
➔ Wel rangorde en meeteenheid, geen nulpunt
Ratio: (nauwelijks hiermee werken) Rangorde is belangrijk, verhoudingen tussen opeenvolgende
waarden is gelijk. Zoals, niet dubbel zo depressief als de andere persoon.
➔ Wel rangorde, meeteenheid en nulpunt
1
, 2022 – 2023
0.1.4 Onafhankelijk of afhankelijk
Onafhankelijke variabele: de oorzaak, de waarde vd variabele is onafhankelijk van andere variabelen in
je onderzoek. Deze variabele kun je manipuleren.
Afhankelijke variabele: het gevolg, de waarde is afhankelijk van veranderingen id. onafhankelijke
variabele.
0.2 Steekproeven
Steekproeven: het deel vd populatie dat wordt onderzocht, hierop doen we beroep wanneer de
populatie te groot is om helemaal te onderzoeken.
We willen uitspraken doen over de gehele populatie, dus de steekproef moet een goede afspiegeling
zijn vd populatie.
Aselecte steekproeven: toevallige steekproef, elk individu heeft evenveel kans en de kans is groter dan 0
- Volledig aselecte steekproef: elk element vd populatie heeft een gelijke kans om id. steekproef
te worden opgenomen. Maar niet altijd representatief.
- Gestratificeerde steekproef: alle deelpopulaties evenredig aan bod laten komen in de
steekproeftrekking. Hier is het mogelijk om representativiteit te bereiken.
- Clustersteekproef: de populatie verdelen in gelijkaardige clusters en daarna binnen elke
geselecteerde cluster een aselecte steekproef trekken. Het spaart kosten en tijd, maar is minder
nauwkeurig en representatief.
Niet aselecte steekproeven: niet altijd geschikt voor inductieve statistiek.
- Sneeuwbalsteekproef: onderzoeker vertrekt van één respondent aan wie vervolgens gevraagd
wordt andere respondenten te contacteren. Zoals bij mensen met een verslavingsproblematiek.
Hierdoor worden mensen makkelijker bereikbaar, maar de kans is groot dat mensen sterk op
elkaar lijken.
- Gelegenheidssteekproef: keuze van respondenten wordt overgelaten aan ondervrager. Zoals 1e
jaars psychologie en op straat. Het is goedkoop en snel, maar is niet geschikt voor
populatieschattingen.
- Quotasteekproef: onderzoeker bepaalt kenmerken vd populatie die men ook wil zien id.
steekproef, zoals een verdeling jongens/meisjes.
0.3 Frequentieverdelingen
Frequentieverdelingen: eerste verkenning vd data
Verschillende soorten frequenties:
• Absolute frequenties: het aantal keren dat een waarde voorkomt
• Relatieve frequenties: %, absolute frequentie delen door het totaal aantal respondenten
Visuele voorstellingen – afhankelijk vh meetniveau:
- Taartdiagram – Nominaal: grafische voorstelling vd resultaten van een kwalitatieve variabele.
- Staafdiagram – Nominaal of ordinaal: presenteert een grafische voorstelling vd frequentie
van elke waarde.
2
, 2022 – 2023
- Stamdiagram/histogram/boxplot – Interval:
Percentielscores: de plaats van een score in het geheel.
• Kwartiel: alle scores worden verdeeld in 4 groepen.
o P25 = Q1, P50 = Q2, P75 = Q3, P100 = Q4
• Deciel: het geheel vd observaties verdelen in 10 evenwaardige delen – 10%
o D1 = P10, D2 = P20
0.4 Centrummaten
- Modus: waarde die het meeste voorkomt, elk meetniveau
- Mediaan: middelste waarde bij gerangschikte waarnemingen, minimum ordinaal
- Gemiddelde: som van alle waarden gedeeld door aantal waarnemingen, minimum interval
Modus = mediaan = gemiddelde
➔ Mediaan minder gevoelig voor extreme waarden
➔ Gemiddelde consistenter over verschillende steekproeven
0.5 Spreidingsmaten
Spreidingsmaten: toont hoe ver scores uit elkaar liggen.
Interkwartielafstand: 𝑃75 − 𝑃25 , de afstand daartussen wordt berekend.
Variantie (𝑠 2 ): de afwijking van elke uitslag ten opzichte vh gemiddelde en deze afwijking
kwadrateren. Zo ontstaat het gemiddelde van deze gekwadrateerde afwijkingsscores.
Standaarddeviatie (s): de vierkantswortel van de variantie. Geeft de mate van
spreiding aan in bepaalde data.
𝑋− 𝑋̅
Standaardscores (Z-scores): om verschillende testen met elkaar te vergelijken. 𝑍𝑥 = 𝑆𝑋
0,5
0.6 De normale verdeling
0,4
De normale verdeling: normale verdelingen verschillen enkel in gemiddelde en
0,3
standaarddeviatie. De curve is altijd klokvormig en symmetrisch.
➔ Gemakkelijk observaties afleiden 0,2
0,1
Niet alle data zijn normaal verdeeld, en om makkelijk berekeningen te maken is het 0
nuttig om een verdeling te transformeren zodat ze de normale verdeling benadert. -4 -3 -2 -1 0 1 2 3 4
Vormkenmerken van een verdeling:
• Centrummaat (gemiddelde, mediaan, modus)
• Spreidingsmaat (standaarddeviatie), hoe ver de scores zich v.h. gemiddelde gaan bevinden
3
, 2022 – 2023
• Kurtosis: gepiektheid, hoe hoog is die piek
• Skewness: scheefheid, hoe hoog is de scheefheid
Lineaire transformaties: enkel gemiddelde en standaarddeviatie veranderen
Normaliserende transformaties: ook kurtosis en skewness veranderen zodat de normale verdeling
benaderd wordt.
0.7 Kruistabellen
Kruistabellen: ter bestudering van samenhang tussen variabelen
Afhankelijk van meetniveau:
• Nominaal en nominaal – kruistabel
• Nominaal en ordinaal – kruistabel
• Interval en interval – correlatie
Drie maten van samenhang bij kruistabellen:
• Chi-kwadraat: niet geschikt voor kleine steekproeven, onderzoekt wanneer een verband
betekenisvol is.
• Contingentiecoëfficiënt: variabelen met 2 niveaus
𝑋²
o 𝐶 = √𝑋 2 +𝑛
• Cramer’s V: variabelen met meer dan 2 niveaus
𝑋²
o 𝑉 = √𝑛∗(𝑘−1)
0.8 Correlaties
Correlaties: ze hebben hetzelfde doel als kruistabellen maar gaan samenhang tussen interval- of
ratiovariabelen.
• Hoge correlaties is bv .75 (positief verband) maar ook -.85 (negatief verband)
• Covariantie: hetzelfde als de correlatie, maar is geen gestandaardiseerde maat (omdat er niet
wordt gedeeld door de standaarddeviatie in de formule).
Hoofdstuk 1: Inductieve statistiek in onderzoek
dinsdag 27 september 2022 – Hoorcollege 2+3
1.1 Wat is de bedoeling van statistiek?
We hanteren statistiek als hulpmiddel bij empirisch onderzoek dat erop gericht is algemeen geldende
uitspraken te doen over wetmatigheden (zoals menselijk gedrag) waarnaar we onderzoek verrichten.
De statistiek biedt ons de nodige regels om consequent en verantwoord conclusies te trekken over
wetmatigheden in menselijk gedrag.
4