Bijlessen statistiek (LDM126)
Meetschalen
De variabelen kunnen verschillende schalen hebben:
Nominaal
o Geen getalswaarde, geen volgorde
o Voorbeelden: geslacht, nationaliteit, godsdienst, roken (ja/nee)
o Geen gemiddelde (onzin om gemiddelde uit te rekenen)
2 mogelijkheden is altijd nominaal (kan meer dan 2 hebben)
Ordinaal
o Geen getalswaarde, wel een volgorde
o Voorbeelden: mening over bewering (eens/neutraal/oneens), smaak
(slecht/matig/voldoende/goed)
Minimaal 3 waarden, er is een verschil tussen even/oneven aantal ‘waarden’:
Bij een oneven aantal is er wel een ‘neutraal’ antwoord, bij een even aantal niet.
Je moet je als onderzoeker afvragen of dat wenselijk is (ligt aan product/dienst waar de vraag over
gaat en of mensen weten waarmee ze het moeten vergelijken).
Interval/ ratio, scalair (in SPSS: scale)
o Wel een getalswaarde en een volgorde
o Voorbeelden: hoeveel kinderen hebt u? (heel getal), hoeveel hectare land hebt u?
(evt. gebroken), wat is uw leeftijd? (heel), wat is uw lengte? (heel), wat is uw lengte?
(ratio, natuurlijk nulpunt, kan niet negatief zijn), wat is uw lichaamstemperatuur?
(interval, kan negatief en positief zijn)
o Je kunt ermee rekenen!
o Je kan gemiddelden uitrekenen
Liggingsmaten
Nominaal
Bij een nominale variabele kun je alleen spreken over de modus (mode) = meest
voorkomende waarde (je kan alleen modus uitrekenen voor nominaal)
In een frequentietabel kun je dat ook zien (als er niet te veel categorieën zijn)
Ordinaal
Bij een ordinale variabele kun je naast de modus ook/beter spreken over de mediaan
(median, 50% van de waarden ligt erboven, 50% eronder)
Is er sprake van een even aantal dan is de mediaan het gemiddelde van de 2 middelste
waarnemingen
Modus mag je ook uitrekenen voor een ordinale waarde
Interval/ratio (scalair)
, Bij een interval/ratio variabele kun je ook spreken over het gemiddelde (mean)
Alle waarden optellen en delen door het aantal waarden
Verder kun je de variantie, modus, mediaan en standaarddeviatie uitrekenen voor
interval/ratio
Altijd het gemiddelde?
-Het gemiddelde is een goede liggingsmaat als de variabele normaal verdeeld is, of ten minste
symmetrisch verdeeld is
-Wanneer het gemiddelde teveel verschilt van de mediaan dan is de verdeling niet symmetrisch,
gebruik in dit geval liever de mediaan (het gemiddelde beschrijft de variabele dan niet goed meer)
-Als de verdeling symmetrisch is, is er geen verschil, alle liggingsmaten geven hetzelfde resultaat
-Als de verdeling niet symmetrisch is (of scheef), dan geven de liggingsmaten niet hetzelfde resultaat.
Je moet dan naar het plaatje van de verdeling kijken
-De normale verdeling (veroorzaakt door ‘natuurlijke’ variatie) is een voorbeeld van een
symmetrische verdeling
Hoe kun je controleren of een variabele normaal verdeeld is?
Maak een grafiek (histogram, waar je de normale verdeling met één muisklik aan kunt toevoegen) en
bekijk deze of gebruik een test (een zogeheten one sample Kolmogrov-Smirnov test)
Spreidingsmaten
-Bij een nominale variabele bestaat er niet zoiets als een spreidingsmaat
-Bij een interval/ratio variabele heb je:
Range: hoogste – laagste
Standaarddeviatie: gemiddelde afwijking van het gemiddelde (zie samenvatting schrift)
Bij een ordinale variabele heb je de interkwartielafstand (IQR):
o De afstand tussen eerste kwartiel en derde kwartiel (75 %)
o Eerste kwartiel: 25 % ligt lager, 75 % hoger
o Tweede kwartiel: 50 % lager, 50 % hoger
o Derde kwartiel: 75 % ligt lager, 25 % ligt hoger
o Mediaan kan samenvallen met het 1e kwartiel!
Grafieken voor één variabele
Als je een nominale of ordinale variabele in beeld wilt brengen, kun je kiezen: