Samenvatting
Statistiek
1
,Hoorcollege 1
Waarom statistiek?
Je kunt heel veel meten. Maar hoe kom je tot goede uitspraken op zinvolle
vragen? Het grootste deel van het werk als bedrijfskundige onderzoeker zit in het
komen tot de juiste vraag en een goede analyse, zodat je tot goede uitspraken,
conclusies en adviezen kunt komen. Als je onderzoek van anderen leest is het de
bedoeling dat je het verband tussen de manieren van meten en de manier van
analyseren gaat zien. met statistiek alleen kun je de gekste zaken beweren en
daarop adviseren. Je vind namelijk altijd wel een mooi resultaat. Maar wat is
zinvol?
Krijgen statistiek om te leren goed zelf te analyseren en om onderzoek van
anderen goed op waarde te kunnen inschatten.
Statistiek kun je dus gebruiken om van alles te berekenen maar het is afhankelijk
van wat je onderzoeksvraag is en wie deze heeft.
Casus ‘Luzia’
Tijdens alle lessen worden er voorbeelden gegeven voor de casus Luzia. Deze en
de voorbeelden zijn te lezen in de powerpoints.
Soorten data
- Ieder aspect dat een rol speelt bij het beantwoorden van een
onderzoeksvraag wordt ‘variabele’ genoemd
- Voor iedere variabele verzamel je data
o Bijv. soort huisartsenpraktijk, de leeftijd, mening over het
gebruiksgemak etc.
o Voor variabelen verzamel je data
- Er bestaan verschillende soorten data
o Niet alleen op inhoud maar ook op ‘wat je er statistisch mee kunt’
wat voor soort data en wat voor soort schaal bepalen wat voor soort informatie
een vraag kan gaan opleveren. (boek blz. 112 nog. Zijn de schalen behandeld)
Soorten onderzoek
In het soort onderzoek zijn een paar onderscheidingen te maken:
- Kwalitatief of kwantitatief onderzoek
o Keuze wordt bepaald door je afhankelijke variabelen en de
informatie die je nodig hebt
o Kwantitatief: wil je onderzoeksresultaten in cijfers
o Kwalitatief: wil je ervaringen, voorbeelden en verhalen
- Onafhankelijke variabelen bepalen het soort onderzoek niet.
o Invloed op leeftijd..
o Relatie tussen soort patiënt en mening over…
Beide onderzoeken kunnen data van alle vier de meetniveaus hebben.
De variabelen waar je onderzoeksvraag over gaan zijn de afhankelijke variabelen.
Soorten data: Meetniveaus
2
,Afhankelijk van de invulling van variabelen heb je soorten data. Data zijn in te
delen in vier meetniveaus:
- Nominaal
- Ordinaal
- Interval
- Ratio
De meetniveaus bepalen hoe je je data kunt gaan analyseren.
Hoe je hypothese te toetsen is synoniem aan ‘welke statistiek mag je gebruiken’.
Wiskundig gezien zit de ene vorm van statistiek veel beter onderbouwd in elkaar
dan de andere. Hoe beter onderbouwd, hoe harder straks de uitspraak over je
hypothese.
Variabele
Kwalitatief Kwantitatief
Nominaal Ordinaal Interval Ratio
Naam & volgorde & vaste & nulpunt
intervallen
Rood Dun, normaal, dik Geboortejaar inkomen
De indelingen heb je nodig om vast te kunnen stellen welke rekenkundige
bewerkingen zijn toegestaan voor een bepaalde variabele.
Nominale schaal
Variabelen meet kwalitatief kenmerk en kan niet in zinvolle volgorde gezet
worden. Is het laagste niveau dat de statistiek kent.
- Bijvoorbeeld als je vraagt wat is jouw lievelingskleur, is dat geel, groen,
blauw of rood. Je kunt niet zeggen rood is mooier dan blauw. Je kunt wel
aan iemand vragen wat is jouw mooiste kleur, maar je kunt het niet alleen
op basis van de kenmerken met elkaar vergelijken.
- Bijvoorbeeld geslacht: man/vrouw, abonnee op krant/geen abonnee op de
krant, provincies, diersoorten etc.
- Kan geen gemiddelde worden berekend. Alleen percentages aangeven.
Ordinale schaal
Variabele meet kwalitatief kenmerk dat wel in een zinvolle volgorde gezet kan
worden, maar de onderlinge afstand tussen twee meetwaarden geen eenduidige
betekenis heeft. Je kunt zeggen dat sprake is van meer of minder, maar niet
hoeveel meer of minder.
- Bijv. Dun, normaal, dik.. Iemand met een dun postuur is smaller dan
iemand met een dik postuur. Zit dus een volgorde in en bij een ordinale
schaal met meetniveaus kun je de woorden in een logische volgorde met
elkaar vergelijken.
- Rangen in het leger, eens/neutraal/oneens, goud/zilver/brons etc. iemand
die goud wint op het WK heeft het beter gedaan dan iemand met zilver,
maar de stap tussen goud en zilver is niet persé even groot als tussen
3
, brons en zilver. Een hotel met 4 sterren is niet twee keer zo goed als een
hotel met 2 sterren.
- Niet toegestaan om rekenkundige gemiddeldes te berekenen.
Intervalschaal
Variabelen meet kwantitatief kenmerk dat in zinvolle volgorde gezet kan worden,
de afstand tussen twee meetwaarden heeft een eenduidige betekenis, maar
variabele heeft geen natuurlijk 0-punt.
- Bijv. geboortejaar. Iemand die in 2002 is geboren is 5 jaar ouder dan
iemand die in 2007 is geboren. Je kunt alleen aantallen optellen en aftellen
omdat de intervallen precies vast zijn. maar je kunt niet zeggen iemand
die in.. is geboren is 2x zo oud als iemand die in… is geboren. Je kunt dus
ook niet verder dan de 0 omlaag.
- 13:::00 (het is telkens 1 uur later, maar dat de dag 24 uur
duurt en om middernacht 0:00 begin is een afspraak tussen mensen net
als dat we 0 graden Celsius hebben gekozen (geen natuurlijk nulpunt (in
Fahrenheit ligt het vriespunt op een andere plek en niet op 0, je kunt
hierdoor ook niet zeggen dan 30 graden 2 keer zo warm is als 15 graden),
IQ van 100 / IQ van 110 / IQ van 120; iemand met een IQ van 160 is niet
twee keer zo intelligent als iemand met een IQ van 80. (AANTEKENING:
geen natuurlijk 0 punt. Je kunt er niet 2x zoveel of 2x zo weinig van maken
maar je kunt wel iedere keer netjes een meetwaarde erbij optrekken of
afhalen en daarmee vergelijken.
Ratioschaal
Variabele meet kenmerk dat wel in een zinvolle volgorde gezet kan worden, de
afstand tussen twee meetwaarden heeft een eenduidige betekenis én er is een
natuurlijk 0-punt. De waarde ‘0’ staat op deze schaal voor afwezigheid van de
waarde en kan niet onder 0 komen.
- bijv. inkomen. Als je vraagt wat is je inkomen kan je beginnen bij 0 euro
per maand en eindigen bij een paar miljoenen per maand. Ook kun je
zeggen bij inkomen dat iemand die 400 euro per maand verdiend 2 keer
zoveel verdiend dan iemand die 200 euro per maand verdiend. Voor een
ratio meetschaal heb je een 0 punt nodig en je kunt er mee rekenen in 2x
zo groot, 2x zo klein etc.
- aantal goed beantwoorde vragen in een toets, inkomen, leeftijden,
gewicht. Je kunt alleen met een ratioschaal scores weergeven als 'twee
keer zo goed’, ‘twee keer zo zwaar’, etc. Dat maakt dat je er meer
berekeningen mee kunt doen. En dat maakt weer, dat je veel meer soorten
statistische toetsen kunt gebruiken
- Kan dus niet onder de 0. Je kunt niet -1 appels hebben.
Likertschaal ordinaal of interval?
- Ordinaal: wanneer je woorden hebt waar je uit kunt kiezen
- Interval: wanneer je aan de buitenkanten 2 woorden hebt met daartussen
cijfers
4