Statistiek Yinthe Valcke
MODULE 1 – INLEIDING TOT DE STATISTIEK
• Kwalitatieve onderzoeksmethoden: data is tekst
- Bv interviews, focusgroepen
• Kwantitatieve onderzoeksmethoden: data bestaat uit cijfers
- = Statistiek
- = een set v tools & technieken die gebruikt wordt voor het beschrijven, organiseren &
interpreteren v informatie of gegevens
- = instrument dat ons helpt om de wereld rond ons heen te begrijpen
• Misconcepties over statistiek etc
- Baby’s lopen gemiddeld aan x maanden … -> varianties rond het gemiddelde
- Oppassen voor misleidende statistiek
ONDERZOEKSPROCES
• Wat je doet:
- genereer een duidelijke onderzoeksvraag, -probleem waarop het onderzoek antwoordt moet geven
- vraag moet ondubbelzinnig geformuleerd zijn, zodat we precies weten wat te onderzoeken: waarin
geïnteresseerd en welke doelgroep bestuderen
• Hoe je het doet:
- Onderzoeksvraag kan voortkomen uit iets dat je vaststelt doordat je de wereld observeert en waar je
meer over wilt weten
- Geen observatie: literatuur bestuderen en leemte zoeken die verder onderzocht kan worden
§ Bv Ben heeft 5 ijswinkels, merkt dat verkoop bij sommige is gedaald en wil oorzaak daarvan
vaststellen. Denkt dat sommige managers geen belang hechten aan klanttevredenheid – wil dit
verder onderzoeken, onderzoeksvraag: verschilt de klanttevredenheid tussen de 5 locaties?
Wat je doet:
• Genereer onderzoeksvraag
• Raadpleeg een theorie:
- = uitleg of set v principes die een breed fenomeen verklaart en die goed onderbouwd
is door herhaaldelijk te zijn getest
- Je doet dat op een populatie:
§ = Theoretische groep waarover je conclusies wilt trekken (bv alle potentiële
klanten)
• Genereer een hypothese:
- = vooropgestelde verklaring voor een vrij beperkt fenomeen of reeks waarnemingen
§ Bv klanttevredenheid verschilt per winkellocatie
• Verzamel data om de hypothe te testen
- Variabele: Alles dat kan worden gemeten en dat kan verschillen (of veranderen of
variëren) tussen entiteiten of in de tijd
- Case: De gegevens uit één bron van één of meerdere variabelen
1
, Statistiek Yinthe Valcke
Een variabele
Case Winkel Q1 Q2 Q3
Een case 1 A 2 5 Ja
2 A 2 3 Nee
Een dataset 3 B 5 3 Ja
4 B 1 1 Ja
5 C 2 1 Ja
6 D 1 2 Nee
7 D 1 3 Nee
Hoe je het doet:
VARIABELEN: KWALITATIEF/KWANTITATIEF, MEETNIVEAU, CONTINU/DISCREET
Variabele
Kwalitatief Kwantitatief
Categorisch Scale
Nominaal Ordinaal Interval Ratio
Discreet Continu
19 20 21 40 34,3° 12,4°
19,8 36,7
• Kwalitatief: categorisch
§ Opgebouwd uit categorieën, zoals bv dieren: het kan niet beetje hond, beetje
kat zijn, het is óf hond óf kat …
- Binaire of dichotome variabelen: wanneer het maar 2 dingen benoemt: dood of
levend, roker of niet-roker -> herleiden naar ja of nee
- Nominaal: 1, 2, 3, … : 4 kleuren, 5 vlaggen, 3 chocolades … -> volgorde niet belangrijk
- Ordinaal: Goud, zilver, brons; van heel slecht tot heel goed … -> volgorde vd
nummering belangrijk (goud=1 …)
• Kwantitatief: schaal
- Interval: bv van 2005 -> 2006 = 2014 -> 2015 of van 80° -> 90° = 90° -> 100,
§ geen ratio: 100° =/= 2 x 50°
§ geen 0-punt
- Ratio: heeft een nulpunt, breuk
§ 100 kg -> 150 kg = 0 -> 50 kg
§ 0 kg = gewichtsloos
§ 20 kg = 2 x 10 kg
- Interval & ratio kunnen discreet of continue zijn:
2
,Statistiek Yinthe Valcke
§Discreet: kunnen eindig aantal gehele getallen aannemen, waarden meestal
verkregen door te tellen
- bv. Het aantal lln in een klas, kan geen kommagetal zijn -> enkel
afgebakende getallen
§ Continu: oneindig aantal fractionele waarden, waarden kunnen niet worden
geteld (bv leeftijd tellen: duurt te lang want er zijn jaren, maanden, dagen ..)
- kan wel kommagetallen etc zijn, bv. De temperatuur, leeftijd
! Continue variabelen kunnen in discrete termen worden gemeten: bv leeftijd tellen in jaren
-> daarbij maken we van een continue variabele een discrete
Of omgekeerd: discrete variabelen behandelen alsof ze continu zijn: bv #partners ve vrouw
gestegen v 3,3 naar 3,5 -> continu (beetje zinloos want niemand id steekproef had 3,5
partners)
Meetniveau (meetschaal) = nominaal, ordinaal, interval of ratio
• Direct meetbare variabele: meteen waarnemen, meten (met meetlat, weegschaal …)
- Bv. Leeftijd, hoogte, gewicht
• Indirect meetbare variabele: niet direct meten
- Bv. Depressie, angst, intelligentie, geluk, klanttevredenheid
- = Constructen: kenmerken of eigenschappen die niet direct kunnen worden
gemeten, eigenschappen, belangrijk voor een populatie, conceptueel gedefineerd
(hebben betekenis in theorethische termen, maar niet direct waarneembaar)
-
Bv. Gemeten verband tussen adoptie en het gebruik van online boodschappen, via een
conceptueel framework -> de variabelen zijn contructen
-> bij constructen niet mogelijk om het in te schatten met 1 vraag (zoals wel gaat bij bv
leeftijd) -> om constructen te kunnen meten: hebben operationele definitie nodig (=
procedure of reeks procedures om construct te kwantificeren)
-> Wordt vaak gemeten met een Likertschaal (bv. Performance expectancy)
7-PUNTS (5-PUNTS) LIKERTSCHAAL
Bv. Van 1 (helemaal niet akkoord) tot 7 (helemaal wel akkoord)
• Elke respondent geeft per vraag een score van 1 tot 7 -> zo kunnen we wel een score
plakken op het construct
• Score: door het gemiddelde te nemen vd antwoorden op de stellingen
3
, Statistiek Yinthe Valcke
• Maar: voor we zomaar deze vragen mogen samennemen om construct te meten:
aandacht voor betrouwbaarheid vh meetinstrument:
• Een vd belangrijste daarvan: Interne consistentie betrouwbaarheid:
- Nagaan of de items in de schaal samen eenzelfde construct meten -> zijn de items vd
schaal intern consistent
- Onderzocht dmv de Cronbach’s Alpha analyse:
§ Gebaseerd op uitgangspt dat elk item in een schaal voldoende moet
gecorreleerd zijn met elk ander item in diezelfde schaal -> alpha analyse
gebaseerd op die correlatie (samenhang elk item met andere)
§ Getal tss 0 en 1, hoe hoger, hoe beter de consistentie tss de items
§ Ondergrens: 0,7
§ Uitkomst sterk afhankelijk vh aantal items
- Bv. 3 items, gem intercorrelatie 0,2 -> Cronbach’s alpha = 0,43
- Zelfde construct, maar 20 items -> C alpha = 0,83
- 2e lijkt wel goed, maar is enkel door grote aantal items
- -> nuttig om ook item to total correlation = correlatie tss elk item
afzonderlijk & het construct te onderzoeken
- Zoals in vb:
Construct Klanttevredenheid
(niet meetbaar)
Operationele definitie Antwoorden gegeven
(wel meetbaar) op vragen Q1-Q3
Bij Lickertschaal: zien als interval of als ordinaal? -> interval zou willen zeggen dat als ik aanduid 4
(bv op de vraag of ik die winkel leuk vind) en mijn vriend 2, dat ik die dubbel zo leuk zou vinden, dat is niet
zo -> mensen denken dat het interval is wnr ze invullen maar het is ordinaal, subjectieve vragen -> maar
soms zien we dit als interval om berekeningen mee te doen
VOORSPELLENDE VS. UITKOMSTVARIABELE
Allebei variabelen die dus kunnen variëren en die moeten worden gemeten
Bv. Uitgaan v “klanttevredenheid verschilt per winkellocatie”
• Voorspellende variabele = onafhankelijke, verklarende variabele
- Onafhankelijk: waarde is niet afhankelijk v andere variabelen
- Verklarende: kan worden gebruikt om scores v andere variabele te voorspellen
- Bv: winkellocatie, verklarend: we voorspellen de klanttevredenheid op basis vd winkels
naar waar de klant is gegaan
• Uitkomstvariabele = afhankelijke, verklaarde variabele
- Uitkomst waarin we geïnteresseerd zijn
4