Samenvatting Kwantitatieve methoden voor bedrijfskunde.
Prof. dr. Marie-Laure Vandenhaute ondersteund door dra. Linde
Kerckhofs, drs. Benjamin Kinnart en Benjamin Middelbos.
Academiejaar: 2021/2022
Module 1: Inleiding tot de
statistiek
1.1 Inleiding
Doel: inleiding geven tot statistiek en toelichten waarom statistiek belangrijk is.
Wetenschap = Om ons zelf, de wereld en het universum te begrijpen hebben we wetenschap
nodig. Wetenschap gaat over dataverzameling en verklaringen vinden in deze data.
Kwalitatieve onderzoeksmethoden = wanneer gegevens bestaan uit woorden of tekst dan heb
je kwalitatieve onderzoeksmethoden nodig, om de woorden en betekenissen te analyseren.
Veel voorkomende voorbeelden van kwalitatieve dataverzamelingsmethoden:
o Interviews
o Focusgroepen
Kwantitatieve onderzoeksmethoden =
Wanneer data uit cijfers bestaan
Een set van tools en technieken die gebruikt worden voor het beschrijven, organiseren en
interpreteren van informatie of gegevens. Statistiek is een instrument om de wereld om
ons heen te begrijpen het helpt ons ook bij het trekken van conclusies op een
verantwoorde manier.
Voorbeeld: volgens het Amerikaanse ministerie van volksgezondheid, beweegt minder dan 5% van
de volwassenen elke dag 30 minuten. Brengen kinderen meer dan 7,5 uur per dag voor een scherm
door en is 40% van de voeding van kinderen tussen 2 en 18 jaar afkomstig van toegevoegde suikers
en verzadigde vetten.
Al deze cijfers zijn afkomstig uit data en statistische analyse van deze data. Op die manier
helpt statistiek bij het trekken van conclusies op een verantwoorde manier.
Statistiek kan misleidend zijn:
Colgate beweerde dat 80% van de tandartsen het merk aanbevelen. Zulke slogan zal men
niet meer zien. De consumenten werden naar toe gebracht te geloven dat 80% van tandartsen
Colgate aanraden. Terwijl 20% van tandartsen andere merken zouden aanbevelen. Uiteindelijk
bleek dat wanneer tandartsen werden ondervraagd, ze verschillende merken konden kiezen en
niet slechts 1. Dus andere merken konden net zo populair zijn als Colgate. Deze volledige misleidend
statistiek werd daarom verboden.
, 1.2 Onderzoeksproces
Hoe beantwoord je nu een interessante onderzoeksvraag?
STAP 1: Genereren van een onderzoeksprobleem(vraag)
o Elk onderzoek begint met een duidelijk geformuleerde vraag of probleem, waarop het onderzoek een
antwoord moet bieden.
o Deze vraag moet ondubbelzinnig worden geformuleerd zodat we precies weten waarin we geïnteresseerd
zijn en welke doelgroepen we willen bestuderen.
o Een onderzoeksvraag kan voortkomen uit iets dat je vaststelt doordat je de wereld observeert en waar je
een antwoord op wenst.
o Als je geen observatie hebt, kan je ook een onderzoeksvraag genereren door voorgaande literatuur te lezen
en je leert in die literatuur te ontdekken dat verder onderzoek vereist.
Voorbeeld: Ben is eigenaar van een lokale ijsketen met 5 locaties. Hij merkte op dat de verkoop op
sommige van die locaties is gedaald en Ben wil de oorzaak weten. Hij vermoedt dat sommige van zijn
winkelmanagers geen belang hechten aan klanttevredenheid maar hij heeft meer dan een buikgevoel
nodig om de winkelmanagers te overtuigen om hun manier van werken aan te passen. Daarom
besluit hij dit verder te onderzoeken.
Hij begint aan zijn onderzoeksproces met het genereren van een onderzoeksvraag = verschilt de
klanttevredenheid over de vijf locaties?
STAP 2: Raadpleeg een theorie
De eerste stap in het beantwoorden van een interessante onderzoeksvraag is het zoeken naar een relevante theorie.
Theorie = een uitleg/verklaring of een set van principes die een breed fenomeen verklaart en die
goed onderbouwd is door herhaaldelijk te zijn getest.
Theorieën zijn heel algemeen van toepassing op alle entiteiten of situaties. Een hele set van
entiteiten staat bekend als populatie.
Populatie = Een theoretisch groep waarover je conclusies wilt trekken. Een populatie kan zeer
divers zijn. Verschillende soorten wetenschappers kunnen zich richten op verschillende populaties.
Voorbeeld: Een econoom kan geïnteresseerd zijn in populatie van klanten, kleine ondernemingen of
werknemers. Terwijl biologen geïnteresseerd kunnen zijn in populatie van kleine cellen.
Ben wil conclusies trekken over klanten in het algemeen. Daardoor zijn klanten de populatie
waarin hij geïnteresseerd is.
Om de vraag te beantwoorden of klanttevredenheid verschilt per locatie, kunnen we beginnen
met de theorieën over klanttevredenheid. Eén van de theorieën zegt bijvoorbeeld dat
klanttevredenheid beïnvloed wordt door veel factoren. Waaronder vriendelijke en behulpzame
winkelmanagers.
Op basis van theorieën genereren we hypotheses.
3
, STAP 3: Genereer een hypothese
Hypothese = een vooropgestelde verklaring voor een vrij beperkt fenomeen of reeks
waarnemingen.
Het is geen gok maar een geïnformeerde poging om trachten te verklaren wat er is waargenomen.
Zowel theorieën als hypotheses proberen de wereld te verklaren.
MAAR een theorie verklaart een breed schaal aan fenomenen en werd ook getest terwijl
hypotheses typisch een enger fenomeen verklaren en vooral nog niet getest is geweest.
Op basis van voldoende klanttevredenheidtheorieën die stellen dat klanttevredenheid degelijk
afhangt van de winkelmanager, kan volgende hypothese worden gegenereerd =
“Klanttevredenheid verschilt per winkellocatie.”
STAP 4: Verzamel data om de hypothese te testen
Om hypotheses te testen moeten we gegevens verzamelen die we achteraf zullen analyseren.
In ons voorbeeld verzamelt Ben de klanttevredenheid in elke winkel. De gegevens die Ben
verzameld in één plek wordt een dataset genoemd.
Datasets kunnen worden beschreven met 2 termen:
Een case (observatie) = de gegevens uit één bron van één of meerdere variabelen.
Een variabele = alles dat kan worden gemeten en dat kan verschillen (of veranderen of
variëren) tussen entiteiten of in de tijd. Een variabele wordt in dataset weergegeven als
een kolom. (als je bv de lengte van uw vrienden hebt gemeten, dan is lengte uw
variabele)
In onze dataset zijn: winkel, Q1, Q2 en Q3 de variabelen.
Een case wordt in een dataset weergegeven in een rij. In onze dataset bevat case 1, 4 datapunten:
Een A voor de Winkel
Een 2 voor de Q1 variabele
Een 5 voor de Q2 variabele
Een Ja voor de Q3 variabele
In de statistiek is een variabele een kenmerk dat een persoon, een ding, een plaats of idee beschrijft. Een waarde van een
variabele kan verschillende vormen aannemen. Alle waargenomen waarden samen noemt men de data.
Neem bijvoorbeeld het ras van enkele honden. De variabele in dit voorbeeld is ras. De waarde is voor elke hond anders.
Dit is labrador voor de ene hond, teckel voor de andere hond en soms wel een kruising voor de andere honden. De data
zijn alle soorten waarden: chihuahua, golden retriever, labrador, border collie, teckel, etc.
Samengevat kunnen we zeggen dat een dataset een verzameling van gegevens is die op één of
andere manier aan elkaar gekoppeld zijn. Een dataset is een spreadsheet met variabelen als
kolommen en cases of observatie als rijen. Elke variabele vertegenwoordigt een verzameling van
één enkel type gegeven terwijl een case of een observatie alle gegevens over alle variabelen in
de dataset uit één enkele bron omvat.
Een case/observatie is een groep van gegevens verzameld over 1 of meerdere variabelen, maar
van 1 en dezelfde bron bv een persoon.
Om een hypothese te testen moet men variabelen meten.
Zodra we variabelen meten hebben we termen nodig om uw soort variabele te beschrijven. Dit is
, belangrijk omdat verschillende soorten variabelen, verschillende analyses vereisen.
In het algemeen worden variabelen geclassificeerd als kwalitatief of kwantitatief:
Kwalitatieve of categorische variabelen =
Een categorische variabele is opgebouwd uit categorieën waarin een entiteit in slechts 1
van de categorieën kan worden geplaatst.
Voorbeeld: Dieren Een koe, een kat of een hond. Een dier is dus of een koe of een kat
of een hond. Een dier kan niet een beetje een kat of een beetje een hond zijn.
In zijn eenvoudigste vorm heeft een categorische variabele slechts 2 categorieën (=
Binaire of dichotome variabele)
Voorbeeld: Mannen en vrouwen, leven en dood, Ja en nee.
Kwalitatieve gegevens zijn niet numeriek van aard maar kunnen met cijfers gecodeerd worden.
Cijfers worden soms toegewezen aan kwalitatieve variabelen voor data-‐analyse. Maar ze
worden ondanks de numerieke classificatie nog steeds geclassificeerd als kwalitatieve
variabelen. Een onderzoeker kan bijvoorbeeld het cijfer 1 aan mannen en 2 aan vrouwen
toekennen.
Codering = het aanduiden van categorieën door middel van getallen
Die cijfers betekenen niets meer dan de namen van de categorieën, maar het kan handig zijn om
cijfers te gebruiken om verschillende categorieën aan te duiden. Daarom, zelfs als de variabele
gecodeerd is door middel van getallen, is het zinloos om berekeningen ermee te doen. Je kan
bijvoorbeeld het aantal dieren tellen maar je kan een hond niet optellen met een kat. Of je kan
geen gemiddeld dier berekenen.
Kwantitatieve variabelen of scale variabelen = Zijn variabelen die een bepaalde numerieke
weergave hebben en die numerieke informatie bevatten. Kwantitatieve variabelen worden ook
scale variabelen genoemd. Lengte, leeftijd en gewicht zijn voorbeelden van kwantitatieve
variabelen. Met kwantitatieve variabelen kan je berekeningen doen. We kunnen bijvoorbeeld de
leeftijd van twee personen optellen.
Variabelen kunnen veel verschillende vormen en niveaus van verfijning aannemen:
De relatie tussen wat gemeten wordt en de getallen die vertegenwoordigen wat er wordt gemeten
staat bekend als het meetniveau of de meetschaal.
Kwalitatieve variabelen worden verder geclassificeerd als:
Nominaal schaal = de eenvoudigste meetschaal.
Voorbeeld: geslacht, chocolade soort en kleur. Dit zijn beschrijvingen of labels zonder
orde. We kunnen niet zeggen dat de kleur rood superieur is dan de andere kleuren of we
kunnen mannen en vrouwen niet rangschikken.
Ordinaal schaal = ordinale variabelen hebben een betekenisvolle volgorde.
Voorbeeld: olympische medailles, rang of tevredenheid
o Olympische medailles kunnen van hoog naar laag gerangschikt worden.
o Tevredenheid: De intervallen tussen de waarde in de schalen zijn niet gelijk. Zo
kan er een groot verschil zijn tussen tevreden en ontevreden maar een klein
verschil zijn tussen ontevreden en zeer ontevreden. Andere voorbeeld: Zo kan
de kloof tussen de eerste en de tweede in een race klein zijn terwijl er een grotere
kloof is tussen de tweede en de derde loper.
5