Het gaat om lesnotities van hetgeen wat de prof allemaal heeft verteld tijdens de colleges. De colleges werd opgenomen, dus ik heb letterlijk alles genoteerd wat er verteld werd.
Module 1 – Inleiding tot de statistiek
1.1 Inleiding
Om onszelf te begrijpen hebben we wetenschap nodig. Wetenschap gaat over het
verzamelen van data en het zoeken van verklaringen voor die data. We hebben
volgende onderzoeksmethoden:
Wanneer de gegevens bestaan uit woorden of Wanneer data bestaan uit cijfers hebben we
tekst, dan hebben we kwalitatieve kwantitatieve onderzoeksmethoden nodig.
onderzoeksmethoden nodig om de woorden
en hun betekenis te analyseren. Het is een set van tools en technieken die
gebruikt wordt voor het beschrijven,
Veelvoorkomende kwalitatieve organiseren en interpreteren van informatie
verzamelingsmethoden zijn interviews en en gegevens.
focusgroepen.
We worden steeds overspoeld door cijfergegevens, en dan kan je twee dingen doen:
of je gelooft het, of je wilt er meer over weten en nagaan of het wel klopt.
Voorbeeld: In een boek over de ontwikkeling kan men lezen rond welke leeftijd een
baby normaal begint te kruipen. Als je kind op die dag nog niet kruipt gaan mensen al
snel denken dat hun kind een ontwikkelingsprobleem heeft. Veel mensen begrijpen
niet dat rond de gemiddelde variatie bestaat.
1.2 Het onderzoeksproces.
1.2.1 Genereer een onderzoeksprobleem (wat je doet)
Bij elk onderzoek start je met de formulering van een onderzoeksvraag. Op die vraag
wil je een antwoord weten. Belangrijk is dat de vraag ondubbelzinnig moet
geformuleerd worden. De onderzoeksvraag kan voortkomen uit iets dat je vaststelt,
doordat je de wereld observeert.
1.2.2 Observeer de wereld of lees (hoe je het doet)
Als je niets observeert kan je voorgaande literatuur lezen en een leemte ontdekken dat
verder onderzoek vereist.
1.2.3 Raadpleeg een theorie.
Theorie = een uitleg of set van principes die een breed fenomeen verklaart en die
goed onderbouwd is door herhaaldelijk te zijn getest.
Belangrijk: Theorieën zijn heel algemeen van toepassing op alle entiteiten of situaties.
1
,1.2.4 De populatie (waar je het op doet)
Populatie = een theoretische groep waarover je conclusies wilt trekken. (Vb. Bij
klanttevredenheid studies kan je populatie klanten zijn)
1.2.5 Genereer een hypothese.
Hypothese = vooropgestelde verklaring voor een vrij beperkt fenomeen of reeks
waarnemingen.
ð Verschillend met theorie: Zowel theorieën als hypotheses proberen de wereld
te verklaren. MAAR... een theorie verklaart een breed scala aan fenomenen en
werd reeds veelvuldig getest. Terwijl een hypothese een enger fenomeen
probeert te verklaren en nog niet getest is geweest.
1.2.6 Verzamelen data om hypothese te testen.
Dataset = verzameling van gegevens die op de ene of andere manier aan elkaar
gekoppeld zijn. Het gaat om data die men op één plek
Datasets kunnen worden beschreven met twee termen:
- Variabele = alles dat kan worden gemeten en dat kan verschillen (of veranderen
of variëren) tussen entiteiten of in de tijd (kolom in de dataset)
- Case = de gegevens uit één bron van één of meerdere variabelen (rij in de
dataset).
ALGEMEEN: een dataset is een spreadsheet met variabelen als kolommen en
cases/observaties als rijen. Elke variabele vertegenwoordigt een verzameling van één
type gegeven, terwijl een case alle gegevens over alle variabelen in de dataset uit één
enkele bron omvat.
2
,A. Soorten variabelen.
Variabelen kunnen verder verdeeld worden in twee termen:
Kwalitatief (categorisch) Kwantitatief (scale)
Is opgebouwd uit categorieën waarbij een entiteit Variabelen die een bepaalde numerieke
slechts in één van de categorieën kan worden weergave hebben en numerieke informatie
geplaatst. bevatten. (Vb. Lengte, gewicht en leeftijd)
Vb. Koe, kat en hond. Een dier is slechts één van Met kwantitatieve gegevens kan men
de drie en niet van elk een beetje. berekeningen doen. (Vb. We kunnen de leeftijd
van twee personen optellen)
Een speciale vorm is binaire of dichotome
variabel. Hierin heeft een categorische variabele
slechts twee verschillende categorieën. (Vb. Man
en vrouw, levend en dood, …)
Kwalitatieve gegevens zijn niet numeriek van
aard, maar kunnen als een getal worden
gecodeerd (Vb: mannen = 1 en vrouwen = 2)
B. Meetniveau ’s.
Meetniveau/meetschaal = relatie tussen wat wordt gemeten en de getallen die
vertegenwoordigen wat er wordt gemeten.
We hebben verschillende vormen van meetniveau ’s. Nominaal en ordinaal
behoren tot de categorische variabele en interval en ratio bij de scale variabele:
3
, Nominale (variabelen) Interval (variabelen)
Is de eenvoudigste meetschaal. (Vb. Geslacht, Intervalschalen hebben geen echt nulpunt,
kleur, chocoladesoort, …) waarden onder de nul zijn dus mogelijk. De
verhoudingen zijn zinloos.
Dit zijn labels zonder orde. We kunnen niet
zeggen dat de ene superieur is aan de andere. Vb. Kalenderjaren, temperatuur, … deze
meetschaal heeft geordende categorieën en
vereist dat de intervallen tussen de categorieën
gelijk zijn.
Ordinale (variabelen) Ratio (variabelen)
Vb: olympische medailles, rang en tevredenheid. Deze meetschaal heeft dezelfde vereisten als
Deze variabelen hebben een betekenisvolle interval, maar gaat nog een stap verder. Hier
volgorde. moeten ook de verhoudingen zinvol zijn.
De intervallen tussen de waarden in de schaal Om dit te laten kloppen, moet de schaal een
zijn mogelijk niet gelijk. echt en zinvol nulpunt hebben. Een nulpunt
waar er een volledige afwezigheid is van
Vb: er is een groot verschil tussen tevreden en hetgeen je aan het meten bent.
ontevreden, maar een klein verschil tussen
ontevreden en zeer ontevreden Voorbeelden: leeftijd, gewicht, lengte, behaalde
punten op het examen...
De intervallen zijn consistent: 100 kg => 150 kg
= 0 kg => 50 kg
Er is een betekenisvol nulpunt: 0 kg =
gewichtloos
Het hebben van een betekenisvol nulpunt
betekent dat verhoudingen/ratio’s worden
gehandhaafd.
C. Classificatie van de kwantitatieve variabele.
Kwantitatieve variabelen kunnen enerzijds discreet of continu zijn:
- Discrete variabelen = kunnen een eindig aantal verschillende gehele waarden
aannemen. Waarden voor deze variabelen worden meestal verkregen door te
tellen.
Voorbeeld: het aantal leerlingen in een klas kan 19 of 20 zijn, maar niet 19,80.
Opgelet: kwalitatieve variabelen zijn altijd discreet!
- Continue variabelen = hebben een oneindig aantal kommagetallen. Waarden
voor deze variabelen kunnen niet worden geteld.
Voorbeeld: leeftijd (2j, 6 maanden, 23 dagen, enzovoort) en temperatuur.
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper stormcuyt. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,39. Je zit daarna nergens aan vast.