Statistiek I: statistisch gezien
Inhoud
Table of Contents
Statistiek I: statistisch gezien..................................................................................................................1
Inhoud....................................................................................................................................................1
Hoofdstuk 1 Inleiding: over statistiek, statistieken en mathemafobia................................................2
statistiek is …..................................................................................................................................2
Hoofdstuk 2 data statistisch onder de loep genomen........................................................................3
Datamatrix......................................................................................................................................3
onderzoekselementen....................................................................................................................3
variabelen.......................................................................................................................................4
Meetwaarden.................................................................................................................................5
Sommatieteken..............................................................................................................................5
Dubbel sommatieteken..................................................................................................................6
Hoofdstuk 3: visuele inspectie van verdelingen op basis van ruwe data............................................6
Rangorde kengetallen.....................................................................................................................6
Grafieken kwalitatieve variabelen..................................................................................................7
Stam-bladdiagram : diepte.............................................................................................................8
Kwartielen vs scharnierwaarden.....................................................................................................8
Centrale tendentie..........................................................................................................................9
Spreiding.......................................................................................................................................10
Vorm.............................................................................................................................................10
overzicht kengetallen...................................................................................................................11
Uitschieters...................................................................................................................................12
Hoofdstuk 4: eerste analyseniveau, centrale tendentie...................................................................12
Rekenkundig gemiddelde.............................................................................................................12
Specifiek gemiddelde....................................................................................................................14
Logaritmen...................................................................................................................................16
Overzicht gemiddelden.................................................................................................................17
Hoofdstuk 5: tweede analyseniveau, spreiding................................................................................17
Standaardafwijking (.....................................................................................................................18
Variantie ).....................................................................................................................................18
Interkwartiele spreidingscoëfficiënt:............................................................................................21
Kengetallen...................................................................................................................................22
Spreiding kwalitatieve variabelen.................................................................................................22
Informatietheorie.........................................................................................................................25
1
, entropie H.....................................................................................................................................25
Hoofdstuk 6: derde en vierde analyseniveau, vorm van verdeling...................................................26
Van spreiding naar scheefheid......................................................................................................27
Scheefheidscoefficient van Pearson.............................................................................................27
Scheefheidscoefficient van Yule...................................................................................................28
Merkwaardig product...................................................................................................................28
Scheefheidsmaat van Gamma......................................................................................................29
scheefheidsmaat : rekenwerk.......................................................................................................31
Gepiektheid of kurtosis.................................................................................................................33
Scheefheidsmaat..........................................................................................................................34
Gepiektheidsmaat : rekenwerk.....................................................................................................34
Totaaloverzicht kengetallen..........................................................................................................35
Hoofdstuk 7: werken met geclassificeerde data...............................................................................35
Geclassificeerde frequentietabel..................................................................................................35
Kengetallen voor een geclassificeerde frequentietabel................................................................38
Hoofdstuk 1 Inleiding: over statistiek, statistieken en mathemafobia
statistiek is …
Hoe verwerk je de leerstof?
Stap 1: theorie begrijpen en eenvoudige oefeningen
Stap 2: leerstof inoefenen tijdens werkcolleges
Stap 3: theorie studeren en extra oefeningen maken
Beschrijvende statistiek: beschrijven van steekproef/populatiegegevens m.b.v. tabellen, grafieken en
kengetallen (deel 1)
Inferentiële statistiek: o.b.v. steekproefgegevens uitspraken doen over de populatie (deel 2)
begrippen
Statistiek = de wetenschap van het verzamelen, organiseren, presenteren, analyseren en
interpreteren van gegevens of data volgens een numerieke logica.
Populatie N = de grep wrover het onderzoek een uitspraak wil doen (bv. Amerikaanse mannen)
Steekproef n = een selectie uit de totale populatie, wrop je het onderzoek uitvoert. (bv. Het
daadwerkelijke aantal Amerikaanse mannen die je hebt ondervraagd)
Problemen bij dataverzameling:
2
, Problemen bij de presentatie van data:
Misleidende grafieken
Populatie v gemiddelde is risky, gevoelig vr uitschieters
Hoofdstuk 2 data statistisch onder de loep genomen
Datamatrix
- Onderzoekselement
- Variabelen
- Meetwaarden
Enkelvoudig sommatieteken
Dubbel sommatieteken
Rangorde kengetallen
Datamatrix
Kolommen
Variabelen: kenmerken van
de onderzoekselementen
Rijen
Meetwaarden of observaties: waarde van een onderzoekselement op een variabele
Onderzoekselementen of cases: Datgene waar we iets over willen zeggen
onderzoekselementen
Aggregatieniveaus
- Micro: individuen (burgers, studenten, tieners)
- Meso: organisaties, beroepsgroepen, scholen
- Macro: gemeenten, landen, provincies
3
, Ecologische meetfout: op basis van gegevens op macro (/meso) niveau uitspraken doen over
het micro-niveau (Simpson paradox)
variabelen
Meten van variabelen
Conceptualisering: wat wil je meten?
Indicering: hoe het theoretisch concept empirisch meten? – validiteit: meet je wat je wil
meten?
Operationalisering: hoe ga je het registreren?
o Belang v antwoordschalen
o Betrouwbaarheid: leveren verschillende metingen hetzelfde resultaat op?
(interpersoonlijk: meerdere indicatoren of intertemporeel: op verschillende momenten)
Kwalitatieve/ categorische meetniveaus
Ordinaal: linkert-schaal (eens-oneens), onderwijsniveau, aantal sterren hotel
Vb: resultaat wedstrijd (winnen-gelijk-verliezen)
Nominaal: geslacht, politieke partijvoorkeur, haarkleur, regio
Vb: soorten olympische diciplines
Kwantitatieve meetniveaus
Ratio: afstand, leeftijd, aantallen, inkomen
Vb: leeftijd eendagsvlieg, aantal politieke partijen
Interval: jaartelling, IQ, temperatuur (Celsius, Fahrenheit)
Kwantitatieve variabelen (interval/ratio) kunnen discreet of continue zijn
Discreet = variabele kan een beperkt aantal waarden aannemen
Vb: gezinsomvang, leeftijd gemeten in hele jaren, aantal radio zenders, resultaat wedstrijd,
soorten olympische disciplines
Continue = variabele kan een oneindig aantal waarden aannemen
4