4. Visualisatie van data ................................................................................................................. 31
Staafdiagram (bar plot) voor categorische data ............................................................................................ 31
Histogram en dichtheidsgrafiek (density plot) ................................................................................................. 31
Histogram in R (frequentie- en dichtheidshistogram) .................................................................................................... 32
Frequentiehistogram in R .................................................................................................................................................... 34
Dichtheidshistogram in R .................................................................................................................................................... 35
Toevoegen tapijt (rug plot) ................................................................................................................................................ 36
Rijk dichtheidshistogram in R .............................................................................................................................................. 37
Statistische modellen voor kansverdeling ........................................................................................................ 57
Modellen voor discrete variabelen ................................................................................................................................. 57
1. Binaire verdeling: X ~ B (p) ..................................................................................................................................... 58
2. Binomiale verdeling: X ~ B (n, p) ........................................................................................................................... 59
3. Poissonverdeling: X ~ Pois (λ) ................................................................................................................................. 61
Modellen voor continue variabelen ............................................................................................................................... 63
4. Exponentiële verdeling: X ~ Exp (λ) ...................................................................................................................... 63
5. Normale verdeling: X ~ N (μ, σ2) .......................................................................................................................... 64
Centrale Limiet Stelling ....................................................................................................................................... 67
CLT voor een som ............................................................................................................................................................. 67
CLT voor een gemiddelde ............................................................................................................................................... 67
Steekproefverdeling van X en zijn standaardiseringen .................................................................................. 86
Z-verdeling: berekening variabele Z en zobs .................................................................................................................... 86
T-verdeling: berekening variabele T en tobs .................................................................................................................... 87
Betrouwbaarheidsinterval met T-verdeling ...................................................................................................... 88
Betrouwbaarheidsniveau, foutenniveau, foutmarge en standaardfout ........................................................ 89
Betrouwbaarheidsinterval met Z-verdeling ...................................................................................................... 90
Betrouwbaarheidsinterval voor een proportie ................................................................................................. 91
Vereiste steekproefomvang voor een specifieke foutenmarge .................................................................... 92
, Voor gemiddelde ............................................................................................................................................................. 92
Voor proportie................................................................................................................................................................... 92
Tweezijdige t-toets voor het gemiddelde ......................................................................................................... 93
Een ‘wat als’-redenering .................................................................................................................................................. 94
P-waarde........................................................................................................................................................................... 97
Eenzijdige t-toets voor gemiddelde (rechterstaart) ........................................................................................ 99
Eenzijdige t-toets voor gemiddelde (linkerstaart) ......................................................................................... 101
Relatie tussen tweezijdige t-toets en betrouwbaarheidsinterval.................................................................. 102
De z-toets voor het gemiddelde ...................................................................................................................... 103
Maten voor effecten ......................................................................................................................................... 105
Effectgrootte ................................................................................................................................................................... 105
9. Statistische testen in de praktijk ............................................................................................ 108
Testen van de centrale tendens van een numerieke variabele .................................................................. 108
1. T-toets voor populatiegemiddelde voor één groep .......................................................................................... 108
Effectgrootte (herhaling) ............................................................................................................................................... 109
Functie cohensD() ............................................................................................................................................................. 110
2. Wilcoxon-toetsen voor één groep ....................................................................................................................... 112
3. T-toets voor gemiddelde voor twee gepaarde groepen.................................................................................. 114
4. Wilcoxon test voor twee gepaarde groepen ..................................................................................................... 115
5. T-toets voor gemiddelde voor twee onafhankelijke groepen met gelijke variantie ....................................... 116
6. T-toets voor gemiddelde voor twee onafhankelijke groepen met ongelijke variantie................................... 117
7. Wilcoxontoets voor twee onafhankelijke groepen ............................................................................................ 118
Toetsen voor frequentietabellen ...................................................................................................................... 120
X2-test voor goodness of fit: 1 dimensie ........................................................................................................................ 120
Berekening van de toets X2 .............................................................................................................................................. 121
Berekening teststatistiek X2 ............................................................................................................................................... 121
Cochran-regel .................................................................................................................................................................... 122
X2 -toets voor onafhankelijkheid: 2 dimensies .............................................................................................................. 124
Verwachte frequentie....................................................................................................................................................... 125
Teststatistiek X2 .................................................................................................................................................................... 126
X2-toets voor homogeniteit bij onafhankelijke groepen .............................................................................................. 127
Toetsen voor proporties .................................................................................................................................... 128
t-toets voor proportie ..................................................................................................................................................... 128
Binomiale toets voor proportie ...................................................................................................................................... 129
,1. Introductie van de datasets
Kolomtypes in de datasets
Casus: European Social Survey
• Cross-nationale dataset die elke 2 jaar in Europa verzameld wordt
• Doel: landen vergelijken op vlak van (politieke) visies, progressiviteit
• Alsook evoluties in kaart brengen
Stap 1: probleemstelling
Hoe verhouden politieke en sociale opinies van Eu burgers zich t.o.v. elkaar?
Stap 2: verzamelen data
Cross-nationale steekproef
Stap 3: meten van gegevens
Publieke opinies, gedrag, socio-demografische gegevens
Classificatie van gegevens
• Kenmerken = variabele: kenmerken, geobserveerde eigenschappen bij onderzoekseenheden
• Uitkomstenverzameling: verzameling van alle mogelijke uitkomsten van een variabele
• Meetprocedure: wijze waarop gegevens gemeten worden
• De data kunnen alleen worden gecategoriseerd, zonder duidelijke rangorde.
• Je kunt je data categoriseren door labels toe te kennen.
• Elk datapunt kan maar tot één label behoren en er is geen rangorde.
• Bv. geboorteplaats, gender, nationaliteit.
2. Ordinaal meetniveau
• De data kunnen worden gecategoriseerd en er is sprake van een duidelijke rangorde.
• Maar je kunt niets zeggen over de intervallen tussen de categorieën.
• De intervallen zijn niet te bepalen of niet betekenisvol.
• Bv. top 10 bestsellers, taalvaardigheid (hoog, middel, laag), Likertschaal-vragen.
Voorbeeld: Likertschaal
niet akkoord neutraal akkoord
wat wij denken -1 0 1
wat het kan zijn -10 0 2
• We denken dat we de afstanden tussen de categorieën kennen, maar dat is niet zo.
• Het kan zijn dat “niet akkoord” veel zwaarder doorweegt dan “akkoord”.
4
, Numerisch meetniveau
Op dit niveau kan je centrummaten berekenen: modus, mediaan en gemiddelde.
Ze helpen ons een typische meting in onze data te capteren.
Opdeling 1
3. Interval niveau
• De data worden gecategoriseerd, er is rangorde en intervallen tussen de categorieën zijn gelijk.
• Er is geen betekenisvol of absoluut nulpunt.
• Bv. scores op een toets, scores op persoonlijkheidstest, graden Celsius.
• Het verschil tussen twee opeenvolgende temperaturen is hetzelfde: 1 graad.
• Je kunt dus spreken van gelijke intervallen. Nul graden betekent niet dat er geen temperatuur is.
4. Ratio niveau
• Gecategoriseerd, rangorde, intervallen tussen categorieën gelijk en er is betekenisvol nulpunt.
• Bv. lengte, leeftijd, gewicht, temperatuur in Kelvin.
• Een betekenisvol nulpunt betekent dat de bestudeerde variabele bij 0 helemaal afwezig is.
• Bij ratioschalen staat 0 dus gelijk aan die absolute afwezigheid van de eigenschap.
Op ratio niveau kan je 2 spreidingsmaten toepassen:
• Ze berekenen spreidingsmaten t.o.v. een centrummaat (gemiddelde, modus, mediaan).
• Toepassen op ratio niveau (niet op interval niveau) omdat je een absoluut nulpunt nodig hebt.
• Standaarddeviatie: deze berekening is meetschaalafhankelijk.
o Je drukt de afwijking uit in dezelfde maat als de centrummaat.
o Hoeveel de geobserveerde waardes afwijken van het gemiddelde, mediaan of modus.
o Bv. standaarddeviatie is 3 cm voor het gemiddelde van de lengte (uitgedrukt in cm).
• Variatiecoëfficiënt: deze berekening is meetschaalonafhankelijk.
o Je drukt de afwijking uit in de vorm van een percentage.
o Hoeveel de geobserveerde waardes procentueel afwijken van de centrummaat.
o De variantiecoëfficiënt is 1,68% → 3 cm afwijking / totale lengte van 179 cm.
Opdeling 2
5. Discreet niveau
Tellingen
• Een discrete variabelen kan enkel gehele getallen aannemen (geen komma’s).
• Bv. er kan 1 auto langs zijn gereden, maar ook 30 auto’s of zelfs 100. Alleen geen 4,5 auto’s.
• Bv. je zus kan 2, 3 of 4 kinderen hebben. Alleen geen 1,5 kind.
6. Continu niveau
Metingen
• Een continue variabele kan letterlijk elke waarde aannemen.
• Bv. de lengte van een persoon, het gewicht van een dier, de temperatuur in Amsterdam.
5
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper linnrademaekers2. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €12,59. Je zit daarna nergens aan vast.