100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Statistiek voor humane wetenschappen F0FG1A €12,59
In winkelwagen

Samenvatting

Samenvatting Statistiek voor humane wetenschappen F0FG1A

 6 keer bekeken  0 keer verkocht

Vak gebaseerd op de cursus van Speelman.

Voorbeeld 6 van de 133  pagina's

  • 22 mei 2024
  • 133
  • 2022/2023
  • Samenvatting
Alle documenten voor dit vak (1)
avatar-seller
linnrademaekers2
Statistiek voor humane
wetenschappen

Linn Rademaekers
Schakeljaar Bedrijfscommunicatie

,1. Introductie van de datasets ....................................................................................................... 4

Kolomtypes in de datasets ................................................................................................................................... 4
Meten en meetniveaus ......................................................................................................................................... 4
Categoriaal meetniveau ................................................................................................................................................... 4
1. Nominaal meetniveau ............................................................................................................................................. 4
2. Ordinaal meetniveau ............................................................................................................................................... 4
Numerisch meetniveau ...................................................................................................................................................... 5
3. Interval niveau ........................................................................................................................................................... 5
4. Ratio niveau ............................................................................................................................................................... 5
5. Discreet niveau .......................................................................................................................................................... 5
6. Continu niveau .......................................................................................................................................................... 5

2. Introductie RStudio ...................................................................................................................... 6

3. Descriptieve of beschrijvende statistiek ................................................................................. 15

Centrummaten (measures of central tendency) ............................................................................................. 16
Gemiddelde (mean) ........................................................................................................................................................ 16
Standaard gemiddelde ...................................................................................................................................................... 16
Gewogen gemiddelde....................................................................................................................................................... 16
Wegingscoëfficiënten ......................................................................................................................................................... 17
Mediaan (median) ........................................................................................................................................................... 18
Gemiddelde versus mediaan ............................................................................................................................................ 18
Modus (mode) .................................................................................................................................................................. 19
Modus bij categoriale variabelen ..................................................................................................................................... 19
Modus bij numerische variabelen ..................................................................................................................................... 19

Spreidingsmaten (measures of dispersion) ...................................................................................................... 21
Bereik (range) ................................................................................................................................................................... 21
Variantie (variance) ......................................................................................................................................................... 21
Standaarddeviatie (standard deviation) ....................................................................................................................... 23
Standaardiseren van variabelen....................................................................................................................................... 23
Variantiecoëfficiënt (coëfficient of variation)................................................................................................................ 23
Interkwartielbereik (interquartile range) ......................................................................................................................... 24
Covariantie (covariance) ................................................................................................................................................ 25
Correlatie (pearson product-moment correlation) ....................................................................................................... 27

4. Visualisatie van data ................................................................................................................. 31

Staafdiagram (bar plot) voor categorische data ............................................................................................ 31
Histogram en dichtheidsgrafiek (density plot) ................................................................................................. 31
Histogram in R (frequentie- en dichtheidshistogram) .................................................................................................... 32
Frequentiehistogram in R .................................................................................................................................................... 34
Dichtheidshistogram in R .................................................................................................................................................... 35
Toevoegen tapijt (rug plot) ................................................................................................................................................ 36
Rijk dichtheidshistogram in R .............................................................................................................................................. 37

Cumulatieve frequentiegrafiek .......................................................................................................................... 38

,Boxplot ................................................................................................................................................................. 39
Smooth lines toevoegen aan scatter plots ....................................................................................................... 42

5. Kansverdelingen (probability distributions) ........................................................................... 44

Stochastisch/willekeurige proeven (random experiment) ............................................................................. 44
Kansen (probability) ........................................................................................................................................... 45
Basic probability axioms and rules (kanswetten) ........................................................................................................... 47
Kansbomen (probability trees) ........................................................................................................................................ 48
Regel van Bayes voor gestratificeerde data (niet aselect) .......................................................................................... 51

Kansverdeling (probability distribution) ............................................................................................................ 52
1. Dichtheidsfunctie (desity function) ........................................................................................................................ 53
2. Verdelingsfunctie (cumulative distribution function) ........................................................................................... 54
3. Kwantielfunctie (quantile function) ....................................................................................................................... 55

Populatie-parameters ......................................................................................................................................... 55
Populatiegemiddelde μ ................................................................................................................................................... 55
Populatievariantie σ2........................................................................................................................................................ 57
Populatiestandaarddeviatie σ ........................................................................................................................................ 57

Statistische modellen voor kansverdeling ........................................................................................................ 57
Modellen voor discrete variabelen ................................................................................................................................. 57
1. Binaire verdeling: X ~ B (p) ..................................................................................................................................... 58
2. Binomiale verdeling: X ~ B (n, p) ........................................................................................................................... 59
3. Poissonverdeling: X ~ Pois (λ) ................................................................................................................................. 61
Modellen voor continue variabelen ............................................................................................................................... 63
4. Exponentiële verdeling: X ~ Exp (λ) ...................................................................................................................... 63
5. Normale verdeling: X ~ N (μ, σ2) .......................................................................................................................... 64

Centrale Limiet Stelling ....................................................................................................................................... 67
CLT voor een som ............................................................................................................................................................. 67
CLT voor een gemiddelde ............................................................................................................................................... 67

6. Normaliteitstoetsen.................................................................................................................... 77

Normaal kwantieldiagram (normal QQ plot) ................................................................................................... 77
Shapiro-Wilktoets ................................................................................................................................................. 82
Lilliefors-toets ....................................................................................................................................................... 83

7. Betrouwbaarheidsintervallen ................................................................................................... 84

Steekproefverdeling van X en zijn standaardiseringen .................................................................................. 86
Z-verdeling: berekening variabele Z en zobs .................................................................................................................... 86
T-verdeling: berekening variabele T en tobs .................................................................................................................... 87

Betrouwbaarheidsinterval met T-verdeling ...................................................................................................... 88
Betrouwbaarheidsniveau, foutenniveau, foutmarge en standaardfout ........................................................ 89
Betrouwbaarheidsinterval met Z-verdeling ...................................................................................................... 90
Betrouwbaarheidsinterval voor een proportie ................................................................................................. 91
Vereiste steekproefomvang voor een specifieke foutenmarge .................................................................... 92

, Voor gemiddelde ............................................................................................................................................................. 92
Voor proportie................................................................................................................................................................... 92

8. Hypotheses ................................................................................................................................. 93

Tweezijdige t-toets voor het gemiddelde ......................................................................................................... 93
Een ‘wat als’-redenering .................................................................................................................................................. 94
P-waarde........................................................................................................................................................................... 97

Eenzijdige t-toets voor gemiddelde (rechterstaart) ........................................................................................ 99
Eenzijdige t-toets voor gemiddelde (linkerstaart) ......................................................................................... 101
Relatie tussen tweezijdige t-toets en betrouwbaarheidsinterval.................................................................. 102
De z-toets voor het gemiddelde ...................................................................................................................... 103
Maten voor effecten ......................................................................................................................................... 105
Effectgrootte ................................................................................................................................................................... 105

Parametrische en niet-parametrische toetsen .............................................................................................. 107
Parametrische toetsen ................................................................................................................................................... 107
Niet-parametrische toetsen ........................................................................................................................................... 107

9. Statistische testen in de praktijk ............................................................................................ 108

Testen van de centrale tendens van een numerieke variabele .................................................................. 108
1. T-toets voor populatiegemiddelde voor één groep .......................................................................................... 108
Effectgrootte (herhaling) ............................................................................................................................................... 109
Functie cohensD() ............................................................................................................................................................. 110
2. Wilcoxon-toetsen voor één groep ....................................................................................................................... 112
3. T-toets voor gemiddelde voor twee gepaarde groepen.................................................................................. 114
4. Wilcoxon test voor twee gepaarde groepen ..................................................................................................... 115
5. T-toets voor gemiddelde voor twee onafhankelijke groepen met gelijke variantie ....................................... 116
6. T-toets voor gemiddelde voor twee onafhankelijke groepen met ongelijke variantie................................... 117
7. Wilcoxontoets voor twee onafhankelijke groepen ............................................................................................ 118

Toetsen voor frequentietabellen ...................................................................................................................... 120
X2-test voor goodness of fit: 1 dimensie ........................................................................................................................ 120
Berekening van de toets X2 .............................................................................................................................................. 121
Berekening teststatistiek X2 ............................................................................................................................................... 121
Cochran-regel .................................................................................................................................................................... 122
X2 -toets voor onafhankelijkheid: 2 dimensies .............................................................................................................. 124
Verwachte frequentie....................................................................................................................................................... 125
Teststatistiek X2 .................................................................................................................................................................... 126
X2-toets voor homogeniteit bij onafhankelijke groepen .............................................................................................. 127

Toetsen voor proporties .................................................................................................................................... 128
t-toets voor proportie ..................................................................................................................................................... 128
Binomiale toets voor proportie ...................................................................................................................................... 129

Toetsen voor correlatie ..................................................................................................................................... 130
Pearson-correlatietoets .................................................................................................................................................. 130
Spearman-rangcorrelatietoets ...................................................................................................................................... 131

,1. Introductie van de datasets
Kolomtypes in de datasets
Casus: European Social Survey

• Cross-nationale dataset die elke 2 jaar in Europa verzameld wordt
• Doel: landen vergelijken op vlak van (politieke) visies, progressiviteit
• Alsook evoluties in kaart brengen

Stap 1: probleemstelling
Hoe verhouden politieke en sociale opinies van Eu burgers zich t.o.v. elkaar?

Stap 2: verzamelen data
Cross-nationale steekproef

Stap 3: meten van gegevens
Publieke opinies, gedrag, socio-demografische gegevens

Classificatie van gegevens

• Kenmerken = variabele: kenmerken, geobserveerde eigenschappen bij onderzoekseenheden
• Uitkomstenverzameling: verzameling van alle mogelijke uitkomsten van een variabele
• Meetprocedure: wijze waarop gegevens gemeten worden

Kwalitatieve en kwalitatieve meetschalen

• Kwalitatief: categoriaal meetniveau
• Kwantitatief: numerisch meetniveau


Meten en meetniveaus
Categoriaal meetniveau

1. Nominaal meetniveau

• De data kunnen alleen worden gecategoriseerd, zonder duidelijke rangorde.
• Je kunt je data categoriseren door labels toe te kennen.
• Elk datapunt kan maar tot één label behoren en er is geen rangorde.
• Bv. geboorteplaats, gender, nationaliteit.

2. Ordinaal meetniveau

• De data kunnen worden gecategoriseerd en er is sprake van een duidelijke rangorde.
• Maar je kunt niets zeggen over de intervallen tussen de categorieën.
• De intervallen zijn niet te bepalen of niet betekenisvol.
• Bv. top 10 bestsellers, taalvaardigheid (hoog, middel, laag), Likertschaal-vragen.

Voorbeeld: Likertschaal

niet akkoord neutraal akkoord
wat wij denken -1 0 1
wat het kan zijn -10 0 2

• We denken dat we de afstanden tussen de categorieën kennen, maar dat is niet zo.
• Het kan zijn dat “niet akkoord” veel zwaarder doorweegt dan “akkoord”.



4

, Numerisch meetniveau

Op dit niveau kan je centrummaten berekenen: modus, mediaan en gemiddelde.
Ze helpen ons een typische meting in onze data te capteren.

Opdeling 1

3. Interval niveau

• De data worden gecategoriseerd, er is rangorde en intervallen tussen de categorieën zijn gelijk.
• Er is geen betekenisvol of absoluut nulpunt.
• Bv. scores op een toets, scores op persoonlijkheidstest, graden Celsius.
• Het verschil tussen twee opeenvolgende temperaturen is hetzelfde: 1 graad.
• Je kunt dus spreken van gelijke intervallen. Nul graden betekent niet dat er geen temperatuur is.

4. Ratio niveau

• Gecategoriseerd, rangorde, intervallen tussen categorieën gelijk en er is betekenisvol nulpunt.
• Bv. lengte, leeftijd, gewicht, temperatuur in Kelvin.
• Een betekenisvol nulpunt betekent dat de bestudeerde variabele bij 0 helemaal afwezig is.
• Bij ratioschalen staat 0 dus gelijk aan die absolute afwezigheid van de eigenschap.

Op ratio niveau kan je 2 spreidingsmaten toepassen:

• Ze berekenen spreidingsmaten t.o.v. een centrummaat (gemiddelde, modus, mediaan).
• Toepassen op ratio niveau (niet op interval niveau) omdat je een absoluut nulpunt nodig hebt.
• Standaarddeviatie: deze berekening is meetschaalafhankelijk.
o Je drukt de afwijking uit in dezelfde maat als de centrummaat.
o Hoeveel de geobserveerde waardes afwijken van het gemiddelde, mediaan of modus.
o Bv. standaarddeviatie is 3 cm voor het gemiddelde van de lengte (uitgedrukt in cm).
• Variatiecoëfficiënt: deze berekening is meetschaalonafhankelijk.
o Je drukt de afwijking uit in de vorm van een percentage.
o Hoeveel de geobserveerde waardes procentueel afwijken van de centrummaat.
o De variantiecoëfficiënt is 1,68% → 3 cm afwijking / totale lengte van 179 cm.

Opdeling 2

5. Discreet niveau

Tellingen

• Een discrete variabelen kan enkel gehele getallen aannemen (geen komma’s).
• Bv. er kan 1 auto langs zijn gereden, maar ook 30 auto’s of zelfs 100. Alleen geen 4,5 auto’s.
• Bv. je zus kan 2, 3 of 4 kinderen hebben. Alleen geen 1,5 kind.

6. Continu niveau

Metingen

• Een continue variabele kan letterlijk elke waarde aannemen.
• Bv. de lengte van een persoon, het gewicht van een dier, de temperatuur in Amsterdam.




5

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper linnrademaekers2. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €12,59. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 53022 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€12,59
  • (0)
In winkelwagen
Toegevoegd