100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Statistiek voor humane wetenschappen F0FG1A $13.51   Add to cart

Summary

Samenvatting Statistiek voor humane wetenschappen F0FG1A

 4 views  0 purchase
  • Course
  • Institution

Vak gebaseerd op de cursus van Speelman.

Preview 6 out of 133  pages

  • May 22, 2024
  • 133
  • 2022/2023
  • Summary
avatar-seller
Statistiek voor humane
wetenschappen

Linn Rademaekers
Schakeljaar Bedrijfscommunicatie

,1. Introductie van de datasets ....................................................................................................... 4

Kolomtypes in de datasets ................................................................................................................................... 4
Meten en meetniveaus ......................................................................................................................................... 4
Categoriaal meetniveau ................................................................................................................................................... 4
1. Nominaal meetniveau ............................................................................................................................................. 4
2. Ordinaal meetniveau ............................................................................................................................................... 4
Numerisch meetniveau ...................................................................................................................................................... 5
3. Interval niveau ........................................................................................................................................................... 5
4. Ratio niveau ............................................................................................................................................................... 5
5. Discreet niveau .......................................................................................................................................................... 5
6. Continu niveau .......................................................................................................................................................... 5

2. Introductie RStudio ...................................................................................................................... 6

3. Descriptieve of beschrijvende statistiek ................................................................................. 15

Centrummaten (measures of central tendency) ............................................................................................. 16
Gemiddelde (mean) ........................................................................................................................................................ 16
Standaard gemiddelde ...................................................................................................................................................... 16
Gewogen gemiddelde....................................................................................................................................................... 16
Wegingscoëfficiënten ......................................................................................................................................................... 17
Mediaan (median) ........................................................................................................................................................... 18
Gemiddelde versus mediaan ............................................................................................................................................ 18
Modus (mode) .................................................................................................................................................................. 19
Modus bij categoriale variabelen ..................................................................................................................................... 19
Modus bij numerische variabelen ..................................................................................................................................... 19

Spreidingsmaten (measures of dispersion) ...................................................................................................... 21
Bereik (range) ................................................................................................................................................................... 21
Variantie (variance) ......................................................................................................................................................... 21
Standaarddeviatie (standard deviation) ....................................................................................................................... 23
Standaardiseren van variabelen....................................................................................................................................... 23
Variantiecoëfficiënt (coëfficient of variation)................................................................................................................ 23
Interkwartielbereik (interquartile range) ......................................................................................................................... 24
Covariantie (covariance) ................................................................................................................................................ 25
Correlatie (pearson product-moment correlation) ....................................................................................................... 27

4. Visualisatie van data ................................................................................................................. 31

Staafdiagram (bar plot) voor categorische data ............................................................................................ 31
Histogram en dichtheidsgrafiek (density plot) ................................................................................................. 31
Histogram in R (frequentie- en dichtheidshistogram) .................................................................................................... 32
Frequentiehistogram in R .................................................................................................................................................... 34
Dichtheidshistogram in R .................................................................................................................................................... 35
Toevoegen tapijt (rug plot) ................................................................................................................................................ 36
Rijk dichtheidshistogram in R .............................................................................................................................................. 37

Cumulatieve frequentiegrafiek .......................................................................................................................... 38

,Boxplot ................................................................................................................................................................. 39
Smooth lines toevoegen aan scatter plots ....................................................................................................... 42

5. Kansverdelingen (probability distributions) ........................................................................... 44

Stochastisch/willekeurige proeven (random experiment) ............................................................................. 44
Kansen (probability) ........................................................................................................................................... 45
Basic probability axioms and rules (kanswetten) ........................................................................................................... 47
Kansbomen (probability trees) ........................................................................................................................................ 48
Regel van Bayes voor gestratificeerde data (niet aselect) .......................................................................................... 51

Kansverdeling (probability distribution) ............................................................................................................ 52
1. Dichtheidsfunctie (desity function) ........................................................................................................................ 53
2. Verdelingsfunctie (cumulative distribution function) ........................................................................................... 54
3. Kwantielfunctie (quantile function) ....................................................................................................................... 55

Populatie-parameters ......................................................................................................................................... 55
Populatiegemiddelde μ ................................................................................................................................................... 55
Populatievariantie σ2........................................................................................................................................................ 57
Populatiestandaarddeviatie σ ........................................................................................................................................ 57

Statistische modellen voor kansverdeling ........................................................................................................ 57
Modellen voor discrete variabelen ................................................................................................................................. 57
1. Binaire verdeling: X ~ B (p) ..................................................................................................................................... 58
2. Binomiale verdeling: X ~ B (n, p) ........................................................................................................................... 59
3. Poissonverdeling: X ~ Pois (λ) ................................................................................................................................. 61
Modellen voor continue variabelen ............................................................................................................................... 63
4. Exponentiële verdeling: X ~ Exp (λ) ...................................................................................................................... 63
5. Normale verdeling: X ~ N (μ, σ2) .......................................................................................................................... 64

Centrale Limiet Stelling ....................................................................................................................................... 67
CLT voor een som ............................................................................................................................................................. 67
CLT voor een gemiddelde ............................................................................................................................................... 67

6. Normaliteitstoetsen.................................................................................................................... 77

Normaal kwantieldiagram (normal QQ plot) ................................................................................................... 77
Shapiro-Wilktoets ................................................................................................................................................. 82
Lilliefors-toets ....................................................................................................................................................... 83

7. Betrouwbaarheidsintervallen ................................................................................................... 84

Steekproefverdeling van X en zijn standaardiseringen .................................................................................. 86
Z-verdeling: berekening variabele Z en zobs .................................................................................................................... 86
T-verdeling: berekening variabele T en tobs .................................................................................................................... 87

Betrouwbaarheidsinterval met T-verdeling ...................................................................................................... 88
Betrouwbaarheidsniveau, foutenniveau, foutmarge en standaardfout ........................................................ 89
Betrouwbaarheidsinterval met Z-verdeling ...................................................................................................... 90
Betrouwbaarheidsinterval voor een proportie ................................................................................................. 91
Vereiste steekproefomvang voor een specifieke foutenmarge .................................................................... 92

, Voor gemiddelde ............................................................................................................................................................. 92
Voor proportie................................................................................................................................................................... 92

8. Hypotheses ................................................................................................................................. 93

Tweezijdige t-toets voor het gemiddelde ......................................................................................................... 93
Een ‘wat als’-redenering .................................................................................................................................................. 94
P-waarde........................................................................................................................................................................... 97

Eenzijdige t-toets voor gemiddelde (rechterstaart) ........................................................................................ 99
Eenzijdige t-toets voor gemiddelde (linkerstaart) ......................................................................................... 101
Relatie tussen tweezijdige t-toets en betrouwbaarheidsinterval.................................................................. 102
De z-toets voor het gemiddelde ...................................................................................................................... 103
Maten voor effecten ......................................................................................................................................... 105
Effectgrootte ................................................................................................................................................................... 105

Parametrische en niet-parametrische toetsen .............................................................................................. 107
Parametrische toetsen ................................................................................................................................................... 107
Niet-parametrische toetsen ........................................................................................................................................... 107

9. Statistische testen in de praktijk ............................................................................................ 108

Testen van de centrale tendens van een numerieke variabele .................................................................. 108
1. T-toets voor populatiegemiddelde voor één groep .......................................................................................... 108
Effectgrootte (herhaling) ............................................................................................................................................... 109
Functie cohensD() ............................................................................................................................................................. 110
2. Wilcoxon-toetsen voor één groep ....................................................................................................................... 112
3. T-toets voor gemiddelde voor twee gepaarde groepen.................................................................................. 114
4. Wilcoxon test voor twee gepaarde groepen ..................................................................................................... 115
5. T-toets voor gemiddelde voor twee onafhankelijke groepen met gelijke variantie ....................................... 116
6. T-toets voor gemiddelde voor twee onafhankelijke groepen met ongelijke variantie................................... 117
7. Wilcoxontoets voor twee onafhankelijke groepen ............................................................................................ 118

Toetsen voor frequentietabellen ...................................................................................................................... 120
X2-test voor goodness of fit: 1 dimensie ........................................................................................................................ 120
Berekening van de toets X2 .............................................................................................................................................. 121
Berekening teststatistiek X2 ............................................................................................................................................... 121
Cochran-regel .................................................................................................................................................................... 122
X2 -toets voor onafhankelijkheid: 2 dimensies .............................................................................................................. 124
Verwachte frequentie....................................................................................................................................................... 125
Teststatistiek X2 .................................................................................................................................................................... 126
X2-toets voor homogeniteit bij onafhankelijke groepen .............................................................................................. 127

Toetsen voor proporties .................................................................................................................................... 128
t-toets voor proportie ..................................................................................................................................................... 128
Binomiale toets voor proportie ...................................................................................................................................... 129

Toetsen voor correlatie ..................................................................................................................................... 130
Pearson-correlatietoets .................................................................................................................................................. 130
Spearman-rangcorrelatietoets ...................................................................................................................................... 131

,1. Introductie van de datasets
Kolomtypes in de datasets
Casus: European Social Survey

• Cross-nationale dataset die elke 2 jaar in Europa verzameld wordt
• Doel: landen vergelijken op vlak van (politieke) visies, progressiviteit
• Alsook evoluties in kaart brengen

Stap 1: probleemstelling
Hoe verhouden politieke en sociale opinies van Eu burgers zich t.o.v. elkaar?

Stap 2: verzamelen data
Cross-nationale steekproef

Stap 3: meten van gegevens
Publieke opinies, gedrag, socio-demografische gegevens

Classificatie van gegevens

• Kenmerken = variabele: kenmerken, geobserveerde eigenschappen bij onderzoekseenheden
• Uitkomstenverzameling: verzameling van alle mogelijke uitkomsten van een variabele
• Meetprocedure: wijze waarop gegevens gemeten worden

Kwalitatieve en kwalitatieve meetschalen

• Kwalitatief: categoriaal meetniveau
• Kwantitatief: numerisch meetniveau


Meten en meetniveaus
Categoriaal meetniveau

1. Nominaal meetniveau

• De data kunnen alleen worden gecategoriseerd, zonder duidelijke rangorde.
• Je kunt je data categoriseren door labels toe te kennen.
• Elk datapunt kan maar tot één label behoren en er is geen rangorde.
• Bv. geboorteplaats, gender, nationaliteit.

2. Ordinaal meetniveau

• De data kunnen worden gecategoriseerd en er is sprake van een duidelijke rangorde.
• Maar je kunt niets zeggen over de intervallen tussen de categorieën.
• De intervallen zijn niet te bepalen of niet betekenisvol.
• Bv. top 10 bestsellers, taalvaardigheid (hoog, middel, laag), Likertschaal-vragen.

Voorbeeld: Likertschaal

niet akkoord neutraal akkoord
wat wij denken -1 0 1
wat het kan zijn -10 0 2

• We denken dat we de afstanden tussen de categorieën kennen, maar dat is niet zo.
• Het kan zijn dat “niet akkoord” veel zwaarder doorweegt dan “akkoord”.



4

, Numerisch meetniveau

Op dit niveau kan je centrummaten berekenen: modus, mediaan en gemiddelde.
Ze helpen ons een typische meting in onze data te capteren.

Opdeling 1

3. Interval niveau

• De data worden gecategoriseerd, er is rangorde en intervallen tussen de categorieën zijn gelijk.
• Er is geen betekenisvol of absoluut nulpunt.
• Bv. scores op een toets, scores op persoonlijkheidstest, graden Celsius.
• Het verschil tussen twee opeenvolgende temperaturen is hetzelfde: 1 graad.
• Je kunt dus spreken van gelijke intervallen. Nul graden betekent niet dat er geen temperatuur is.

4. Ratio niveau

• Gecategoriseerd, rangorde, intervallen tussen categorieën gelijk en er is betekenisvol nulpunt.
• Bv. lengte, leeftijd, gewicht, temperatuur in Kelvin.
• Een betekenisvol nulpunt betekent dat de bestudeerde variabele bij 0 helemaal afwezig is.
• Bij ratioschalen staat 0 dus gelijk aan die absolute afwezigheid van de eigenschap.

Op ratio niveau kan je 2 spreidingsmaten toepassen:

• Ze berekenen spreidingsmaten t.o.v. een centrummaat (gemiddelde, modus, mediaan).
• Toepassen op ratio niveau (niet op interval niveau) omdat je een absoluut nulpunt nodig hebt.
• Standaarddeviatie: deze berekening is meetschaalafhankelijk.
o Je drukt de afwijking uit in dezelfde maat als de centrummaat.
o Hoeveel de geobserveerde waardes afwijken van het gemiddelde, mediaan of modus.
o Bv. standaarddeviatie is 3 cm voor het gemiddelde van de lengte (uitgedrukt in cm).
• Variatiecoëfficiënt: deze berekening is meetschaalonafhankelijk.
o Je drukt de afwijking uit in de vorm van een percentage.
o Hoeveel de geobserveerde waardes procentueel afwijken van de centrummaat.
o De variantiecoëfficiënt is 1,68% → 3 cm afwijking / totale lengte van 179 cm.

Opdeling 2

5. Discreet niveau

Tellingen

• Een discrete variabelen kan enkel gehele getallen aannemen (geen komma’s).
• Bv. er kan 1 auto langs zijn gereden, maar ook 30 auto’s of zelfs 100. Alleen geen 4,5 auto’s.
• Bv. je zus kan 2, 3 of 4 kinderen hebben. Alleen geen 1,5 kind.

6. Continu niveau

Metingen

• Een continue variabele kan letterlijk elke waarde aannemen.
• Bv. de lengte van een persoon, het gewicht van een dier, de temperatuur in Amsterdam.




5

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller linnrademaekers2. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $13.51. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

72042 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$13.51
  • (0)
  Add to cart