Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien
logo-home
Samenvatting Statistiek voor humane wetenschappen F0FG1A €12,59   Ajouter au panier

Resume

Samenvatting Statistiek voor humane wetenschappen F0FG1A

 4 vues  0 fois vendu

Vak gebaseerd op de cursus van Speelman.

Aperçu 6 sur 133  pages

  • 22 mai 2024
  • 133
  • 2022/2023
  • Resume
Tous les documents sur ce sujet (1)
avatar-seller
linnrademaekers2
Statistiek voor humane
wetenschappen

Linn Rademaekers
Schakeljaar Bedrijfscommunicatie

,1. Introductie van de datasets ....................................................................................................... 4

Kolomtypes in de datasets ................................................................................................................................... 4
Meten en meetniveaus ......................................................................................................................................... 4
Categoriaal meetniveau ................................................................................................................................................... 4
1. Nominaal meetniveau ............................................................................................................................................. 4
2. Ordinaal meetniveau ............................................................................................................................................... 4
Numerisch meetniveau ...................................................................................................................................................... 5
3. Interval niveau ........................................................................................................................................................... 5
4. Ratio niveau ............................................................................................................................................................... 5
5. Discreet niveau .......................................................................................................................................................... 5
6. Continu niveau .......................................................................................................................................................... 5

2. Introductie RStudio ...................................................................................................................... 6

3. Descriptieve of beschrijvende statistiek ................................................................................. 15

Centrummaten (measures of central tendency) ............................................................................................. 16
Gemiddelde (mean) ........................................................................................................................................................ 16
Standaard gemiddelde ...................................................................................................................................................... 16
Gewogen gemiddelde....................................................................................................................................................... 16
Wegingscoëfficiënten ......................................................................................................................................................... 17
Mediaan (median) ........................................................................................................................................................... 18
Gemiddelde versus mediaan ............................................................................................................................................ 18
Modus (mode) .................................................................................................................................................................. 19
Modus bij categoriale variabelen ..................................................................................................................................... 19
Modus bij numerische variabelen ..................................................................................................................................... 19

Spreidingsmaten (measures of dispersion) ...................................................................................................... 21
Bereik (range) ................................................................................................................................................................... 21
Variantie (variance) ......................................................................................................................................................... 21
Standaarddeviatie (standard deviation) ....................................................................................................................... 23
Standaardiseren van variabelen....................................................................................................................................... 23
Variantiecoëfficiënt (coëfficient of variation)................................................................................................................ 23
Interkwartielbereik (interquartile range) ......................................................................................................................... 24
Covariantie (covariance) ................................................................................................................................................ 25
Correlatie (pearson product-moment correlation) ....................................................................................................... 27

4. Visualisatie van data ................................................................................................................. 31

Staafdiagram (bar plot) voor categorische data ............................................................................................ 31
Histogram en dichtheidsgrafiek (density plot) ................................................................................................. 31
Histogram in R (frequentie- en dichtheidshistogram) .................................................................................................... 32
Frequentiehistogram in R .................................................................................................................................................... 34
Dichtheidshistogram in R .................................................................................................................................................... 35
Toevoegen tapijt (rug plot) ................................................................................................................................................ 36
Rijk dichtheidshistogram in R .............................................................................................................................................. 37

Cumulatieve frequentiegrafiek .......................................................................................................................... 38

,Boxplot ................................................................................................................................................................. 39
Smooth lines toevoegen aan scatter plots ....................................................................................................... 42

5. Kansverdelingen (probability distributions) ........................................................................... 44

Stochastisch/willekeurige proeven (random experiment) ............................................................................. 44
Kansen (probability) ........................................................................................................................................... 45
Basic probability axioms and rules (kanswetten) ........................................................................................................... 47
Kansbomen (probability trees) ........................................................................................................................................ 48
Regel van Bayes voor gestratificeerde data (niet aselect) .......................................................................................... 51

Kansverdeling (probability distribution) ............................................................................................................ 52
1. Dichtheidsfunctie (desity function) ........................................................................................................................ 53
2. Verdelingsfunctie (cumulative distribution function) ........................................................................................... 54
3. Kwantielfunctie (quantile function) ....................................................................................................................... 55

Populatie-parameters ......................................................................................................................................... 55
Populatiegemiddelde μ ................................................................................................................................................... 55
Populatievariantie σ2........................................................................................................................................................ 57
Populatiestandaarddeviatie σ ........................................................................................................................................ 57

Statistische modellen voor kansverdeling ........................................................................................................ 57
Modellen voor discrete variabelen ................................................................................................................................. 57
1. Binaire verdeling: X ~ B (p) ..................................................................................................................................... 58
2. Binomiale verdeling: X ~ B (n, p) ........................................................................................................................... 59
3. Poissonverdeling: X ~ Pois (λ) ................................................................................................................................. 61
Modellen voor continue variabelen ............................................................................................................................... 63
4. Exponentiële verdeling: X ~ Exp (λ) ...................................................................................................................... 63
5. Normale verdeling: X ~ N (μ, σ2) .......................................................................................................................... 64

Centrale Limiet Stelling ....................................................................................................................................... 67
CLT voor een som ............................................................................................................................................................. 67
CLT voor een gemiddelde ............................................................................................................................................... 67

6. Normaliteitstoetsen.................................................................................................................... 77

Normaal kwantieldiagram (normal QQ plot) ................................................................................................... 77
Shapiro-Wilktoets ................................................................................................................................................. 82
Lilliefors-toets ....................................................................................................................................................... 83

7. Betrouwbaarheidsintervallen ................................................................................................... 84

Steekproefverdeling van X en zijn standaardiseringen .................................................................................. 86
Z-verdeling: berekening variabele Z en zobs .................................................................................................................... 86
T-verdeling: berekening variabele T en tobs .................................................................................................................... 87

Betrouwbaarheidsinterval met T-verdeling ...................................................................................................... 88
Betrouwbaarheidsniveau, foutenniveau, foutmarge en standaardfout ........................................................ 89
Betrouwbaarheidsinterval met Z-verdeling ...................................................................................................... 90
Betrouwbaarheidsinterval voor een proportie ................................................................................................. 91
Vereiste steekproefomvang voor een specifieke foutenmarge .................................................................... 92

, Voor gemiddelde ............................................................................................................................................................. 92
Voor proportie................................................................................................................................................................... 92

8. Hypotheses ................................................................................................................................. 93

Tweezijdige t-toets voor het gemiddelde ......................................................................................................... 93
Een ‘wat als’-redenering .................................................................................................................................................. 94
P-waarde........................................................................................................................................................................... 97

Eenzijdige t-toets voor gemiddelde (rechterstaart) ........................................................................................ 99
Eenzijdige t-toets voor gemiddelde (linkerstaart) ......................................................................................... 101
Relatie tussen tweezijdige t-toets en betrouwbaarheidsinterval.................................................................. 102
De z-toets voor het gemiddelde ...................................................................................................................... 103
Maten voor effecten ......................................................................................................................................... 105
Effectgrootte ................................................................................................................................................................... 105

Parametrische en niet-parametrische toetsen .............................................................................................. 107
Parametrische toetsen ................................................................................................................................................... 107
Niet-parametrische toetsen ........................................................................................................................................... 107

9. Statistische testen in de praktijk ............................................................................................ 108

Testen van de centrale tendens van een numerieke variabele .................................................................. 108
1. T-toets voor populatiegemiddelde voor één groep .......................................................................................... 108
Effectgrootte (herhaling) ............................................................................................................................................... 109
Functie cohensD() ............................................................................................................................................................. 110
2. Wilcoxon-toetsen voor één groep ....................................................................................................................... 112
3. T-toets voor gemiddelde voor twee gepaarde groepen.................................................................................. 114
4. Wilcoxon test voor twee gepaarde groepen ..................................................................................................... 115
5. T-toets voor gemiddelde voor twee onafhankelijke groepen met gelijke variantie ....................................... 116
6. T-toets voor gemiddelde voor twee onafhankelijke groepen met ongelijke variantie................................... 117
7. Wilcoxontoets voor twee onafhankelijke groepen ............................................................................................ 118

Toetsen voor frequentietabellen ...................................................................................................................... 120
X2-test voor goodness of fit: 1 dimensie ........................................................................................................................ 120
Berekening van de toets X2 .............................................................................................................................................. 121
Berekening teststatistiek X2 ............................................................................................................................................... 121
Cochran-regel .................................................................................................................................................................... 122
X2 -toets voor onafhankelijkheid: 2 dimensies .............................................................................................................. 124
Verwachte frequentie....................................................................................................................................................... 125
Teststatistiek X2 .................................................................................................................................................................... 126
X2-toets voor homogeniteit bij onafhankelijke groepen .............................................................................................. 127

Toetsen voor proporties .................................................................................................................................... 128
t-toets voor proportie ..................................................................................................................................................... 128
Binomiale toets voor proportie ...................................................................................................................................... 129

Toetsen voor correlatie ..................................................................................................................................... 130
Pearson-correlatietoets .................................................................................................................................................. 130
Spearman-rangcorrelatietoets ...................................................................................................................................... 131

,1. Introductie van de datasets
Kolomtypes in de datasets
Casus: European Social Survey

• Cross-nationale dataset die elke 2 jaar in Europa verzameld wordt
• Doel: landen vergelijken op vlak van (politieke) visies, progressiviteit
• Alsook evoluties in kaart brengen

Stap 1: probleemstelling
Hoe verhouden politieke en sociale opinies van Eu burgers zich t.o.v. elkaar?

Stap 2: verzamelen data
Cross-nationale steekproef

Stap 3: meten van gegevens
Publieke opinies, gedrag, socio-demografische gegevens

Classificatie van gegevens

• Kenmerken = variabele: kenmerken, geobserveerde eigenschappen bij onderzoekseenheden
• Uitkomstenverzameling: verzameling van alle mogelijke uitkomsten van een variabele
• Meetprocedure: wijze waarop gegevens gemeten worden

Kwalitatieve en kwalitatieve meetschalen

• Kwalitatief: categoriaal meetniveau
• Kwantitatief: numerisch meetniveau


Meten en meetniveaus
Categoriaal meetniveau

1. Nominaal meetniveau

• De data kunnen alleen worden gecategoriseerd, zonder duidelijke rangorde.
• Je kunt je data categoriseren door labels toe te kennen.
• Elk datapunt kan maar tot één label behoren en er is geen rangorde.
• Bv. geboorteplaats, gender, nationaliteit.

2. Ordinaal meetniveau

• De data kunnen worden gecategoriseerd en er is sprake van een duidelijke rangorde.
• Maar je kunt niets zeggen over de intervallen tussen de categorieën.
• De intervallen zijn niet te bepalen of niet betekenisvol.
• Bv. top 10 bestsellers, taalvaardigheid (hoog, middel, laag), Likertschaal-vragen.

Voorbeeld: Likertschaal

niet akkoord neutraal akkoord
wat wij denken -1 0 1
wat het kan zijn -10 0 2

• We denken dat we de afstanden tussen de categorieën kennen, maar dat is niet zo.
• Het kan zijn dat “niet akkoord” veel zwaarder doorweegt dan “akkoord”.



4

, Numerisch meetniveau

Op dit niveau kan je centrummaten berekenen: modus, mediaan en gemiddelde.
Ze helpen ons een typische meting in onze data te capteren.

Opdeling 1

3. Interval niveau

• De data worden gecategoriseerd, er is rangorde en intervallen tussen de categorieën zijn gelijk.
• Er is geen betekenisvol of absoluut nulpunt.
• Bv. scores op een toets, scores op persoonlijkheidstest, graden Celsius.
• Het verschil tussen twee opeenvolgende temperaturen is hetzelfde: 1 graad.
• Je kunt dus spreken van gelijke intervallen. Nul graden betekent niet dat er geen temperatuur is.

4. Ratio niveau

• Gecategoriseerd, rangorde, intervallen tussen categorieën gelijk en er is betekenisvol nulpunt.
• Bv. lengte, leeftijd, gewicht, temperatuur in Kelvin.
• Een betekenisvol nulpunt betekent dat de bestudeerde variabele bij 0 helemaal afwezig is.
• Bij ratioschalen staat 0 dus gelijk aan die absolute afwezigheid van de eigenschap.

Op ratio niveau kan je 2 spreidingsmaten toepassen:

• Ze berekenen spreidingsmaten t.o.v. een centrummaat (gemiddelde, modus, mediaan).
• Toepassen op ratio niveau (niet op interval niveau) omdat je een absoluut nulpunt nodig hebt.
• Standaarddeviatie: deze berekening is meetschaalafhankelijk.
o Je drukt de afwijking uit in dezelfde maat als de centrummaat.
o Hoeveel de geobserveerde waardes afwijken van het gemiddelde, mediaan of modus.
o Bv. standaarddeviatie is 3 cm voor het gemiddelde van de lengte (uitgedrukt in cm).
• Variatiecoëfficiënt: deze berekening is meetschaalonafhankelijk.
o Je drukt de afwijking uit in de vorm van een percentage.
o Hoeveel de geobserveerde waardes procentueel afwijken van de centrummaat.
o De variantiecoëfficiënt is 1,68% → 3 cm afwijking / totale lengte van 179 cm.

Opdeling 2

5. Discreet niveau

Tellingen

• Een discrete variabelen kan enkel gehele getallen aannemen (geen komma’s).
• Bv. er kan 1 auto langs zijn gereden, maar ook 30 auto’s of zelfs 100. Alleen geen 4,5 auto’s.
• Bv. je zus kan 2, 3 of 4 kinderen hebben. Alleen geen 1,5 kind.

6. Continu niveau

Metingen

• Een continue variabele kan letterlijk elke waarde aannemen.
• Bv. de lengte van een persoon, het gewicht van een dier, de temperatuur in Amsterdam.




5

Les avantages d'acheter des résumés chez Stuvia:

Qualité garantie par les avis des clients

Qualité garantie par les avis des clients

Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.

L’achat facile et rapide

L’achat facile et rapide

Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.

Focus sur l’essentiel

Focus sur l’essentiel

Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur linnrademaekers2. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €12,59. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis)

67096 résumés ont été vendus ces 30 derniers jours

Fondée en 2010, la référence pour acheter des résumés depuis déjà 14 ans

Commencez à vendre!
€12,59
  • (0)
  Ajouter