Chapter 11: betrouwbaarheidsintervallen en hypothesetoetsen voor gemiddeldes ...................................... 20
1. De centrale limietstelling ......................................................................................................................... 20
1.1. Simuleren van een steekproevenverdeling van een gemiddelde .................................................. 20
1.2. De centrale limietstelling ............................................................................................................... 21
2. De steekproevenverdeling van het gemiddelde ...................................................................................... 21
2.1. Aannames en voorwaarden voor de steekproevenverdeling van het gemiddelde ....................... 22
3. Hoe steekproevenverdelingsmodellen werken ........................................................................................ 22
3.1. Standaardfout ................................................................................................................................ 22
3.2. Hoe steekproevenverdelingsmodellen werken ............................................................................. 23
4. Gosset en de de t-verdeling ..................................................................................................................... 24
4.1. Analogie met fracties ..................................................................................................................... 24
4.2. Standaardfout ................................................................................................................................ 24
4.3. Gosset’s t ....................................................................................................................................... 24
4.4. Voorbeeld ...................................................................................................................................... 25
4.5. Gosset en de t-verdeling ................................................................................................................ 25
5. Een betrouwbaarheidsinterval voor gemiddeldes ................................................................................... 25
5.1. Vrijheidsgraden: waarom n-1 ........................................................................................................ 25
5.2. t-waarden vinden........................................................................................................................... 25
5.3. Voorbeeld ...................................................................................................................................... 26
6. Aannames en voorwaarden .................................................................................................................... 26
6.1. Aanname van normaal-verdeelde populatie ................................................................................. 26
6.2. Voorbeeld: controleer aannames en voorwaarden ....................................................................... 27
6.3. Waarschuwingen over het interpreteren van betrouwbaarheidsintervallen ................................ 27
7. Testen van hypothesen over gemiddeldes – de One-Sample-t-test......................................................... 27
7.1. Voorbeeld: winkelpatronen ........................................................................................................... 28
7.2. Steekproefomvang......................................................................................................................... 28
7.3. Steekproefomvang: voorbeeld ...................................................................................................... 29
8. Samenvatting .......................................................................................................................................... 29
Chapter 12: Meer over toetsen en intervallen ............................................................................................... 30
1. Hoe om te gaan met P-waarden ............................................................................................................. 30
2. Alfa-niveau en significantie ..................................................................................................................... 30
3. Kritieke waarden ..................................................................................................................................... 31
4. Betrouwbaarheidsintervallen en hypothesetoetsen................................................................................ 32
4.1. Voorbeeld: winkelpatronen ........................................................................................................... 32
5. Twee soorten fouten ............................................................................................................................... 33
6. Onderscheidend vermogen van een toets ............................................................................................... 33
6.1. Onderscheidend vermogen ........................................................................................................... 33
6.2. Verminderen van zowel type-1 als type-2 fouten ......................................................................... 35
6.3. Voorbeeld: Alfa .............................................................................................................................. 35
6.4. Voorbeeld: Fouten ......................................................................................................................... 35
7. Samenvatting .......................................................................................................................................... 36
7.1. Begrijp P-waarden beter ................................................................................................................ 36
7.2. Twee soorten fouten ..................................................................................................................... 36
7.3. Onderscheidend vermogen ........................................................................................................... 36
Chapter 13: Twee gemiddelden vergelijken ................................................................................................... 37
2
, 1. Twee gemiddelden vergelijken ................................................................................................................ 37
2. Two sample t-test/ t-toets voor twee steekproeven ............................................................................... 38
3. Aannames en voorwaarden .................................................................................................................... 39
4. Een betrouwbaarheidsinterval voor het verschil tussen twee gemiddelden ........................................... 40
5. The pooled t-test ..................................................................................................................................... 41
6. Paired data .............................................................................................................................................. 42
6.1. Gepaarde data ............................................................................................................................... 42
6.2. Aannames ...................................................................................................................................... 43
7. Paired t-methods ..................................................................................................................................... 43
8. Samenvatting .......................................................................................................................................... 44
8.1. T-toets voor twee steekproeven.................................................................................................... 44
8.2. Betrouwbaarheidinterval ............................................................................................................... 44
8.3. Gepaarde steeproeven .................................................................................................................. 44
Chapter 14: Chi-kwadraat toetsen ................................................................................................................. 45
1. Goodness of Fit Test ................................................................................................................................ 45
1.1. Aannames en voorwaarden ........................................................................................................... 45
1.2. Chi-kwadraat model....................................................................................................................... 45
1.3. Berekeningen ................................................................................................................................. 46
1.4. Voorbeeld: stock market ‘up’ days ................................................................................................ 46
1.5. Voorbeeld: credit cards ................................................................................................................. 47
2. Chi-kwadraatwaarden interpreteren ...................................................................................................... 47
3. Onderzoek naar de residuen.................................................................................................................... 47
3.1. Chi-kwadraat verdeling .................................................................................................................. 47
3.2. Onderzoek naar de residuen ......................................................................................................... 48
4. De Chi-kwadraat homogeniteitstest........................................................................................................ 48
4.1. Test ................................................................................................................................................ 48
4.2. Aannames en voorwaarden ........................................................................................................... 49
4.3. Berekening ..................................................................................................................................... 49
4.4. Voorbeeld: meer credit cards ........................................................................................................ 49
5. Twee fracties vergelijken ......................................................................................................................... 50
5.1. Twee fracties vergelijken ............................................................................................................... 50
5.2. Betrouwbaarheidsinterval voor het verschil tussen twee fracties ................................................ 50
5.3. Twee fracties vergelijken ............................................................................................................... 50
6. De Chi-kwadraat-onafhankelijkheidstoets .............................................................................................. 51
7. Samenvatting .......................................................................................................................................... 53
7.1. De Chi-kwadraat-toets ................................................................................................................... 53
Chapter 4: Correlatie en lineaire regressie..................................................................................................... 53
1. Scatterplot ............................................................................................................................................... 54
1.1. Looking at scatterplots .................................................................................................................. 54
1.2. Assigning roles to variables in scatterplots .................................................................................... 54
2. Correlation............................................................................................................................................... 54
2.1. Understanding correlation............................................................................................................. 54
2.2. Lurking variables and causation ..................................................................................................... 55
3. Linear regression ..................................................................................................................................... 56
3.1. The linear model ............................................................................................................................ 56
3.2. Correlation and the line ................................................................................................................. 56
3.3. Regression to the mean ................................................................................................................. 57
3
, 3.4. Checking the model ....................................................................................................................... 57
3.5. Variation in the model and R2 ....................................................................................................... 58
3.6. Reality check: is the regression reasonable? ................................................................................. 58
4. Nonlinear relationships ........................................................................................................................... 59
4.1. Nonlinear relationships.................................................................................................................. 59
5. Summary ................................................................................................................................................. 60
Chapter 15: Inference for Regression ............................................................................................................ 61
1. Hypothesetoets en betrouwbaarheidsinterval voor de richtingscoëfficiënt ............................................ 61
2. Aannames en voorwaarden .................................................................................................................... 63
3. Standaardfouten voor voorspelde waarden ............................................................................................ 64
4. Betrouwbaarheidsintervallen en voorspellingsintervallen gebruiken ..................................................... 65
5. Samenvatting .......................................................................................................................................... 65
,Herhaling statistiek 1
Chapter 1: Data
- Definitie van data
o Informatie + context
o Wie, wat (en wat zijn de eenheden), wanneer, waar, hoe werd de data
gegenereerd en waarom
- Datatabellen
o Organiseren van data
o Rij = informatie van een eenheid, persoon, respondent (bij survey), records
(bij database), algemeen = cases
§ Niet altijd mensen, kunnen ook bv bedrijven zijn
§ = wie
o Kolom = informatie van een variabele = wat
§ Variabele = een specifiek element van de data gegenereerd bij alle
cases
- Categorische en kwantitatieve variabelen
o Categorisch = namen, maar kunnen ook cijfers zijn
§ Bv blauw, rood
§ Maar nummers bijvoorbeeld bij een categorie (bv categorie 1,2,3,4,5)
o Kwantitatieve data = cijfers (eenheden zijn hier heel belangrijk)
Chapter 2: Categorische gegevens weergeven en beschrijven
- Werken met categorische variabelen
o Aantal cases tellen in een category = frequentie nagaan
§ Kan weergegeven worden met een aantal of met een percentage (=
relatieve frequentie)
§ Frequentie en relatieve frequentie tabellen
o Staafdiagrammen en taartdiagrammen
§ Hiermee werken om de gegevens visueel te maken
§ Taartdiagrammen zijn visueel maar moeilijker te interpreteren dan
staafdiagrammen
- Kruistabellen
o Bij het werken met 2 verschillende variabelen
o Je kan hier ook gebruik maken van aantal (som) of percentages
- Marginale en conditionele verdelingen
o Uniforme verdeling als bv per categorie +- hetzelfde percentage
o Conditionele verdeling = voorwaardelijke verwachting
- Staafdiagrammen voor 2 variabelen
o ‘side-by-side bar chart/ stacked bar chart’
o Maakt het gemakkelijk om 2 variabelen met elkaar te vergelijken
- Onafhankelijke variabelen = als 2 conditionele verdelingen ongeveer hetzelfde zijn
- Afhankelijke variabelen = de variabelen zijn gelinkt/ beïnvloeden elkaar
5
,Chapter 3: Kwantitatieve gegevens weergeven en beschrijven
- Kwantitieve gegevens
o Vorm
o Midden
o Spreiding
- Kijken naar de vorm van een distributie: aan de hand van een histogram
o Kijken naar pieken, dallen
§ 1 piek = unimodaal
• Hier nagaan of de verdeling symmetrisch is of niet
• Niet symmetrisch: rechts- of linksscheef
§ Meerdere pieken = multimodaal
o We willen het liefst: unimodale en symmetrische verdelingen
- Kijken naar het midden van de distributie
o Gemiddelde
!"#
§ 𝑥̅ = $
o Mediaan
§ Beter bij scheve verdelingen
§ Letterlijk middelste getal
- Kijken naar de spreiding van de verdeling
o Standaard variatie
o Interkwartielafstand = verschil tussen 3e en 1e kwartiel van de data
- Standaardiseren van variabelen
%&%'
o Z= (
- Vergelijken van verdelingen
o Aan de hand van boxplots
Chapter 4: Relatie tussen twee kwantitatieve variabelen
- Correlatie = relatie tussen gestandaardiseerde variabelen
o Hiermee kunnen we de helling berekenen
((%)
o B1 = r*
((+)
o R2 = de fractie van de variabiliteit dat te wijten is aan het regressie model
- Lineair model om de relatie te beschrijven tussen beschrijven
- Regressielijn: 𝑦% : b0 + b1*x
o B0 = intercept
o B1 = helling
o Lijn zal nooit door alle datapunten gaan maar is een
zo dicht mogelijke benadering
§ Ruimte tussen lijn en datapunten = residuals
§ Residual = y - 𝑦%
• We willen de residuals zo laag mogelijk
o Least squares regression line
§ Least squares = minimum van gekwadrateerde residuals
- Voorwaarden
o Lineariteit conditie
o Uitschieters controleren
o Gelijke verdeling conditie
6
, Chapter 5: Willekeurigheid en voorspelbaarheid
- Willekeurige verschijnselen en waarschijnlijkheid
o Willekeurig = de uitkomst kan niet voorspeld worden
o Gebeurtenis = een combinatie van mogelijke uitkomsten
o Onafhankelijke gebeurtenissen = de uitkomst van 1 experiment/variabele
heeft geen invloed op de andere variabele
- De wet van de grote getallen
o Voor onafhankelijke gebeurtenissen komt de relatieve frequentie van een
gebeurtenis dichter en dichter bij één getal (de waarschijnlijkheid) naarmate
het aantal proeven toeneemt
o Zegt niets over korte termijn gegevens, enkel over lange termijn gegevens
- Waarschijnlijkheidsregels
o Probability assignment rule
§ Waarschijnlijkheid moet tussen 0 en 1 zijn
§ Som van alle waarschijnlijkheid is gelijk aan 1
o Complement rule: P(A) = 1 – P(B)
§ De kans dat iets niet gebeurt = 1 – de kans dat iets wel gebeurt
o Addition rule: P (A of B) = P(A) + P(B)
• Mutual exclusive events, hebben niets met elkaar te maken
§ P(A of B) = P(A) + P(B) – P(A en B)
• Niet mutual exclusive events
• Hier zullen A en B afhankelijk zijn van elkaar
o Mutiplication rule: P(A en B) = P(A) * P(B)
§ Indien dit waar is dan zijn de variabelen onafhankelijk
, (. /$ 0)
o P (A |B) = ,(0)
o Algemene vermenigvuldigingsregel: P (A en B) = P (A|B) * P(B)
Chapter 6: Willekeurige variabelen en voorspellingsmodellen
- Verwachte waarde
o Waarde van de variabele zal afhangen van andere gebeurtenissen
o E(X) = μ = mean
o Voorspellingmodel gebruiken om de verwachte waarde te weten
o E(X) = Σ x*P(X)
§ De verwachte waarde van x + een constante is gelijk aan de verwachte
waarde van x
- Standaard deviatie
o SD(X) = '𝑉𝑎𝑟 (𝑥)
o 𝜎 = 'Σ(𝑥 − µ)1 ∗ 𝑃(𝑋)
§ De variante van x + een constante is gelijk aan de variantie van x
- Herschalen van variabelen
o E(aX) = a*E(X)
o Var(aX) = a2 * Var(X)
- Werken met meerdere X warden
o E(X1 + X2) = E(X1) + E(X2)
o Var (X1+X2) = Var (X1) + Var(X2)
§ !! Bij onafhankelijke variabelen
§ !! NIET: SD(X1 + X2) = SD (X1) + SD (X2)
7
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur paulineverhelst. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €6,49. Vous n'êtes lié à rien après votre achat.