Chapter 11: betrouwbaarheidsintervallen en hypothesetoetsen voor gemiddeldes ...................................... 20
1. De centrale limietstelling ......................................................................................................................... 20
1.1. Simuleren van een steekproevenverdeling van een gemiddelde .................................................. 20
1.2. De centrale limietstelling ............................................................................................................... 21
2. De steekproevenverdeling van het gemiddelde ...................................................................................... 21
2.1. Aannames en voorwaarden voor de steekproevenverdeling van het gemiddelde ....................... 22
3. Hoe steekproevenverdelingsmodellen werken ........................................................................................ 22
3.1. Standaardfout ................................................................................................................................ 22
3.2. Hoe steekproevenverdelingsmodellen werken ............................................................................. 23
4. Gosset en de de t-verdeling ..................................................................................................................... 24
4.1. Analogie met fracties ..................................................................................................................... 24
4.2. Standaardfout ................................................................................................................................ 24
4.3. Gosset’s t ....................................................................................................................................... 24
4.4. Voorbeeld ...................................................................................................................................... 25
4.5. Gosset en de t-verdeling ................................................................................................................ 25
5. Een betrouwbaarheidsinterval voor gemiddeldes ................................................................................... 25
5.1. Vrijheidsgraden: waarom n-1 ........................................................................................................ 25
5.2. t-waarden vinden........................................................................................................................... 25
5.3. Voorbeeld ...................................................................................................................................... 26
6. Aannames en voorwaarden .................................................................................................................... 26
6.1. Aanname van normaal-verdeelde populatie ................................................................................. 26
6.2. Voorbeeld: controleer aannames en voorwaarden ....................................................................... 27
6.3. Waarschuwingen over het interpreteren van betrouwbaarheidsintervallen ................................ 27
7. Testen van hypothesen over gemiddeldes – de One-Sample-t-test......................................................... 27
7.1. Voorbeeld: winkelpatronen ........................................................................................................... 28
7.2. Steekproefomvang......................................................................................................................... 28
7.3. Steekproefomvang: voorbeeld ...................................................................................................... 29
8. Samenvatting .......................................................................................................................................... 29
Chapter 12: Meer over toetsen en intervallen ............................................................................................... 30
1. Hoe om te gaan met P-waarden ............................................................................................................. 30
2. Alfa-niveau en significantie ..................................................................................................................... 30
3. Kritieke waarden ..................................................................................................................................... 31
4. Betrouwbaarheidsintervallen en hypothesetoetsen................................................................................ 32
4.1. Voorbeeld: winkelpatronen ........................................................................................................... 32
5. Twee soorten fouten ............................................................................................................................... 33
6. Onderscheidend vermogen van een toets ............................................................................................... 33
6.1. Onderscheidend vermogen ........................................................................................................... 33
6.2. Verminderen van zowel type-1 als type-2 fouten ......................................................................... 35
6.3. Voorbeeld: Alfa .............................................................................................................................. 35
6.4. Voorbeeld: Fouten ......................................................................................................................... 35
7. Samenvatting .......................................................................................................................................... 36
7.1. Begrijp P-waarden beter ................................................................................................................ 36
7.2. Twee soorten fouten ..................................................................................................................... 36
7.3. Onderscheidend vermogen ........................................................................................................... 36
Chapter 13: Twee gemiddelden vergelijken ................................................................................................... 37
2
, 1. Twee gemiddelden vergelijken ................................................................................................................ 37
2. Two sample t-test/ t-toets voor twee steekproeven ............................................................................... 38
3. Aannames en voorwaarden .................................................................................................................... 39
4. Een betrouwbaarheidsinterval voor het verschil tussen twee gemiddelden ........................................... 40
5. The pooled t-test ..................................................................................................................................... 41
6. Paired data .............................................................................................................................................. 42
6.1. Gepaarde data ............................................................................................................................... 42
6.2. Aannames ...................................................................................................................................... 43
7. Paired t-methods ..................................................................................................................................... 43
8. Samenvatting .......................................................................................................................................... 44
8.1. T-toets voor twee steekproeven.................................................................................................... 44
8.2. Betrouwbaarheidinterval ............................................................................................................... 44
8.3. Gepaarde steeproeven .................................................................................................................. 44
Chapter 14: Chi-kwadraat toetsen ................................................................................................................. 45
1. Goodness of Fit Test ................................................................................................................................ 45
1.1. Aannames en voorwaarden ........................................................................................................... 45
1.2. Chi-kwadraat model....................................................................................................................... 45
1.3. Berekeningen ................................................................................................................................. 46
1.4. Voorbeeld: stock market ‘up’ days ................................................................................................ 46
1.5. Voorbeeld: credit cards ................................................................................................................. 47
2. Chi-kwadraatwaarden interpreteren ...................................................................................................... 47
3. Onderzoek naar de residuen.................................................................................................................... 47
3.1. Chi-kwadraat verdeling .................................................................................................................. 47
3.2. Onderzoek naar de residuen ......................................................................................................... 48
4. De Chi-kwadraat homogeniteitstest........................................................................................................ 48
4.1. Test ................................................................................................................................................ 48
4.2. Aannames en voorwaarden ........................................................................................................... 49
4.3. Berekening ..................................................................................................................................... 49
4.4. Voorbeeld: meer credit cards ........................................................................................................ 49
5. Twee fracties vergelijken ......................................................................................................................... 50
5.1. Twee fracties vergelijken ............................................................................................................... 50
5.2. Betrouwbaarheidsinterval voor het verschil tussen twee fracties ................................................ 50
5.3. Twee fracties vergelijken ............................................................................................................... 50
6. De Chi-kwadraat-onafhankelijkheidstoets .............................................................................................. 51
7. Samenvatting .......................................................................................................................................... 53
7.1. De Chi-kwadraat-toets ................................................................................................................... 53
Chapter 4: Correlatie en lineaire regressie..................................................................................................... 53
1. Scatterplot ............................................................................................................................................... 54
1.1. Looking at scatterplots .................................................................................................................. 54
1.2. Assigning roles to variables in scatterplots .................................................................................... 54
2. Correlation............................................................................................................................................... 54
2.1. Understanding correlation............................................................................................................. 54
2.2. Lurking variables and causation ..................................................................................................... 55
3. Linear regression ..................................................................................................................................... 56
3.1. The linear model ............................................................................................................................ 56
3.2. Correlation and the line ................................................................................................................. 56
3.3. Regression to the mean ................................................................................................................. 57
3
, 3.4. Checking the model ....................................................................................................................... 57
3.5. Variation in the model and R2 ....................................................................................................... 58
3.6. Reality check: is the regression reasonable? ................................................................................. 58
4. Nonlinear relationships ........................................................................................................................... 59
4.1. Nonlinear relationships.................................................................................................................. 59
5. Summary ................................................................................................................................................. 60
Chapter 15: Inference for Regression ............................................................................................................ 61
1. Hypothesetoets en betrouwbaarheidsinterval voor de richtingscoëfficiënt ............................................ 61
2. Aannames en voorwaarden .................................................................................................................... 63
3. Standaardfouten voor voorspelde waarden ............................................................................................ 64
4. Betrouwbaarheidsintervallen en voorspellingsintervallen gebruiken ..................................................... 65
5. Samenvatting .......................................................................................................................................... 65
,Herhaling statistiek 1
Chapter 1: Data
- Definitie van data
o Informatie + context
o Wie, wat (en wat zijn de eenheden), wanneer, waar, hoe werd de data
gegenereerd en waarom
- Datatabellen
o Organiseren van data
o Rij = informatie van een eenheid, persoon, respondent (bij survey), records
(bij database), algemeen = cases
§ Niet altijd mensen, kunnen ook bv bedrijven zijn
§ = wie
o Kolom = informatie van een variabele = wat
§ Variabele = een specifiek element van de data gegenereerd bij alle
cases
- Categorische en kwantitatieve variabelen
o Categorisch = namen, maar kunnen ook cijfers zijn
§ Bv blauw, rood
§ Maar nummers bijvoorbeeld bij een categorie (bv categorie 1,2,3,4,5)
o Kwantitatieve data = cijfers (eenheden zijn hier heel belangrijk)
Chapter 2: Categorische gegevens weergeven en beschrijven
- Werken met categorische variabelen
o Aantal cases tellen in een category = frequentie nagaan
§ Kan weergegeven worden met een aantal of met een percentage (=
relatieve frequentie)
§ Frequentie en relatieve frequentie tabellen
o Staafdiagrammen en taartdiagrammen
§ Hiermee werken om de gegevens visueel te maken
§ Taartdiagrammen zijn visueel maar moeilijker te interpreteren dan
staafdiagrammen
- Kruistabellen
o Bij het werken met 2 verschillende variabelen
o Je kan hier ook gebruik maken van aantal (som) of percentages
- Marginale en conditionele verdelingen
o Uniforme verdeling als bv per categorie +- hetzelfde percentage
o Conditionele verdeling = voorwaardelijke verwachting
- Staafdiagrammen voor 2 variabelen
o ‘side-by-side bar chart/ stacked bar chart’
o Maakt het gemakkelijk om 2 variabelen met elkaar te vergelijken
- Onafhankelijke variabelen = als 2 conditionele verdelingen ongeveer hetzelfde zijn
- Afhankelijke variabelen = de variabelen zijn gelinkt/ beïnvloeden elkaar
5
,Chapter 3: Kwantitatieve gegevens weergeven en beschrijven
- Kwantitieve gegevens
o Vorm
o Midden
o Spreiding
- Kijken naar de vorm van een distributie: aan de hand van een histogram
o Kijken naar pieken, dallen
§ 1 piek = unimodaal
• Hier nagaan of de verdeling symmetrisch is of niet
• Niet symmetrisch: rechts- of linksscheef
§ Meerdere pieken = multimodaal
o We willen het liefst: unimodale en symmetrische verdelingen
- Kijken naar het midden van de distributie
o Gemiddelde
!"#
§ 𝑥̅ = $
o Mediaan
§ Beter bij scheve verdelingen
§ Letterlijk middelste getal
- Kijken naar de spreiding van de verdeling
o Standaard variatie
o Interkwartielafstand = verschil tussen 3e en 1e kwartiel van de data
- Standaardiseren van variabelen
%&%'
o Z= (
- Vergelijken van verdelingen
o Aan de hand van boxplots
Chapter 4: Relatie tussen twee kwantitatieve variabelen
- Correlatie = relatie tussen gestandaardiseerde variabelen
o Hiermee kunnen we de helling berekenen
((%)
o B1 = r*
((+)
o R2 = de fractie van de variabiliteit dat te wijten is aan het regressie model
- Lineair model om de relatie te beschrijven tussen beschrijven
- Regressielijn: 𝑦% : b0 + b1*x
o B0 = intercept
o B1 = helling
o Lijn zal nooit door alle datapunten gaan maar is een
zo dicht mogelijke benadering
§ Ruimte tussen lijn en datapunten = residuals
§ Residual = y - 𝑦%
• We willen de residuals zo laag mogelijk
o Least squares regression line
§ Least squares = minimum van gekwadrateerde residuals
- Voorwaarden
o Lineariteit conditie
o Uitschieters controleren
o Gelijke verdeling conditie
6
, Chapter 5: Willekeurigheid en voorspelbaarheid
- Willekeurige verschijnselen en waarschijnlijkheid
o Willekeurig = de uitkomst kan niet voorspeld worden
o Gebeurtenis = een combinatie van mogelijke uitkomsten
o Onafhankelijke gebeurtenissen = de uitkomst van 1 experiment/variabele
heeft geen invloed op de andere variabele
- De wet van de grote getallen
o Voor onafhankelijke gebeurtenissen komt de relatieve frequentie van een
gebeurtenis dichter en dichter bij één getal (de waarschijnlijkheid) naarmate
het aantal proeven toeneemt
o Zegt niets over korte termijn gegevens, enkel over lange termijn gegevens
- Waarschijnlijkheidsregels
o Probability assignment rule
§ Waarschijnlijkheid moet tussen 0 en 1 zijn
§ Som van alle waarschijnlijkheid is gelijk aan 1
o Complement rule: P(A) = 1 – P(B)
§ De kans dat iets niet gebeurt = 1 – de kans dat iets wel gebeurt
o Addition rule: P (A of B) = P(A) + P(B)
• Mutual exclusive events, hebben niets met elkaar te maken
§ P(A of B) = P(A) + P(B) – P(A en B)
• Niet mutual exclusive events
• Hier zullen A en B afhankelijk zijn van elkaar
o Mutiplication rule: P(A en B) = P(A) * P(B)
§ Indien dit waar is dan zijn de variabelen onafhankelijk
, (. /$ 0)
o P (A |B) = ,(0)
o Algemene vermenigvuldigingsregel: P (A en B) = P (A|B) * P(B)
Chapter 6: Willekeurige variabelen en voorspellingsmodellen
- Verwachte waarde
o Waarde van de variabele zal afhangen van andere gebeurtenissen
o E(X) = μ = mean
o Voorspellingmodel gebruiken om de verwachte waarde te weten
o E(X) = Σ x*P(X)
§ De verwachte waarde van x + een constante is gelijk aan de verwachte
waarde van x
- Standaard deviatie
o SD(X) = '𝑉𝑎𝑟 (𝑥)
o 𝜎 = 'Σ(𝑥 − µ)1 ∗ 𝑃(𝑋)
§ De variante van x + een constante is gelijk aan de variantie van x
- Herschalen van variabelen
o E(aX) = a*E(X)
o Var(aX) = a2 * Var(X)
- Werken met meerdere X warden
o E(X1 + X2) = E(X1) + E(X2)
o Var (X1+X2) = Var (X1) + Var(X2)
§ !! Bij onafhankelijke variabelen
§ !! NIET: SD(X1 + X2) = SD (X1) + SD (X2)
7
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller paulineverhelst. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.02. You're not tied to anything after your purchase.