Dit is een volledige, maar zeer bondige samenvatting van alle theorielessen van kwantitatieve analyse, gebaseerd op de slides. Het document is slechts 11 pagina's lang en bevat alle leerstof uit de slides & de leerpaden, op een overzichtelijke manier geschematiseerd.
= Categorieën die niet = Kunnen wel geordend = kunnen geordend worden, en = kunnen geordend worden, en
geordend kunnen worden worden, maar de afstand de afstand tussen de waarden de afstand tussen de waarden
tussen de waarden is niet is kwantificeerbaar, maar heeft is kwantificeerbaar, en heeft
kwantificeerbaar. geen betekenisvol nulpunt. een betekenisvol nulpunt.
Meetniveau bepaalt de analysetechniek die we moeten gebruiken: Data kan weergegeven w in…
- Datamatrix: geeft elke waarde id
dataset weer.
- Freq. Tabel: hoeveel elke waarde
voorkomt.
2. Centrummaten 3. Spreidingsmaten (alleen voor metrische V!)
Rekenkundig gemiddelde Hoe te berekenen met Variatiebreedte Verschil tussen hoogste en laagste
GRM: waarde id dataset.
= Max(X) - Min(X)
- Data in L1 en L2 invullen.
- VARSTATS
Interkwartielafstand (IKA) De spreiding van de centrale 50% vd
Mediaan & kwartielen - X: gemiddelde verdeling.
- Me: Mediaan (50%) = Q3 - Q1
- Q1: kwartiel 1 (25%)
- Q3: kwartiel 3 (75%) Variantie (S2) Vertelt ook hoeveel de waarden id dataset
van het gemiddelde verschillen
Modus - Mo: Modus (meest
voorkomende waarde) (Hoe groter, hoe verder de waarden vh
gemiddelde afwijken)
W ook gebruikt om de outliers/ uitschieters te
berekenen: Standaardafwijking (S) Vertelt ook hoeveel de waarden id dataset
van het gemiddelde verschillen, maar in
- Bovengrens: Q3 +1.5 * IKA dezelfde eenheid als de data zelf (want
- Ondergrens: Q1 - 1.5 * IKA niet gekwadrateerd)
Vanaf een waarde hierboven/ onder gaat is het een
outlier.
4. Normaalverdeling Gemiddelde id populatie S id populatie
= De normaalverdeling N(µ,σ) geeft grafisch weer hoe de waarden in een dataset verdeeld zijn.
—> We kunnen berekenen wat de kans is dat een waarde groter/ kleiner is dan X.
Daarvoor gaan we N Standaardiseren naar N(0,1)
—> Je kan voor elke Z-score een P-Waarde/ kans vinden in de T-tabel.
Voorbeelden:
, Tak vd STAT die uitspraken doet over de populatie obv een steekproef.
H2. Inferentiële statistiek Als we over de populatie spreken gebruiken we altijd Griekse letters:
Drie verdelingen µ (gemiddelde) σ (standaardafwijking)
1) Populatieverdeling = Verdeling van waarden van een
variabele over de eenheden van een populatie Let op! Deze verdeling gaan we nooit empirisch vaststellen. We
kunnen hem alleen opmaken als we voor elk individu uit de populatie
Bv Lichaamslengte is normaalverdeeld id populatie informatie hebben.
2) Steekproefverdeling = Verdeling van waarden van een Hierbij gebruiken we gewone letters zoals X en S.
variabele over de eenheden van een steekproef = wat we meten in een OZ/ wat we vinden ih data view van SPSS.
Bv. Verdeling van de lichaamslengte in onze steekproef
Hierbij gebruiken we bv µx (want het gaat over ALLE
3) SteekproeVENverdeling = Verdeling van een steekproefgrootheid, mogelijke steekproeven)
(zoals het gemiddelde of correlatie) over alle mogelijke steekproeven
(met dezelfde n), getrokken uit dezelfde populatie.
Deze steekproevenverdeling volgt de normaalverdeling (wanneer er een EAS getrokken is en de steekproefgrootte groot genoeg is).
Waarom moet er een EAS getrokken Waarom hebben we best zo’n groot
w? mogelijke n?
Daardoor kunnen we concluderen dat… - Door de CST weten we dat hoe groter n
- Stochastische variabelen (variabele
waarvan de waarde louter Bep w door wordt, hoe meer de steekproevenverdeling vh
1) Het steekproefGEM een zuivere steekproefgemiddelde de normaalverdeling
toeval - bv kop of munt) zijn altijd
schatter is voor het populatieGEM gaat benaderen.
normaalverdeeld.
2) Hoe groter de n, hoe dichter —> Je kan ‘n’ bekijken als ‘trekkracht om de
Steekproefgrootheden worden ook
de waarden bij elkaar gaan verdeling recht te trekken’.
bep door toeval (OP VOORWAARDE
liggen (Kleinere spreiding). dat we ze met een EAS verzamelen).
= ‘Wet van de grote getallen’.
Dit is het basisidee waarop we 2 zaken kunnen toepassen (elk voor een ander doel):
BETROUWBAARHEIDSINTERVALLEN SIGNIFICANTIETOETSEN
= Vertrekt vanuit de SP en gaat obv daarvan iets zeggen over de = (omgekeerd) Vertrekt vanuit een schatting van de populatie en test
populatie. deze op ons steekproefresultaat.
—> Je maakt eig een schatting van een populatieparameter. —> We gaan dus een bewering vd populatie toetsen aan onze SP.
Let op! Een intervalschatting (= een schatting met een boven-
en ondergrens waar de populatieparameter vermoedelijk (kan Dit doen we altijd in 5 stappen:
met versch niveaus van zekerheid) tussen ligt) en geen
puntschatting (= Wat je gebruikt als schatting voor een 1) Hypotheses opstellen:
populatieparameter, zoals het gemiddelde). - Een H0 (nulhyp) = wat je wil testen klopt niet (H0: µ = µ0)
- Een Ha (alternatieve Hyp) = Wat je wil testen klopt wel (Ha: µ ≠/
BI = Puntschatting + foutenmarge (m) > / < µ0)
2) Toetsingsgrootheid bepalen (Z)
X + Z* * σ
-
n
= Hoe ver de steekproefgrootheid van de populatiegrootheid
verwijderd is (veronderstelt in H0)
3) Tekening maken en de P-Waarde daarop aanduiden
4) P-waarde in opzoeken.
5) Conclusie:
—> Hoe kleiner de p-waarde, hoe beter je de H0 kan verwerpen.
10% - 5% - 1% - 0.1%
Toch kunnen we nog altijd fouten maken:
- Type I fout = we gaan de nulhyp foutief verwerpen.
- Type II fout = we gaan de nulhup foutief aanvaarden.
MAAR: hierbij gaan we er steeds vanuit dat we σ kennen
—> Dat is heel onrealistisch: in de praktijk moeten we schatten adhv de
standaardafwijking van de steekproef (S).
Zorgt op zijn beurt weer voor toevalsfouten: daarom werken we met een t-verdeling (ipv een z-verdeling).
- T-verdelingen hebben een grotere spreiding, daarom moeten we ook vrijheidsgraden (df = n-1) berekenen.
(hoe groter n, hoe groter df, hoe meer de t-verdeling lijkt op een z-verdeling.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Student1256. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.59. You're not tied to anything after your purchase.