Spreiding
Spreiding = hoeveel is de afstand tussen een meting en het gemiddelde.
Centrummaten
- Mediaan = de getallenreeks in de juiste volgorde zetten en daarna
de middelste getal uit de rij.
- Gemiddelde = alle getallen bij elkaar optellen en delen door het
aantal getallen.
- Modus = de meest voorkomende in de reeks/set variabelen
Vaak levert een centrummaat weinig informatie op. Om die reden wordt er
gebruik gemaakt van een spreidingsmaat. Spreidingsmaten = vertelt hoe
de waarnemingen liggen ten opzichte van elkaar. Er zijn 4
spreidingsmaten:
1. Variantiebreedte
2. Interkwartielafstand
3. Variantie
4. Standaarddeviatie (standaardafwijking)
Variantie
Variantie = afstand van alle waarnemingen ten opzichte van het
gemiddelde.
door alle absolute (gekwadrateerde) verschillen samen te nemen en te
delen door het totale aantal waarnemingen.
- Zegt iets over hoe de waarnemingen verspreid liggen (afstand) van
alle waarnemingen t.o.v. het gemiddelde
- Bruikbaar bij meetniveaus interval of ratio
- Uitgedrukt in 1 getal
- 2 varianties: populatievariantie en steekproefvariantie
Verklaarde variantie
Verklaarde variantie = de hoeveelheid in Y (de afhankelijke variabele(n))
afwijkt van het gemiddelde (variantie Y) die wordt verklaard door X (de
onafhankelijke variabele(n)).
Populatie versus steekproef
Bij experimenten of metingen in de praktijk gebruik je meestal een
steekproef en niet de gehele populatie
- Maar je weet nooit zeker hoe representatief je steekproef omvang is
- We delen door N of door (n-1) voor steekproef bij variantie
,Standaarddeviatie/standaardafwijking
Standaarddeviatie/standaardafwijking = gebruikt om de spreiding van een
verdeling aan te geven.
- Afgeleid van de variantie
- Uitgedrukt in dezelfde eenheid als de verwachtingswaarde of
gemiddelde (bij variantie niet zo)
- De wortel uit de variantie
Variantie versus standaarddeviatie
- Gemiddelde kwadratische afwijking van het gemiddelde lastig te
interpreteren terug vertalen naar bruikbare maat door wortel te
trekken
Variantie is een ‘vierkante maat’ (m2) en kan dus erg groot worden. Een
oplossing is om het kwadraat weg te halen daarvoor moet je de wortel
trekken uit de variantie = standaardafwijking/standaarddeviatie.
Normaalverdeling
Normaalverdeling = een grafiek van een symmetrische verdeling. Het
heeft een vorm van een klok of heuvel uitgangspunt is
populatiegemiddelde en de standaardafwijking.
Bij grote steekproeven is een variabele normaal verdeeld en kun je de
verdeling van deze variabele weergeven in de vorm van een klok of heuvel
(Gauss-kromme/normale verdeling). positie van de waarnemingen ten
opzichte van het gemiddelde (de verwachtingswaarde). Alle
waarnemingen bevinden zich binnen een bepaalde afstand van dat
gemiddelde.
- Bij grote steekproeven bevindt 68% van de waarnemingen binnen
één standaardafwijking.
- 95% binnen twee
- 99% binnen drie
, zijn gebieden rond het gemiddelde = sigmagebieden.
Vuistregels in de praktijk
- In een normaal verdeelde populatie ligt altijd ongeveer 2/3 van het
aantal waarnemingen binnen een afstand van 1 standaarddeviatie
(68%) van het gemiddelde
- In een normaal verdeelde populatie ligt altijd 95% van het aantal
waarnemingen binnen een afstand van 2 standaarddeviaties van het
gemiddelde (95%)
- In een normaal verdeelde populatie ligt altijd 99% van het aantal
waarnemingen binnen een afstand van 3 standaarddeviaties van het
gemiddelde (99%)
Betrouwbaarheid
Puntschattingen gaan gepaard met een grote mate van onzekerheid. Om
deze onzekerheid zoveel mogelijk te vermijden is er een intervalschatting
je geeft schattingsgebied aan waarbij je uitspraak doet dat de
werkelijke waarde met 95% of 99% zekerheid in dat gebied valt =
betrouwbaarheidsinterval (puntschatting met foutmarge)
- Hoe smaller je interval, des te preciezer je een uitspraak kan doen
over je populatie.
Het 95%-betrouwbaarheidsinterval ligt binnen een afstand van 2 sigma
(standaarddeviatie) rond het gemiddelde (normaal verdeeld)
dit is een maat waarmee de nauwkeurigheid gemeten is.
Er kan met 95% zekerheid gesteld worden dat het populatiegemiddelde
binnen 2 sigma (standaarddeviatie) van het steekproef gemiddelde ligt
Dat is dus vooral behulpzaam als de standaarddeviatie relatief klein is.
Standaardfout = standaardafwijking in steekproef gemiddelde
Als je een waarde van een grootheid preciezer probeert te bepalen door
herhaaldelijk metingen uit te voeren, dan neemt de nauwkeurigheid toe.
Correlatie & regressie
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller bentemartina. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.89. You're not tied to anything after your purchase.