B1 Kwantitatieve data-analyse
Spreidingsmaten
Een spreidingsmaat geeft antwoord op de vraag hoe de waarnemingen liggen ten opzichte van
elkaar liggen.
De variatiebreedte betreft de hele bandbreedte van waarnemingen, van het minimum tot het
maximum. Het is het verschil tussen de minimum- en maximumscore in een set.
De interkwartielafstand is een maat waarbij je naar de middelste 50% van je waarnemingen kijkt.
Het is het verschil tussen het 75e percentiel en het 25e percentiel.
Het kan gebruikt worden vanaf ordinaal meetniveau. De uitschieters hebben geen invloed op de
interkwartielafstand.
Variantie is gemiddelde gekwadrateerde afwijking van het gemiddelde.
- Het is bruikbaar bij de meetniveaus interval en ratio
- Zegt iets over de afstand van alle waarnemingen t.o.v. het gemiddelde
- Uitgedrukt in 1 getal (bij betekenis uitkomst goed kijken naar schaal)
- Formule populatievariantie:
- 02: als de verdeling van de populatie bekend is, dan wordt dit als notatie gebruikt. Wanneer
dit niet het geval is wordt de steekproefvariantie gebruikt: s 2
- Tussen haakjes staat dat telkens voor elke waarneming het verschil tussen een waarneming
en het gemiddelde moet worden berekend. Van elk verschil wordt daarna het kwadraat
genomen
- Het gekwadrateerde verschil wordt getotaliseerd, alle verschilscores worden bij elkaar
opgeteld
- Het totaal van deze verschilscores wordt gedeeld door het totale aantal waarnemingen,
waardoor de variantie ontstaat.
Variantie van steekproef
- Bij experimenten of metingen in de praktijk gebruik je meestal een steekproef en niet de hele
populatie
- Maar je weet nooit zeker hoe representatief je steekproefomvang is
- Om deze onzekerheid weg te nemen zijn correcties mogelijk, door middel van vrijheidsgraden.
-Je neemt niet de gehele steekproefomvang op in je formule, maar de
steekproefomvang minus 1, n - 1.
,Variantie versus standaarddeviatie/afwijking
- Gemiddelde kwadratische afwijking van het gemiddelde is lastig te interpreteren
- Terug vertalen naar bruikbare maat door wortel te trekken
- Standaarddeviatie= σ = √ (σ2)
- De standaarddeviatie geeft de mogelijkheid om de spreiding van een variabele te beoordelen
Standaarddeviatie (standaardafwijking) berekenen:
1. Gemiddelde bereken
2. Variantie bereken
a. Bereken van alle getallen de afwijking t.o.v. het gemiddelde
b. Neem van deze afwijkingen het kwadraat
c. Bereken het gemiddelde van deze getallen
3. Neem de wortel van de variantie
Normaalverdeling
- De normale verdeling/Gauss-kromme is een grafiek met een symmetrische
verdeling en de vorm van een klok of een heuvel
- Uitganspunten voor het tekenen zijn het gemiddelde en de standaardafwijking.
- Op de x-as zet je alle mogelijke waarden van de verdeling uit met het
gemiddelde precies in het midden.
- Op de y-as staat het percentage waarnemingen met een bepaalde x-score
De empirische regel:
- In een normaal verdeelde populatie ligt altijd 68% van het aantal waarnemingen binnen een
afstand
van 1 standaarddeviatie van het gemiddelde
- In een normaal verdeelde populatie ligt altijd ongeveer 95% van het aantal waarnemingen
binnen een afstand van 2 standaarddeviaties van het gemiddelde
- In een normaal verdeelde populatie ligt altijd ongeveer 99% van het aantal waarnemingen
binnen een afstand van 3 standaarddeviaties van het gemiddelde
Betrouwbaarheid
- Het 95% betrouwbaarheidsinterval ligt binnen een afstand van 2 standaarddeviaties rond het
gemiddelde (bij normale verdeling)
- Dit is een maat voor de nauwkeurigheid waarmee gemeten is
, - Er kan met 95% zekerheid gesteld worden dat het populatiegemiddelde binnen 2
standaarddeviaties van steekproefgemiddelde ligt
- Dat is dus vooral behulpzaam als de standaarddeviatie relatief klein is
- Standaardfout van het gemiddelde is de standaardafwijking in steekproefgemiddelde
- Als je een waarde van een grootheid preciezer probeert te bepalen door herhaaldelijk
metingen uit te voeren, dan neemt de nauwkeurigheid toe met V(n)
Statistische verbanden
Correlatie is een statistisch begrip voor de samenhang tussen twee verschijnselen, twee
variabelen. Een hoge correlatie betekent dat beide verschijnselen relatief vaak samen voorkomen.
Maar niet dat de ene de oorzaak van de andere is.
Er zijn verschillende vormen van correlatie:
Met behulp van de correlatiecoëfficiënt kan je berekenen hoe sterk een verband tussen twee
variabelen is. Je kan het bereken als de variabelen numeriek, continue en een ratio/interval
meetniveau hebben.
- Je kijkt naar verschillen ten opzichte van het gemiddelde voor beide variabelen
- x-x is het verschil tussen de waarnemingen en het gemiddelde
- y-y is het verschil tussen de waarnemingen en het gemiddelde
- De verschillen vermenigvuldig je met elkaar en tel je bij elkaar op = sigma
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper madeliefh. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €9,48. Je zit daarna nergens aan vast.