B1 Kwantitatieve data-analyse
Spreidingsmaten
Een spreidingsmaat geeft antwoord op de vraag hoe de waarnemingen liggen ten opzichte van
elkaar liggen.
De variatiebreedte betreft de hele bandbreedte van waarnemingen, van het minimum tot het
maximum. Het is het verschil tussen de minimum- en maximumscore in een set.
De interkwartielafstand is een maat waarbij je naar de middelste 50% van je waarnemingen kijkt.
Het is het verschil tussen het 75e percentiel en het 25e percentiel.
Het kan gebruikt worden vanaf ordinaal meetniveau. De uitschieters hebben geen invloed op de
interkwartielafstand.
Variantie is gemiddelde gekwadrateerde afwijking van het gemiddelde.
- Het is bruikbaar bij de meetniveaus interval en ratio
- Zegt iets over de afstand van alle waarnemingen t.o.v. het gemiddelde
- Uitgedrukt in 1 getal (bij betekenis uitkomst goed kijken naar schaal)
- Formule populatievariantie:
- 02: als de verdeling van de populatie bekend is, dan wordt dit als notatie gebruikt. Wanneer
dit niet het geval is wordt de steekproefvariantie gebruikt: s 2
- Tussen haakjes staat dat telkens voor elke waarneming het verschil tussen een waarneming
en het gemiddelde moet worden berekend. Van elk verschil wordt daarna het kwadraat
genomen
- Het gekwadrateerde verschil wordt getotaliseerd, alle verschilscores worden bij elkaar
opgeteld
- Het totaal van deze verschilscores wordt gedeeld door het totale aantal waarnemingen,
waardoor de variantie ontstaat.
Variantie van steekproef
- Bij experimenten of metingen in de praktijk gebruik je meestal een steekproef en niet de hele
populatie
- Maar je weet nooit zeker hoe representatief je steekproefomvang is
- Om deze onzekerheid weg te nemen zijn correcties mogelijk, door middel van vrijheidsgraden.
-Je neemt niet de gehele steekproefomvang op in je formule, maar de
steekproefomvang minus 1, n - 1.
,Variantie versus standaarddeviatie/afwijking
- Gemiddelde kwadratische afwijking van het gemiddelde is lastig te interpreteren
- Terug vertalen naar bruikbare maat door wortel te trekken
- Standaarddeviatie= σ = √ (σ2)
- De standaarddeviatie geeft de mogelijkheid om de spreiding van een variabele te beoordelen
Standaarddeviatie (standaardafwijking) berekenen:
1. Gemiddelde bereken
2. Variantie bereken
a. Bereken van alle getallen de afwijking t.o.v. het gemiddelde
b. Neem van deze afwijkingen het kwadraat
c. Bereken het gemiddelde van deze getallen
3. Neem de wortel van de variantie
Normaalverdeling
- De normale verdeling/Gauss-kromme is een grafiek met een symmetrische
verdeling en de vorm van een klok of een heuvel
- Uitganspunten voor het tekenen zijn het gemiddelde en de standaardafwijking.
- Op de x-as zet je alle mogelijke waarden van de verdeling uit met het
gemiddelde precies in het midden.
- Op de y-as staat het percentage waarnemingen met een bepaalde x-score
De empirische regel:
- In een normaal verdeelde populatie ligt altijd 68% van het aantal waarnemingen binnen een
afstand
van 1 standaarddeviatie van het gemiddelde
- In een normaal verdeelde populatie ligt altijd ongeveer 95% van het aantal waarnemingen
binnen een afstand van 2 standaarddeviaties van het gemiddelde
- In een normaal verdeelde populatie ligt altijd ongeveer 99% van het aantal waarnemingen
binnen een afstand van 3 standaarddeviaties van het gemiddelde
Betrouwbaarheid
- Het 95% betrouwbaarheidsinterval ligt binnen een afstand van 2 standaarddeviaties rond het
gemiddelde (bij normale verdeling)
- Dit is een maat voor de nauwkeurigheid waarmee gemeten is
, - Er kan met 95% zekerheid gesteld worden dat het populatiegemiddelde binnen 2
standaarddeviaties van steekproefgemiddelde ligt
- Dat is dus vooral behulpzaam als de standaarddeviatie relatief klein is
- Standaardfout van het gemiddelde is de standaardafwijking in steekproefgemiddelde
- Als je een waarde van een grootheid preciezer probeert te bepalen door herhaaldelijk
metingen uit te voeren, dan neemt de nauwkeurigheid toe met V(n)
Statistische verbanden
Correlatie is een statistisch begrip voor de samenhang tussen twee verschijnselen, twee
variabelen. Een hoge correlatie betekent dat beide verschijnselen relatief vaak samen voorkomen.
Maar niet dat de ene de oorzaak van de andere is.
Er zijn verschillende vormen van correlatie:
Met behulp van de correlatiecoëfficiënt kan je berekenen hoe sterk een verband tussen twee
variabelen is. Je kan het bereken als de variabelen numeriek, continue en een ratio/interval
meetniveau hebben.
- Je kijkt naar verschillen ten opzichte van het gemiddelde voor beide variabelen
- x-x is het verschil tussen de waarnemingen en het gemiddelde
- y-y is het verschil tussen de waarnemingen en het gemiddelde
- De verschillen vermenigvuldig je met elkaar en tel je bij elkaar op = sigma
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur madeliefh. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €9,48. Vous n'êtes lié à rien après votre achat.