Studenten kunnen verschillende basis statistieken (zoals gemiddelde,
correlatie, covariantie, standaarddeviatie, variantie, z- score, kans en
conditionele kans) interpreteren en weten hoe en wanneer deze kunnen worden
toegepast
Populatie= de totale set van deelnemers, dat relevant is voor de onderzoeksvraag.
• Om iets te kunnen zeggen over een populatie moeten we gebruik maken van
statistische inferentie, waarbij we conclusies trekken over de populatie op basis
van een representatieve steekproef.
• In de statistiek duidt het begrip inferentie op het generaliseren van waarnemingen,
kenmerken en eigenschappen uit steekproeven naar de gehele populatie
Steekproef= een deel van de populatie waarover data verzameld is. Op basis van een
steekproef wordt een uitspraak gedaan over de algemene populatie, hierdoor is het van
belang dat de steekproef representatief is.
Sampling unit= omvat een steekproefeenheid, dat in de praktijk van alles kan zijn.
Bijvoorbeeld: een individueel persoon of een ouder-kind paar
Representativiteit= Representatief betekent dat de kenmerken uit de populatie
terugkomen in de steekproef. Bijvoorbeeld de verdeling in leeftijd en opleidingsniveau.
Variabele = een karakteristiek/eigenschap van de steekproefeenheid (sampling unit),
die varieert tussen de eenheden. Een eenheid kan bijvoorbeeld zijn een student, dan
varieert de variabele tussen studenten.
Beschrijvende statistiek
Gemiddelde= Het gemiddelde kan op verschillende manieren worden weergegeven.
Vaak wordt het gemiddelde weergegeven met een µ, m, of mu. Het gemiddelde IQ kan je
ook tegenkomen als m(IQ) of μIQ of mIQ. Het is de som van de observaties gedeeld door
een steekproefgrootte. Het gemiddelde kan je alleen uitrekenen voor interval/ratio data.
Het gemiddelde is gevoelig voor uitbijters.
• Bij Interval- of Ratio data is het niet handig om de Modus uit te rekenen. Alle
waardes zijn vaak net anders, dus komt er geen één waarde het meeste voor.
Hierdoor berekenen we voor deze data het gemiddelde.
De variantie= wordt vaak weergegeven met σ2 of s2 of var, bijv. de variantie van IQ is
dan var(IQ). De standaarddeviatie= omvat de gemiddelde afwijking, dat de wortel van
de variantie is, die wordt weergegeven met σ. Standaarddeviatie kan daarnaast ook
worden weergegeven met s of SD.
Het berekenen van de Standaarddeviatie is op te delen in drie stappen:
1. Bereken de Sum of squares: SS:
• Het gemiddelde te berekenen.
• Van elke score het gemiddelde af te halen.
• Elke verschilscore te kwadrateren.
• Al deze gekwadrateerde verschilscores bij elkaar op te tellen.
2. Bereken de Variantie: (σ2)= SS/ n
3. Bereken de Standaarddeviatie: De standaarddeviatie σ is de wortel van de
variantie σ 2
Standaarddeviatie van een steekproef= wanneer je de standaarddeviatie niet op
basis van het populatiegemiddelde maar op basis van een steekproef berekent dan deel
je de som van de gekwadrateerde verschillen niet door n, maar door (n-1). Dit wordt de
steekproef correctie genoemd, dat je gebruikt omdat je de waarde van het
populatiegemiddelde niet kent -- > Populatie: n ; Steekproef: n-1.
, 3
• Als je een steekproef hebt getrokken uit een populatie waarvan je het gemiddelde
kent en gebruikt, gebruik je geen steekproef correctie. De steekproefcorrectie pas je
enkel toe wanneer je met een steekproefgemiddelde rekent.
Scheefheid (skewness) = als de scheefheid een waarde van 0
heeft dan is de verdeling symmetrisch (normaal verdeeld). Een
positieve waarde betekent dat de verdeling een lange rechter staart
heeft en een negatieve waarde betekent een lange linker staart.
Gepiektheid (kurtosis) = geeft aan in welke mate de verdeling
meer (positief kurtosis, bovenste pijl) of minder (negatief kurtosis,
onderste pijl) gepiekt is dan een normaalverdeling (middelste pijl).
Standaardfout= meet de gemiddelde variatie van de
steekproevengemiddelden ten opzichte van het
populatiegemiddelde. Het gemiddelde van al die steekproef fouten noemen we de
standaardfout. De standaardfout neemt toe wanneer de variantie in een variabele
toeneemt en neemt af als steekproefomvang toeneemt.
Dus het verkleinen van variantie in steekproef en vergroten van steekproefomvang
vergroot de validiteit en betrouwbaarheid voor inferentiële statistiek.
Formule = standaardfout (SE) = standaarddeviatie/ √ steekproefgrootte
Parameter= De beschrijvende statistieken die we gebruiken om een verdeling van
testscores te beschrijven worden ook wel parameters genoemd. Bijvoorbeeld, de
normaalverdeling kent twee parameters: het gemiddelde en de standaarddeviatie.
We maken een onderscheid tussen:
• De populatie waarde= Bijvoorbeeld: het populatiegemiddelde van IQ is 100.
• De geschatte waarde= Bijvoorbeeld: het gemiddelde in een steekproef.
De parameterschattingen= omdat de steekproeven verschillen, omdat iedere
steekproef andere sampling units bevat. Met andere woorden: parameterschattingen
verschillen van steekproef tot steekproef, omdat de precieze samenstelling van
steekproeven verschillen. Geschatte parameters worden vaak weergegeven met een
dakje.
Correlatie = onderzoeken of twee variabelen samenhangen.
Covariantie = drukt de lineaire relatie uit tussen de variabelen (X enY) op de originele
schalen van de variabelen. De covariantie is lastig te interpreteren, daarom
standaardiseren we de covariantie door het delen door het product van de
standaarddeviaties van de variabelen, zo komen we tot de Pearson correlatiecoëfficiënt r.
Dit is makkelijker te interpreteren. Het varieert van -1 tot 1, waarbij 0 betekent dat de
variabelen niet gerelateerd zijn.
Pearson Product Moment (PPM) correlatiecoëfficiënt = de Pearson correlatie, het
geeft de sterkte aan van de lineaire relatie tussen twee variabelen. Een lineaire relatie
geeft een rechtlijnig verband tussen twee variabelen weer. Deze relatie kan positief of
negatief zijn.
De letter r wordt vaak gebruikt om de Pearson correlatie aan te duiden.
• Positief verband = als de stippen samen schuin omhoog lijken te gaan. De uitkomst
is tussen de 0 en +1. (De afhankelijke variabele stijgt als de onafhankelijke variabele
stijgt).
• Negatief verband = als de stippen schuin naar beneden lijken te gaan. De uitkomst
is tussen de 0 en -1. (De afhankelijke variabele daalt als de onafhankelijke variabele
stijgt).
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller LisanneJansen3. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.89. You're not tied to anything after your purchase.