Variabelen:
- Kwantitatief: met getallen/ numerieke (voorbeelden: number of students in class, weight, length)
- Kwalitatief: zonder getallen/ non-numerieke (voorbeelden: color of the sky, favorite food)
- Discrete variabele: Heeft een beperkt aantal getallen of klassen als mogelijke uitkomsten. De tussenliggende
waarden hebben geen betekenis. (Voorbeelden: tellingen, bloedgroepen)
- Continue variabele: Een continue variabele kan letterlijk elke waarde aannemen. Of het nu 30000 of 1,3589 is,
alle opties zijn mogelijk. (Voorbeelden: de lengte van je kleine zusje, het gewicht van een koe)
Hiërarchie:
- Nominaal: Bij een nominaal meetniveau bestaat de variabele uit verschillende waarden waar geen verschil zit
tussen beide. Er zijn dus verschillende categorieën aan te duiden, maar er zijn geen verschillen tussen deze
categorieën. Voorbeelden: bloedgroepen, geslacht, provincies,
- Ordinaal: Bij een ordinaal meetniveau bestaat de variabele uit verschillende waarden waar wel verschil tussen
beide zit. Er zijn verschillende categorieën aan te duiden, waar verschillen tussen zitten. Voorbeelden: goud/
zilver/ brons, vmbo/ havo/ vwo
- Interval: Bij een interval meetniveau bestaat de variabele uit verschillende waarden waar wel verschil tussen
de waarden zit. Het verschil tussen deze waarden is ook duidelijk aan te geven. De waarde kan alleen nooit
voor het nulpunt staan. Voorbeelden: tijd, IQ, temperatuur, ph waarde
- Ratio: Bij een ratio meetniveau bestaat de variabele uit verschillende waarden waar wel verschil tussen de
waarden zit. Het verschil tussen deze waarden is ook duidelijk aan te geven. De waarde kan wel '0' zijn, dit
betekent dat er bij de ratioschaal wel sprake is van een absoluut nulpunt. Voorbeelden: percentages, inkomen
in euro’s, gewicht in kilo’s.
Frequentieverdelingen:
Een frequentieverdeling rangschikt een steekproef door de waarnemingen van laagste naar hoogste score te
rangschikken en alle waarnemingen met dezelfde score te groeperen. Er zijn drie belangrijke eigenschappen van een
frequentieverdeling:
- Centrality refers to what a typical or average score looks like.
- Variability relates to whether the scores are clustered together or spread out evenly.
- The shape of a distribution is related to the degree to which a distribution is either symmetrical or skewed.
Cumulatieve frequentieverdeling:
, Distribution forms:
- Symmetrical distribution
- Uniform distribution
- Positively skewed distribution
- Negatively skewed distribution
De range is het verschil tussen de hoogste score en de laagste score van een distributie. Range=Xmax−Xmin
De interkwartielafstand is het verschil tussen het eerste kwartiel en het derde kwartiel van een distributie.
Range=Xmax−Xmin
De ‘five number summary’ bestaat uit vijf punten van een distributie:
1. Minimum
2. Eerste kwartiel
3. Mediaan
4. Derde kwartiel
5. Maximum
Een score is een outlier als:
- X < (Q1−1.5⋅IQR)
- X>(Q3+1.5⋅IQR)
Deviatie score: de afstand van een score tot het gemiddelde. X− X̄
Een score met een positieve deviatie ligt boven het gemiddelde, een negatieve score ligt onder het gemiddelde.
De sum of scores is het kwadraat van de som van alle deviatie scores gedeeld door het aantal scores en laat variantie
zien. SS=∑ (X− X̄)2
Variantie is het gemiddelde van de sum of squares:
Sigma = populatie en s= steekproef
De standaardafwijking is de wortel van de variantie:
- De percentiel rank van een score is het percentage van scores in een distributie die gelijk zijn of lager. Bij alle
𝑥𝑥
scores op volgorde: ∗ 100%
𝑛𝑛
- Percentielen zijn waardes die een distributie verdelen in 100 even delen. De index van de Pste percentiel van een
𝑃𝑃
verdeling is: 𝑖𝑖 = ∗ (𝑛𝑛 − 1) + 1
100
- Als je de data set in k gelijke delen verdeeld heten deze k-kwantielen. Er zijn altijd k-1 kwantielen
- Als je de data set in 4 delen verdeeld krijg je 4 kwartielen. De index van de Qste kwantiel van een verdeling is: 𝑖𝑖 =
𝑄𝑄
∗ (𝑛𝑛 − 1) + 1
4
𝑋𝑋−𝜇𝜇
De z-score laat zien aan welke kant van het gemiddelde de score staat. 𝑧𝑧 =
𝜎𝜎
- Een positieve z-score geeft aan dat de score boven het gemiddelde ligt
- Een negatieve z-score geeft aan dat de score onder het gemiddelde ligt
- Een z-score van 0 geeft aan dat de score hetzelfde is als het gemiddelde.
Correlatie is een statistische maat die de relatie tussen twee variabelen aangeeft.
- Een contingentietabel geeft de distributie van de ene variabele aan in de rijen en de andere variabele in de
kolom van een tabel.
- Een scatterplot geeft de correlatie voor kwantitatieve variabelen aan
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller matthiaslouws. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.97. You're not tied to anything after your purchase.