Kernbegrippen Statistiek II:
Hoofdstuk 2: Meten en Meetniveaus:
Equivalentieklasse = deelverzameling van de populatie die alle elementen
groepeert, die voor het bestudeerde kenmerk als equivalent wordt gezien
Meetschaal = toekennen van een waarde aan de equivalentieklassen
Meetniveau = verschillende manieren hoe variabelen gemeten kunnen worden;
nominaal, ordinaal, interval en ratio
Kwalitatieve waarden = variabelen die beschrijvend zijn, die bepaalde
eigenschappen toekennen aan de variabelen
Kwantitatieve waarden: kunnen gemeten worden en zijn numeriek van aard, ze
vertegenwoordigen bv de frequentie, de grootte, …
Modaliteiten: de verschillende waarden of categorieën die variabelen kunnen
aannemen in een dataset, identificeert de variabelen, bv modaliteiten van burgerlijke
staat kan zijn: getrouwd, verloofd, …
Meeteenheid = in welke eenheid je je variabele kan/gaat uitdrukken, zoals dat °C
en °F verschillende meeteenheden zijn
Absoluut nulpunt = verwijst naar het laagst mogelijke punt op een schaal. Bij
temperaturen worden absolute nulpunten niet gehanteerd omdat ze ook negatieve
waarden kunnen aannemen
Nominaal meetniveau = je kan deze opdelen in categorieën zonder enige vorm
van ordening of volgorde tussen de variabelen, niet kwantitatief!
Ordinaal meetniveau = variabelen kunnen worden geordend en er is sprake van
volgorde, maar geen vaste afstanden tussen de variabelen, zoals diploma
Intervalmeetniveau = variabelen worden numeriek gemeten en hebben ze een
ordinale rangorde, hierbij hebben variabelen wel gelijke afstanden tussen hen en een
absoluut nulpunt, zoals graden Celsius
Ratiomeetniveau: variabelen worden gemeten met een absoluut nulpunt,
afstanden en verhoudingen tussen variabelen zijn waardevol; gewicht, lengte, leeftijd,
…
Dummyvariabele = variabelen die worden gecodeerd naar binaire codes, met
waarde 0 of 1
Hiërarchie van meetniveaus = nominaal, ordinaal, interval en ratio, kan niet
andersom worden gebruikt!
1
,Hoofdstuk 3: Frequentieverdelingen en grafische voorstellingen
· Absolute frequentie = verwijst naar het aantal keer dat een waarde of variabele
voorkomt
· Relatieve frequentie = hoe vaak een bepaalde waarde voorkomt in verhouding
met totale aantal waarnemingen in de steekproef
· Absolute cumulatieve frequentie = hoeveel waarnemingen er onder een
bepaalde waarde vallen in de dataset (aantal)
· Relatieve cumulatieve frequentie = hoeveel procent van de waarnemingen er
onder een bepaalde waarde van de dataset vallen (aandeel)
· Waarnemingsklasse = interval van waarnemingen dat wordt gebruikt om data te
groeperen bij het maken van een frequentietabel of histogram, maakt de data
overzichtelijker
· Exacte klasse = klasse of waarnemingen hoe we ze exact zien, zonder afronding
· Klassenmidden = midden tussen de bovengrens en ondergrens
· Cirkeldiagram = of taartdiagram, grafische voorstelling waarin waarden
voorgesteld worden in schijven
· Cumulatieve frequentiefunctie = functie die de cumulatieve frequentie van
waarden in dataset weergeeft tot aan een bepaalde waarde
· Frequentiepolygoon = is een grafische voorstelling van de frequentietabel,
waarbij het uiteinde van de frequenties als punt wordt gevisualiseerd en deze
punten worden vervolgens verbonden met elkaar
2
, Hoofdstuk 4: Univariate statistiek:
Parameter van ligging = verschillende parameters kunnen bepalen waar de
variabele precies zal liggen
Centrummaten = maatstaven van centrale tendens die het midden van de dataset
beschrijven, zoals mediaan, modus, …
Modus/modale klasse: meest voorkomende waarde in de frequentietabel, meest
voorkomende klasse
Kwantiel: verdeelt de frequentietabel in twee gelijke delen
Mediaan: verdeelt de geordende frequentietabel in twee gelijke delen en zoekt
vervolgens de middelste waarde
Rekenkundig gemiddelde = telt alle waarden op en deelt deze vervolgens door het
aantal waarnemingen, hierdoor krijgen we een gemiddelde
Harmonisch gemiddelde = berekent het gemiddelde met de nadruk op de
verhoudingen van deze waarden, zoals het berekeken van een gemiddelde voor km/h
Meetkundig gemiddelde = berekent het gemiddelde met de nadruk op
verhoudingen tussen de verschillende getallen, zo wordt er vaak gebruik gemaakt van
meetkundig gemiddelde voor groeipercentages
Momenten = verwijzen naar bepaalde kenmerken van de verdeling van gegevens, ze
geven informatie over de vorm, ligging, …
Gewone momenten = momenten rond 0, is gelijk aan 0
Centrale momenten = of momenten rond het gemiddelde, kunnen 4 verschillende
vormen aannemen, zo geeft het eerste moment het gemiddelde weer, het tweede de
variantie, het derde de scheefheid en het vierde de kurtosis
Spreiding = het geeft aan hoe ver waarden van elkaar verschillen, zo zijn er
verschillende maatstaven om de spreiding in een dataset te berekenen, zoals de
variantie, standaardafwijking, IKA, IDA, modus en variantie van de gemiddelde
absolute afwijking
Variantie = spreidingsmaat, ook gelijk aan het tweede centrale moment rond het
gemiddelde. Wordt berekent door de variatie te delen door steekproefgrootte, het
berekent de gemiddelde kwadratische afwijking van elk punt tot het gemiddelde, hoe
hoger de variantie, hoe groter de spreiding
Standaardafwijking = is een spreidingsmaat, ook gelijk aan de vierkantswortel van
de variantie en geeft aan hoeveel waarden typisch afwijken van het gemiddelde van
de dataset
Variatiecoëfficiënt = is een spreidingsmaat, wordt gebruikt om de relatieve
spreiding van verschillende datasets te vergelijken met elkaar, wordt berekent door
3