variabelen/frequentietabel
Categorische variabelen zijn meer een soort labels. Je kunt er getallen aan toekennen om ze te
‘’labelen’’, maar dat kunnen net zo goed andere getallen zijn.
Numerieke variabelen representeren de getallen echt zoals wij die kennen waardoor je ermee kan
rekenen.
Niveau Vaste Gelijke Absoluut Voorbeeld
volgorde afstanden nulpunt
Nominaal - - - Geslacht/identificatienummer
Ordinaal + - - Opleidingsniveau
Interval + + - Temperatuur
Ratio + + + Aantal kinderen in een klas
Frequentietabel = een frequentieverdeling in een tabel, vaak gebruikt voor categorische variabelen.
Absolute frequentie = het aantal malen dat een score voorkomt
Percentage = absolute frequentie gedeeld door het aantal individuen x 100
(deel:geheelx100)
Valide percentage = absolute frequentie: (totaal aantal individuen – missings) x 100
Cumulatieve frequentie = de som van de frequentie van een scorewaarde zelf en de
frequenties van alle lagere klassen.
Cumulatief percentage = som van het percentage van de scorewaarde en het percentage van
alle lagere klassen. Je moet altijd eindigen met 100.
Proportie = een getal dat de verhouding aangeeft tussen het aantal elementen uit een
populatie met een bepaalde eigenschap en het totale aantal elementen uit de populatie
(deel:geheel). Het percentage is de proportie x 100.
grafieken/boxplot
grafieken voor categorische variabelen:
staafdiagram (houdt ruimte tussen de staven!)
cirkel/taartdiagram
grafieken voor numerieke variabelen:
stemplot
histogram (staven tegen elkaar aan!)
Boxplot
mogelijke outliner als het meer dan 1.5 x IQR
boven het derde kwartiel of onder het eerste
kwartiel valt.
centrale tendentie
Centrale tendentie weer = centrale tendentie maten geven een samenvatting van groepsgegevens.
Het betekent strekking/neiging. Ze kijken waar het centrum/midden ligt van de verdeling.
Er zijn 3 centrummaten.
De mediaan (M): op volgorde het middelste getal van een verdeling of het gemiddelde
van de middelste twee getallen. M = (n+1)/2. Dit geeft aan
waar de mediaan staat (welk getal), niet de mediaan zelf.
Het gemiddelde: alle waardes bij elkaar optellen: het totaal
aantal waarden (n).
, Modus: de waarden/klassen met de hoogste frequenties. trimodaal = een verdeling met
3 modussen. bimodaal = een verdeling met 2 modussen. unimodaal = verdeling met 1
modus
Resistente/robuuste centrummaten = centrummaten die ongevoelig zijn voor externe
waarnemingen (modus en mediaan)
Niet robuust = wel gevoelig voor externe waarnemingen (gemiddelde, standaarddeviatie)
spreidingsbreedte = spreiding van een variabele (kleinste en grootste waarde).
Standaarddeviatie: (grofweg) gemiddelde afwijking t.o.v. gemiddelde
Variantie: standaarddeviatie in kwadraat.
Interkwartielafstand (IQR) = Q3-Q1
the five-number summary = minimum, Q1, M, Q3 en maximum
variantie (S2) = de mate waarin de waarden onderling verschillen.
Kan je aangeven door:
1. De range: het verschil tussen het hoogste en
laagste getal (minimum en maximum).
2. Het gemiddelde: de variantie kan je aangeven door te kijken hoe dichtbij of ver weg
alle scores van het gemiddelde afliggen (spreiding). Hoe dichter alle scores bij het
gemiddelde liggen, hoe kleiner de variantie.
Hiervoor bereken je de deviatie score = elke score – het gemiddelde. Als de uitkomst
positief is betekent het dat dit getal boven het gemiddelde ligt, negatief is eronder.
Hierna reken je de ‘deviation score squared’ uit, door alle losse deviaties bij elkaar op te
tellen.
Tel vervolgens alle losse deviation score squared bij elkaar op = the total some of
squares. Hoe meer participanten je hebt, hoe hoger dit getal zou zijn. Je wilt voorkomen
dat je variantie afhangt van je aantal participanten, daarom doe je nog een laatste stap:
Deel deze uitkomst door het totale aantal participanten – 1. Dit is dan de totale
variantie = de totale variabiliteit in een onderzoeksdataset.
variantie = standaarddeviatie in het kwadraat.
totale variantie = systematische variantie + foute variantie.
dichtheid = de relatieve frequentie : de klassenbreedte
density curve/dichtheidscurve is een soort grafiek waarmee het algemene
patroon van een verdeling wordt aangegeven.’
68-95-99,7 regel = de empirische regel