Samenvatting Toegepaste Statistiek
College 1:
Statistiek = het verzamelen, organiseren en interpreteren van data.
Variabele = een eigenschap van een persoon/situatie (in getal uitgedrukt)
- Kwantitatief (getallen)
- Kwalitatief (categorieën)
Meetniveaus:
- Nominaal Er is een verschil tussen de waarden (man/vrouw, namen, kleuren)
- Ordinaal Er is een verschil tussen de waarden en ik kan ze ordenen (HAVO/VWO)
- Schaal Er is een verschil tussen de waarden, ik kan ze ordenen en ik kan er berekeningen
meemaken (dosis, golflengte etc..)
Mediaan = de waarde die exact in het midden van alle getallen ligt.
- Oneven reeks: het middelste getal
- Even reeks: 2 middelste getallen/ alle waardes
2 , 3 , 1 , 0 , 0 , 1 , 2 ----> 0 , 0 , 1 , 1 , 2 , 2 , 3 ---> Mediaan: 1
Modus = het meest voorkomende getal van de reeks.
2 , 3, 1, 0 , 1 , 2, 1, ---> Modus: 1, want dit getal komt in totaal 3 keer voor.
Outliers: Grote afwijkingen (Hebben grote invloed op het gemiddelde)
Gemiddelde: Som van alle getallen / het aantal
- Zwakheden: Gevoelig voor outliers
2, 3, 1, 0, 0, 1, 2, 1, 2, 1, 2, 0, 0, 3
X = 18/14 = 1,286…
Scheefheid rechterkant =
positieve scheefheid
, Scheefheid naar links = negatieve scheefheid
Percentiel: %
Kwartiel: 25%, 50%, 75% en 100%
- 1e kwartiel: 25%, Q1
- 2e kwartiel: 50%, Q2, mediaan
- 3e kwartiel: 75%, Q3
Interkwartiel afstand (IKA): afstand van Q1 tot Q3 = 50%
- Outliers hebben geen invloed op IKA
Q1 = 14. Q2 = 20 Q3 = 33
IKA? 33-14 = 19
Hoe bepaal je de maximale outlier? --> De hoogste waarde die nog tussen Q3 + (IKA x 1,5) valt.
Hoe bepaal je de het minimale? --> De laagste waarde de nog tussen Q1 - (IKA x 1,5) valt.
Q1 = 14 Q2 = 20 Q3 = 33
1,5 x 19 = 28,5
Maximale outlier: 33 + 28,5 = 61,5
Minimale: 14 – 28,5 = -14,5