SAMENVATTEN EN REPRESENTEREN VN DATA
1. Verschillende soorten data
Kwalitatieve data kenmerk met een beperkt # uitkomstcategorieën die niet vn
numerieke aard zijn
- kunnen in een categorisch systeem worden geplaatst
- dichotomie: categorisch systeem met 2 categorieën
niet-geordend of nominaal
geordend of ordinaal
Kwantitatieve data gegevens drukken een hoeveelheid uit en zijn verkregen dr
metingen, tellingen…
- numerieke data
discreet: getallen die niet willekeurig dicht bij elkaar kunnen liggen
continue: kunnen theoretisch elke waarde aannemen
2. Voorstellen vn data
n = # gegevens p = # verschillende waarden
Kwalitatieve data
- frequentietabel
~ gegeven
~ frequentie
~ procent
(~ cumulatieve frequentie en procent)
- staafdiagram
~ X-as categorieën
~ Y-as frequenties
~ geen aangrenzende staven omdat ze geen continuïteit aantonen, allemaal
verschillende categorieën
Kwantitatieve data
- frequentietabel discrete data
~ idem als kwalitatieve data
- frequentietabel continue data
~ klassenindeling
1) zoek grootste en kleinste waarde
2) bereken feitelijke waarden -> kleinste -0.005 en grootste +0.005
3) bereken verschil tussen feitelijke extrema
4) deel waarde dr het aantal klassen dat je ong wilt (tussen 5 en 10 ->
delen dr beide)
5) kies klassenbreedte tussen beide waarden
- staafdiagram
- histogram: staven aan elkaar want toont een continuïteit, staven zijn de
klassenbreedte
~ linkseenzijdig: gemiddelde > mediaan
~ rechtseenzijdig: gemiddelde < mediaan
~ tweezijdig: gemiddelde = mediaan
1
, 3. Data resumeren
Locatie
- rekenkundig gemiddelde gevoelig vr uitschieters
~ algemeen (formule 1)
~ frequentietabel (formule 2)
- mediaan niet gevoelig vr uitschieters
~ middelste waarde v/d gegevens
1) rangschik gegevens vn klein nr groot
2) bereken n+1/2
3) zoek overeenkomstige getal in de data, als we een komma getal
bekomen dan gemiddelde
- interkwartielafstand
~ Q1 = n+1/4
~ Q2 = mediaan
~ Q3 = 3*n+1/4
Spreiding
- gemiddelde v/d kwadratische afwijking (formule 3)
- variantie (formule 4 & 5)
- standaardafwijking (formule 6)
- het bereik = maximum – minimum
- IKA = Q3 – Q1 ligt gevoelig aan uitschieters
Boxplot grafische voorstelling belangrijke kerngetallen
- mediaan
- Q1 en Q3
- 2 extremen
2
1. Verschillende soorten data
Kwalitatieve data kenmerk met een beperkt # uitkomstcategorieën die niet vn
numerieke aard zijn
- kunnen in een categorisch systeem worden geplaatst
- dichotomie: categorisch systeem met 2 categorieën
niet-geordend of nominaal
geordend of ordinaal
Kwantitatieve data gegevens drukken een hoeveelheid uit en zijn verkregen dr
metingen, tellingen…
- numerieke data
discreet: getallen die niet willekeurig dicht bij elkaar kunnen liggen
continue: kunnen theoretisch elke waarde aannemen
2. Voorstellen vn data
n = # gegevens p = # verschillende waarden
Kwalitatieve data
- frequentietabel
~ gegeven
~ frequentie
~ procent
(~ cumulatieve frequentie en procent)
- staafdiagram
~ X-as categorieën
~ Y-as frequenties
~ geen aangrenzende staven omdat ze geen continuïteit aantonen, allemaal
verschillende categorieën
Kwantitatieve data
- frequentietabel discrete data
~ idem als kwalitatieve data
- frequentietabel continue data
~ klassenindeling
1) zoek grootste en kleinste waarde
2) bereken feitelijke waarden -> kleinste -0.005 en grootste +0.005
3) bereken verschil tussen feitelijke extrema
4) deel waarde dr het aantal klassen dat je ong wilt (tussen 5 en 10 ->
delen dr beide)
5) kies klassenbreedte tussen beide waarden
- staafdiagram
- histogram: staven aan elkaar want toont een continuïteit, staven zijn de
klassenbreedte
~ linkseenzijdig: gemiddelde > mediaan
~ rechtseenzijdig: gemiddelde < mediaan
~ tweezijdig: gemiddelde = mediaan
1
, 3. Data resumeren
Locatie
- rekenkundig gemiddelde gevoelig vr uitschieters
~ algemeen (formule 1)
~ frequentietabel (formule 2)
- mediaan niet gevoelig vr uitschieters
~ middelste waarde v/d gegevens
1) rangschik gegevens vn klein nr groot
2) bereken n+1/2
3) zoek overeenkomstige getal in de data, als we een komma getal
bekomen dan gemiddelde
- interkwartielafstand
~ Q1 = n+1/4
~ Q2 = mediaan
~ Q3 = 3*n+1/4
Spreiding
- gemiddelde v/d kwadratische afwijking (formule 3)
- variantie (formule 4 & 5)
- standaardafwijking (formule 6)
- het bereik = maximum – minimum
- IKA = Q3 – Q1 ligt gevoelig aan uitschieters
Boxplot grafische voorstelling belangrijke kerngetallen
- mediaan
- Q1 en Q3
- 2 extremen
2