Week 1
Definitie Statistiek: Verzamelen, bewerken en interpreteren
We onderscheiden 4 fases in een onderzoek:
1. Ontwerpen
2. Verzamelen
3. Analyseren
4. Evalueren
Meetniveaus
Categorische variabelen = gemeten in groepen & categorieën
- Nominaal = kwalitatieve classificatie vb. Kleuren
- Ordinaal = kwalitatieve classificatie met een logische ordening vb. KNMI weeralarm,
stoplicht (ordenen)
Continue variabelen = gemeten op schaal
- Interval = numerieke schaal vb. aantal meter zeespiegelstijging. Verschillen zijn meetbaar en
relevant. Ze hebben geen absoluut nulpunt.
- Ratio = numerieke schalen met een absoluut nulpunt, 0 is echt het minimum. Vb. lengte en
gewicht. Je kunt geen negatieve lengtes en gewichten meten. Verschillen tussen getallen
hebben wel betekenis.
Gemiddelde
Bij interval- of Ratio data is het niet handig om de Modus uit te rekenen. Alle waardes zijn vaak net
anders, dus komt er geen 1 waarde het meest voor.
Bij interval- of ratio data rekenen we daarom vaak het gemiddelde uit. Het gemiddelde is gevoelig
voor uitschieters.
Stap 1; Tel alle waardes bij elkaar op
Stap 2; Deel door het aantal waardes
Waarde = X
Als je de som van iets neemt, gebruik je de Griekse hoofdletter Sigma ∑
Aantal waardes = n
Gemiddelde waarde = X met een streepje erboven of µ
Gemiddelde = optellen (alle waardes) / Aantal waardes
Korter =
µ = ∑ (X) / n
Modus
Centrummaat = punt waar het grootste deel van de data zich bevindt.
Modus = Welke waarde het meeste voor komt
Hoe vind je de modus?
- Tel hoe vaak elke waarde voorkomt?
- De waarde die het meeste voorkomt is de Modus
- Komen er 2 waardes even vaak voor? Dan zijn er 2 ‘modi’.
, Modus gebruik je bij categorische data. Als er geen enkel getal het meest voorkomt kun je geen
modus berekenen. Modus is het makkelijkst te vinden bij categorische data.
Absolute frequentie = hoe vaak de modus voorkomt.
Mediaan
Centrummaten = manieren om het punt waar het grootste deel van je data is te bepalen
Deze centrummaat kun je toepassen op variabelen van ordinaal en ratio meetniveau
Uitschieter = een waarde die uitschiet bij alle andere waarden.
Mediaan = middelste waarden van een dataset
Hoe vind je de mediaan?
- Zet alle waarden op volgorde van klein naar groot
- Tel hoeveel waardes er totaal zijn
- Deel het totaal aantal waardes door 2 en rond af naar boven
- Tel vanaf het begin tot aan het getal uit stap 3 om zo de middelste waarde te vinden
Als er even aantal waardes is, is de Mediaan de middelste van de 2 waarde!
Frequentietabel
Frequentie = Hoe vaak bepaalde waardes voorkomen. In een tabel vorm is het een frequentietabel.
Absolute frequentie = Een aantal keer dat iets voorkomt
Relatieve frequentie = Het aantal keer dat iets voorkomt uitgedrukt als percentage; relatief ten
opzichte van het totaal aantal keren. Het getal dat het aantal waarnemingen uitdrukt in verhouding
tot het totale aantal waarnemingen.
Geldige frequentie = vb. geldige relatieve frequentie berekenen ten opzichte van iedereen die een
geldig antwoord in heeft gevuld.
Cumulatieve relatieve frequentie = hierbij tel je de relatieve frequentie van een groep op bij de
percentages van de voorgaande groepen.
Staafdiagram
- Zet alle groepen op de horizontale x-as
- Teken voor elke groep een staafje waarbij de hoogte de frequentie aangeeft.
Dit is een staafdiagram
Voordelen staafdiagram is dat je meteen ziet:
- Welke groepen de hoogste en laagste frequentie hebben
- De verhoudingen goed te zien zijn.
Is goed te gebruiken als er niet te veel groepen zijn en deze groepen allemaal voldoende hoge
frequenties hebben.
Definitie Statistiek: Verzamelen, bewerken en interpreteren
We onderscheiden 4 fases in een onderzoek:
1. Ontwerpen
2. Verzamelen
3. Analyseren
4. Evalueren
Meetniveaus
Categorische variabelen = gemeten in groepen & categorieën
- Nominaal = kwalitatieve classificatie vb. Kleuren
- Ordinaal = kwalitatieve classificatie met een logische ordening vb. KNMI weeralarm,
stoplicht (ordenen)
Continue variabelen = gemeten op schaal
- Interval = numerieke schaal vb. aantal meter zeespiegelstijging. Verschillen zijn meetbaar en
relevant. Ze hebben geen absoluut nulpunt.
- Ratio = numerieke schalen met een absoluut nulpunt, 0 is echt het minimum. Vb. lengte en
gewicht. Je kunt geen negatieve lengtes en gewichten meten. Verschillen tussen getallen
hebben wel betekenis.
Gemiddelde
Bij interval- of Ratio data is het niet handig om de Modus uit te rekenen. Alle waardes zijn vaak net
anders, dus komt er geen 1 waarde het meest voor.
Bij interval- of ratio data rekenen we daarom vaak het gemiddelde uit. Het gemiddelde is gevoelig
voor uitschieters.
Stap 1; Tel alle waardes bij elkaar op
Stap 2; Deel door het aantal waardes
Waarde = X
Als je de som van iets neemt, gebruik je de Griekse hoofdletter Sigma ∑
Aantal waardes = n
Gemiddelde waarde = X met een streepje erboven of µ
Gemiddelde = optellen (alle waardes) / Aantal waardes
Korter =
µ = ∑ (X) / n
Modus
Centrummaat = punt waar het grootste deel van de data zich bevindt.
Modus = Welke waarde het meeste voor komt
Hoe vind je de modus?
- Tel hoe vaak elke waarde voorkomt?
- De waarde die het meeste voorkomt is de Modus
- Komen er 2 waardes even vaak voor? Dan zijn er 2 ‘modi’.
, Modus gebruik je bij categorische data. Als er geen enkel getal het meest voorkomt kun je geen
modus berekenen. Modus is het makkelijkst te vinden bij categorische data.
Absolute frequentie = hoe vaak de modus voorkomt.
Mediaan
Centrummaten = manieren om het punt waar het grootste deel van je data is te bepalen
Deze centrummaat kun je toepassen op variabelen van ordinaal en ratio meetniveau
Uitschieter = een waarde die uitschiet bij alle andere waarden.
Mediaan = middelste waarden van een dataset
Hoe vind je de mediaan?
- Zet alle waarden op volgorde van klein naar groot
- Tel hoeveel waardes er totaal zijn
- Deel het totaal aantal waardes door 2 en rond af naar boven
- Tel vanaf het begin tot aan het getal uit stap 3 om zo de middelste waarde te vinden
Als er even aantal waardes is, is de Mediaan de middelste van de 2 waarde!
Frequentietabel
Frequentie = Hoe vaak bepaalde waardes voorkomen. In een tabel vorm is het een frequentietabel.
Absolute frequentie = Een aantal keer dat iets voorkomt
Relatieve frequentie = Het aantal keer dat iets voorkomt uitgedrukt als percentage; relatief ten
opzichte van het totaal aantal keren. Het getal dat het aantal waarnemingen uitdrukt in verhouding
tot het totale aantal waarnemingen.
Geldige frequentie = vb. geldige relatieve frequentie berekenen ten opzichte van iedereen die een
geldig antwoord in heeft gevuld.
Cumulatieve relatieve frequentie = hierbij tel je de relatieve frequentie van een groep op bij de
percentages van de voorgaande groepen.
Staafdiagram
- Zet alle groepen op de horizontale x-as
- Teken voor elke groep een staafje waarbij de hoogte de frequentie aangeeft.
Dit is een staafdiagram
Voordelen staafdiagram is dat je meteen ziet:
- Welke groepen de hoogste en laagste frequentie hebben
- De verhoudingen goed te zien zijn.
Is goed te gebruiken als er niet te veel groepen zijn en deze groepen allemaal voldoende hoge
frequenties hebben.