Grasple theorie
Variabelen
Variabele = Alles wat in een onderzoek gemeten, uitgevraagd of bijgehouden wordt.
- Eigenschap die verschillende waarden heeft voor verschillende individuen zoals
leeftijd/geslacht
Informatie ookwel data
Dataset bevat informatie over alle participanten en alle variabelen.
Meetniveaus
Alle variabelen kan je verdelen in twee soorten:
- Categorische variabelen → gemeten in groepen/categorieën
- Nominaal: classificatie zonder ordening
- Ordinaal: classificatie met logische ordening
- Continue variabelen → gemeten op schaal
- Interval: numerieke schaal, verschil tussen waardes zijn meetbaar en
relevant, geen absoluut nulpunt.
- Ratio: numerieke schaal, wel absoluut nulpunt, minimum = 0,
Populatie en steekproef
Populatie = de complete groep mensen waarover ze informatie willen verkrijgen
Steekproef = je neemt een kleine groep mensen die deel is van de gehele populatie
Representatief = kenmerken uit populatie komen terug in steekproef
Populatie gemiddelde: μ
Populatie standaarddeviatie: σ
Steekproefgemiddelde: x (met streepje erboven en krullende uiteinden)
Steekproefstandaarddeviatie: s
Twee vormen statistiek
1. Beschrijvende statistiek: steekproef en populatie zijn hetzelfde
2. Inferentiële statistiek: steekproef kleiner dan populatie
Frequentietabel
Frequentie = hoevaak een bepaalde waarde voorkomt
Frequentietabel = tabel waarin je aangeeft hoe vaak een waarde voorkomt
Frequenties:
- Absolute frequentie → getallen
- Relatieve frequentie → percentage
- Geldige frequentie → alleen geldige/goed beantwoorde antwoorden
- Cumulatieve frequentie → opgeteld van voorgaande groepen
,Relatieve versus absolute percentages
Procentuele verandering = nieuw-oud / oud x 100%
Percentage = deel / geheel x 100%
Absoluut percentage = een deel van geheel
Relatief percentage = de toename/afname ten opzichte van een ander percentage
- Relatieve percentages vertellen slechts een deel van een verhaal
Vermeld nooit een relatief percentage zonder ook een absolute waarde te melden.
Modus
Modus = welke waarde komt het meest voor?
Hoe vind je de modus?
1. Tel hoe vaak elke waarde voorkomt
2. De waarde die het meest voorkomt is de modus
3. Komen er twee waardes even vaak voor = Modi
Symbolen
Gemiddelde cijfer berekenen = optelsom van alle waarde / aantal cijfers
Conventie = afspraken over symbolen
Licht altijd je conventies toe in je verslag als je symbolen gebruikt, het is namelijk niet altijd
hetzelfde.
X = waarde of observatie
∑ = Sigma, alles na sigma wordt opgeteld (SOM)
N = aantal waardes
M = gemiddelde
X3 = derde waarde
I = index, die lage 3 noemen we de index!
n
∑ = tel de waardes van 3 tot laatste waarde op
i=3
, Mediaan
Centrum data = punt waar het grootste deel van je data geconcentreerd is, dit bereken je
met centrummaten
Uitschieter = getal dat anders is vergeleken met rest van de groep
a. Mediaan wordt minder/niet beïnvloed door uitschieters, gemiddelde wel!
Mediaan = anders dan het gemiddelde
- De mediaan is de middelste waarde
Bij oneven aantal waarden is waarden in het midden
Bij even aantal waarden is de mediaan het gemiddelde van de 2 middelste
Hoe vind je de mediaan?
1. Zet alle waarde op volgorde klein naar groot
2. Tel hoeveel waardes het in totaal zijn
3. Deel het totaal aantal waardes door 2 en rond af naar boven
4. Tel vanaf het begin tot aan getal van ^^
Gemiddelde
Bij interval en ratio reken je het gemiddelde uit, modus niet handig hierbij
Gemiddelde = alle waardes / aantal waardes
Gemiddelde waarde = x met streepje erboven
Gemiddelde = μ
Formule gemiddelde:
Bereik
Variatie = geeft aan hoeveel de data van elkaar verschillen
Bereik = verschil tussen hoogste en laagste waarde
a. Bereik = maximum - minimum
Kwartielen
Kwartielen = de getallen waarmee je de data verdeeld in 4 gelijke stukken.
Hoe bereken je de kwartielen bij oneven aantal?
1. Zet alle getallen op volgorde
2. Vind de mediaan
3. Zoek nu mediaan van 1e en 2e helft
Hoe bereken je de kwartielen bij even aantal?
1. Gemiddelde tussen twee waardes
Interkwartielafstand = afstand tussen Q3 en Q1 → Q3-Q1
Variabelen
Variabele = Alles wat in een onderzoek gemeten, uitgevraagd of bijgehouden wordt.
- Eigenschap die verschillende waarden heeft voor verschillende individuen zoals
leeftijd/geslacht
Informatie ookwel data
Dataset bevat informatie over alle participanten en alle variabelen.
Meetniveaus
Alle variabelen kan je verdelen in twee soorten:
- Categorische variabelen → gemeten in groepen/categorieën
- Nominaal: classificatie zonder ordening
- Ordinaal: classificatie met logische ordening
- Continue variabelen → gemeten op schaal
- Interval: numerieke schaal, verschil tussen waardes zijn meetbaar en
relevant, geen absoluut nulpunt.
- Ratio: numerieke schaal, wel absoluut nulpunt, minimum = 0,
Populatie en steekproef
Populatie = de complete groep mensen waarover ze informatie willen verkrijgen
Steekproef = je neemt een kleine groep mensen die deel is van de gehele populatie
Representatief = kenmerken uit populatie komen terug in steekproef
Populatie gemiddelde: μ
Populatie standaarddeviatie: σ
Steekproefgemiddelde: x (met streepje erboven en krullende uiteinden)
Steekproefstandaarddeviatie: s
Twee vormen statistiek
1. Beschrijvende statistiek: steekproef en populatie zijn hetzelfde
2. Inferentiële statistiek: steekproef kleiner dan populatie
Frequentietabel
Frequentie = hoevaak een bepaalde waarde voorkomt
Frequentietabel = tabel waarin je aangeeft hoe vaak een waarde voorkomt
Frequenties:
- Absolute frequentie → getallen
- Relatieve frequentie → percentage
- Geldige frequentie → alleen geldige/goed beantwoorde antwoorden
- Cumulatieve frequentie → opgeteld van voorgaande groepen
,Relatieve versus absolute percentages
Procentuele verandering = nieuw-oud / oud x 100%
Percentage = deel / geheel x 100%
Absoluut percentage = een deel van geheel
Relatief percentage = de toename/afname ten opzichte van een ander percentage
- Relatieve percentages vertellen slechts een deel van een verhaal
Vermeld nooit een relatief percentage zonder ook een absolute waarde te melden.
Modus
Modus = welke waarde komt het meest voor?
Hoe vind je de modus?
1. Tel hoe vaak elke waarde voorkomt
2. De waarde die het meest voorkomt is de modus
3. Komen er twee waardes even vaak voor = Modi
Symbolen
Gemiddelde cijfer berekenen = optelsom van alle waarde / aantal cijfers
Conventie = afspraken over symbolen
Licht altijd je conventies toe in je verslag als je symbolen gebruikt, het is namelijk niet altijd
hetzelfde.
X = waarde of observatie
∑ = Sigma, alles na sigma wordt opgeteld (SOM)
N = aantal waardes
M = gemiddelde
X3 = derde waarde
I = index, die lage 3 noemen we de index!
n
∑ = tel de waardes van 3 tot laatste waarde op
i=3
, Mediaan
Centrum data = punt waar het grootste deel van je data geconcentreerd is, dit bereken je
met centrummaten
Uitschieter = getal dat anders is vergeleken met rest van de groep
a. Mediaan wordt minder/niet beïnvloed door uitschieters, gemiddelde wel!
Mediaan = anders dan het gemiddelde
- De mediaan is de middelste waarde
Bij oneven aantal waarden is waarden in het midden
Bij even aantal waarden is de mediaan het gemiddelde van de 2 middelste
Hoe vind je de mediaan?
1. Zet alle waarde op volgorde klein naar groot
2. Tel hoeveel waardes het in totaal zijn
3. Deel het totaal aantal waardes door 2 en rond af naar boven
4. Tel vanaf het begin tot aan getal van ^^
Gemiddelde
Bij interval en ratio reken je het gemiddelde uit, modus niet handig hierbij
Gemiddelde = alle waardes / aantal waardes
Gemiddelde waarde = x met streepje erboven
Gemiddelde = μ
Formule gemiddelde:
Bereik
Variatie = geeft aan hoeveel de data van elkaar verschillen
Bereik = verschil tussen hoogste en laagste waarde
a. Bereik = maximum - minimum
Kwartielen
Kwartielen = de getallen waarmee je de data verdeeld in 4 gelijke stukken.
Hoe bereken je de kwartielen bij oneven aantal?
1. Zet alle getallen op volgorde
2. Vind de mediaan
3. Zoek nu mediaan van 1e en 2e helft
Hoe bereken je de kwartielen bij even aantal?
1. Gemiddelde tussen twee waardes
Interkwartielafstand = afstand tussen Q3 en Q1 → Q3-Q1