Statistiek
1.1 Algemeen
Een dataset bevat alle informatie over alle deelnemers en variabelen.
Absolute frequentie: aantal keer dat iets voorkomt
Relatieve frequentie: aantal keer dat iets voorkomt in %
Relatieve geldige frequentie: % ten opzichte van iedereen die een geldig antwoord heeft ingevuld
Cumulatieve relatieve frequentie: relatieve frequenties (%) tel je bij elkaar op
Twee soorten variabelen:
1. Categorische variabelen (groepen/categorieën)
- Nominaal. Zonder volgorde.
- Ordinaal. Met volgorde.
2. Continue variabelen (schaal lengte, zeespiegel)
- Metrische variabelen. Zijn kwantitatief.
Mediaan: middelste getal. Bij even aantal waarden is het het gemiddelde van middelste twee
waarden.
Modus: meest voorkomende waarde
1.2 Spreidingsmaten
Spreiding: hoe ver waarden van centrummaten afwijken en van elkaar verschillen
Maten van spreiding:
Bereik. Verschil hoogste en laagste waarde.
Mean absolute deviation (MAD). Gemiddelde absolute afwijking.
Absolute waarde is zonder + of – teken. Weinig nadruk op extreme waarden.
Variantie. Gemiddelde gekwadrateerde afwijking waarde van gemiddelde. Genoteerd als σ2
Standaarddeviatie. σ
Gemiddelde gekwadrateerde afwijking vertaald naar eenheid van variabele en wortel van
variantie.
Berekenen door: gekwadrateerde afwijkingen bij elkaar op te tellen, delen door aantal
waarden, wortel
Spreidingsdiagram als je de relatie wilt zien tussen twee variabelen op interval/ratio niveau
(temperaturen)
Bij afwijking wordt er gekeken naar het verschil tussen de waarden en het gemiddelde.
Gemiddelde afwijking is altijd 0.
, 1.3 Populatie en steekproef
Populatie gemiddelde: μ
Populatie standaarddeviatie: σ
Steekproef gemiddelde: x
Steekproef standaarddeviatie: s
Twee vormen statistiek:
1. Beschrijvende statistiek. Steekproef en populatie hetzelfde. Beschikt over alle informatie.
2. Inferentiële statistiek. Steekproef kleiner dan populatie. Op basis van steekproef uitspraak
over de populatie.
Steekproefvariatie houdt in dat voor elke steekproef er een ander antwoord uit kan komen. Toevallig
lage of hoge waarden gemeten.
Bij steekproefgemiddelde: (n-1). Steekproefcorrectie.
2.1 Kansen
Kans ligt altijd tussen 0 en 1. Notatie = P
Discrete variabelen: beperkt aantal getallen of opties.
Continue variabelen: kunnen alle waardes aannemen.
2.2 Verdelingen
Normale verdeling: symmetrisch. -1SD en +1SD = 68%. -2SD en +2SD = 95%.
Populatie verdeling: verdeling populatie.
Steekproef verdeling: verdeling van waardes uit één steekproef.
Steekproevenverdeling: verdeling van meerdere steekproefgemiddelden.
Significatieniveau zijn de meest onwaarschijnlijke waardes links en rechts van de normaalverdeling.
Valt waarde hier binnen? Niet significant.
2.3 Z-scores
Z-score in een normaal verdeling is het aantal SD dat een waarde van gemiddelde af ligt.
Van kans naar waarde: percentage delen door honderd. Getal opzoeken in Z-tabel en formule
omdraaien. X = μ + Z * σ
1.1 Algemeen
Een dataset bevat alle informatie over alle deelnemers en variabelen.
Absolute frequentie: aantal keer dat iets voorkomt
Relatieve frequentie: aantal keer dat iets voorkomt in %
Relatieve geldige frequentie: % ten opzichte van iedereen die een geldig antwoord heeft ingevuld
Cumulatieve relatieve frequentie: relatieve frequenties (%) tel je bij elkaar op
Twee soorten variabelen:
1. Categorische variabelen (groepen/categorieën)
- Nominaal. Zonder volgorde.
- Ordinaal. Met volgorde.
2. Continue variabelen (schaal lengte, zeespiegel)
- Metrische variabelen. Zijn kwantitatief.
Mediaan: middelste getal. Bij even aantal waarden is het het gemiddelde van middelste twee
waarden.
Modus: meest voorkomende waarde
1.2 Spreidingsmaten
Spreiding: hoe ver waarden van centrummaten afwijken en van elkaar verschillen
Maten van spreiding:
Bereik. Verschil hoogste en laagste waarde.
Mean absolute deviation (MAD). Gemiddelde absolute afwijking.
Absolute waarde is zonder + of – teken. Weinig nadruk op extreme waarden.
Variantie. Gemiddelde gekwadrateerde afwijking waarde van gemiddelde. Genoteerd als σ2
Standaarddeviatie. σ
Gemiddelde gekwadrateerde afwijking vertaald naar eenheid van variabele en wortel van
variantie.
Berekenen door: gekwadrateerde afwijkingen bij elkaar op te tellen, delen door aantal
waarden, wortel
Spreidingsdiagram als je de relatie wilt zien tussen twee variabelen op interval/ratio niveau
(temperaturen)
Bij afwijking wordt er gekeken naar het verschil tussen de waarden en het gemiddelde.
Gemiddelde afwijking is altijd 0.
, 1.3 Populatie en steekproef
Populatie gemiddelde: μ
Populatie standaarddeviatie: σ
Steekproef gemiddelde: x
Steekproef standaarddeviatie: s
Twee vormen statistiek:
1. Beschrijvende statistiek. Steekproef en populatie hetzelfde. Beschikt over alle informatie.
2. Inferentiële statistiek. Steekproef kleiner dan populatie. Op basis van steekproef uitspraak
over de populatie.
Steekproefvariatie houdt in dat voor elke steekproef er een ander antwoord uit kan komen. Toevallig
lage of hoge waarden gemeten.
Bij steekproefgemiddelde: (n-1). Steekproefcorrectie.
2.1 Kansen
Kans ligt altijd tussen 0 en 1. Notatie = P
Discrete variabelen: beperkt aantal getallen of opties.
Continue variabelen: kunnen alle waardes aannemen.
2.2 Verdelingen
Normale verdeling: symmetrisch. -1SD en +1SD = 68%. -2SD en +2SD = 95%.
Populatie verdeling: verdeling populatie.
Steekproef verdeling: verdeling van waardes uit één steekproef.
Steekproevenverdeling: verdeling van meerdere steekproefgemiddelden.
Significatieniveau zijn de meest onwaarschijnlijke waardes links en rechts van de normaalverdeling.
Valt waarde hier binnen? Niet significant.
2.3 Z-scores
Z-score in een normaal verdeling is het aantal SD dat een waarde van gemiddelde af ligt.
Van kans naar waarde: percentage delen door honderd. Getal opzoeken in Z-tabel en formule
omdraaien. X = μ + Z * σ