Populatie: bijv. alle klanten van een grote supermarktketen.
Steekproef: ik kies willekeurig 500 klanten die ik een vragenlijst voorleg.
- moet representatief zijn (afspiegeling van alle klanten).
- moet aselect zijn: alle klanten moeten even veel kans maken om tot de steekproef te
behoren.
In de statistiek heb je veel te maken met variabelen (bijv. geslacht, leeftijd, bedrijfssector
variabelen zoals omzet of betalingsduur).
Gegeven worden vaak samengevat met behulp van de volgende kengetallen:
Centrummaten: Spreidingsmaten:
- Gemiddelde - Spreidingsbreedte (range)
- Modus - Variantie
- Mediaan - Standaarddeviatie
- Variatiecoëfficiënt
*Gemiddelde
Formule steekproefgemiddelde: x= sommatieteken x/n
Sommatieteken x is de som van alle x-en
*Modus: waarneming die het meeste voorkomt
*Mediaan: de ‘middelste’ waarneming (nadat alle waarnemingen op volgorde zijn gezet)
*Spreidingsbreedte (range) = hoogte – laagste
*Standaarddeviatie (= s): een soort ‘gemiddelde afwijking ten opzichte van het gemiddelde’
Variantie (Var) en standaarddeviatie (s) bij een steekproef:
Var=(∑▒〖(x- gemiddelde x ̅)〗^2 / X: het gemiddelde
(n-1) N : het aantal waarnemingen
Stappenplan
1. Bereken voor elke x (x-x)^2
2. Tel alle uitkomsten bij elkaar op: sommatieteken (x-x)^2
3. Deel het totaal door n-1
4. De standaarddeviatie is de wortel van de variantie:
S = √var = √s2
Frequentie: hoe vaak komt een bepaalde uitkomst voor
Absoluut: in getallen
Relatief: in procenten
Cumulatief: alles tot nu toe op geteld
Classificeren: losse waarnemingen indelen in verschillende klassen klassenindeling of
frequentieverdeling.
Regels bij classificering
- Klassen moeten elkaar uitsluiten
- Klassenindeling is ‘uitputtend’ (elke waarneming moet in een klasse passen)
- Klassen bij voorkeur even breed
- Klassenindeling moet ‘gevoelig’ zijn
Continue variabelen alle variabelen kunnen voorkomen (bijv. in gewicht: 30,7)
Discrete variabelen niet alle waarden kunnen voorkomen (bijv. in jaren: 30)
, Frequentieverdeling: wat is hier de modus? Frequentiedichtheid
Bijv.:
Leeftijd Frequentie Klassenbreedte (x5) Frequentiedichtheid
10-<15 10 1 10
15-<25 32 2 32/2= 16
25-<35 29 2 29/2= 14,5
35-<50 40 3 40/3=13,33
50-<65 30 3 30/3=10
65-<85 9 4 9/4=2,5
16 is dus de modale klasse
Het gemiddelde geef je aan met een x met een streepje erboven.
Je berekent het gemiddelde door: sommatieteken (f x m)/n
De mediaan bereken bij een frequentieverdeling.
Me L + (r – 0,5) x (b/f)
L = Linker grens
r = rangnummer binnen de klasse
b = breedte van de klasse
f = frequentie van de klasse
Frequentieverdeling (steekproef): wat is de variantie en de standaarddeviatie
Var = s2 = sommatieteken f x (m – gemiddelde x)2
N–1
M = (klassenmidden)
F = frequentie
F M Fxm M–x (M – x)2 F(m-x)2
Meetniveaus (schaaltypen) variabelen
Nominaal Geen getallenschaal Geslacht, regio
Volgorde heeft geen betekenis
Oridnaal Geen getallenschaal Schooltype, oordeel (zeer
Volgorde heeft wel betekenis ontevreden t/m zeer tevreden)
Interval Getallenschaal, geen natuurlijk Temperatuur, IQ
nulpunt, verhoudingen hebben
geen betekenis
Ratio Getallenschaal, verhoudingen Afstand, omzet
hebben betekenis, vast
nulpunt
Absoluut Gehele aantallen, alleen Aantal medewerkers
positief of 0
Modus
De modus is de waarneming die het meest voorkomt. De modus kan op alle meetniveaus worden
toegepast, ook op nominaal niveau.
Mediaan
De mediaan is de ‘middelste’ waarneming, nadat alle getallen op volgorde zijn gezet. De mediaan
kan op alle meetniveaus voorkomen, behalve op nominaal niveau.