WETENSCHAPPELIJK DENKEN;STATISTIEK
1|P a gin a
, 1. Inleiding statistiek
1.1. Beschrijvende statistiek:
➔ Het resultaat van de beschrijvende statistiek is dus een beschrijving van de
meetgegevens onder de vorm van relevante karakteristieke grootheden.
Steekproef versus populatie:
• Steekproef
o Representatieve vertegenwoordigers uit de populatie
o Meetresultaten van de proefelementen
• Populatie:
o Deze verzameling die alle elementen bevat met dezelfde kenmerken als deze
die men in de steekproef selecteerde.
o Te groot om te gebruiken voor een onderzoek.
➔ Er zal blijken dat men met de resultaten uit de steekproef zinvolle uitspraken kan doen
over de populatie.
1.2. Verklarende statistiek:
➔ Men ziet dat op grond van de steekproefgegevens terug uitspraken kan doen over de
populatie, analoog zoals bij het schatten, en dit is kenmerkend voor de verklarende
statistiek.
1.3. Meten en meetniveaus
➔ Bij statistisch onderzoek gaat men kenmerken van voorwerpen of personen
vaststellen.
➔ Kenmerken zoals: de lengte van personen, oogkleur,…
• Meetschaal moet beschikken over een aantal voorwaarden:
1. Ordenbaarheid: wanneer men de verschillende waarnemingen kan ordenen.
2. Meeteenheid: deze eigenschap/voorwaarde is voldaan wanneer zelfde
verschillen tussen waarden, dezelfde verschillen hebben tussen de kenmerken.
3. Absoluut nulpunt: dit is een waarde (nul of 0) die de afwezigheid van het
kenmerk weergeeft.
2|P a gin a
,• Hierdoor is het mogelijk de volgende meetschalen/meetniveau’s te verkrijgen:
1.3.1. Nominaal meetniveau
• De kleur van de ogen kan niet zinvol door getallen weergegeven worden, maar alleen
door een naam zoals groen, grijs, bruin,…
• Nominale schaal (nomen = naam)
• Hier kan men eerder spreken van een indeling van het kenmerk in categorieën.
Voorbeelden:
Rijbewijs: Ja – Nee
Politieke partij: Open VLD – SP – CVP – Groen - …
Geslacht: Man – Vrouw
1.3.2. Ordinaal meetniveau
• Wanneer een kenmerk, bij de verschillende elementen van het onderzoek, zich alleen
in een rangschikking d.m.v. getallen laat uitdrukken zegt men, dat gemeten wordt
volgens het ordinaal meetniveau (er zit ordening in de getallen).
Voorbeeld:
De kwaliteit van wijn kan uitgedrukt worden in een aantal categorieën zoals: zeer
slecht, slecht, matig, goed en zeer goed.
In tegenstelling tot de kenmerken van het nominale niveau kunnen de hier
besproken kenmerken in een rangorde geplaatst worden, nl. van laag naar hoog,
waarbij zeer slecht dan de laagste trap in de rangorde is en zeer goed de hoogste.
3|P a gin a
, Daarom zal men in dergelijk geval het gemeten kenmerk meestal weergeven d.m.v.
een getal:
1 = zeer slecht; 2 = slecht; 3 = matig; 4 = goed; 5 = zeer goed
• De getallen duiden de rangorde aan van het gemeten kenmerk (kwaliteit), NIET de
grootte ervan.
• Gebruikelijke rekenkundige bewerkingen zoals optellen, aftrekken, vermenigvuldigen
en delen kunnen niet bij de rangordeschalen worden toegepast, maar wel statistische
methoden die op rangorde zijn gebaseerd (bv. Rangcorrelatie).
Andere voorbeelden:
Graad van de uitslag: voldoening, onderscheiding, grote onderscheiding,…
Tevredenheidstest: niet tevreden, matig tevreden,…
Restaurant-Hotel: *, **, ***, ****, *****
Militaire rang: soldaat, korporaal,…
1.3.3. Rationiveau (verhoudingsschaal)
• KAN NIET ONDER NUL!!!
• Gebeurt het toekennen in de klassieke zin van meten, nl. door te vergelijken met een
gelijksoortige grootheid die als eenheid geldt.
• Lengte, gewicht, bloeddruk, hartvolume,… kunnen door getallen uitgedrukt worden.
• Zo is een gewicht van 400 gram precies 4 maal zo groot als een gewicht van 100 gram
• Alle rekenkundige bewerkingen kunnen betekenisvol toegepast worden.
1.3.4. Intervalniveau
• Ligt tussen het ordinaal en rationiveau
• Er geld een arbitrair nulpunt, hierdoor kunnen verschillen tussen twee waarden
direct vergeleken worden.
• Gelijke intervallen tussen de waarden van de variabelen duiden op gelijke verschillen
tussen die waarden, maar verhoudingen tussen die variabelen hebben GEEN
betekenis.
Voorbeelden:
Temperaturen worden gemeten volgens het intervalniveau.
Het nulpunt op de Celsiusschaal werd door Celsius ingevoerd. Andere hebben andere
nulpunten ingevoerd.
➔ Als gevolg dat 60 graden niet twee maal zo warm is als 30 graden. Het verschil tussen
40 en 60 graden is wel even groot als tussen 80 en 100 graden. Dit komt omdat de
waarde 0 geen natuurlijk nulpunt is bij de Celsiusschaal.
4|P a gin a
, 1.4. Continu en discreet
• Als de waarde van een variabele een getal kan aannemen, dan kan deze zich
voordoen onder een discrete of continu vorm.
• Wanneer alle tussenliggende reële waarden zich kunnen voordoen spreken we van
een continue variabele, anders is het een discrete variabele.
Voorbeelden:
Continu Discreet
Lichaamslengte Aantal kinderen in huisgezin
Tijd voor 100m snellopen Bloedcellen per m3
Levensduur van een gloeilamp Sigaretten per dag
2. Ordenen en voorstellen van gegevens
2.1. Frequentietabellen
In dit hoofdstuk spreken we over hoe steekproefresultaten kunnen geordend worden en hoe
men de steekproefresultaten grafisch kan weergeven zodat in één oogopslag heel wat
duidelijk wordt.
Frequentietabel:
• Worden alle verschillende waarden in geplaatst met daarnaast het aantal keer dat
elke waarde zich voordoet.
• Wanneer de variabele over een ordenbaarheid beschikt, dan zal die volgorde ook zo
voorkomen in de frequentietabel.
Voorbeelden:
De tabellen in de afbeelding doen allen hetzelfde. In de tweede
tabel zie je dat de lengtes gegroepeerd worden volgens klasse. Bv.
155,156 en 157 worden gegroepeerd tot één klasse, nl. de klasse
met mogelijke waarden 155,156 en 157. Deze variabele is continu,
dus alle tussenwaarden kunnen voorkomen.
Bv. 155 is afkomstig van uitslagen gelegen tussen 154,5 en 155,5
cm (links inbegrepen, rechts niet).
5|P a gin a
, Voor de drie waarden wil dit zeggen dat ze afkomstig zijn uit de klasse 154,5-157,5 cm. In de
wiskunde = [154,5;157,5[ . De frequentie van de klasse wordt dan twee. (zie tabel). Hierdoor
krijg je ook een gegroepeerde frequentietabel:
2.2. Begrippen i.v.m. niet- gegroepeerde frequentietabellen
2.2.1. Steekproefgrootte: Het aantal elementen in een steekproef noemt de
steekproefgrootte, en stelt men (meestal) voor door het symbool n. In een
frequentietabel is de steekproefgrootte steeds de som van de aparte frequenties,
of de som van die kolom.
2.2.2. De waarde van een variabele: Een variabele wordt doorgaans voorgesteld door het
symbool x. Een waarde van de variabele wordt weergegeven door xi, met een getal
tussen het totaal aantal mogelijke waarden (of klassen)
2.2.3. De absolute frequentie fi : De frequentie van de i- waarde (of klasse) wordt
voorgesteld door fi. . (het werkelijk aantal)
Zo wordt de tabel van de neus- keel- oor aandoeningen:
6|P a gin a