Oefentoetsvragen uit het werkboek statistiek van BA107
WC1 Beschrijven van de data en normale verdeling
1. ‘Ernst van de depressie’ (optie C) spreekt voor zich (met als gradatie geen, gemiddeld tot meer dan
gemiddeld).
Ook het ‘Aantal keren somatische comorbiditeit’ kan als ordinale variabele beschouwd worden,
aangezien nog los van de ernst van de comorbiditeit, het aantal wel degelijk meeweegt (temeer
omdat depressie hier het onderwerp van onderzoek is).
zowel antw. A als C zijn juist. Antwoord B, specifieke comorbide angststoornissen, is een nominale
variabele.
2. De mediaan ligt (gezien het totaal van 38 waarnemingen) tussen de 19 e en 20e waarneming, dus
tussen de waarde van 25 en 26 in. Aangezien volgens de definitie 50% van de waarnemingen onder
en 50% boven de mediaan ligt, is 25,5 (antw. C) het enige juiste antwoord.
3. Boxplot A heeft waarde bij 45, deze waarde zit niet bij de dataset
Boxplot B heeft de mediaan niet bij 25,5
Rond de waarde 25 zijn er net iets minder waarnemingen gedaan dan er vlak onder en boven, dus is
histogram C (antw. C) de juiste. Bij antw. D is rond de waarde 25 namelijk net een piekje te zien in de
frequentieverdeling, waardoor dit een onjuiste weergave is.
4. Aan het histogram bij antwoord C te zien is het rechtsscheef verdeeld, omdat er een aantal
uitschieters rechts van de verdeling liggen.
5. De scores uit de vragenlijst zijn kwalitatief van aard, dus categoriaal (niet-numeriek). De
categorieën met scoring zijn geordend van lage tot hoge mate van instemming, en zijn dus ordinaal.
6. In de boxplot is aan de staartuiteinden te zien, dat de verdeling rechtsscheef is (de
rechterstippellijn ofwel het 4e kwartiel is langer dan de linkerlijn ofwel het eerste kwartiel). Zo ligt
bijv. in 4e kwartiel een kwart van de waarnemingen (zie op de x-as tussen de waarden 8 en de 10) en
dit komt overeen met weergave B (antw. B)
, Oefentoetsvragen uit het werkboek statistiek van BA107
WC2 Schatten met onzekerheid
1. De variantie van de steekproef is s = 15 = 225. De variantie
2 2
van de verdeling van de steekproefgemiddelden bij een
steekproef van 10, is SEM = s /n = 22,5 (antw. D)
2 2
2. Een steekproef genomen met n = 38, levert een gemiddelde
MA-hoek op van 16,8 graden.
Aangezien de variantie uit de populatie bekend is, kunnen we de
standaarddeviatie s van de populatie
berekenen, namelijkstandaarddeviatie = √variantie = √45. Het
BHI bereken je met de formule m ± za*s/√n. Voor een 95% BHI is
de z-waarde 1,96 (zie Z-tabel). Dus:
BHI = 16,8 ± 1,96 * √45/√38 = 16,8 ± 1,96 *
√(45/38) (waarbij SEM = s/√n) (antw. B)
3. 0,014 radialen (antw. A). De variantie kun je als
2
volgt omrekenen naar radialen : (√45/57,3) = 0,0137 radialen ~
2 2 2
0,014 radialen 2
4. De formule voor de standaarddeviatie van een steekproef is:
s (of sd) = √(7,94/8) = 0,996
SEM = s/√n = 0,996/√9 = 0,332
antw. B is juist
5. Ja, de door persoon B bepaalde gehaltes in de tabletten zijn
vergelijkbaar met die van persoon A. Het door persoon B
gevonden gemiddelde van de opgegeven waardes ligt namelijk in
het door persoon A berekende BHI (al vallen de waardes zelf er
buiten, het is een BHI voor de gemiddelden van de uit
de steekproef bepaalde gehaltes). Antw. A
6. De steekproefgrootte van 20 is hoogstwaarschijnlijk groot
genoeg om een normale steekproevenverdeling te krijgen.
Histogram B valt hiermee af. (Het gemiddelde van de
steekproevenverdeling zal bij deze steekproefgrootte ook gelijk
zijn aan de populatieverdeling.)
De SEM is 6,15/√20 = 1,38. Histogram D valt daarmee al af, daar
is de spreiding veel groter. De grenzen waarbinnen 99% van de
steekproefgemiddelden liggen is 9,98 ± 2,58*1,38, dus 6,43-
13,53. Histogram A valt hiermee af en het juiste antwoord is
antwoord C.
7. Antwoord C is onjuist. Bij 21 verschillende personen is de
bloeddruk gemeten met beide apparaten. Over de
nauwkeurigheid van de metingen (oftewel de accuraatheid, hoe
dicht de metingen liggen bij de werkelijke waarden) kan met deze