GZW1026 – Introductie statistische methoden voor D
Seminairs
- Seminair 1.1 2
- Seminair 1.2 14
- Seminair 2.1 29
- Seminair 2.2 40
- Seminair 3.1 48
- Seminair 3.2 57
- Seminair 4.1 66
- Seminair 4.2 70
1
,Seminair 1.1 assignments
Ratio → histogram of boxplot Antwoorden + motivatie
Problem 1
In a sample of women, the number of children that each woman has, is an example
of which type of measurement?
a. Nominal
b. Ordinal
c. Interval
d. Ratio
→ Bij ratio is er een vaste nul-waarde. Dus wanneer het aantal kinderen 0 is,
heeft een vrouw geen kinderen.
Problem 2
In which situation would the median be an appropriate measure of central tendency?
a.When the average is not appropriate
b. When the mode is less than 10
c. When the data are of nominal scale level
d. When the data are of ordinal scale level
→ Bij nominaal kan je geen gebruik maken van de mediaan.
Problem 3
Which of the following is not true for a normal distribution?
a.Median is equal to the mode
b. Mode is equal to the mean
c. The distribution is skewed to the right
d. Approximately 95% of the observations are located between the mean minus two
times the standard deviation and the means plus two times the standard deviation
→ Bij normale distributie zit de distributie in het midden en niet naar rechts.
Problem 4
Which of the following is true for a distribution skewed to the left?
a.Mean is smaller than the median, the median is smaller than the mode
b. Mode is smaller than the median, the median is smaller than the mean
c. Mode, median and mean are equal
d. Median is smaller than the mean, the mean is smaller
than the mode
Problem 5
Which of the following is true of a normal distribution?
a.The distribution has two modes
b. The distribution is not symmetric
c. Approximately 68% of the observations are located between the mean minus one
standard deviation and the mean plus one standard deviation
2
,d. Approximately 50% of the observations are located between the mean minus one
standard deviation and the mean plus one standard deviation
→ Normale distributie is unimodal en heeft dus maar 1 piek. Bovendien is een
normale distributie altijd symmetrisch.
Problem 6
Which option is the mean of the numbers below? 4544356342
a. 10
b. 8
c. 4
d. 4.5
4+5+4+4+3+5+6+3+4+2
→ =4
10
Problem 7
Which option is the variance of the numbers below? 4544356342
a. 4.0
b. 1.3
c. 1.2
d. 1.8
→ ((4-4)2 + (5-4)2 + (4-4)2 + (4-4)2 + (3-4)2 + (5-4)2 + (6-4)2 + (3-4)2 + (4-4)2 +
(2-4)2)/ 10 = 1,2
Wanneer N-1 en wanneer normaal n? Variantie beschouwd als steekproef moet je N-
1 (meestal zo, niet gehele populatie maar steekproef. De variantie moet een
representatie zijn voor de populatie, dus N-1). Variantie beschouwd als populatie
moet je gewoon N doen
Problem 8
If the variance is very low:
a. The individuals in the data set are very different from eachother
b. The standard deviation is 0
c. The data set is too small
d. The individuals in the data set are very similar to eachother
→ Hoe lager de variantie, hoe beter de getallen op elkaar lijken. Wanneer je 2
reeksen getallen hebt: -10, 0, 10, 20, 30 of 8, 9, 10, 11, 12 en de varianties
berekent, zal je zien dat de variantie van de eerste reeks (-10 tot 30) 200 is en
de variantie van de tweede reeks (8 tot 12) 2 is. Hieruit kan je afleiden dat hoe
meer de getallen bij elkaar liggen, hoe lager de variantie is.
Problem 9
What is the minimal level of measurement required to calculate a mode?
a. ratio
3
, b. interval
c. ordinal
d. nominal
→ Bij de modus bepaal je welke categorie of wel getal het vaakst voorkomt.
Bij nominaal heb je bijvoorbeeld haarkleur. Hierbij kan je bepalen hoe vaak
een bepaalde kleur haar voorkomt. Kan bij elke variabele.
Problem 10
Explain on what scale level the following measurements are:
a.Haircolor (e.g.brown, black, blond, red, grey)
Nominaal, er is geen natuurlijke volgorde en de categorieën zijn niet
geordend. De ruimte tussen de scores heeft geen betekenis.
b. Social economic status (low, middle,high)
Ordinaal, er is wel een natuurlijke volgorde. Er is echter een onbekende
afstand tussen de rankings.
c. Income (in euros)
Ratio, de gegevens zijn geordend en er is een bekende afstand tussen de
punten. Bovendien betekent 0 inkomen, dus geen inkomen.
d. Temperature (in degrees Celsius)
Interval, de gegevens zijn geordend en de afstand tussen de punten is
bekend. Wanneer de temperatuur 0 graden is, betekent dit echter niet dat er
geen temperatuur is.
e. Age (in years)
Ratio, de gegevens hebben een natuurlijke volgorde en zijn geordend. De
afstand tussen de punten is bekend, maar wanneer de leeftijd 0 is, betekent dit
dat er ‘geen leeftijd’. Bovendien kan je zeggen dat iemand van 20, 2x zo oud is
als iemand van 10 jaar.
f. Blood pressure (in mmHg)
Ratio, de gegevens hebben een natuurlijke volgorde en zijn geordend. De
afstand tussen de punten is bekend, maar wanneer de bloeddruk 0 is,
betekent dit dat er geen bloeddruk is.
g. Sort of cancer (lung, prostate, bowel,etc.)
Nominaal, er is geen natuurlijke volgorde en bovendien zijn de categorieën
niet geordend.
4