Blok 6 GZW1026 Introductie in Statistische Methodes
Alle video’s, colleges, SPSS seminars, syllabus aanvullingen,
werkcollege opdrachten en extra oefentoets
Faculty of Health, Medicine and Life Sciences (FHML)
Bachelor Gezondheidswetenschappen
Blokcode: GZW1026
1
,Inhoud
Week 1
- College P.3
- SPSS seminars P.6
- Video’s + syllabus aanvullingen P.10
- Responsiecollege P.31
Week 2
- College P.35
- SPSS seminars P.39
- Extra info week 2 P.42
- Video’s + syllabus aanvullingen P.46
- Responsiecollege P.54
Week 3
- College P.55
- SPSS seminars P.61
- Video’s + syllabus aanvullingen P.66
- Responsiecollege P.83
Week 4
- College P.85
- Video’s + syllabus aanvullingen P.89
- Responsiecollege P.95
Opdrachten seminars P.96
Oefentoets P.143
2
,Week 1
College week 1: descriptieve statistiek
Descriptive statistics: describing and summarizing data
Types of data: nominal, ordinal, interval, ratio
Graphs: Histograms, bar charts
Theoretical distribution: skewed, symmetric
Measures of central tendency: mean, mode and median
Measures of variability: variance and standard deviation
Z-score
Populatie vs sample (steekproef):
- Population: een hele groep eenheden voor de
analyse
- Parameter: de waarde van een variabele die een populatie
karakteriseert
- Sample: een subgroep van de populatie
- Statistiek: de waarde van een variabelen dat de subgroep
karakteriseert.
SPSS: horizontaal: variabelen en verticaal: cases (1 tm…)
Als de staven in een staafdiagram te veel van elkaar verschillen is er
niet genoeg gerandomiseerd. Dan zouden ze ongeveer even hoog zijn.
Staafdiagram die bv van 1 tot 20 gaat kun je ook omwisselen van 20 naar 1. Het maakt niet
uit. Elke staaf heeft een eigen gegeven en bij een histogram is er een bepaalde volgorde.
Je kunt bij een histogram gemiddeldes en SD uitrekenen en bij een staafdiagram niet.
Opp histogram: optellen krijg je 1. 1 staaf is een bepaald percentage en samen vormen ze 1.
Grafiek met glijbaan aan de rechterkant: rechtsscheve verdeling/ positively skewed.
Opp onder de grafiek is gelijk aan 1 (onder een verdeling, bv normaalverdeling).
Vb rechtsscheef: aankomen in een collegezaal: veel op tijd en een paar te laat.
Vb linksscheef/ negatively: overlijden leeftijd
Symmetrische verdeling: een soort hierbinnen is de normale verdeling
Measures of tendency/center: mean, modian, mode
Spread/ variability: range, IQ range, SD
3
, Range: verschil tussen kleinste en grootste. Is niet voldoende om twee groepen te
vergelijken. Dan kun je beter kijken naar SD want die geeft een duidelijker beeld over de
afwijkingen.
Breder histogram: grotere SD
Q1 = P25: eerste 25% van de waarnemingen ligt eronder.
Q3 = P75: 25% ligt erboven.
Bij deze bloxplot zie je ook dat die rechtsscheef is verdeeld (je ziet dat de waardes
uitwijken naar 281 -> ver van de mediaan).
Boxplot kan bij continu, interval en ratio variabelen. Niet bij een staafdiagram: die is
meer voor nominale variabelen.
Normale verdeling: symmetrisch, mediaan = mode = mean
Z-score: hoeveel SD ligt score van mean in eenheden van SD
μ is gemiddelde in populatie
x̅ is gemiddelde in steekproef
Scatterplot: puntenwolk. Elk punt heeft de meting van de x en de y.
Correlatie:
- Direction: + of –
- Sterkte: punten meest dicht bij elkaar -> meer samenhang -> meer correlatie
- Unusual features: bv maar met 1 x-waarde
Pearson correlation coefficient: r(X,Y)
Correlation r: geeft de sterkte (hoe dicht bij de lijn) en de richting (+ of -) van een straight
line relationship.
Causation: correlatie tussen variabelen is niet automatisch causatie.
Causaal verband:
- X= onafhankelijke variabele (gewicht)
- Y= afhankelijke variabele, (pulse) hangt af van andere variabelen. Pulse hangt af van
lichaamsgewicht.
Regressielijn: lijn die de puntenwolk het beste kan samenvatten. Het geeft de gemiddelde
relatie tussen Y en X-waardes.
- Je wilt de residuen (residuele variantie) van Y tot de lijn zo klein mogelijk maken. De
som van de residuen (gekwadrateerd anders heffen ze op) geeft de variatie rondom
de regressielijn, maar die som wil je zo klein mogelijk hebben en daar komt dus je
regressielijn.
- Voorwaarden:
o Y moet een kwantitatieve variabele zijn (continu: lichaamsgewicht, lengte,
niet: ziek/ niet ziek -> is kwalitatief)
De formule van de regressielijn wordt bepaalde door:
4