Practical Biostatistics
Samenvatting module 3:
Practical Biostatistics
1
, Samenvatting module 3:
Practical Biostatistics
Inhoudsopgave
1. College 1: Data description ................................................................................................................. 4
1.1 Leerdoelen ..................................................................................................................................... 4
1.2 Beschrijvende en verklarende statistiek ....................................................................................... 4
1.3 Normale verdeling ......................................................................................................................... 5
1.4 Categorische data .......................................................................................................................... 7
1.5 Numerieke data ............................................................................................................................. 8
2. College 2: Analyzing binominal data ................................................................................................. 11
2.1 Leerdoelen ................................................................................................................................... 11
2.2 Afhankelijke en onafhankelijke variabelen ................................................................................. 11
2.3 Schatten versus hypotheses testen............................................................................................. 12
2.5 Chi kwadraat test......................................................................................................................... 14
3. College 3: Analysing data from two groups...................................................................................... 18
3.1 Leerdoelen ................................................................................................................................... 18
3.2 Continue data .............................................................................................................................. 18
3.3 Z-verdeling ................................................................................................................................... 19
3.4 95% betrouwbaarheidsinterval van het gemiddelde .................................................................. 20
3.5 T-verdeling ................................................................................................................................... 21
3.6 Non-parametrische testen .......................................................................................................... 23
4. College 4: Numerical data: more than two groups ........................................................................... 24
4.1 Leerdoelen ................................................................................................................................... 24
4.2 Systematische aanpak statistiek.................................................................................................. 24
4.2.1 Meetniveau .......................................................................................................................... 24
4.2.2 Aantal groepen (2 of meer) .................................................................................................. 25
4.2.3 Afhankelijkheid van data ...................................................................................................... 26
4.2.4 Test assumpties .................................................................................................................... 26
4.3 ANOVA ......................................................................................................................................... 27
4.4 Non parametrische tests bij > 2 groepen .................................................................................... 30
5. College 5: Correlation & Linear Regression ....................................................................................... 31
5.1 Leerdoelen ................................................................................................................................... 31
5.2 Correlatie ..................................................................................................................................... 31
5.2 Lineaire regressie......................................................................................................................... 34
6. College 6: Logistic regression ............................................................................................................ 38
2
, Samenvatting module 3:
Practical Biostatistics
6.1 Leerdoelen ................................................................................................................................... 38
6.2 Logistische regressieanalyse........................................................................................................ 38
7. College 7: Introductie multivariate analyses ..................................................................................... 41
7.1 Leerdoelen ................................................................................................................................... 41
7.2 Multipele regressie ...................................................................................................................... 41
7.3 Corrigeren voor verschillen bij aanvang ...................................................................................... 42
7.4 Analyseren van verandering ........................................................................................................ 43
3
, Samenvatting module 3:
Practical Biostatistics
1. College 1: Data description
1.1 Leerdoelen
• De student kan het verschil uitleggen tussen beschrijvende statistiek en verklarende statistiek.
• De student kan de kenmerken van de normale verdeling noemen.
• De student kan onderscheid maken tussen categorische (nominaal, ordinaal) data en
numerieke (discrete, continue) data.
• De student kan de kenmerken van de metingen van deze vormen van data benoemen en
beschrijven.
• De student kan de kenmerken van de metingen van variabelen herkennen en benoemen.
• De student kan variabelen beschrijven met passende metingen (of grafieken) van
puntschatting en spreiding.
1.2 Beschrijvende en verklarende statistiek
Onderzoek wordt gedaan in een sample uit een populatie (een taartpunt uit een taart). Hiermee
probeert men de conclusies te generaliseren naar de populatie. Hiervoor wordt data verzameld in de
sample. Data zijn kwantitatieve of kwalitatieve observaties van variabelen. Een variabele kan alles zijn
wat varieert tussen individuen in de populatie. Met statistiek worden de verschillen tussen individuen
gekwantificeerd. Hiervoor kunnen twee soorten statistiek worden gebruikt:
• Beschrijvende statistiek (descriptive statistics) kan de beschikbare data samenvatten en
eventueel presenteren. Hiervoor wordt vooral numerieke data gebruikt, met een puntschatting
en een spreiding. Men probeert dit vooral grafisch weer te geven en er kan eventueel een
standaarddeviatie (SD) worden berekend.
• Verklarende statistiek (inferential statistics) kan generaliserende uitspraken doen over een
populatie aan de hand van resultaten uit een sample. Hiervoor worden testen gedaan naar
aanleiding van een variabele, er wordt een schatting gemaakt van het resultaat, de resultaten
worden verklaard en er kan een voorspellende component in zitten. Hierbij is statistische
significantie een belangrijk (maar geen leidend) begrip, in de vorm van p-waarden en
betrouwbaarheidsintervallen, gebaseerd op de standaardfout (standard error, SE).
Onderzoek wordt gedaan naar variabelen. Variabiliteit is onvoorspelbaar, hele kleine kansen komen
toch voor. Het vaststellen van een effect hangt af van de sterkte van het effect en van de mate van
variatie in het effect. Door onderzoek worden onzekerheden gekwantificeerd. Omdat de ‘waarheid’
alleen bij benadering te achterhalen is spreekt men in kansen (probabilities). Er zijn veel manieren om
kansen uit te drukken, het kwantitatief weergeven van kansen geeft de minste kans op
onduidelijkheid. Kansen zijn onafhankelijk of afhankelijk. Variabelen kunnen ook afhankelijk en
onafhankelijk zijn, maar dit zijn twee verschillende begrippen. Een afhankelijke kans maakt dat hij
4