• Cross-sectionally
o Data collected at one point in time
• Prospectively
o Start at baseline, outcome in future
o Randomized Controlled Trial (RCT)
o Longitudinal / observational study
• Retrospectively
o Outcome has been assessed
o Looking back in time
o Existing database
1. Descriptive statistics
− Summarize and describe important features of the data
− Graphics: histogram, boxplot, scatter plot
− Numerical summary measures: mean, median, SD, percentage
2. Inferential statistics
− Draw a conclusion beyond your data sample
− Effect size (mean difference), confidence interval, hypothesis testing
Descriptive statistics
Shapes of distribution
Median = order the observations from low to high and take the middle value.
,If the distribution is right-skewed, then the mean > median. There is a high frequency in the low (left)
area, so the median will be here. The mean is more to the right (higher area) since there are a few
observations that drag the mean to the right.
Measures of spread:
SD, Variance (= SD2), Range (maximum – minimum or begin till the end), IQR (interquartile range =
Q3 – Q1).
Fat line = median. Grey = Q1 and Q3.
Sigma = standard deviation. 2x SD away from mean → ~95% of data
Central limit theorem = the more dices you throw, the more your distribution becomes normal.
Scatter Plot of bivariate (2 variables) data:
,Inferential statistics
If you want to know how reliable an obtained mean is, you can use the standard error (uncertainty)
Higher SD means higher Standard Error (SE). The more people observed (n), the lower the SE.
➔ 95% confidence interval (CI) = mean + or - 1.96 x SEmean
In this case: 95% CI = 1.59 (mean) +/- 1.96 x 0.012 = [1.57; 1.61]. This is the 95% CI.
This was continuous data but you can also use binary data:
, Diagnostic testing
Sensitivity = the chance that a case is correctly identified as positive.
Positive cases : cases (127 : 130 = 97.7%)
Specificity = the chance that a control is correctly identified as negative.
Negative controls : controls (848 : 870 = 97.5%).
The NPV is higher since there are more people that are negative for corona (higher n). these 22 mess
up the outcome for the PPV. It has a higher impact there since there are less people that are positive.
When a disease is not so prevalent in a population, the PPV is often lower than the NPV.
0.852 = positive cases : positives = PPV.
149 was the total number of positives.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper SophiedBoer. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €10,49. Je zit daarna nergens aan vast.