Samenvatting voor het SOWIESO tentamen van Epidemiologie en Biostatistiek II (voormalig Methodologie) voor het tweede jaar van de bacheloropleiding Gezondheid & Leven.
Met deze samenvatting is het cijfer van een 8 behaald.
DESCRIPTIVE STATISTICS: TYPES OF DATA AND MEASUREMENT
Qualitative and Quantitative Variables
Er zijn twee basistypen van variabelen:
- Kwalitatieve variabele: niet-numeriek of categoriaal, maar namen of labels worden
gebruikt om observaties te classificeren in verschillende categorieën. Er kunnen
hierdoor geen wiskundige operaties aan deze data worden toegeschreven.
- Kwantitatieve variabele: numeriek en wordt gemeten door te tellen of door gebruik
van meetapparaten. Je kunt deze variabele weer opdelen in twee typen:
- Discreet: kan een eindig of oneiding aantal waardes zijn die worden gelabeld
met nummers (bijv. aantal broers, aantal studenten in een klas).
- Continuous: kan elke waarde zijn in 1 of meerdere intervallen (bijv gewicht).
Measurement Scales
De scale of measurement is de complete set aan waardes die worden gebruikt om
verschillen aan te duiden tussen observaties. Er zijn vier soorten schalen:
- Nominaal: gebruikt kwalitatieve variabelen, de categorieën kunnen niet op waarde
worden gesorteerd (bijv. oogkleur). Er kunnen verschillen tussen individuen worden
gedetecteerd, maar niet de richting of grootte van het verschil.
- Ordinaal: gebruikt kwalitatieve variabelen die kunnen worden gesorteerd op basis
van grootte of kwaliteit (bijv. t-shirt maten). Ze kunnen dus verschillen detecteren, en
ook de richting van het verschil.
- Interval: gebruikt kwantitatieve variabelen met even grote afstand ertussen. De
waardes kunnen worden gesorteerd waarbij de afstand tussen elke waarde bekend
en hetzelfde is (bijv. temperatuur gemeten in C/F). Je kunt dus verschillen
detecteren, de richting van het verschil, én de grootte van het verschil.
- Ratio: gebruikt kwantitatieve variabelen met een absoluut nulpunt (bijv. lengte). Dit
betekent dat het nulpunt betekent dat de variabele niet gemeten is. Hier kan je naast
het verschil detecteren, richting en grootte van het verschil ook rekenen aan de
waardes door het nulpunt.
,DESCRIPTIVE STATISTICS: FREQUENCY DISTRIBUTIONS
Frequency Distributions
Een frequentie distributie organiseert een monster door observaties te rangschikken van de
laagste naar de hoogste score en de observaties met dezelfde score bij elkaar te groeperen.
Dit kan worden gepresenteerd als een tabel of grafiek. Er zijn 3 belangrijke gebieden van
een frequentie distributie:
- Centraliteit: de gemiddelde score.
- Variabiliteit: of de scores bij elkaar of uit elkaar liggen.
- Vorm: is de distributie symmetrisch of scheef.
Frequency Distribution Tables
Absolute frequentie (f): het aantal keer dat een bepaalde score voorkomt in een dataset.
Relatieve frequentie (f relative): de absolute frequentie van een score gedeeld door het
totale aantal scores in de dataset. f/n (*100%).
Cumulatieve frequentie (cf): het aantal scores die een waarde hebben op of onder de score.
Cumulatieve relatieve frequentie (cf relative): de proportie aan scores die een waarde
hebben onder of op de score. cf/n (*100%).
Frequency Distribution Graphs
Frequentie distributie kan in verschillende grafieken worden weergegeven:
- Bar chart: geeft frequenties van kwalitatieve data weer.
- Histogram: geeft frequenties van kwantitatieve data weer.
- Ogive: de grafiek van een cumulatieve frequentie distributie.
Shape of a Distribution
Symmetrisch: de rechter en linkerkant van een distributie zijn elkaars spiegelbeeld.
Uniform: een type symmetrische distributie waarbij elke score met dezelfde frequentie
voorkomt. De vorm hiervan is een rechthoek.
Positief/rechtsscheef: de top zit links en loopt uit naar rechts. Er zijn hier dus een groot
aantal lage scores en een klein aantal hoge scores.
Negatief/linksscheef: de top zit rechts en loopt uit naar links. Er zijn een groot aantal hoge
scores en een klein aantal lage scores.
, Measures of Location I: Quantiles
Je kunt ook de locatie van een individuele score in een distributie aangeven:
Dit kan met en percentile rank: het percentage van scores in de distributie die gelijk of lager
zijn dan de score.
Percentile: de waardes die een distributie van scores delen in honderd gelijke delen. De P
percentile van een distributie is de waarde dat P procent van de scores gelijk of lager zijn.
i = P/100 * (n-1) + 1. Dit is de index en de plaats waar de P percentiel gelokaliseerd is. Als
de index niet een even getal is gebruik je linear interpolation om het P percentiel te
berekenen: P percentiel = Xbelow + (i - ibelow) * (Xabove - Xbelow).
X is de waarde die hoort bij de plek van i.
DESCRIPTIVE STATISTICS: MEASURES OF CENTRAL TENDENCY
Mode
De mode van een distributie is de meest frequent voorkomende score. De mode kan je
bepalen bij nominaal, ordinaal, interval en ratio. Soms een een distributie bimodal, hij heeft
dan twee scores die het meest frequent voorkomen. Een distributie met meer dan twee
modes is multimodal. Ook kan een distributie geen mode hebben, als hij uniform is.
Median
Mediaan is het middelste punt van een distributie, de score die de distributie in twee gelijke
helften verdeeld. De mediaan is gelijk aan het 50e percentiel. Berekenen:
- Oneven aantal scores: (n + 1) / 2. Dit is de plaats van de mediaan in de lijst.
- Even aantal scores: n / 2 + 1. “ “
Mediaan kan bepaald worden bij ordinaal, interval en ratio.
Mean
Het gemiddelde (mean) wordt berekend door de scores bij elkaar opgeteld te delen door het
totale aantal observaties. Hij kan bepaald worden bij interval en ratio.
Central Tendency and the Shape of a Distribution
Symmetrisch: mean = median
Symmetrisch unimodal: mean = median = mode
Positief scheef: mean > median > mode
Negatief scheef: mode > median > mean
Sensitivity to Outliers
Een outlier is een ongewoon hoge of lage score die niet het patroon volgt wat wordt gezien
in de rest van de data. De mode en mediaan zijn niet gevoelig voor outliers, de mean wel.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper rooseijgenraam. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,92. Je zit daarna nergens aan vast.