Samenvatting SOWIESO Methodologie II Gezondheid & Leven
3 views 0 purchase
Course
Epidemiologie en biostatistiek 2 (AB_470227)
Institution
Vrije Universiteit Amsterdam (VU)
Samenvatting voor het SOWIESO tentamen van Epidemiologie en Biostatistiek II (voormalig Methodologie) voor het tweede jaar van de bacheloropleiding Gezondheid & Leven.
Met deze samenvatting is het cijfer van een 8 behaald.
Gezondheid en Leven: Biomedische Wetenschappen
Epidemiologie en biostatistiek 2 (AB_470227)
All documents for this subject (2)
Seller
Follow
rooseijgenraam
Content preview
SMV METHODOLOGIE SOWIESO
DESCRIPTIVE STATISTICS: TYPES OF DATA AND MEASUREMENT
Qualitative and Quantitative Variables
Er zijn twee basistypen van variabelen:
- Kwalitatieve variabele: niet-numeriek of categoriaal, maar namen of labels worden
gebruikt om observaties te classificeren in verschillende categorieën. Er kunnen
hierdoor geen wiskundige operaties aan deze data worden toegeschreven.
- Kwantitatieve variabele: numeriek en wordt gemeten door te tellen of door gebruik
van meetapparaten. Je kunt deze variabele weer opdelen in twee typen:
- Discreet: kan een eindig of oneiding aantal waardes zijn die worden gelabeld
met nummers (bijv. aantal broers, aantal studenten in een klas).
- Continuous: kan elke waarde zijn in 1 of meerdere intervallen (bijv gewicht).
Measurement Scales
De scale of measurement is de complete set aan waardes die worden gebruikt om
verschillen aan te duiden tussen observaties. Er zijn vier soorten schalen:
- Nominaal: gebruikt kwalitatieve variabelen, de categorieën kunnen niet op waarde
worden gesorteerd (bijv. oogkleur). Er kunnen verschillen tussen individuen worden
gedetecteerd, maar niet de richting of grootte van het verschil.
- Ordinaal: gebruikt kwalitatieve variabelen die kunnen worden gesorteerd op basis
van grootte of kwaliteit (bijv. t-shirt maten). Ze kunnen dus verschillen detecteren, en
ook de richting van het verschil.
- Interval: gebruikt kwantitatieve variabelen met even grote afstand ertussen. De
waardes kunnen worden gesorteerd waarbij de afstand tussen elke waarde bekend
en hetzelfde is (bijv. temperatuur gemeten in C/F). Je kunt dus verschillen
detecteren, de richting van het verschil, én de grootte van het verschil.
- Ratio: gebruikt kwantitatieve variabelen met een absoluut nulpunt (bijv. lengte). Dit
betekent dat het nulpunt betekent dat de variabele niet gemeten is. Hier kan je naast
het verschil detecteren, richting en grootte van het verschil ook rekenen aan de
waardes door het nulpunt.
,DESCRIPTIVE STATISTICS: FREQUENCY DISTRIBUTIONS
Frequency Distributions
Een frequentie distributie organiseert een monster door observaties te rangschikken van de
laagste naar de hoogste score en de observaties met dezelfde score bij elkaar te groeperen.
Dit kan worden gepresenteerd als een tabel of grafiek. Er zijn 3 belangrijke gebieden van
een frequentie distributie:
- Centraliteit: de gemiddelde score.
- Variabiliteit: of de scores bij elkaar of uit elkaar liggen.
- Vorm: is de distributie symmetrisch of scheef.
Frequency Distribution Tables
Absolute frequentie (f): het aantal keer dat een bepaalde score voorkomt in een dataset.
Relatieve frequentie (f relative): de absolute frequentie van een score gedeeld door het
totale aantal scores in de dataset. f/n (*100%).
Cumulatieve frequentie (cf): het aantal scores die een waarde hebben op of onder de score.
Cumulatieve relatieve frequentie (cf relative): de proportie aan scores die een waarde
hebben onder of op de score. cf/n (*100%).
Frequency Distribution Graphs
Frequentie distributie kan in verschillende grafieken worden weergegeven:
- Bar chart: geeft frequenties van kwalitatieve data weer.
- Histogram: geeft frequenties van kwantitatieve data weer.
- Ogive: de grafiek van een cumulatieve frequentie distributie.
Shape of a Distribution
Symmetrisch: de rechter en linkerkant van een distributie zijn elkaars spiegelbeeld.
Uniform: een type symmetrische distributie waarbij elke score met dezelfde frequentie
voorkomt. De vorm hiervan is een rechthoek.
Positief/rechtsscheef: de top zit links en loopt uit naar rechts. Er zijn hier dus een groot
aantal lage scores en een klein aantal hoge scores.
Negatief/linksscheef: de top zit rechts en loopt uit naar links. Er zijn een groot aantal hoge
scores en een klein aantal lage scores.
, Measures of Location I: Quantiles
Je kunt ook de locatie van een individuele score in een distributie aangeven:
Dit kan met en percentile rank: het percentage van scores in de distributie die gelijk of lager
zijn dan de score.
Percentile: de waardes die een distributie van scores delen in honderd gelijke delen. De P
percentile van een distributie is de waarde dat P procent van de scores gelijk of lager zijn.
i = P/100 * (n-1) + 1. Dit is de index en de plaats waar de P percentiel gelokaliseerd is. Als
de index niet een even getal is gebruik je linear interpolation om het P percentiel te
berekenen: P percentiel = Xbelow + (i - ibelow) * (Xabove - Xbelow).
X is de waarde die hoort bij de plek van i.
DESCRIPTIVE STATISTICS: MEASURES OF CENTRAL TENDENCY
Mode
De mode van een distributie is de meest frequent voorkomende score. De mode kan je
bepalen bij nominaal, ordinaal, interval en ratio. Soms een een distributie bimodal, hij heeft
dan twee scores die het meest frequent voorkomen. Een distributie met meer dan twee
modes is multimodal. Ook kan een distributie geen mode hebben, als hij uniform is.
Median
Mediaan is het middelste punt van een distributie, de score die de distributie in twee gelijke
helften verdeeld. De mediaan is gelijk aan het 50e percentiel. Berekenen:
- Oneven aantal scores: (n + 1) / 2. Dit is de plaats van de mediaan in de lijst.
- Even aantal scores: n / 2 + 1. “ “
Mediaan kan bepaald worden bij ordinaal, interval en ratio.
Mean
Het gemiddelde (mean) wordt berekend door de scores bij elkaar opgeteld te delen door het
totale aantal observaties. Hij kan bepaald worden bij interval en ratio.
Central Tendency and the Shape of a Distribution
Symmetrisch: mean = median
Symmetrisch unimodal: mean = median = mode
Positief scheef: mean > median > mode
Negatief scheef: mode > median > mean
Sensitivity to Outliers
Een outlier is een ongewoon hoge of lage score die niet het patroon volgt wat wordt gezien
in de rest van de data. De mode en mediaan zijn niet gevoelig voor outliers, de mean wel.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller rooseijgenraam. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.37. You're not tied to anything after your purchase.