STATISTIEK: THEORIE
INTRO
• 4 stp (1e sem)
• Situering opleidingsonderdeel
o Kern: wetenschappelijke basis in theorie van beschrijvende en verklarende statistiek
§ Directe link met ‘Statistiek voor de gezondheidswetenschappen: data- analyse
§ Ook connectie ‘Methodologie: kwantitatief onderzoek voor de gzhwetenschappen
§ Voorbereidingstraject Masterproef
• Eindcompetenties:
• Examen:
o Gesloten boek examen: 3 uur
o Ter beschikking: lijst met formules, statistische tabellen, rekenmachine (zelf meebrengen)
Toegelaten: gewone bureaurekenmachines en wetenschappelijke rekenmachines (bv. Texas Ti-40, Texas Ti-34, Casio
FX-82) – NIET toegelaten: grafische rekenmachines (bv. Texas Ti- 84, Casio FX-9860, Casio FX-9750)
o Opbouw: Deel open vragen, deel meerkeuze vragen
§ → ZONDER giscorrectie, wel HOGERE CESUUR: Vb. 25 vragen met 4 respons
categorieën: 16 juiste nodig om te slagen → ALLE vragen invullen!
• Overzicht lessen:
LES 1: donderdag 28-09-2023 LES 2: donderdag 05-10-2023
o LES 3: 12-10-2023 LES 4: op dinsdag 17-10-2023 om 16u00 AUD E1 Oehoe,
Blok E, Campus Coupure
o LES 5: donderdag 26-10-2023 LES 6: donderdag 02-11-2023
o LES 7: donderdag 09-11-2023 LES 8: donderdag 16-11-2023
o LES 9: donderdag 23-11-2023 LES 10: donderdag 30-11-2023
o LES 11: donderdag 07-12-2023 LES 12: donderdag 14-12-2023
o (INHAAL: 21-12-2022)
• Opbouw lessen
o MODULE I
§ H1-2: Inleiding & beschrijvende statistiek
§ H3: Verklarende statistiek
§ Werkcollege 1
o MODULE II
§ H4-H7: Continue uitkomstvariabelen
§ Werkcollege 2
o MODULE III
§ H5-H7: Dichotome uitkomstvariabelen
§ Werkcollege 3
o MODULE IV
§ H6-H8-H9-H10: Verdieping
1
,1. INLEIDENDE BEGRIPPEN
• Toegepaste statistiek = analyseren van data om een wetensch vraag te beantwoorden
• Data: waarnemingen op variabelen
o Variabelen = kenmerken van proefpersonenen die kunnen variëren (bv. vooropleiding,
geslacht, motivatie,…)
• Steekproef (= onderzoekspopulatie) v/d doelpopulatie (daar willen we uitspraken over doen
o Doelpopulatie: grotere ruimere populatie bv. mentale gezondheid van jongeren in
Vlaanderen (geen metingen mogelijk op volledige doelpopulatie)
o Steekproef: sample uit volledige doelpopulatie bv. jongeren uit ¹ provincies uit ¹ scholen
1.1. ONDERZOEKSVORMEN
• Observationeel: als onderzoeker niet zelf
tussenkomen
• Experimenteel: interventie opleggen bv.
implementeren beweegprogramma bij
obesitas. Altijd prospectief (in toekomst effect
interventie nagaan)
• Cohort: groep mensen zaken bevragen uit het
verleden, transversaal/cross-sectioneel (alles
op 1 moment), prospectief (follow-up, wie na
2j bep ziekte ontwikkeld)
• Case-control: als onderzoeker groep cases gaan
selecteren met bep uitkomstvariabele +
controlegroep (in 2 groepen metingen doen), meestal retrospectief bv. kankerpt en niet-kankerpt
navragen naar roken
1.2. VARIABELEN
1.2.1. TERMINOLOGIE
• Uitkomstvariabele (outcome)
o = afhankelijke (dependent) variable
o → willen we voorspellen, verklaren
o Bv. mentale gezondheid bij jongeren
• Onafhankelijke (independent) variabele
o = determinanten, verklarende variabelen, voorspellers, predictoren
o Onderzoeken In welke mate staan ze in relatie tot uitkomstvariabele?
• Soorten variabelen
o Categorische / categoriale / kwalitatieve var.
§ Nominaal (niet geordend) bv. provincie
§ Ordinaal (geordend) bv. leeftijd, opleidingsniveau (laag naar hoog)
§ Dichotoom (2 categorieën) à specifieke codering (ene code 1 andere code 0)
• → dummy codering: 1 vs. 0
2
, o Numerieke / kwantitatieve var.
§ Discreet (gehele getallen / aantallen): niet zuiver continu, geen oneindig mogelijke
getallen aannemen, enkel gehele getallen bv. count variabele bv. aantal keer ziek
afgelopen jaar bij WN, aantal keer gzh professional bezoeken
§ Continu (in theorie oneindig aantal mogelijke waarden): op schaal, bv. gewicht (kan
in theorie oneindig mogelijke variabelen aannemen)
• Interval-schaal: elk interval heeft
dez waarde bv. gewicht van 12-
13kg, zelfde betekenis van 30-
31kg
• Ratio-schaal: hebben natuurlijk
nulpunt: 0 = ontbreken kenmerk
bv. 0kg ontbreken gewicht. Bij T°
geen natuurlijk nulpunt
o Zie diagram: Numeriek naar categorisch pijl
mogelijk om var. te gaan coderen en om te zetten
naar categroische var. bv. leeftijd (aantal jaar) =
numeriek, achteraf in dataset beslissen om leeftijd
in 3 groepen te plaatsen, hercodering à nieuwe
var.: categorische (leeftijd 1: tot 30j, leeftijd 2: tot
40j, leeftijd 3: boven 40j)
Grijze zone: Bv. attitude tov statistiek (op schaal
van 1-7), akkoort tot bep stelling = lyckert schalen
=> nooit continue variabele, wel categorisch (maar
soms numeriek behandeld bv. gem. op attitude
schaal)
• Soorten statistiek
o Beschrijvende statistiek = overzichtelijk samenvatten van data: grafische / numerieke
weergave
§ Steekproef beschrijven (variabelen,…), nog geen testen hierop uitvoeren
o Verklarende / inferentiële statistiek = schatten van effecten / relaties
§ →betrouwbaarheid v/d onderzoeksresultaten
§ → hypothesen testen
§ Testen uitvoeren
2. BESCHRIJVENDE STATISTIEK
2.1. GRAFISCHE EN NUMERIEKE WEERGAVE VAN DATA
• Overzicht mogelijkheden binnen de
beschrijvende statistiek:
• Normaal verdeeld? (normaaldistributie)
belangrijk ikv welke beschrijvende
mogelijkheid
• Voorbeeld:
o Cohort: 100 personen
o Op 1 ogenblik
o Enkel observaties, geen interventies
3
, Alcohol: 3 niveau’s categorisch / Roken: dichotoom (dummy codering 0 = niet-rokers, 1 = rokers)
2.1.1. GRAFISCHE WEERGAVE: CATEGORISCHE VARIABELEN
• Staafdiagram (bar chart)
o Geslacht:
categorische
variabele met 2
soorten variabelen
o Alcohol: 3
categorieën
(distributie in
steekproef
zichtbaar)
• Voorbeeld 2:
o Leeftijd hier categorisch (in 4 versch.
categorieën)
o Relevant om 1e groep als groep te houden?
Variabele hercoderen ev. 1e groep
samenvoegen (preschool/elementery school)
• 2 categorische variabelen: geclusterd/gesegmenteerd
staafdiagram
o 2 categorische variabelen samenvoegen en zien hoe
deze zich onder elkaar verhouden (geslacht,
bijwerkingen)
o = puur beschrijvend
o Later is er een significante relatie tss geslacht en
bijwerkingen?
4