Basisprincipes van statistiek
Blinding: random code geven aan sample/ therapie, de wetenschapper weet zelf niet wie wat krijgt
of wat erin welk staal zit, 1 onafhankelijk persoon weet dit
à Subjectieve factor best vermijden (vb: objectief = overleving, subjectief = reductie tumor)
Double blinding: zowel wetenschapper als patiënt weten niet wat ze geven/ krijgen
Om efficiëntie van een therapie te achterhalen à therapie vergelijken met Placebo
- Soms niet verantwoord: ipv placebo een GM als controlegroep om te kijken of de nieuwe
therapie evengoed werkt
Statistiek helpt met: de controle van de fouten, de kwantiteit van de fouten (kan niks bewijzen)
Wat is statistiek?
Beschrijvende statistiek: Geobserveerde data samenvatten en beschrijven zodat de relevante
aspecten duidelijk worden gemaakt, vb: gemiddelde, mediaan, variantie, bereik, frequentie
Inferentiële statistiek: Wat te verwachten valt als het effect en de conclusies worden door getrokken
over de gehele populatie, veralgemenen voor de hele populatie
Populatie VS steekproef
à Steekproef uitvoeren met als doel iets te kunnen concluderen over de populatie
Populatie: Gedefinieerd door Inclusie en Exclusie, zo objectief mogelijk
- Inclusie: zijn voorwaarden die voldaan moeten zijn om tot populatie te behoren
o Specifieke ziekte, Leeftijd gebied (vb: geen kinderen)
- Exclusie: Zijn voorwaarden die niet mogen voldaan zijn om tot populatie te behoren
o Zwangerschap, Al een bepaalde behandeling voor de ziekte gehad
- Vermijden: verwachte overleving van tenminste 90 dagen, tumor moet extreem groot zijn
- Is oneindig à elke dag komen er vb nieuwe patiënten bij/ weg, dus kan je niet exact weten
hoe groot de populatie is
(Random) Steekproef: Stukje uit de populatie
- Zo accuraat mogelijk aan de populatie (vb: niet enkel vrouwen als er in de populatie ook mannen zitten)
o Vb: Zelfde proportie tussen man en vrouw, zelfde types ziekenhuizen, zelfde leeftijd verdeling
Kanstheorie: voorspellen wat er gaat gebeuren in een steekproef als je de populatie kent
↕
Statistiek: geeft conclusie over populatie met wat er is geobserveerd in de steekproef
Oorzakelijkheid en Randomisatie
Randomisatie: de enige manier om zeker te zijn dat de behandelde groepen vergelijkbaar zijn met
respect naar de gekende en ongekende factoren à de therapieën willekeurig en random manier
voor te stellen aan de patiënten
1
, Randomisatie is niet altijd mogelijk
à VB: experiment chemotherapie:
- Groep 1: krijgt chemotherapie <--> Groep 2: niet => ethisch niet mogelijk
- Oplossing = historical controls (geobserveerde data van vroeger)
à VB: effect roken op kans op longkanker
- Groep 1: mogen niet roken <--> Groep 2: moeten meerdere keren roken per dag voor jaren
- Kan je niet controleren
- Oplossing: patiënten met longkanker ondervragen over hun rookgedrag: hoeveel per
jaar/dag, hoelang, … = Case-control studie
Oorzakelijkheid/ causaliteit: het verschil dat we zien ligt aan bepaalde oorzaak, we weten de oorzaak
- Cause à effect
Beschrijven en samenvatten van data
Types van uitkomsten
Kwalitatieve variabelen: niet gekarakteriseerd door numerieke waarden
- Dichotoom: enkel 2 mogelijke waarden; vb: geslacht, overleving
- Nominaal: geen rangorde, vb: haarkleur, doodsoorzaak
- Ordinaal: wel rangorde; vb: pijn score van 1 – 10 of van nooit – altijd
Kwantitatieve variabelen: wel gekarakteriseerd door numerieke waarden
- Discreet: waarden zijn verschillend en gescheiden, enkel bepaalde waarden kunnen
geobserveerd worden; vb: hartslag, radioactieve bron à kan zijn maar niet ertussen
- Continu: waarden liggen op een continue, ononderbroken schaal; vb: lengte, bloeddruk
à Discrete waarden met veel mogelijke waarden worden vaak als continu beschouwd
Grafische presentatie van data
1 kwalitatieve variabele à Bar plot, Pie chart
1 kwantitatieve variabele à Histogram, Box-plot
2 of meer kwalitatieve variabele à Bar plot
2 of meer kwantitatieve variabele à Scatterplot, scatterplot met box-plot, scatterplot matrix
Mix van kwalitatieve + kwantitatieve variabelen à gecategoriseerde box-plot, histogram, bubble plot
Samenvatting statistiek
∑ " "𝑖
Gemiddelde: 𝑥 = ## Mediaan (= middelste observatie): 1 3 3 4 5 14 = 3+ = 3,5
Het gemiddelde is zeer gevoelig aan uitschieters! 1 3 3 4 5 6 14 = 4
Sample mode (= meest geobserveerde waarde) : 1 3 3 4 5 14 = 3
- Symmetrische data: Gemiddelde = Mediaan à Gemiddelde + standaarddeviatie
- Skewed data (scheve data): Gemiddelde ≠ Mediaan à Mediaan + Interkwartielafstand
2