Statistiek
Hoofdstuk 1
De medische wetenschap is nooit exact, omdat er altijd onzekerheden zijn door onnauwkeurigheden
of onzekerheden. Statistiek beschrijft en kwantificeert de onzekerheden. Er worden vervolgens
algemene geldige uitspraken gedaan. Hierbij wordt er meestal een bereik aangegeven waartussen de
werkelijkheid zal liggen, dit zorgt voor een grotere betrouwbaarheid.
Vaak wordt π gebruikt om de prevalentie of een ziekte aan te geven, dit is dan geen 3,14.
De kansrekening doet een uitspraak voor een bekende populatie over de samenstelling van de
steekproef. Statistiek doet het precies andersom, zij doet een uitspraak over de onbekende
populatie.
Inferentie = conclusies trekken over de populatie op grond van de resultaten van de steekproef.
Hierdoor wordt de concluderende statistiek soms aangeduid als inferentiële statistiek.
Hoofdstuk 2
Sociaal-wetenschappelijk onderzoek: veel nadruk op onderzoeksopzet en correcte redenatie.
Twee vormen van onderzoek:
- Observationeel (niet-experimenteel) onderzoek
- Gerandomiseerd (experimenteel) onderzoek
Quasi-experiment is een tussenvorm.
Observationeel onderzoek: er wordt een steekproef genomen uit een populatie, de bevindingen
hiervan worden gegeneraliseerd naar de onderzoekspopulatie. Vb. onderzoekspopulatie: totale
bevolking, deel van de bevolking die aan een bepaalde ziekte lijdt, groep patiënten die wordt
behandeld voor een bepaalde ziekte. Bij dit soort onderzoek kunnen wel ideeen maar geen echte
causale conclusies (oorzaak) worden getrokken. Het idee kan namelijk samenhangen met een andere
eigenschap, zoals geloof (= confounder). Een confounder kan op twee manieren worden
gecorrigeerd:
- Stratificatie: opdeling populatie naar wel of geen confounder. Per groep wordt bestudeerd
wat de oorzaak van een ziekte is of hoe deze ontstaat.
- Corrigeren van het effect van een confounder(s): maken van statistische modellen, hierin
wordt de mogelijke ziekteveroorzaker en confounder opgenomen. Hierna wordt een
schatting gemaakt van de ziekteverwekker gemaakt na correctie van de confounder.
Gerandomiseerd onderzoek: het bestuderen van het effect van een mogelijke handeling door het
vergelijken met een situatie waarin geen handeling is of deze handeling is vervangen. Bij
gezondheidszorgonderzoek heet deze onderzoeksvorm ook wel een interventiestudie. In medische
kring wordt dit soort onderzoeken ook wel een clinical trial genoemd, zoals het effect bekijken van
een nieuw medicijn. Om te zorgen dat er geen bias (vertakking) zal zijn, moeten de verschillende
groepen zo mogelijk te vergelijken zijn, dit kan het beste door loting of randomisatie (= randomised
clinical trial, hierbij is er een behandelingsgroep en een controlegroep en er is sprake van toeval).
- Quasi-experiment: dit lijkt op een RCT, maar hierbij is er geen sprake van willekeurige
indeling. Dit onderzoek komt ook dicht bij een observationeel onderzoek, omdat er geen
echte causale relatie kan worden vastgesteld.
Door inclusie en exclusie criteria wordt geprobeerd de groepen zo goed mogelijk op elkaar af te
stemmen.
, Hoofdstuk 3
E = uitkomstenruimte, dit kan op verschillende manieren worden weergegeven:
- E = ,e1, e2, …. em- : m is het aantal elementen.
- E = {1, 2, 3, 4, 5, 6} : eindige uitkomstenruimte.
- E = ,1, 2, 3, …. - : oneindige uitkomstenruimte.
Gebeurtenissen zijn deelverzamelingen van uitkomstruimte E. Deze worden als volgt weergeven:
E = {1, 2, 3, 4, 5, 6-: ,1, 2, 3-, ,2, 4, 6-, ,6-, ,1, 2, 5, … - (als de rest nog niet duidelijk is) en E = Ø (geen
uitkomsten).
Gebeurtenissen kunnen ook worden weergeven met letters, deze zijn vaak uit het begin van het
alfabet. Er kunnen andere letters gebruikt worden als deze bij de gebeurtenis past:
- A u B: vereniging van A en B: alles dat tot A en B behoort:
(er is minstens 1 van de 2 gebeurtenissen, A of B)
- A n B: doorsnede van A en B: uitkomsten die tot A en B behoren:
(er zijn twee gebeurtenissen, A en B)
- Ac of Ā: complement: alle uitkomsten die niet bij A behoren:
Als E = {1, 2, 3, 4, 5, 6} en A = {1, 2, 3}, dan Ac = {4, 5, 6}
(gebeurtenis A treedt niet op)
A u Ac = E en A n Ac = Ø
P (A) = de kans op gebeurtenis A (p = probability).
Empirische wet van de grote getallen= bij het herhaald
uitvoeren van een experiment de fractie van het aantal
experimenten waarbij een gebeurtenis optreedt zich op den
duur stabiliseert (= converteren naar limietgetallen). Vb: het
aantal keer dat kruis is gegooid met 100 keer werpen van een
munt:
Frequentiequotiënt bij dit experiment: fq (A) = N(A) / N
N = totaal aantal worpen
N(A) = totaal aantal keer kruis
Kansruimte = alle mogelijke uitkomsten. Bij het bovenstaande experiment, kan kruis (K) of munt (M)
gegooid worden, dus: E = {K, M}.
De kansen bij een dobbelsteen zijn beter te berekenen:
A = {het aantal even ogen} = { 2, 4, 6}, P (A) = 1/6 + 1/6 + 1/6 = 3/6 = 0,5
B = {het aantal ogen is minstens} = {5, 6}, P (B) = 1/6 + 1/6 = 26 = 0,333
Kansen hebben eigenschappen:
1. 0 ≤ P(A) ≥ 1
2. P(E) = 1
3. Als A n B = Ø, dan geldt: P(A u B) = P(A) + P(B)
Dus als er geen doorsnede (overlap) bestaat is de vereniging van A en B gewoon optellen.
4. P(Ø) = 0
5. P(Ac) = 1 – P(A)
P(E) = 1, P(E) = P(A) + P(Ac), P(Ac) = P(E) – P(A), P(Ac) = 1 – P(A)
6. P(A u B) = P(A) + P(B) – P(A n B)