• Introductie
• Rol van biostatistiek in medisch onderzoek
• Inferentiële statistiek
Introductie
Wat is nu juist statistiek? Het is de wetenschap die zich bezig houdt met de studie van
fenomenen van de natuur of de maatschappij door analyses en besluiten te maken die
veralgemeend kunnen worden naar volledige populatie op basis van gelimiteerde steekproeven:
• Wiskundige statistiek:
o Abstracte wiskunde gebruiken om nieuwe statistische methoden te ontwikkelen
• Toegepaste statistiek:
o Wiskunde methoden toepassen op specifieke voorbeelden en velden:
▪ Vb’en zijn economie, psychologie en volksgezondheid
Er worden dus wiskundige methoden gebruikt die de zaken gaan benaderen, maar meestal wordt
er aan toegepaste statistiek gedaan. Echter, niet te veel aantrekken van wiskunde erachter.
Biostatistiek is een tak van de toegepaste statistiek die statistische methoden toepast op
medische en biologie problemen die zich stellen. Statistische standaardmethoden zijn niet
noodzakelijkerwijs van toepassingen op alle onderzoeken binnen de (bio)medische wereld en
vandaar worden er meer en meer nieuwe biostatistische methoden ontwikkeld door biostatistici.
Rol van biostatistiek in medisch onderzoek
Een belangrijk vb. in medisch onderzoek is een bloeddrukmeting. De bloeddruk zal variëren al
naargelang deze wordt gemeten door een toestel of manueel (115 mmHg vs. 90 mmHg).
Waarom is er een verschil in bloeddrukmetingen tussen een toestel en een menselijke
waarnemer? Zijn de twee methoden voor bepaling van de bloeddruk vergelijkbaar met elkaar?
Op basis van één meting is het niet mogelijk om een antwoord te geven op deze vragen, want
deze ondervinding kan een toevalstreffer zijn. Dus trachten om zoveel mogelijk gegevens te
bekomen om zo voldoende ‘power’ te hebben voor analyse en besluit (statistisch significant!).
1
, Om de eerste vraag aan te pakken, werd een kleinschalig onderzoek naar bloeddrukmeters
ontworpen en uitgevoerd. De bekomen gegevens, kunnen samengevat worden door descriptieve
statistiek te gebruiken. Dit descriptief materiaal wordt zowel numeriek als grafisch voorgesteld:
• Indien numeriek, gegevens kunnen worden getabelleerd of gepresenteerd als een
frequentieverdeling (= tabel van getallen), echter niet zo bruikbaar voor verder gebruik
• Indien grafisch, gegevens kunnen picturaal worden samengevat wat wel belangrijk is
om te doen, want door meteen in de statistiek te duiken, kunnen er fouten gemist worden
De keuze tussen numerieke of grafisch beschrijvende statistiek is afhankelijk van het type
gegevensdistributie. Zo wordt een onderscheid gemaakt tussen continue en discrete gegevens:
• Continue gegevens:
o Waar er een oneindig aantal mogelijke waarden zijn bv. bloeddrukmetingen
o Gemiddelden en standaarddeviaties kunnen hierbij worden toegepast
• Discrete gegevens:
o Waar er maar een paar mogelijk waarden zijn bv. geslacht (man OF vrouw)
o Percentage mensen voor elke waarde kunnen in aanmerking genomen worden
Let op het duidelijke verschil
in bloeddrukmetingen tussen
de machinale- en handmatige
metingen op de locaties C en D
Een belangrijk opmerking om te maken in bovenstaand vb. is dat er geen zinvolle gegevens
voor alle 100 mensen op elke testlocatie konden worden verkregen vanwege enkele niet-geldige
metingen van de toestellen. Zulke ontbrekende gegevens komen frequent voor in de
biostatistiek en hiervoor moet in planningsfase van onderzoeken dan ook worden geanticipeerd.
Statistische inferentie
In het vb. van de bloeddrukmetingen moet er nu nog bepaald worden of het verschil in de
bloeddrukmetingen echt (= significant) of toevallig zijn. Er wordt hierbij gestart van een
steekproef van de algemene populatie bestaande uit 98 mensen met een geschat gemiddeld
verschil in bloeddruk van 14 mmHg. Wat is nu de fout of de standaarddeviatie op het geschatte
gemiddelde verschil en wat is dan de reële waarde voor dit gemiddelde verschil in bloeddruk?
Het afleiden van de kenmerken van een populatie uit een steekproef is de centrale zorg van
statistische inferentie. Om dit doel te bereiken, moet er een waarschijnlijkheidsmodel
ontwikkeld worden dat verteld hoe waarschijnlijk het is om een verschil van 14 mmHg te
2
,verkrijgen tussen de twee methoden in een steekproef van 98 mensen als er geen echt verschil
zou zijn tussen de twee methoden over de gehele populatie van gebruikers van de toestellen. Er
moet dus een statistisch model gehanteerd worden, maar dit blijkt niet altijd het beste te zijn
omdat er telkens nieuwe modellen bijkomen. Het is dus belangrijk om het juiste model te kiezen
voor de juiste gegevens, want de resultaten zullen vast en zeker afhankelijk zijn van het model.
Een voldoende kleine kans zou erop wijzen dat het verschil tussen de twee methoden,
handmatig of met een toestel, reëel is. In bovenstaande studie werd er gebruik gemaakt van een
kansmodel dat gebaseerd is op de t-verdeling. De kans dat het verschil dat te zien is weldegelijk
een verschil is wanneer ervan uitgegaan wordt dat er geen verschil is, uitgedrukt als de p-
waarde, bleek < 0.001 te zijn voor elk van de toestellen op locatie C en D. Als de kans klein is,
dan is de p-waarde klein en deze lage waarschijnlijkheid gaf aan dat er een reëel verschil is
tussen de automatische en handmatige methode van bloeddrukbepaling. Verdere data-analyses
werden uitgevoerd met behulp van statistische pakketten, collecties van statistische
programma’s die gegevens beschrijven en diverse statistische tests uitvoeren op deze gegevens.
3
, Chapter 2: Descriptive statistics
• Introductie
• Maten van locatie
• Maten van spreiding
• Grafische methoden
Introductie
De eerste stap bij data-analyse is om de gegevens op een beknopte manier te beschrijven.
Beschrijvende statistiek met numerieke of grafische weergave zijn cruciaal voor het vastleggen
en overbrengen van de eindresultaten van de onderzoeken in publicaties. Een goede numerieke
of grafische vorm van gegevenssamenvatting heeft aantal kenmerken die best voldaan worden:
• Moet op zichzelf kunnen staan
• Begrijpelijk zonder de bijhorende tekst te lezen
• Duidelijk gelabeld van attributen met goed gedefinieerde termen
• De belangrijkste ‘trends’ in de gegevens aanduiden
Een goed vb. zijn staafdiagrammen of ‘scatter plots’:
Vitamine A-consumptie voorkomt kanker
Totaal aantal gevallen van kanker: 200
Totaal gekoppelde controles: 200
De staafdiagrammen laten zien dat
vitamine A die door de controles wordt
geconsumeerd meer is dan die door de
kankerpatiënten. In sommige gevallen
overschrijden de niveaus zelfs de
dagelijks aanbevolen hoeveelheid (ADH).
CO-concentratie in de werkomgevingen
van zowel passieve rokers als niet-rokers
zijn vroeg op de dag ongeveer gelijk.
Dit ondersteunt de waarneming dat
passieve rokers een lagere longfunctie
hebben dan vergelijkbare niet-rokers.
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper cedricbauters. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €15,49. Je zit daarna nergens aan vast.