BIOSTATISTIEK
Chapter 3: What is statistics?
Inleiding
Population – sample = We kunnen een oneindige/eindige populatie kiezen. Een
welgedefinieerde eindige populatie is bijvoorbeeld alle inwoners van België of alle
inwoners van Europa. Indien oneindig kunnen we maar een beperkte steekproef
nemen en daar komt ruis bij kijken.
Metingen die onderhevig zijn aan schommelingen moeten een grotere
steekproefgrootte krijgen!
Random variability = ruis, de prijs die we moeten bepalen voor het generaliseren
van de steekproef naar de populatie.
3.1 Captopril Data
We hebben 15 patiënten met hypertensie en testen de werking van een medicijn.
Captopril zou de bloeddruk verlagen. Belangrijk is: wanneer definiëren we iemand
met hypertensie?
Hoe gaat de behandeling de bloeddruk beïnvloeden?
Opzet experiment:
We meten de effecten van een behandeling door een voor en na studie te doen in
dezelfde persoon. We meten de DBP en SBP voor en na een behandeling. DBP en
SBP bevatten informatie op zich, maar hangen ook samen waardoor we ze apart
kunnen bekijken, maar ook de samenhang tussen DBP en SBP.
In deze studie hebben we een situatie waarbij we binnen een persoon gaan
vergelijken en 2 waarnemingen gaan koppelen.
Gepaarde T-toets
We zien dat de bloeddruk mooi daalt na behandeling <-> MAAR hoe
waarschijnlijk is het dat de waargenomen veranderingen in de bloeddruk door
puur toeval ontstaan?
Als deze uitkomst is ontstaan door pure toeval hebben we dus geen bewijs voor
de doeltreffendheid voor de werking van Captopril.
In de statistiek willen we niet enkel conclusies trekken over 15 patiënten, maar
willen we het effect van Captopril toeschrijven aan de totale populatie van
hypertensiepatiënten.
,Statistieken hebben tot doel conclusies te trekken over een bepaalde populatie,
op basis van wat is waargenomen in een willekeurige steekproef.
3.2 Population versus random sample
Doel statistiek = een conclusie trekken over een bepaalde populatie op basis van
wat is waargenomen in een willekeurige steekproef.
Populatie: Hypothetische groep van huidige en toekomstige proefpersonen, met
een specifieke conditie, waarover conclusies moeten worden getrokken
Steekproef: Subgroep van de populatie waarop observaties worden uitgevoerd
Om ervoor te zorgen dat de effecten die in de steekproef worden waargenomen,
generaliseerbaar zijn naar de totale populatie, moet de steekproef willekeurig
worden genomen.
3.3 The aim of statistics
Het doel van de statistiek is tweezijdig
1) Beschrijvende statistiek: Samenvatten en beschrijven van waargenomen
gegevens, zodat de relevante aspecten expliciet worden gemaakt =
Visualisatie populatie
2) Inferentiële statistieken: Onderzoeken in hoeverre waargenomen
trends/effecten kunnen worden gegeneraliseerd naar een algemene
(oneindige) populatie
Grote link tussen de steekproef en de populatie waar we conclusies uit
wensen te trekken
Extrapolatie = overstap steekproef naar de populatie waarover je een
uitspraak wilt doen
Voorbeelden: correcte statistische methodologie en correcte interpretatie
van resultaten
Schatter μ = best mogelijke uitspraak over de populatie op basis van de
steekproef (=niet met zekerheid)
Chapter 4 Summary statistics
Geven aanleiding tot de inferentiële statistiek. We berekenen bijvoorbeeld een
gemiddeld aan de hand van een steekproef en willen een uitspraak doen over de
populatie: dan gaan we het gemiddelde gebruiken om de populatieparameter μ
te schatten. Schatters maken dus gebruik van de beschrijvende statistiek.
,4.2 Measures of location
Steekproefgemiddelde x
Steekproefmediaan: middelste getal van de observatie
Steekproefmodus: de waarde dat we het meest observeren
Opmerkingen:
- Het gemiddelde is zeer gevoelig aan grote uitschieters <-> mediaan geeft
dan een beter idee over de ligging van de observaties
- Bij een symmetrische of normaalverdeling zijn de modus, mediaan en het
gemiddelde gelijk <-> scheve verdelingen
- In een scheve verdeling is de modus de piek
- Voor symmetrische verdelingen kiezen we best het gemiddelde en voor
scheve verdelingen best de mediaan als locatiemaat (ivm uitschieters)
4.3 Measures of spread
Gemiddelde afwijking van het gemiddelde
Gemiddelde kwadratische afwijking van het gemiddelde
Steekproef variantie
Steekproef standaarddeviatie
Range
Interkwartielafstand: de range na het verwijderen van de 25% hoogste en 25%
kleinste waarden
Opmerkingen:
- De gemiddelde afwijking van het gemiddelde is altijd 0 ≠ goede
spreidingsmaat
, - We zouden dan de absolute waardes kunnen nemen, maar dan krijgen we
veel wiskundige problemen en sprongen. We kunnen dan beter het
kwadraat nemen.
- De variantie is een wiskundige handige maat. We delen hier door n-1 want
je kan altijd 1 onafhankelijke halen uit je andere bekenden.
- Belangrijk is het kwadraat van de variantie zodat onze eenheden terug
kloppen in het experiment. (We willen bv. Geen mmHg in het kwadraat)
- Standaardeviatie ≠ standaardfout (er is nu eenmaal een verschil in
bloeddruk in de populatie)
- De range is zeer afhankelijk van de sample size n ≠ interkwartielafstand
- Een grotere populatiegrootte heeft een grotere kans om extreme waarden
te bevatten
- De variantie, standaarddeviatie en de range zijn zeer gevoelig aan
uitschieters <-> interkwartielafstand
- Bij symmetrische data gebruiken we de standaard deviatie en voor scheve
verdelingen de interkwartielafstand om de spreiding te bepalen
4.4 Percentages
Percentage
Hervorming variantie
Proportie is equivalent aan percentage, maar ligt tussen 0 en 1
Opmerkingen:
- In sommige gevallen berekenen we de proportie
- We berekenen dan enkel het gemiddelde: hoe groot de afwijking is, is dan
minder van belang aangezien we enkel de waarde 0 en 1 kunnen bekomen
Chapter 5: Confidence intervals & hypothesis testing
5.1 Random variability
Captopril experiment:
Captopril is een geneesmiddel dat de bloeddruk zou moeten verlagen. We testen
dit op een steekproef van n=15. We merken op dat er een gemiddelde afname is
van 9.27 mmHg is obv het experiment (=beschrijvende statistiek) MAAR indien
we een andere steekproef zouden nemen, zouden we dan dezelfde uitkomst
bekomen of een andere gemiddelde afname of zelfs toename bekomen? We
wensen de Δ van de populatie.
Vraag: Volstaat onze 9.27 mmHg daling als bewijs dat de behandeling effect
heeft op de BD?
Oplossing: We nemen 9.27 als onze schatter voor µ en moeten nu voldoende
bewijs verzamelen door betrouwbaarheidsintervallen en hypothesen
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper yoniottenburgs. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €13,49. Je zit daarna nergens aan vast.