Dit is zijn de samenvattingen van heel het vak Methodologie en Biostatistiek I van de pre-master Health Sciences aan de VU. Met deze samenvattingen heb ik een 8.5 gehaald voor het tentamen.
Een hypothese is een verwachting die een onderzoeker heeft over een bepaald patroon in
de populatie. Hierbij maken we onderscheid tussen de nulhypothese (H0) en alternatieve
hypothese (H1). Onder de nulhypothese wordt verondersteld dat er 'geen
verband/associatie' bestaat; onder de alternatieve hypothese dat er 'wel een
verband/associatie' is. De alternatieve hypothese is dus wat we eigenlijk proberen aan te
tonen. In plaats van een 'ongerichte' hypothese, zoals hierboven, kunnen we ook 'gerichte'
hypotheses formuleren, waarbij we een richting van het verband/associatie formuleren. Stel,
je verwacht in je alternatieve hypothese dat het gemiddelde A groter is dan het gemiddelde
van B (H1: ), dan is het belangrijk, om altijd alle alternatieven (hier: A is gelijk of
kleiner dan B) in de nulhypothese op te nemen (H0: ).
Vervolgens proberen we de nulhypothese te weerleggen (we zoeken bewijs tegen H0 om
hem te verwerpen) om de alternatieve hypothese aan te kunnen nemen. En als het ons niet
lukt om H0 te verwerpen, dan klinkt dat als volgt.
Als je H0 niet kunt verwerpen betekent dat niet dat het verband niet bestaat, maar slechts
dat het jou niet is gelukt het verband aan te tonen. Wij hebben dus geen bewijs kunnen
vinden dat het verband er is, misschien omdat onze steekproef niet goed genoeg was, of
onze onderzoeksvraag niet goed ingekaderd, of, of, of...
Type I en Type II fout
Belangrijk bij het testen van hypothesen is om in je achterhoofd te houden dat we nooit
zeker weten of we de juiste beslissing hebben genomen. We hebben beperkte informatie
over de populatie op basis van onze steekproef. In de statistiek maken we een afweging
over hoeveel onzekerheid we over de waarheid accepteren; dit wordt uitgedrukt met de
onbetrouwbaarheid, ɑ (die we meestal vastleggen op ɑ= 5% of ɑ= 0.05). Bij p<0.05 zouden
we de nulhypothese verwerpen. We zeggen dan ook dat we 5% onzekerheid accepteren, of
dat we 5% kans hebben dat we een ware nulhypothese tóch verwerpen. Dat is 1 van de 20
ware nulhypotheses die we toetsen!
Bij ɑ=0.05 verwerpen we dus bij 1 van de 20 toetsen onterecht de H0. Als dit gebeurt, dan
maken we een Type I fout.
Naast een Type I fout bestaat ook een Type II fout. Bij een Type II fout wordt een onware
nulhypothese niet verworpen. 𝛃 geeft de kans hierop, echter is de waarde meestal
onbekend.
Standaardfout:
We hebben de standaarddeviatie leren kennen. De SD is een maat voor de afwijking tussen
individuele observaties en een (populatie)gemiddelde (X - M of X - ). De standaardfout
(steekproeffout) is daarentegen een maat voor de afwijking tussen steekproefgemiddelde
(gemiddelde van meerdere observaties) en populatiegemiddelde (M - ).
1
, Grotere steekproeven hebben kleinere standaardfouten, en kleinere steekproeven hebben
grotere standaardfouten. Standaardfouten hebben we nodig omdat ook het
steekproefgemiddelde toevallig is.
De standaardfout van een steekproef wordt als volgt berekend =
Betrouwbaarheidsinterval:
In plaats van het toetsen op basis van p-waardes, zal je heel vaak tegenkomen dat
onderzoekers een betrouwbaarheidsinterval rapporteren. Met behulp van een
betrouwbaarheidsinterval wordt aangegeven dat er onzekerheid is rond je schatting (en dat
doen we met p-waardes eigenlijk ook), en die onzekerheid wordt becijferd. Bij een
betrouwbaarheidsinterval kun je de vraag stellen: "Hoe betrouwbaar/reproduceerbaar is
onze schatting?"
Het betrouwbaarheidsinterval is dus een indicator van de nauwkeurigheid van de kennis
over de populatie en geeft aan hoe stabiel (betrouwbaar, reproduceerbaar) de schatting is.
Meestal wordt er een 95% betrouwbaarheidsinterval gerapporteerd (maar dat kan ook 90%
of 99% zijn).
Het betrouwbaarheidsinterval (BI) ligt altijd rond onze puntschatting (bijvoorbeeld het
gemiddelde) en is afhankelijk van de spreiding (de spreiding geeft aan hoe 'nauwkeurig' de
schatting is). Hierdoor wordt de formule voor een 95% betrouwbaarheidsinterval de
volgende =
Stel in een steekproef van n=36 is het geschatte gemiddelde 10 met een standaarddeviatie
van 3. Er even voor het gemak van uitgaande dat die sd ook gelijk is aan de populatie
standaardafwijking (een behoorlijke aanname - meer erover in MTB2), dan zou het 95%
betrouwbaarheidsinterval lopen van:
Het 95% BI omvat dus (afgeronde) waarden van 9 tot 11. Ofwel: Het 95%
betrouwbaarheidsinterval voor loopt van 9.02 tot 10.98.
Er is best veel verwarring over de juiste interpretatie van betrouwbaarheidsintervallen.
Wij houden in de cursus de volgende interpretatie aan (cijfers ingevuld op basis van
bovenstaand voorbeeld):
- We kunnen met 95% betrouwbaarheid stellen dat de werkelijke (het
populatiegemiddelde) tussen 9.02 en 10.98 ligt.
- De gebruikte procedure zou bij eindeloze herhaling in 95 van de 100 keer de
werkelijke waarde (het populatiegemiddelde) in het te vinden interval liggen. Daarbij
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper mirjamdeelen2. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,49. Je zit daarna nergens aan vast.