Practicum Data-Analyse
- Week 1 - 1 waarde toetsen -
Schatten: op basis van een steekproef een gok doen over de waarde van de
gehele populatie.
Toetsen: vaststellen of de populatie afwijkt van de verwachte waarde.
Populatieparameters schatten we in op basis van de steekproef. Als de
steekproef representatief is, kunnen we een geïnformeerde gok doen. Het helpt
met de representativiteit als de steekproef willekeurig getrokken is. In de praktijk
gebeurt dit zelden.
M = het gemiddelde van de steekproef, hier is geen onzekerheid over.
μ= de beste gok voor het gemiddelde in de populatie. Dit is een schatting.
Het verschil tussen M en μis de sampling error, oftewel
standaardschattingsfout.
De standard error is de gemiddelde afwijking van steekproefgemiddelden ten
opzichte van het populatiegemiddelde. Het is de standaardafwijking van de
sampling distribution.
De standard error kan niet berekend worden op basis van één steekproef. We
schatten de standard error namelijk in op basis van de sample.
Standaarddeviatie steekproef
Standard error voor gemiddelde =
√ grootte steekproef
Betrouwbaarheidsinterval: een schatting waarin de populatieparameter
waarschijnlijk valt. Deze is afhankelijk van de standaarddeviatie. Een 95% b.i. zijn
als het ware de middelste 95% van metingen op een normale verdeling. Het
midden van de normale verdeling is de beste gok voor het gemiddelde in de
populatie. Vanaf daar wordt een two-tailed test uitgevoerd, waarin de kritieke
waarde (meestal 1,96 bij df = infinity) uitwijst welke waarde bij alfa = 0.05 wordt
gebruikt. Deze waarde wordt vermenigvuldigd met de standard error om de
afstanden vanaf μin de normaalverdeling te bepalen.
De linker barrière in de normaalverdeling wordt berekend met μ- kritieke waarde
* SE.
De rechter barrière in de normaalverdeling met μ+ kritieke waarde * SE.
Je weet maar met 95% zekerheid of je interval de populatieparameter bevat. Er is
dus een foutmarge van 5%.
Nominaal meetniveau: categorisch, verschilt slechts in naam.
Ordinaal meetniveau: categorieën met volgorde.
Interval meetniveau: consistente grootte van afstanden tussen waardes.
Ratio meetniveau: heeft daarnaast een logisch, absoluut 0-punt.
Als we geen data hebben om zeker te weten of het populatiegemiddelde groter is
dan 0, dan wordt een poging gedaan om aan te tonen dat de verzamelde data
zou bestaan als het populatiegemiddelde inderdaad 0 zou zijn. Wat is de kans om
, data te observeren die minstens zo extreem zijn als onze steekproef, als het
populatiegemiddelde 0 is?
Stappenplan toetsen p(data|H0):
Stap 1) Hypotheses formuleren.
H0 = populatiegemiddelde ≤ 0.
HA = populatiegemiddelde > 0.
Stap 2) Teststatistiek berekenen.
Deze beschrijft hoeveel standaarderrors het steekproefgemiddelde afligt van het
gemiddelde onder de nulhypothese.
Stap 3) p-waarde uitrekenen
De kans dat de data (of nog extremer) voorkomt als H 0 waar is.
Stap 4) Conclusie trekken over hypothese.
Je kijkt of de p-waarde laag genoeg is en onder de grenswaarde (meestal 0.05)
komt.
Teststatistiek: een waarde die aangeeft hoeveel standaardafwijkingen je
geobserveerde data afliggen van de verwachting onder de nulhypothese.
Aangenomen wordt, dat data zich verspreiden op een normaalverdeling. H 0 is het
midden, dus extremere waardes zitten ver van H 0 af en komen minder vaak voor.
Verschil tussen H 0 en data
Dit kan met de formule
Standard error
Significantieniveau: de drempelwaarde die aangeeft wanneer H 0 verworpen
mag worden. Dit wordt ook wel de grenswaarde genoemd.
Directionele hypotheses: hebben een richting voor de verwachting ten
opzichte van H0, ze verwachten of een hogere of een lagere waarde. Hiervoor
wordt een eenzijdige toets gebruikt.
Non-directionele hypotheses: hebben geen vaste richting en verwachten
simpelweg een verschil ten opzichte van H0. Hiervoor wordt een tweezijdige toets
gebruikt. Het significantieniveau blijft hetzelfde, dus moeten de metingen van
een tweezijdige toets twee keer zo ver afliggen van H 0 als een eenzijdige toets.
Power: de kans dat je een significant resultaat vindt. Eenzijdige toetsen hebben
meer power als de goede richting is verwacht. Verder wordt power beïnvloed
door de grootte van het effect, de grootte van de standaardafwijking en het
aantal proefpersonen.
Independent samples t-test: is er een significant verschil tussen de
gemiddelden tussen twee groepen? De gemiddelden zijn op interval/ratio niveau,
de groepen op nominaal/ordinaal. Dit is vaak een waarde tussen de -3 en 3.
Z-waarde: wordt berekend met de populatiestandaardafwijking. Deze is echter
zelden bekend. Daarom wordt de standaardafwijking, met enige onzekerheid, op
basis van steekproeven ingeschat. Deze onzekerheid leidt tot een meer
uitgesmeerde normaalverdeling van p-waardes. Ze worden dus hoger, ook bij
extremere metingen. Des te groter de populatie, des te dichter Z bij de uitslag t
ligt.
Z-verdeling: de standaardnormaalverdeling. Hier heb je dus de
standaardafwijking van de populatie nodig. De t-verdeling is de Z-verdeling,
met extra onzekerheid.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper StuviaManMetHetStuviaPlan. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.