Practicum Data-Analyse
- Week 1 - 1 waarde toetsen -
Schatten: op basis van een steekproef een gok doen over de waarde van de
gehele populatie.
Toetsen: vaststellen of de populatie afwijkt van de verwachte waarde.
Populatieparameters schatten we in op basis van de steekproef. Als de
steekproef representatief is, kunnen we een geïnformeerde gok doen. Het helpt
met de representativiteit als de steekproef willekeurig getrokken is. In de praktijk
gebeurt dit zelden.
M = het gemiddelde van de steekproef, hier is geen onzekerheid over.
μ= de beste gok voor het gemiddelde in de populatie. Dit is een schatting.
Het verschil tussen M en μis de sampling error, oftewel
standaardschattingsfout.
De standard error is de gemiddelde afwijking van steekproefgemiddelden ten
opzichte van het populatiegemiddelde. Het is de standaardafwijking van de
sampling distribution.
De standard error kan niet berekend worden op basis van één steekproef. We
schatten de standard error namelijk in op basis van de sample.
Standaarddeviatie steekproef
Standard error voor gemiddelde =
√ grootte steekproef
Betrouwbaarheidsinterval: een schatting waarin de populatieparameter
waarschijnlijk valt. Deze is afhankelijk van de standaarddeviatie. Een 95% b.i. zijn
als het ware de middelste 95% van metingen op een normale verdeling. Het
midden van de normale verdeling is de beste gok voor het gemiddelde in de
populatie. Vanaf daar wordt een two-tailed test uitgevoerd, waarin de kritieke
waarde (meestal 1,96 bij df = infinity) uitwijst welke waarde bij alfa = 0.05 wordt
gebruikt. Deze waarde wordt vermenigvuldigd met de standard error om de
afstanden vanaf μin de normaalverdeling te bepalen.
De linker barrière in de normaalverdeling wordt berekend met μ- kritieke waarde
* SE.
De rechter barrière in de normaalverdeling met μ+ kritieke waarde * SE.
Je weet maar met 95% zekerheid of je interval de populatieparameter bevat. Er is
dus een foutmarge van 5%.
Nominaal meetniveau: categorisch, verschilt slechts in naam.
Ordinaal meetniveau: categorieën met volgorde.
Interval meetniveau: consistente grootte van afstanden tussen waardes.
Ratio meetniveau: heeft daarnaast een logisch, absoluut 0-punt.
Als we geen data hebben om zeker te weten of het populatiegemiddelde groter is
dan 0, dan wordt een poging gedaan om aan te tonen dat de verzamelde data
zou bestaan als het populatiegemiddelde inderdaad 0 zou zijn. Wat is de kans om
, data te observeren die minstens zo extreem zijn als onze steekproef, als het
populatiegemiddelde 0 is?
Stappenplan toetsen p(data|H0):
Stap 1) Hypotheses formuleren.
H0 = populatiegemiddelde ≤ 0.
HA = populatiegemiddelde > 0.
Stap 2) Teststatistiek berekenen.
Deze beschrijft hoeveel standaarderrors het steekproefgemiddelde afligt van het
gemiddelde onder de nulhypothese.
Stap 3) p-waarde uitrekenen
De kans dat de data (of nog extremer) voorkomt als H 0 waar is.
Stap 4) Conclusie trekken over hypothese.
Je kijkt of de p-waarde laag genoeg is en onder de grenswaarde (meestal 0.05)
komt.
Teststatistiek: een waarde die aangeeft hoeveel standaardafwijkingen je
geobserveerde data afliggen van de verwachting onder de nulhypothese.
Aangenomen wordt, dat data zich verspreiden op een normaalverdeling. H 0 is het
midden, dus extremere waardes zitten ver van H 0 af en komen minder vaak voor.
Verschil tussen H 0 en data
Dit kan met de formule
Standard error
Significantieniveau: de drempelwaarde die aangeeft wanneer H 0 verworpen
mag worden. Dit wordt ook wel de grenswaarde genoemd.
Directionele hypotheses: hebben een richting voor de verwachting ten
opzichte van H0, ze verwachten of een hogere of een lagere waarde. Hiervoor
wordt een eenzijdige toets gebruikt.
Non-directionele hypotheses: hebben geen vaste richting en verwachten
simpelweg een verschil ten opzichte van H0. Hiervoor wordt een tweezijdige toets
gebruikt. Het significantieniveau blijft hetzelfde, dus moeten de metingen van
een tweezijdige toets twee keer zo ver afliggen van H 0 als een eenzijdige toets.
Power: de kans dat je een significant resultaat vindt. Eenzijdige toetsen hebben
meer power als de goede richting is verwacht. Verder wordt power beïnvloed
door de grootte van het effect, de grootte van de standaardafwijking en het
aantal proefpersonen.
Independent samples t-test: is er een significant verschil tussen de
gemiddelden tussen twee groepen? De gemiddelden zijn op interval/ratio niveau,
de groepen op nominaal/ordinaal. Dit is vaak een waarde tussen de -3 en 3.
Z-waarde: wordt berekend met de populatiestandaardafwijking. Deze is echter
zelden bekend. Daarom wordt de standaardafwijking, met enige onzekerheid, op
basis van steekproeven ingeschat. Deze onzekerheid leidt tot een meer
uitgesmeerde normaalverdeling van p-waardes. Ze worden dus hoger, ook bij
extremere metingen. Des te groter de populatie, des te dichter Z bij de uitslag t
ligt.
Z-verdeling: de standaardnormaalverdeling. Hier heb je dus de
standaardafwijking van de populatie nodig. De t-verdeling is de Z-verdeling,
met extra onzekerheid.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller StuviaManMetHetStuviaPlan. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.25. You're not tied to anything after your purchase.