100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
College aantekeningen Toetsende Statistiek - Cijfer: 9.1 $7.69
Add to cart

Class notes

College aantekeningen Toetsende Statistiek - Cijfer: 9.1

 0 view  0 purchase
  • Course
  • Institution

HC aantekeningen toetsende statistiek, ik heb zelf een 9.1 gehaald voor het tentamen.

Preview 4 out of 54  pages

  • December 20, 2024
  • 54
  • 2023/2024
  • Class notes
  • Frank de vos
  • All classes
avatar-seller
HC 1 – Steekproevenverdeling en Hypothesen

Literatuur: Hoofdstuk 4

Error variance: verschil tussen samples (variabiliteit), de statistieken die zijn gevonden (bijv.
het gemiddelde), verschillen van sample tot sample
Sampling error: synoniem voor de variabiliteit door kans, de numerieke waarde van een
sample van statistieken zal waarschijnlijk een ‘error’ zijn (=zal afwijken van de voorspelde
parameter) als resultaat van de specifieke observaties die zijn gebeurd in de sample.

Hypothese toetsing
Redenen om dit te doen: data zijn ambigue, er is een grote kans dat gemiddelden anders zijn
als je ook het gemiddelde berekend maar dan met andere groepen.

Sampling distributions
‘Is het verkregen verschil te groot om te worden toegeschreven aan kans?’
SD vertelt ons specifiek welke rang van sample-to-sample variabiliteit we kunnen
verwachten bij de kans als functie van de sampling error
SD vertelt ons welke waardes we mogelijk (of niet) mogen verwachten voor een specifieke
statistiek onder een set van gedefinieerde condities.
De standaarddeviatie van die distributie van verschillen tussen gemiddelden (standard
error), laat de variabiliteit zien die we zouden verwachten om te vinden in de waardes van
de statistiek van de herhaaldelijke metingen.
Samenvattend: SD kan worden gezien als de distributie van waardes die zijn verkregen
vanuit het herhaaldelijk meten van een sampling.

Sampling distribution of differences between means
De distributie van verschillen tussen gemiddelden van een oneindig nummer van paren van
random sample, die zijn getrokken onder specifieke omstandigheden.

De rol van hypothese testing, verschillende issues:
1. Is het wel een verstandige werkwijze?
2. De logica die we gebruiken voor het toetsen?
3. Wat we moeten overwegen in aanvulling op de traditionele hypothese toetsing?

Testfases:
1. We willen de hypothese testen (research hypothesis)
2. We verkrijgen random samples van gedrag onder 2 condities
3. We zeggen dat de hypothese (nul-hypothese of H0), is verworven uit een sample met
allemaal dezelfde gemiddelden.
4. We verkrijgen de SD van de verschillen tussen gemiddelden onder de assumptie dat H0
waar is.
5. Gegeven de SD, we berekenen de kans van een gemiddelde verschil in ieder geval even
groot als degene die we eigenlijk hadden verkregen tussen de gemiddelden van de twee
samples.
6. Op basis van die kans, maken we een keuze, afwijzen of falen in het afwijzen van H0, want
H0 stelt dat de gemiddelden van de populaties gelijk zijn, afwijzen van H- laat zien dat ze niet

,gelijk zijn, ondanks dat de eigenlijke waarde van het verschil in de populatie gemiddelde niet
gespecificeerd blijft.

Nu makkelijk:
1. Begin met een onderzoekshypothese
2. Stel de nul hypothese
3. Een SD maken van een specifieke statistiek onder de assumptie dat H0 waar is
4. Data verzamelen
5. De sample statistic vergelijken met die distributie
6. Afwijzen of behouden van H0, afhankelijk van de kans, onder H0, of een sample statistic
als extreem als we hebben verkregen.

t-test gebruiken we als we willen bepalen of 2 samples getrokken zijn uit populaties met
dezelfde gemiddelden.

We zeggen dat we H0 afwijzen,a ls de kans lager of gelijk is aam 0.05 = significantie level of
rejection level.
Als er wordt gezegd: verschil is statistisch significant op level 0.05, bedoelen we dat een
verschil zo groot, vindt plaats, minder dan 5% van de tijd als H0 waar zou zijn.
Als het eronder is verwerpen we H0, erboven niet.
Critical value: score die de 5% afkapt


Hoorcollege

Hypothese: uitspraak over parameters in de populatie (dit is altijd over de gehele populatie,
de statistiek heeft te maken met uitspraken over de steekproef)
H0= ‘er is niets aan de hand’ in de populatie (geen verandering, geen verschil, geen relatie)
Statistiek begint altijd met de nulhypothese.
Ha= “er is iets aan de hand” in de populatie (vaak wat we denken of hopen dat het geval is)
Alternatieve hypothese (voorbeeld):
Ho: μ = 7
Ha: μ > 7
Dit is rechts-zijdig
Keuze voor eenzijdig (links/rechts), of tweezijdig is afhankelijk van onze kennis en
verwachtingen.

Een steekproef nemen
Populatie  hieruit neem je een steekproef (je wilt middels deze steekproef een uitspraak
doen over de gehele populatie). μ is een parameter.

Steekproevenverdeling
Een verdeling van een statistiek verkregen uit alle mogelijke steekproeven van een bepaalde
grootte (n) uit een populatie.
Voorbeeld: de verdeling van de gemiddelde oorlengte van alle mogelijke steekproeven van 5
konijnen uit de gewone populatie.

,Steekproefverdeling
De verdeling van waarden binnen een steekproef.
Voorbeeld: de verdeling van de oorlengte van de 5 konijnen in mijn steekproef

Hypothesetoetsing: hoe uitzonderlijk is onze steekproef eigenlijk?
p-waarde
De kans op deze of een extremere toetsstatistiek, als in werkelijkheid de nulhypothese waar
is.
De statistiek die we hier gebruikt hebben is het gemiddelde (van oorlengte), maar meestal
gebruiken we een specifiek soort toetsstatistiek.
Voorbeelden: χ2-statistiek, t-statistiek

Het voordeel van deze toetsstatistieken is dat we hun verdeling kunnen berekenen zonder al
die steekproeven te nemen van de populatie onder de nulhypothese. We weten dus hun
steekproevenverdeling.

Hypothesetoets
Een statistische methode om uit steekproefdata een uitspraak te doen over een
nulhypothese (χ2-toets voor homogeniteit, one-sample t-toets) (voorbeeld: dat het
gemiddelde van de populatie van konijnen gelijk is aan 7).

De p-waarde laat de kracht van het bewijs tegen de nulhypothese zien. Als de p-waarde erg
laag is, is de data onwaarschijnlijk onder de nulhypothese, dus dan is de nulhypothese
waarschijnlijk onjuist.

We kiezen een significantieniveau α.
Als de kans (p-waarde) kleiner is dan deze waarde, verwerpen we H0.

Deze α geeft ook een kritieke waarde en een verwerpingsgebied. Als de steekproefstatistiek
in het verwerpingsgebied ligt, verwerpen we H0. In dit geval tussen 8.7 en 8.4.
We toetsen: de gewone statistiek, het significantieniveau en het verwerpingsgebied.
We verwerpen de nulhypothese: als
Verwerp de nulhypothese als mijn steekproefgemiddelde groter is of gelijk aan mijn
steekproefgemiddelde van mijn significantieniveau.
X met streepje alpha is de kritieke waarde, alles rechts van die waarde is het
verwerpingsgebied. In dit geval is het alles van 8.4 of nog groter (en daar ligt 8.7 in).

- Onderzoekers kiezen een significantieniveau α (vaak 0.05)
- Ze rapporteren zowel de p-waarde als de beslissing (verwerpen of niet) over de
nulhypothese.
- Lagere p-waarden worden gezien als sterker bewijs (0.00001 is beter dan 0.04). Is ie kleiner
dan alpha en zo ja, hoe klein is ie dan?

Fouten
Maar… onze steekproef was een willekeurige (random) steekproef uit ‘mijn tuin’, dus je kan
een fout begaan.

, Type-I-fout (kans α)
Verwerp een nulhypothese, die eigenlijk waar is (we concluderen dat er een effect is, maar
dat is er niet) (we zeggen dat de oren langer zijn, maar dat is niet zo)
Type-II-fout (kans β)
Een nulhypothese niet verwerpen, terwijl hij wel onjuist is (we missen een effect dat er wel
is) (we zeggen niet dat de oren langer zijn, maar dat zijn ze wel).

Stel je hebt een statistisch significant resultaat, is dat ook praktisch significant of relevant?
Statistisch significant = kun je niet altijd bepalen wat voor resultaat dat dan precies is,
moeilijk te interpreteren
Praktisch significant = groot genoeg? Beter te bepalen door een effectmaat te berekenen;
kijken of er een klein, middel of groot effect is.

1. Hypothese Combinatie van H0 en Ha
2. Steekproevenverdeling Verdeling van de
toetsstatistiek onder H0
3. Toetsstatistiek Steekproefstatistiek → toetsstatistiek
4. p-waarde Vergelijk p met α
5. Statistische conclusie H0 verwerpen of niet
6. Inhoudelijke conclusie Beantwoord de
onderzoeksvraag

Correcte Ha = D
C is wanneer je geen duidelijk beeld hebt, er is sowieso een verschil maar ik weet niet welke
kant op, hier heb je een duidelijke hypothese dus D.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller suzannekuijpers. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $7.69. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

52928 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$7.69
  • (0)
Add to cart
Added