100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
College aantekeningen Toetsende Statistiek - Cijfer: 9.1 €7,16
In winkelwagen

College aantekeningen

College aantekeningen Toetsende Statistiek - Cijfer: 9.1

 0 keer bekeken  0 keer verkocht

HC aantekeningen toetsende statistiek, ik heb zelf een 9.1 gehaald voor het tentamen.

Voorbeeld 4 van de 54  pagina's

  • 20 december 2024
  • 54
  • 2023/2024
  • College aantekeningen
  • Frank de vos
  • Alle colleges
Alle documenten voor dit vak (45)
avatar-seller
suzannekuijpers
HC 1 – Steekproevenverdeling en Hypothesen

Literatuur: Hoofdstuk 4

Error variance: verschil tussen samples (variabiliteit), de statistieken die zijn gevonden (bijv.
het gemiddelde), verschillen van sample tot sample
Sampling error: synoniem voor de variabiliteit door kans, de numerieke waarde van een
sample van statistieken zal waarschijnlijk een ‘error’ zijn (=zal afwijken van de voorspelde
parameter) als resultaat van de specifieke observaties die zijn gebeurd in de sample.

Hypothese toetsing
Redenen om dit te doen: data zijn ambigue, er is een grote kans dat gemiddelden anders zijn
als je ook het gemiddelde berekend maar dan met andere groepen.

Sampling distributions
‘Is het verkregen verschil te groot om te worden toegeschreven aan kans?’
SD vertelt ons specifiek welke rang van sample-to-sample variabiliteit we kunnen
verwachten bij de kans als functie van de sampling error
SD vertelt ons welke waardes we mogelijk (of niet) mogen verwachten voor een specifieke
statistiek onder een set van gedefinieerde condities.
De standaarddeviatie van die distributie van verschillen tussen gemiddelden (standard
error), laat de variabiliteit zien die we zouden verwachten om te vinden in de waardes van
de statistiek van de herhaaldelijke metingen.
Samenvattend: SD kan worden gezien als de distributie van waardes die zijn verkregen
vanuit het herhaaldelijk meten van een sampling.

Sampling distribution of differences between means
De distributie van verschillen tussen gemiddelden van een oneindig nummer van paren van
random sample, die zijn getrokken onder specifieke omstandigheden.

De rol van hypothese testing, verschillende issues:
1. Is het wel een verstandige werkwijze?
2. De logica die we gebruiken voor het toetsen?
3. Wat we moeten overwegen in aanvulling op de traditionele hypothese toetsing?

Testfases:
1. We willen de hypothese testen (research hypothesis)
2. We verkrijgen random samples van gedrag onder 2 condities
3. We zeggen dat de hypothese (nul-hypothese of H0), is verworven uit een sample met
allemaal dezelfde gemiddelden.
4. We verkrijgen de SD van de verschillen tussen gemiddelden onder de assumptie dat H0
waar is.
5. Gegeven de SD, we berekenen de kans van een gemiddelde verschil in ieder geval even
groot als degene die we eigenlijk hadden verkregen tussen de gemiddelden van de twee
samples.
6. Op basis van die kans, maken we een keuze, afwijzen of falen in het afwijzen van H0, want
H0 stelt dat de gemiddelden van de populaties gelijk zijn, afwijzen van H- laat zien dat ze niet

,gelijk zijn, ondanks dat de eigenlijke waarde van het verschil in de populatie gemiddelde niet
gespecificeerd blijft.

Nu makkelijk:
1. Begin met een onderzoekshypothese
2. Stel de nul hypothese
3. Een SD maken van een specifieke statistiek onder de assumptie dat H0 waar is
4. Data verzamelen
5. De sample statistic vergelijken met die distributie
6. Afwijzen of behouden van H0, afhankelijk van de kans, onder H0, of een sample statistic
als extreem als we hebben verkregen.

t-test gebruiken we als we willen bepalen of 2 samples getrokken zijn uit populaties met
dezelfde gemiddelden.

We zeggen dat we H0 afwijzen,a ls de kans lager of gelijk is aam 0.05 = significantie level of
rejection level.
Als er wordt gezegd: verschil is statistisch significant op level 0.05, bedoelen we dat een
verschil zo groot, vindt plaats, minder dan 5% van de tijd als H0 waar zou zijn.
Als het eronder is verwerpen we H0, erboven niet.
Critical value: score die de 5% afkapt


Hoorcollege

Hypothese: uitspraak over parameters in de populatie (dit is altijd over de gehele populatie,
de statistiek heeft te maken met uitspraken over de steekproef)
H0= ‘er is niets aan de hand’ in de populatie (geen verandering, geen verschil, geen relatie)
Statistiek begint altijd met de nulhypothese.
Ha= “er is iets aan de hand” in de populatie (vaak wat we denken of hopen dat het geval is)
Alternatieve hypothese (voorbeeld):
Ho: μ = 7
Ha: μ > 7
Dit is rechts-zijdig
Keuze voor eenzijdig (links/rechts), of tweezijdig is afhankelijk van onze kennis en
verwachtingen.

Een steekproef nemen
Populatie  hieruit neem je een steekproef (je wilt middels deze steekproef een uitspraak
doen over de gehele populatie). μ is een parameter.

Steekproevenverdeling
Een verdeling van een statistiek verkregen uit alle mogelijke steekproeven van een bepaalde
grootte (n) uit een populatie.
Voorbeeld: de verdeling van de gemiddelde oorlengte van alle mogelijke steekproeven van 5
konijnen uit de gewone populatie.

,Steekproefverdeling
De verdeling van waarden binnen een steekproef.
Voorbeeld: de verdeling van de oorlengte van de 5 konijnen in mijn steekproef

Hypothesetoetsing: hoe uitzonderlijk is onze steekproef eigenlijk?
p-waarde
De kans op deze of een extremere toetsstatistiek, als in werkelijkheid de nulhypothese waar
is.
De statistiek die we hier gebruikt hebben is het gemiddelde (van oorlengte), maar meestal
gebruiken we een specifiek soort toetsstatistiek.
Voorbeelden: χ2-statistiek, t-statistiek

Het voordeel van deze toetsstatistieken is dat we hun verdeling kunnen berekenen zonder al
die steekproeven te nemen van de populatie onder de nulhypothese. We weten dus hun
steekproevenverdeling.

Hypothesetoets
Een statistische methode om uit steekproefdata een uitspraak te doen over een
nulhypothese (χ2-toets voor homogeniteit, one-sample t-toets) (voorbeeld: dat het
gemiddelde van de populatie van konijnen gelijk is aan 7).

De p-waarde laat de kracht van het bewijs tegen de nulhypothese zien. Als de p-waarde erg
laag is, is de data onwaarschijnlijk onder de nulhypothese, dus dan is de nulhypothese
waarschijnlijk onjuist.

We kiezen een significantieniveau α.
Als de kans (p-waarde) kleiner is dan deze waarde, verwerpen we H0.

Deze α geeft ook een kritieke waarde en een verwerpingsgebied. Als de steekproefstatistiek
in het verwerpingsgebied ligt, verwerpen we H0. In dit geval tussen 8.7 en 8.4.
We toetsen: de gewone statistiek, het significantieniveau en het verwerpingsgebied.
We verwerpen de nulhypothese: als
Verwerp de nulhypothese als mijn steekproefgemiddelde groter is of gelijk aan mijn
steekproefgemiddelde van mijn significantieniveau.
X met streepje alpha is de kritieke waarde, alles rechts van die waarde is het
verwerpingsgebied. In dit geval is het alles van 8.4 of nog groter (en daar ligt 8.7 in).

- Onderzoekers kiezen een significantieniveau α (vaak 0.05)
- Ze rapporteren zowel de p-waarde als de beslissing (verwerpen of niet) over de
nulhypothese.
- Lagere p-waarden worden gezien als sterker bewijs (0.00001 is beter dan 0.04). Is ie kleiner
dan alpha en zo ja, hoe klein is ie dan?

Fouten
Maar… onze steekproef was een willekeurige (random) steekproef uit ‘mijn tuin’, dus je kan
een fout begaan.

, Type-I-fout (kans α)
Verwerp een nulhypothese, die eigenlijk waar is (we concluderen dat er een effect is, maar
dat is er niet) (we zeggen dat de oren langer zijn, maar dat is niet zo)
Type-II-fout (kans β)
Een nulhypothese niet verwerpen, terwijl hij wel onjuist is (we missen een effect dat er wel
is) (we zeggen niet dat de oren langer zijn, maar dat zijn ze wel).

Stel je hebt een statistisch significant resultaat, is dat ook praktisch significant of relevant?
Statistisch significant = kun je niet altijd bepalen wat voor resultaat dat dan precies is,
moeilijk te interpreteren
Praktisch significant = groot genoeg? Beter te bepalen door een effectmaat te berekenen;
kijken of er een klein, middel of groot effect is.

1. Hypothese Combinatie van H0 en Ha
2. Steekproevenverdeling Verdeling van de
toetsstatistiek onder H0
3. Toetsstatistiek Steekproefstatistiek → toetsstatistiek
4. p-waarde Vergelijk p met α
5. Statistische conclusie H0 verwerpen of niet
6. Inhoudelijke conclusie Beantwoord de
onderzoeksvraag

Correcte Ha = D
C is wanneer je geen duidelijk beeld hebt, er is sowieso een verschil maar ik weet niet welke
kant op, hier heb je een duidelijke hypothese dus D.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper suzannekuijpers. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €7,16. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 52928 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€7,16
  • (0)
In winkelwagen
Toegevoegd