Week 1: Steekproefverdelingen en hypotheses testen
Steekproevendistributie: verdeling van een statistiek afgeleid van alle mogelijke
steekproeven van een specifieke grootte / n uit de populatie. Als we alle steekproeven
zouden testen met dezelfde n, zouden we dit krijgen. Geeft een schatting van variabiliteit die
je kan krijgen als je een steekproef doet in de populatie. Stappen: neem een populatie,
neem vervolgens alle mogelijke steekproeven van 1 statistiek uit deze populatie zoals
gemiddeld gewicht en dan zet je deze uit een.
Steekproeffouten: veroorzaakt variabiliteit tussen steekproeven door toeval
Een steekproevendistributie van een statistiek is altijd normaal verdeeld.
Steekproefverdeling: verdeling van een statistiek aan de hand van één steekproef
Twee soorten hypothesen:
- Nulhypothese (H0): stelt dat er geen significant verschil / verandering / verband is
tussen bepaalde populaties op een bepaalde variabele. Er is niets aan de hand.
- Alternatieve hypothese (Ha): stelt dat er wel een significant verschil / verandering /
verband is tussen populaties op een bepaalde variabele. Er is wel iets aan de hand.
Twee soorten alternatieve hypothesen:
- Eenzijdige alternatieve hypothese: er wordt een richting aangegeven waar het
verband / verschil vandaan komt.
Rechtszijdige alternatieve hypothese: Aanname: gemiddelde is groter dan groep waarmee je
het vergelijkt
Linkszijdige alternatieve hypothese: Aanname: gemiddelde is kleiner dan groep waarmee je
het vergelijkt
- Tweezijdige alternatieve hypothese: er wordt een verschil verwacht zonder specifieke
richting
De nulhypothese niet verwerpen betekent niet dat je bewijst dat de nulhypothese helemaal
waar is, deze blijft niet bewezen tot er een alternatieve hypothese is gevonden die het kan
verwerpen.
Steekproefstatistiek: kenmerken van een steekproef zoals het gemiddelde of de mediaan
Teststatistiek: een statistiek zoals z die een eigen steekproefverdeling heeft
Gemiddelde van teststatistiek: x met een streepje erboven en standaardafwijking: s
Gemiddelde van populatieparameter: u en standaardafwijking: o-
Afwijzingscriterium / significantieniveau: waarde voor onwaarschijnlijkheid in een
hypothesetoets (vaak a = 0.05). Als het significantieniveau 0.05 is, zal je de statistiek maar
in 5% van de gevallen vinden als nulhypothese juist is. Dit is zo onwaarschijnlijk dat we de
nulhypothese verwerpen als we een statistiek vinden met een waarschijnlijkheid (p-waarde)
van 0.05 of lager. Als het verschil tussen gemiddelden van twee groepen in het
afwijzingsgebied valt, verwerpen we H0 omdat het verschil te groot is om toeval te zijn. Zeer
significante waarden ondersteunen dus de alternatieve hypothese.
Als de nulhypothese verworpen wordt door bv een p-waarde van 0,03, betekent dit dat de
waarschijnlijkheid dat we dit verschil vinden tussen steekproefgemiddelden 0.03 is.
,Verwerpingsgebied: Alle statistieken waarvan de waarschijnlijkheid onder H0 gelijk of kleiner
zijn dan het afwijzingscriterium vallen hierin. Als onze statistiek erin ligt, wordt de
nulhypothese verworpen. Het verkrijgen hiervan is nml te onwaarschijnlijk. Alle extreme
statistieken vallen dus hierin.
Twee methoden om teststatistiek z te vergelijken met het afwijzingscriterium a:
- Vergelijk de p-waarde met a: Als de p-waarde (kans dat je een bepaalde teststatistiek
of extremere krijgt als H0 juist is) kleiner is dan a wordt H0 verworpen. Z kan
berekend worden door:
- Vergelijk z met Z(a): Bepaal de kritieke waarde (grens van het afwijzingsgebied
oftewel Z(a)). Als z groter is dan z(a) wordt H0 verworpen. Als er een negatieve
z-waarde is, dan wordt H0 verworpen als z kleiner is dan z(a).
Tweezijdig testen (a delen door 2): door alfa te delen in 2, wordt het verdeeld over beide
zijden van de verdeling waarbij laagste 2,5% en hoogste 2,5% worden verworpen.
Type I fout: als H0 wordt verworpen terwijl het waar is (kans dat je een verschil vindt terwijl
er geen verschil is). Deze kans is even groot als alfa.
Type II fout: als we H0 behouden terwijl de alternatieve hypothese waar is (kans dat er een
verschil is maar je concludeert dat dat er niet is)
Power (vinden van effect wanneer effect aanwezig is): kans dat H0 wordt verworpen als
nulhypothese onjuist is. Berekenen door 1 - de kans dat H0 niet verworpen wordt terwijl Ha
waar is.
Stappenplan hypothesetests:
- Formuleer H0 en Ha
- Bepaal steekproevendistributie van teststatistiek onder aanname dat H0 waar is
- Teststatistiek bepalen
- Verwerpingsgebied (als p-waarde lager is dan 0,05 dan verwerpen we H0)
- Statistische conclusie (nulhypothese behouden of verwerpen)
- Inhoudelijke conclusie (antwoord vraag)
Week 2: Basisbegrippen van waarschijnlijkheid
Willekeurige variabele: een variabele met waarden verkregen door willekeurige processen
zoals een loting. Twee soorten:
- Discrete: met een beperkt aantal mogelijke waarden zoals een dobbelsteen
- Cotinu: met oneindig veel mogelijke waarden zoals temperatuur
Steekproefgebied: alle mogelijke waarden die een willekeurige variabele kan aannemen
Kansen / waarschijnlijkheden: gebaseerd op theorie (kans op kop is 50%)
Verhoudingen / ratio’s: gebaseerd op gegevens van een steekproef (kans op kop is hoe
vaak je kop gooit delen door hoevaak je hebt gegeooid)
, Verwachte waarde: verwachte gemiddelde van een variabele door veel steekproeven heen,
berekening: vermenigvuldig elk van de mogelijke uitkomsten met de kans op die uitkomst en
tel dan alles bij elkaar op oftewel:
De wet van de grote aantallen: hoe groter de steekproef, hoe groter de kans dat het
steekproefgemiddelde ligt bij het populatiegemiddelde.
Variantie: de gekwadrateerde afwijking van het gemiddelde, berekening voor populatie:
Variantie berekenen voor steekproef:
Transformaties: omzetten van variabelen naar een andere schaal zoals centimeters en
inches, soorten:
- Bepaalde waarde optellen zoals gewicht, dus nieuwe waarde = oude waarde +
waarde die moet worden opgeteld
- Bepaalde waarde vermenigvuldigen zoals cm naar inch, nieuwe waarde = oude
waarde * andere waarde
- Algemene lineaire transformatie: nieuwe waarde = oude waarde + / - waarde die
moet worden opgeteld of afgetrokken * / : waarde die moet worden vermenigvuldigd
- Som van willekeurige variabelen: somscore berekenen door bv alle vragen in een
vragenlijst bij elkaar op te tellen
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper MarkDaniël. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,46. Je zit daarna nergens aan vast.