Week 1: Steekproefverdelingen en hypotheses testen
Steekproevendistributie: verdeling van een statistiek afgeleid van alle mogelijke
steekproeven van een specifieke grootte / n uit de populatie. Als we alle steekproeven
zouden testen met dezelfde n, zouden we dit krijgen. Geeft een schatting van variabiliteit die
je kan krijgen als je een steekproef doet in de populatie. Stappen: neem een populatie,
neem vervolgens alle mogelijke steekproeven van 1 statistiek uit deze populatie zoals
gemiddeld gewicht en dan zet je deze uit een.
Steekproeffouten: veroorzaakt variabiliteit tussen steekproeven door toeval
Een steekproevendistributie van een statistiek is altijd normaal verdeeld.
Steekproefverdeling: verdeling van een statistiek aan de hand van één steekproef
Twee soorten hypothesen:
- Nulhypothese (H0): stelt dat er geen significant verschil / verandering / verband is
tussen bepaalde populaties op een bepaalde variabele. Er is niets aan de hand.
- Alternatieve hypothese (Ha): stelt dat er wel een significant verschil / verandering /
verband is tussen populaties op een bepaalde variabele. Er is wel iets aan de hand.
Twee soorten alternatieve hypothesen:
- Eenzijdige alternatieve hypothese: er wordt een richting aangegeven waar het
verband / verschil vandaan komt.
Rechtszijdige alternatieve hypothese: Aanname: gemiddelde is groter dan groep waarmee je
het vergelijkt
Linkszijdige alternatieve hypothese: Aanname: gemiddelde is kleiner dan groep waarmee je
het vergelijkt
- Tweezijdige alternatieve hypothese: er wordt een verschil verwacht zonder specifieke
richting
De nulhypothese niet verwerpen betekent niet dat je bewijst dat de nulhypothese helemaal
waar is, deze blijft niet bewezen tot er een alternatieve hypothese is gevonden die het kan
verwerpen.
Steekproefstatistiek: kenmerken van een steekproef zoals het gemiddelde of de mediaan
Teststatistiek: een statistiek zoals z die een eigen steekproefverdeling heeft
Gemiddelde van teststatistiek: x met een streepje erboven en standaardafwijking: s
Gemiddelde van populatieparameter: u en standaardafwijking: o-
Afwijzingscriterium / significantieniveau: waarde voor onwaarschijnlijkheid in een
hypothesetoets (vaak a = 0.05). Als het significantieniveau 0.05 is, zal je de statistiek maar
in 5% van de gevallen vinden als nulhypothese juist is. Dit is zo onwaarschijnlijk dat we de
nulhypothese verwerpen als we een statistiek vinden met een waarschijnlijkheid (p-waarde)
van 0.05 of lager. Als het verschil tussen gemiddelden van twee groepen in het
afwijzingsgebied valt, verwerpen we H0 omdat het verschil te groot is om toeval te zijn. Zeer
significante waarden ondersteunen dus de alternatieve hypothese.
Als de nulhypothese verworpen wordt door bv een p-waarde van 0,03, betekent dit dat de
waarschijnlijkheid dat we dit verschil vinden tussen steekproefgemiddelden 0.03 is.
,Verwerpingsgebied: Alle statistieken waarvan de waarschijnlijkheid onder H0 gelijk of kleiner
zijn dan het afwijzingscriterium vallen hierin. Als onze statistiek erin ligt, wordt de
nulhypothese verworpen. Het verkrijgen hiervan is nml te onwaarschijnlijk. Alle extreme
statistieken vallen dus hierin.
Twee methoden om teststatistiek z te vergelijken met het afwijzingscriterium a:
- Vergelijk de p-waarde met a: Als de p-waarde (kans dat je een bepaalde teststatistiek
of extremere krijgt als H0 juist is) kleiner is dan a wordt H0 verworpen. Z kan
berekend worden door:
- Vergelijk z met Z(a): Bepaal de kritieke waarde (grens van het afwijzingsgebied
oftewel Z(a)). Als z groter is dan z(a) wordt H0 verworpen. Als er een negatieve
z-waarde is, dan wordt H0 verworpen als z kleiner is dan z(a).
Tweezijdig testen (a delen door 2): door alfa te delen in 2, wordt het verdeeld over beide
zijden van de verdeling waarbij laagste 2,5% en hoogste 2,5% worden verworpen.
Type I fout: als H0 wordt verworpen terwijl het waar is (kans dat je een verschil vindt terwijl
er geen verschil is). Deze kans is even groot als alfa.
Type II fout: als we H0 behouden terwijl de alternatieve hypothese waar is (kans dat er een
verschil is maar je concludeert dat dat er niet is)
Power (vinden van effect wanneer effect aanwezig is): kans dat H0 wordt verworpen als
nulhypothese onjuist is. Berekenen door 1 - de kans dat H0 niet verworpen wordt terwijl Ha
waar is.
Stappenplan hypothesetests:
- Formuleer H0 en Ha
- Bepaal steekproevendistributie van teststatistiek onder aanname dat H0 waar is
- Teststatistiek bepalen
- Verwerpingsgebied (als p-waarde lager is dan 0,05 dan verwerpen we H0)
- Statistische conclusie (nulhypothese behouden of verwerpen)
- Inhoudelijke conclusie (antwoord vraag)
Week 2: Basisbegrippen van waarschijnlijkheid
Willekeurige variabele: een variabele met waarden verkregen door willekeurige processen
zoals een loting. Twee soorten:
- Discrete: met een beperkt aantal mogelijke waarden zoals een dobbelsteen
- Cotinu: met oneindig veel mogelijke waarden zoals temperatuur
Steekproefgebied: alle mogelijke waarden die een willekeurige variabele kan aannemen
Kansen / waarschijnlijkheden: gebaseerd op theorie (kans op kop is 50%)
Verhoudingen / ratio’s: gebaseerd op gegevens van een steekproef (kans op kop is hoe
vaak je kop gooit delen door hoevaak je hebt gegeooid)
, Verwachte waarde: verwachte gemiddelde van een variabele door veel steekproeven heen,
berekening: vermenigvuldig elk van de mogelijke uitkomsten met de kans op die uitkomst en
tel dan alles bij elkaar op oftewel:
De wet van de grote aantallen: hoe groter de steekproef, hoe groter de kans dat het
steekproefgemiddelde ligt bij het populatiegemiddelde.
Variantie: de gekwadrateerde afwijking van het gemiddelde, berekening voor populatie:
Variantie berekenen voor steekproef:
Transformaties: omzetten van variabelen naar een andere schaal zoals centimeters en
inches, soorten:
- Bepaalde waarde optellen zoals gewicht, dus nieuwe waarde = oude waarde +
waarde die moet worden opgeteld
- Bepaalde waarde vermenigvuldigen zoals cm naar inch, nieuwe waarde = oude
waarde * andere waarde
- Algemene lineaire transformatie: nieuwe waarde = oude waarde + / - waarde die
moet worden opgeteld of afgetrokken * / : waarde die moet worden vermenigvuldigd
- Som van willekeurige variabelen: somscore berekenen door bv alle vragen in een
vragenlijst bij elkaar op te tellen
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller MarkDaniël. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.92. You're not tied to anything after your purchase.