Een hele uitgebreide samenvatting van alle collegestof, waarin alle leerdoelen zitten verweven van het tentamen. Voorbeelden in het blauw weergegeven om te oefenen!
Webcollege 1: herhaling
Beschrijvende statistiek: beschrijft iets over de statistieken.
Toetsende statistiek: we gebruiken de beschrijvende statistiek om een inferentie te maken,
uitspraken te doen over iets groters.
Populatieparameters: een proportie of de gemiddelde waarbij je een schatting doet over de
populatie.
Toetsingsgrootheden: bijvoorbeeld t-waarde en z-waarde. Hierbij geef je dus
populatieparameters op basis van de gevonden gegevens in de steekproef.
Parameter: een waarde die een hele populatie omschrijft
Statistiek: is een geval dat een steekproef beschrijft (bijvoorbeeld het
steekproefgemiddelde)
Hypothesetoetsen: hierbij stel je vooraf een hypothese op en die ga je vervolgens wel of niet
verwerpen
Betrouwbaarheidsintervallen
Voorbeeld: in de hoorcollegezaal zitten 120
studenten, waarvan 80 vrouwen. De proportie
vrouwen is dus 80/120 = 0.67. Wat zegt de
gevonden proportie vrouwen in de steekproef
(p met dakje = 0.67) over de proportie vrouwen
in de populatie (p)?
P met dakje: steekproef proportie
P: proportie in populatie
De populatieparameter heeft een vaste waarde
(p). Er is alleen een exact aantal studenten van
de POW, waarvan een exact aantal vrouwelijke
studenten zijn. Maar deze aantallen zijn onbekend, dus p is onbekend. De steekproefwaarde
kan gebruikt worden als een schatting van de populatieparameter. Deze schatting kent dan
een bepaalde onzekerheid.
Ook is het goed om te weten dat als je telkens dezelfde steekproef herhaalt in een hoge
mate, je uiteindelijk een populatieproportie krijgt die in de normaalverdeling in het midden
ligt. We gebruiken de gegevens in de steekproef om een schatting te maken van de
populatieparameter. De precisie van deze schatting geven we aan met behulp van een
betrouwbaarheidsinterval (BI) die je kunt berekenen a.d.h.v.:
Of…
Je hebt een schatting (bijvoorbeeld p met een dakje) en die +/- je met een
toetsingsgrootheid (t-waarde/ z-waarde) x de standaardfout.
,Bij herhaalde steekproeftrekking ligt in 100(1-a)% van de gevallen de populatieparameter
binnen de grenzen van het interval. Het betrouwbaarheidsinterval geeft plausibele waarden
voor de populatieparameter op basis van:
- De puntschatting (gevonden proportie/ gemiddelde/ verschil, etc.)
- Kritieke grenzen behorend bij de toetsingsgrootheid (t, z, etc.)
- Standaardfout van de puntschatting
- Houdbaarheid van de aannamen die je doet, bijvoorbeeld normaliteit
Hypothese toetsen
Voorbeeld: we gaan dit doen aan de hand van een voorbeeld, namelijk: in de
hoorcollegezaal zitten 120 studenten, waarvan 80 vrouwen. Kan ik aannemen dat in de
populatie de helft van de premaster studenten vrouw is?
De proportie die bij de steekproef hoort > 80:120= 0.67
Stap 1: assumpties checken
- De variabele is categorisch(proportie)/ kwantitatief(gemiddelde)
- De steekproef is groot genoeg → np en n(1-p) groter, of gelijk aan 15
- De steekproef is willekeurig getrokken
Stap 2: hypothesen opstellen
H0: geen effect (=)
Ha/H1: alternatieve hypothese, wel effect (>/< dan)
→ Bij de nulhypothese staat er dus: de proportie is gelijk aan de
proportie van de nulhypothese.
In dit geval is het:
H0 : p = p0 = 0.5
Ha : p ≠ 0.5
Stap 3: toetsingsgrootheid
Hierbij ga je dus uitrekenen hoeveel SE de steekproefproportie afligt van de
nulhypothese proportie! (of gemiddelde bij kwantitatieve variabelen)
z-waarde: categorisch
t-waarde: kwantitatief
Stel dat de z-waarde 3.66 is, betekent het dat de gevonden steekproefwaarde Categorische
3.66 SE’s afligt van de populatiewaarde. variabele!
Stap 4: p-waarde
Hierbij ga je kijken hoe waarschijnlijk het is dat je die standaardwaarde vindt van de vorige
stap! Nu ga je in de tabellen kijken naar de waarde en dit vergelijken met significantieniveau
/ kritieke waarde (a)
Hierbij ga je er telkens vanuit dat H0 waar is.
Let op! Toets je eenzijdig op tweezijdig? → tweezijdig is alpha verspreiden over 2 kanten!
Dus 0.05 wordt 0.025 aan iedere kant.
,Stap 5: conclusie
Verwerpen bij…
- Een kleinere P-waarde dan het significantieniveau (a)
- Toetsingsgrootheid extremer dan de kritieke waarde
o Dus als je z-waarde 3.66 en de kritieke waarde 1.96 (van 95% BI), dan is die
ook al groter.
Toetskeuzeschema
Dit is puur om even te checken of je de juiste
toetsing gebruikt.
Kijk goed wat je onderzoekt: groep
jongens/meiden → z-toets.
IQ meten bij 1 groep → t-toets
SIDENOTE: bij een proportie geldt dat een standaardfout voor het berekenen van een
nulhypothese (hypothesetoetsen) niet gelijk is voor het berekenen voor een
betrouwbaarheidsinterval. Bij het gemiddelde gebruik je wel dezelfde formule hiervoor.
In de discussie ga je de interpretatie van de resultaten beschrijven.
, Webcollege 2: vergelijken van 2 groepen deel I
Toets voor twee proporties onafhankelijk, a.d.h.v. een voorbeeld
Het vorige college hebben we gekeken hoe je moet kijken naar het toetsen van één
proportie en nu gaan we kijken naar het toetsen van twee proporties.
Voorbeeld: bèta-opleidingen zijn van oudsher een ‘mannenopleiding’, maar worden
tegenwoordig vooral gepromoot onder vrouwen.
Onderzoeksvraag: kiezen vrouwen en mannen tegenwoordig even vaak voor een bèta-
opleiding?
Opzet: aan 2076 mannelijke en 2307 vrouwelijke leerlingen werd gevraagd voor welke studie
zij zich zullen inschrijven.
Observatie: van de 1359 leerlingen die voor een bèta-opleiding kozen waren er 508 vrouw.
Tip: maak een tabel →
We gaan nu de proporties berekenen:
Mannen die bèta kozen: 851/2076 = .4099
Vrouwen die bèta kozen: 508/2307 = .2201
Het verschil is dan: 0.4099 – 0.2201 =
0.1898
Hamvraag: wijkt dit verschil van 0.1898
significant af van ‘geen verschil’ (verschil
van 0)?
(Zie afbeelding) We gaan weer het
volgende lijstje langs. En zoals je ziet,
wordt er een nieuwe formule gebruikt
voor het berekenen van de z-score en
standaardfout, doordat we twee
proporties hebben op dit moment!
Let op de aannames!
Je ziet bijvoorbeeld bij de z-score (p1 –
p2) dat je het verschil tussen de
gevonden steekproefproportie en de
nulhypothese moet berekenen.
Om een proportie te berekenen moet je
ook weer een andere formule gebruiken.
(blz. 22 formuleboek →)
Je kunt heel moeilijk doen met deze hele
formule om de p met dakje te schatten,
maar je kunt ook gewoon de formule die
eronder staat gebruiken.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller sannejansssen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.10. You're not tied to anything after your purchase.