Samenvatting Statistical Methods for the Social Sciences, Global Edition, ISBN: 9781292220314 Statistische Modellen 1 (PABAP036)
39 views 2 purchases
Course
Statistische Modellen 1 (PABAP036)
Institution
Rijksuniversiteit Groningen (RuG)
Book
Statistical Methods for the Social Sciences, Global Edition
Dit is een hulpbron te gebruiken bij het online tentamen of ten inzage voorbereidend aan het tentamen. Het omvat aantekeningen van de colleges gecombineerd met stof uit het boek.
Samenvatting per hoofdstuk
Hoofdstuk 4 steekproevenverdeling, les 1a, 1 februari
Kansrekening Het voorspelt op de lange termijn random gebeurtenissen en is daarom relevant. Een
steekproeftrekking is ook een random gebeurtenis. Kansrekening wordt gebruikt om kans uitspraken
te doen over wat er gebeurt als je heel vaak een steekproef zou trekken. Ze kunnen worden gebruikt
voor proporties en gemiddelden. Gemiddelde variëren minder dan de losse scores in de populatie en
zijn meer normaal verdeeld. De gemiddelde is unbiased, omdat het gemiddelde van
steekproefgemiddelden op de lange termijn hetzelfde is als het gemiddelde van de scores in de
populatie. De standaardfout is de maat voor de spreiding tussen steekproefuitkomsten. Het zegt iets
over de hoeveelheid spreiding tussen statistics als je heel vaak een steekproef neemt. Bij het
gemiddelde hangt de standaardfout samen met de standaarddeviatie. Formule standaardfout
berekenen bij gemiddelden:
Het gemiddelde van steekproefgemiddelde staat gelijk aan het populatiegemiddelde.
De standaarddeviatie van steekproefgemiddelden noemt men de standaardfout = sd van de scores
gedeeld door wortel n.
Standaarddeviatie is de verdeling van waarnemingen met verwijzing naar de normale curve.
Daarentegen is de standaardfout de verdeling van een schatting met verwijzing naar de normale
curve.
Als de populatie normal verdeeld is, zijn de steekproefgemiddelden ook normaal verdeeld. Als de
populatie niet normaal verdeeld is, en de n groot is, dan is de steekproefgemiddelde ongeveer
normaal verdeeld.
Steekproevenverdeling zijn nuttig om je inzicht te geven in hoe bijzonder jouw ene uitkomst is. Het
kan worden gebruikt om jouw uitkomst te vergelijken met andere mogelijke uitkomsten en het zegt
iets over hoe bijzonder het is wat je hebt gevonden.
Hoofdstuk 5 betrouwbaarheidsintervallen, les 1b, 21, 4 februari en 8 februari
Bij een steekproef vindt je een schatting van de werkelijke waarde in de populatie (parameter). Er
zijn twee soorten schattingen:
● Puntschatting (point estimate of estimate)
1 specifieke waarde is de best mogelijke waarde. Er zijn vele waardes mogelijk, zoals het
gemiddelde, mediaan of proportie. Hoe goed de puntschatting is, is afhankelijk van de bias.
Unbiased estimator: geen structurele vertekening als je het heel vaak zou herhalen. Biased
estimator: structurele vertekening bij herhaling (komt bijv. voor bij de range = hoogste - laagste
score). Bij beide situaties is er bij 1 steekproef wel over/onderschatting mogelijk. Het
gemiddelde, proportie en sd zijn unbiased.
● Intervalschatting (interval estimate)
De best mogelijke schatting van een range van waardes. Het lost het probleem van variatie en
bias van de puntschatting op. De meest gebruikte intervalschatter is het
betrouwbaarheidsinterval oftewel confidence interval. Basisidee: Een C%-
betrouwbaarheidsinterval dekt in C% van de intervallen de parameter. Het is dus een interval
van getallen waarin de parameter in C% van de gevallen veronderstelt wordt te liggen.
De algemene vorm van een betrouwbaarheidsinterval bestaat uit de puntschatting plus en min de de
margin of error of foutenmarge. De margin of error of foutenmarge hangt af van het
betrouwbaarheidsniveau C%, en over welke uitkomst je het hebt. Hiervoor hebben we kennis nodig
over wat er zou gebeuren als je vaak een steefproef zou nemen oftewel de steekproevenverdeling.
,Betrouwbaarheidsintervallen voor proporties
Bij een grote n is er sprake van een normale verdeling volgens de centrale limietstelling / central
limit theorem. De standaardfout kan men berekenen door de standaarddeviatie van de geschatte
populatieproportie te berekenen middels de volgende formule:
Het probleem is echter dat we pi niet kennen. De oplossing hiervoor is om de proportie oftewel pi-
dakje in te vullen. De z wordt berekend door te kijken naar de bijbehorende z-waarde. Bij een 95%
bhi gebruiken we de z-waarde 1.96 en bij een 99%bhi gebruiken we de z-waarde 2.58 (zie onderaan
tabel b). De ingevulde z-waarde noemen we ook wel de sample estimate of a standard error of se.
Het BHI wordt smaller als n groter wordt. Algemeen geldt dus dat:
Het significantieniveau of alpha is de kans dat een intervalschatter de parameter niet bevat. Dit is
gelijk aan 1 min het betrouwbaarheidsniveau. Het is het risico dat je bereid bent om te nemen om
ten onrechte de nulhypothese te verwerpen. Het wordt ook wel het type 1 fout genoemd.
Betrouwbaarheidsintervallen voor gemiddelden
Bij een bhi voor gemiddelden gebruikt men de volgende formule, indien de standaarddeviatie in de
populatie oftewel sigma bekend is:
, In de praktijk is de standaarddeviatie in de populatie oftewel sigma zelden bekend. Je schat dan de
populatiestandaarddeviatie o.b.v. je steekproefstandaarddeviatie (s).
Bij normale verdelingen maken we gebruik van z-waardes. De formule voor het bereken van de z-
waarde indien sigma bekend:
Bij het schatten van de standaarddeviatie van de populatie oftewel sigma o.b.v. de
standaarddeviatie van de steekproef maken we gebruiken van de t-verdeling. Bij de z-verdeling is er
veel massa rond het midden en af en toe iets verder er af. Bij de t-verdeling is er bijna altijd sprake
van een normale verdeling, maar de staarten zijn iets dikker.
Bij de t-verdeling komt nog iets extra’s, namelijk de degrees of freedom/vrijheidsgraden. Bij de z-
verdeling is het gemiddelde altijd 0 en de sd 1. Bij de t-verdeling hangt de dikte van de staarten af
van n. Voor iedere n is er dus een unieke t-verdeling. Bij een 95% bhi is sprake van een
overschrijdingskans van 5% met 2.5% aan iedere kant. Tabel B geeft de rechteroverschrijdingskans
weer, waardoor t = .025.
Berekenen van de margin of error of foutenmarge en de gewenste steekproefgrootte n
Betrouwbaarheidsintervallen voor een gemiddelde lijken op die voor verhoudingen, behalve dat ze
t-scores uit de t-verdeling gebruiken in plaats van z-scores uit de standaard normale verdeling. Een
bhi geeft een indicatie van de nauwkeurigheid en de locatie van de parameter, maar het is niet voor
C% zeker dat de parameter daar ligt! De betrouwbaarheidsintervalformule voor een verhouding
vereist ten minste 15 waarnemingen van elk type.
De breedte van het betrouwbaarheidsinterval wordt bepaald door niveau C, de standaarddeviatie en
n. Hoe kleiner de standaarddeviatie, des te smaller het interval en des te groter de
steekproefgrootte, des te smaller het interval. Soms wil je vantevoren kunnen bepalen hoe breed je
bhi maximaal mag worden. De gewenste margin of error berekent men bij proporties door:
Bij het berekenen van een gewenste steekproefgrootte of n geld dan de volgende formule:
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller sandyvdvlag. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.93. You're not tied to anything after your purchase.