Tekens en formules
Tekens
= gemiddelde van steekproef
= standaardfout
µ = gemiddelde in populate
α = signifianteniveau
σ = standaarddeviate in populate
S = gebruiken we voor de standaarddeviate in de steekproef.
Formules
= formule standaardfout.
= Z-siore berekenen
= toetsingsgrootheid Hypothese toetsen
Degrees of freedom (df) = steekproefgroote 1
= T-toets berekenen bij een groep
= T-toets berekenen bij twee groepen
= betrouwbaarheidsinterval twee groepen
Aanvullende studieopgaven Hoorcollege 1
Variantie berekenen: S2 = eerst afwijkende siore berekenen t.o.v. gemiddelde allemaal bij elkaar
optellen en vervolgens delen door het aantal personen -1.
Wil je dan de standaarddeviatie dan neem je de wortel van S2
S = √S2
Steekproeffluctuatie: we mogen de resultaten uit de steekproef niet zonder meer generaliseren naar
de populate, omdat we rekening moeten houden met steekproevenfuitates (dat geldt zeker voor
hele kleine steekproeven). Door steekproevenfuituates weten we niet of het versihil dat we in deze
steekproef hebben gevonden kan worden toegesihreven aan de kenmerken van de toevallige
steekproef (d.w.z. een toevallig versihil), of dat het versihil zodanig groot is dat we het niet kunnen
toesihrijven aan toeval en we hier te maken hebben met systematsih versihil. Hoe hier mee om te
gaan leren we in de volgende iolleges.
Steekproefgemiddeldes hebben een grote mate van onzekerheid door steekproevenflutlates
hiermee wordt bedoeld dat de gemiddeldes variëren over steekproeven. Dat wil zeggen: als je steeds
een nieuwe steekproef (met dezelfde N) uit de populate zou trekken, en je zou in elke steekproef
,het gemiddelde berekenen, dan zie je dat de steekproevengemiddeldes variëren over steekproeven
(in de ene steekproef vind je een ander gemiddelde dan in een andere steekproef). Als je het
gemiddelde gebruikt als sihatng van het populategemiddelde dan moet je hiermee rekening
houden. Steekproef A levert een andere sihatng op dan steekproef B. De mate waarin gemiddeldes
variëren geef de onzekerheid weer waarmee het populategemiddelde wordt gesihat.
De steekproevenfuituates van het gemiddelde (=onzekerheid) nemen af naarmate de
steekproeven groter wordt. Dus we hebben meer onzekerheid in kleine steekproeven dan in grotere
steekproeven.
Variabelen: eigensihappen kenmerken waar individuen op variëren (en die gemeten/ meegenomen
zijn in het onderzoek). Vb. geslaiht, leefijd, studie eti.
Z-scores: hebben een gemiddelde van 0 en standaarddeviate van 1
Z-scores: volgen niet altjd een standaard-normale verdeling. Z-siores zijn alleen normaal verdeeld
als de ongestandaardiseerde siores (X) ook normaal verdeeld zijn. Indien de ongestandaardiseerde
siores niet normaal verdeeld zijn, dan zijn de Z-siores ook niet normaal verdeeld (maar hebben wel
een gemiddelde van 0 en standaarddeviate van 1)
Hoorcollege 2 – de steekproeven verdeling van het
steekproevengemiddelde
Steekproevenverdeling van het gemiddelde
Niet verdeling van een willekeurige persoon, maar gemiddelde van verdeling van steekproef. Je wilt
weten of het gemiddelde eiht anders is dan je zou veranderen bij een bepaalde theorie. De verdeling
van steekproevenverdeling van gemiddeldes geef naar verwaihtng aan wat de verdeling is van
steekproefgemiddeldes.
DUS:
De verdeling van van alle mogelijke steekproeven van N personen uit één populate. De verdeling
van gemiddeldes als ik oneindig vaak a seleite steekproeven van N uit één en dezelfde populate
trek.
= gemiddelde van steekproef
Voorbeeld:
Uitgaan van IQ noemen we X = normaal verdeeld met een populategemiddelde (μ) ,
populatestandaarddeviate �x.
μx = 100
�x = 15
Nu ben je geïnteresseerd van verdeling van steekproevengemiddelde gebaseerd op een steekproef
van grote N = 25. Betekend: stel jij bent geïnteresseerd in IQ van populate studenten, je neemt een
steekproef van 25 personen uit die populate. We hebben geen steekproef genomen, maar kunnen al
zeggen hoe die verdeling van steekproevengemiddelde eruit gaat zien. Je bent geïnteresseerd in
verdeling van steekproevengemiddelde. Dus: de verdeling van gebaseerd op een steekproef van
N = 25.
Nu is de vraag: wat zou nu de gemiddelde zijn van de populate Waar zal het gemiddelde van het
steekproefgemiddelde liggen
IQ heef normale verdeling geientreerd rond 100 wat zou naar verwaihtng het
steekproevengemiddelde ongeveer zijn 100. Dus μ x = 100
Als losse siores gemiddelde genomen 100 liggen en je neemt een steekproef uit die populate en
berekend gemiddelde dan zullen de gemiddeldes van die steekproeven ook allemaal rond 100 liggen.
,Wat is de vorm van de verdeling weer normaal verdeeld. De verdeling van het
steekproevengemiddelde ( ) is normaal. Weer een klokvorm.
Wat zou sigma zijn van de verdeling
Sigma die hoort bij het steekproevengemiddelde, verdeling van steekproevengemiddeldes. Is die ook
hetzelfde als die sigma van X
Zullen steekproevengemiddeldes gemiddeld evenveel sihommelen rond de 100 als de losse X
siores Dus:
� = �x minder. � is kleiner dan �x
Het gemiddelde bleef hetzelfde, verdeling bleef normaal, maar intuïte dat het gemiddeld genomen
diihter bij 100 ligt. Als je steekproef neemt kan het zijn dat je paar keer hoge waarde hebt maar ook
lage, die hefen elkaar op dus gemiddeld genomen zit je diihter bij de 100.
Formule
Formule voor sigma steekproevengemiddelde is gelijk aan sigma van losse X siore : grote van je
steekproef en de wortel
In ons voorbeeld: de 3 is dus kleiner dan de 15, dat klopt. Getal wat je hebt berekend
moet kleiner uitvallen. De verdeling wordt dus siherper, de boog vertoont minder
spreiding. Je neemt een steekproef af en toe hoge, af en toe lage, gemiddeld
genomen zal je diihter bij 100 liggen.
Als je 1000 personen hebt, van zo veel mensen IQ gemeten en bereken je het gemiddelde, dan zal
het nog diihter bij het 100 liggen gemiddeld genomen. Diihter dan bij 25 personen.
Beredeneerd van losse X sioren kunnen we iets zeggen over verdeling van
steekproevengemiddeldes.
Als je populate bestaat uit 1000 personen, tevredenheid van alle mensen gemeten en komt een
gemiddelde uit van 3.5 (sihool 1 tot 5), dat is gemiddelde in de populate, je hebt iedereen gevraagd.
Daar gaat dit niet over. Als je populate zou hebben die oneindig groot is en je hebt maar een
snapshot van die verdeling. N = 1000 moet je van uit gaan van verdeling van alle mensen in de
wereld. Heb je allemaal uit een ioniern gehaald is het een sleihte steekpoef.
Dus steekproef moet komen uit een populate die oneindig groot kan zijn en daar neem je maar een
stukje van. Dat is het priniipe van steekproevenverdeling van steekproevengemiddelde. We
nemen een aanname van verdeling van losse X siores, we gaan een vaste steekproef kiezen en dan
weten we ook maar zonder een steekproef te nemen. Als je weet dat deze verdeling geld dan weet je
dat gemiddelde van steekproevengemiddeld er zo uit zou moeten zien.
Sigma van steekproevengemiddelde heet ook wel de standaardfout in het voorbeeld
betekend het dat je maar 3 van de werkelijke populategemiddelde af zou ziten. De fout van de
sihater. Je hebt een steekproefgemiddelde genomen die vb. 106 is dan weet je dat gemiddeld
genomen de μ die je niet kent, + of 3 rond de 106 liggen. Het is soort gemiddelde fout die je maakt
bij experiment, bij trekken van je steekproef. Uiteindelijk moet je weten dat het de standaardfout
heet.
Varieert afankelijk van je steekproef, hoe groter de N, hoe kleiner de fout.
Voorbeeld:
X = 100
N = 15
, μx = 100
�x = 15
Wat is kans dat losse X siore, groter is dan 105 bereken je met tabellen Z-siores. Geven alleen
kansen bij Z-siores. 105 iorrespondeert met Z-siore. Z-siore kun je kans in tabel opzoeken.
Z-siore bereken je door: grenssiore X sihaal (105) gemiddelde X in hele populate : sigma die hoort
bij de X. = 105-100 : 15 = 0.33 Kans dat X siore groter is dan 5 = Kans dat Z siore groter
is dan 0.33.
Je haalt de tabellen erbij, je kijkt bij Z siore van 0.33 en dat is area beyond voorbij Z waarde kans
van gebied van 0.33 = 0.3707. Kans dat je willekeurig een IQ siore vindt in populate van groter dan
104 = 0.3707%.
Stel steekproef groote N = 25. Stel je gaat steekproef nemen van 25 personen en zijn geïnteresseerd
in de kans dat steekproefgemiddelde ( ) groter is dan 105. Net een losse X wat kans is op 105, nu
dat gemiddelde van groep groter is dan 105 we weten uit voorbeeld van net dat losse X siores
veel meer spreiding hebben dan gemiddelde van steekproef.
De waardes liggen diihter bij 100, dus kans op groter dan 105 is kleiner. Kans op
steekproefgemiddelde groter is dan 105 P ( > 105) De verdeling van steekproefgemiddelde is
normaal verdeeld met gemiddelde van 100 en standaardfout van 3.
Berekening is preiies hetzelfde met Z siores: 105-100 : 3 = 1.67 kijk je in tabel,
geïnteresseerd kans dat Z waarde groter is dan 1.67 area beyond (tabel C1). Z = 0.0475 kans
is hetzelfde dat steekproefgemiddelde groter is dan 105. Ongeveer 5% = kans dat je
steekproefgemiddelde vindt dat groter is dan 105.
Wat je hier aan hebt: stel je trekt een steekproef uit deze verdeling en neemt aan dat dit je verdeling
is en je vindt dan een steekproefgemiddeld van 108. Dat is relatef heel onwaarsihijnlijk, weet je dat
je steekproevenverdeling van steekproevengemiddelde hebt. Dus als je een
steekproevengemiddelde vindt van 108 zou het kunnen zijn dat je populate geen gemiddelde heef
van 100, dus je kunt je aanname toetsen of je populategemiddelde of dat werkelijk wel 100 is.
Missihien populate die gemiddeld hoger IQ hebben.
Deze verdeling geef je een idee wat voor een uitkomst waarsihijnlijk zou zijn, dan kun je je uitkomst
toetsen of je aanname klopt, in dit geval is je aanname dat IQ gemiddeld 100 is.
Stel dat steekproefgemiddelde groter of gelijk is aan 105 het antwoord is hetzelfde. Het IQ is geen
vast punt. Je hebt geen IQ van 102 of 101, maar je kunt ook ertussen hebben. Op het moment dat of
preiies deze grenswaarde meedoet of niet maakt niet uit. Over het algemeen groter dan, bij IQ
maakt dus niet uit omdat sihaal een interval sihaal is, met een komma getal. Het is dus hetzelfde als
steekproefgemiddelde groter is aan 105. Zonder komma getallen maakt het wel uit, dan moet je kans
inilusief die meenemen.
Kleiner dan, dan zit je in het tegenovergestelde gebied dus dan doe je 1- de kans die je net hebt
berekend. Eerst via berekening doen dat het via groter dan doen (die kun je opzoeken in tabel) en
dan de waarden te doen.
Wat is de verdeling van steekproefgemiddelde als losse X siores niet normaal zijn verdeeld Losse X
siores geen normale verdeling hebben, wat kun je dan zeggen over de vorm, blijf de klokvorm dan
in stand ja, zolang je steekproef groter en groot genoeg is.
N moet minstens 30 zijn. Als steekproef minstens 30 personen is, dan zal het normaal verdeeld zijn.
Voorbeeld inkomen = X. Inkomen is siheef verdeeld, groepje dat weinig verdiend en groepje wat
meer verdiend. Land met meer ongelijkheid zullen nog minder normaal verdeeld zijn. Maar
gemiddelde nog het hoogste.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller kimhabets78. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.21. You're not tied to anything after your purchase.