Samenvatting Onderzoek en Statistiek II (H8.8 H8.10 & H9.1 t/m 9.5 9.8 & H10.1 t/m H10.11 H10.13 t/m H10,17 en SPSS toevoegingen).
Zelf had ik moeite met Onderzoek & Statistiek, maar door deze samenvatting heb ik het vak met een 6.9 in één keer weten te halen! Hopelijk draagt deze samenva...
Hoofdstuk 8 Rekenen op kansen............................................................................................................3
8.8 Binomiale verdelingen nader bekeken.........................................................................................3
8.10 De normale benadering van een binomial verdeling..................................................................3
Hoofdstuk 9 Betrouwbaar schatten........................................................................................................4
9.1 Inductieve statistiek en kansrekening...........................................................................................4
9.2 Het principe van betrouwbaarheidsintervallen............................................................................4
9.3 De steekproefverdeling................................................................................................................5
9.4 Een populatiegemiddelde schatten..............................................................................................6
9.5 Een populatieproportie schatten..................................................................................................6
9.8 Het betrekkelijke belang van de steekproefomvang....................................................................7
Hoofdstuk 10 Toetsen op significantie...................................................................................................8
10.1 Intuïtieve inleiding op het begrip significantie............................................................................8
10.2 De binomiaaltoets......................................................................................................................8
10.3 De nulhypothese en haar alternatief........................................................................................10
10.4 Een- en tweezijdige toetsing.....................................................................................................11
10.5 Toetsingsgrootheden en hun kritieke gebieden.......................................................................12
10.6 Toetsen in soorten en maten....................................................................................................13
10.7 De X2- toets voor verdelingen...................................................................................................14
10.8 De X2- toets voor samenhang....................................................................................................16
10.9 De t-toets voor het gemiddelde in één steekproef...................................................................17
10.10 De t-toets voor twee onafhankelijke steekproeven................................................................18
10.11 De t-toets voor twee afhankelijke steekproeven....................................................................21
10.13 Enkele andere statistische toetsen.........................................................................................21
10.14 Toetsing: interpretatie en beperkingen..................................................................................22
10.15 De benodigde steekproefomvang...........................................................................................23
10.16 Hypothesetoetsing in de verslaglegging.................................................................................25
10.17 Tot slot van dit boek: kritisch omgaan met onderzoek...........................................................25
SPSS......................................................................................................................................................26
Overzicht met de toetsen + belangrijke zaken......................................................................................27
,Toelichting: de begrippen die onderstreept zijn, zijn belangrijke begrippen die aan de zijkant
van het boek staan.
,Hoofdstuk 8 Rekenen op kansen
8.8 Binomiale verdelingen nader bekeken
In de theorie bestaan er oneindig veel binomiale verdelingen. Elk daarvan wordt getypeerd
door een combinatie van N en . Voor een aantal waarden van N, in combinatie met een
aantal mooie waarden van , bestaan er tabellen voor kansverdelingen. Daardoor hoef je
niet steeds omslachtige berekeningen met de binomiaalformule uit de voeren. Om dergelijke
tabellen te kunnen hanteren, is het nodig het begrip overschrijdingskans, weergegeven met
de kleine letter p, te kennen.
- Je onderscheidt de linker- en rechteroverschrijdingskans. De linker
overschrijdingskans van een bepaalde uitkomst van een kansproces is de kans op
die uitkomst of een nog lagere uitkomst.
Wanneer p 4 is (4 of lager) wordt het als volgt genoteerd: P(k ≤ 4). Deze bedraagt
P(k ≤ 4) = P(k = 0) + P(k = 1) + P(k = 2) + P(k = 3) + P(k = 4) = 0,59%. Dit is de
cumulatieve kans voor k = 4.
- Voor de berekening van een rechteroverschrijdingskans kijk je juist naar de
uitkomsten die hoger zijn. De rechteroverschrijdingskans van bijvoorbeeld 4 keer
munt is de kans op 4 of meer, ofwel P(k ≥ 4). Ook voor de bepaling van de
rechteroverschrijdingskans maak je gebruik van cumulatieve kansverdeling.
100% - P(k ≤ 4) = P(k ≥ 5).
Altijd 100% - een getal lager (100-3).
Tabel B: opzoekregels
- De linker overschrijdingskans: direct opzoeken bij de betreffende k.
- De rechteroverschrijdingskans: de kans opzoeken bij k-1; deze kans aftrekken van
100%.
- De kans op precies een bepaalde k:
A De (linker overschrijdingskans) opzoeken van k.
B Dan de linker overschrijdingskans opzoeken van k-1.
C De kans van B aftrekken van de kans van A.
Notities hoorcollege:
- 10 of meer goed = 100% - 1 waarde minder
- 10 goed = 9-10
- 10 of minder = aflezen en overnemen
Bij een binomiale verdeling is 0.50 of 50.
8.10 De normale benadering van een binomial verdeling
De binomiale verdeling mag alleen onder bepaalde voorwaarden met een normale verdeling
worden benaderd.
- Als een binomiale verdeling wordt benaderd door een normale verdeling, moet er ook
sprake zijn van een gemiddelde en van een standaarddeviatie.
,Hoofdstuk 9 Betrouwbaar schatten
9.1 Inductieve statistiek en kansrekening
De inductieve statistiek redeneert in zeker opzicht in de tegengestelde richting van de
kansrekening zoals die in hoofdstuk 8 is behandeld. Daar reken je vanuit een gegeven kans
per getal naar de kans op een bepaalde einduitkomst van een kansproces, maar niet de
kans per toeval.
- De kansrekening gaat uit van bekenede gegevens over de populatie (zoals
parameters , µ en p, om van daaruit de kans op waarden in de steekproef te
berekenen (zoals de stochasten p, r en
- Met behulp van de inductieve statistiek probeer je daarentegen parameters te
schatten op basis van stochasten. Dit gebeurt door gebruik te maken van
kansrekening.
- Stochasten gedragen zich als kansvariabelen, want ze zijn aan toevalsfactoren
onderhevig. Voorbeelden van stochasten zijn:
= het steekproefgemiddelde
S = de standaarddeviatie
S2 = de variantie
P = de proportie
R = PM-correlatiecoëfficiënt
µ = gemiddelde in de steekproef
α = foutkans
p = overschrijdingskans
Je wilt de voor de steekproef berekende waarden gebruiken als schatters voor de
overeenkomstige parameters. Wanneer je de waarde die je in een steekproef vindt zonder
meer gebruikt als de geschatte waarde van een parameter, maak je een puntschatting.
9.2 Het principe van betrouwbaarheidsintervallen
Door de toevalsfactoren die altijd meespelen in steekproeven, zou het zeer uitzonderlijk in
als je in een steekproef een gemiddelde vindt die exact gelijk is aan het gemiddelde in de
populatie: zal zelden precies µ zijn. Een onderzoeker houdt bij een schatting altijd een slag
om de arm. Hij schat de populatie niet precies op wat hij in de steekproef vindt, maar met
een bepaalde marge daaromheen.
- Zo kun je in het gegeven voorbeeld misschien zeggen dat het populatie gemiddelde µ
van de sporttijd ergens tussen de zeven en de negen uren per week ligt. Die
uitspraak komt neer op: 7 uur per week ≤ µ ≤ 9 uur per week.
Een betrouwbaarheidsinterval valt te berekenen met behulp van de kansrekening.
- Een betrouwbaarheidsinterval geeft overigens nooit volledige zekerheid: bij de
berekening ervan hoort een percentage dat aangeeft hoe groot de kans is dat de
parameter werkelijk in dat interval ligt.
- In het voorbeeld zou de kans dat een werkelijke gemiddelde tijd die de populatie
soldaten aan sport besteedt tussen de zeven en de negen uur ligt, bijvoorbeeld 95%
zijn. In symbolen uitgedrukt, komt dit neer op (eenheden weglaten): P(7 ≤ µ ≤ 9) =
95%.
Het gevolg is dat de kans 5% bedraagt dat het werkelijke gemiddelde lager ligt
dan zeven uur óf hoger ligt dan negen uur. En daarom is 5% kans dat je het met
je betrouwbaarheidsinterval mis hebt.
Die foutkans wordt aangegeven met α, de Griekse letter van alfa.
Er is een betrouwbaarheidsinterval van 99% en van 95%.
, Iemand stelt bijvoorbeeld met 99% zekerheid vast dat in een populatie
aanstaande moeders 53% tot 59% van plan is het komende kind aan de borst te
voeden. Bij een betrouwbaarheidsinterval van 99% rond proportie, loopt dan van
53% tot 59%.
Wie een betrouwbaarheidsinterval opstelt, bouwt twee onzekerheden in. Ten eerste, de
breedte van het interval. Deze heeft te maken met de nauwkeurigheid van de schatting. Een
interval die loopt van 6 tot 10 uur is nauwkeuriger dan een interval die loopt van 6 tot 11 uur.
De tweede onzekerheid betreft de betrouwbaarheid. Dit is de gekozen kans dat de interval
klopt, en wordt dus uitgedrukt in een percentage (95% en 99%).
Hoe groter (breder) een betrouwbaarheidsinterval is, des te groter de slag is die de
onderzoeker kennelijk om de arm houdt, en hoe minder nauwkeurig de schatting is.
- Een betrouwbaarheidsinterval van 99% heeft een grotere kans om te kloppen dan
een betrouwbaarheidsinterval van 95% maar het is onnauwkeuriger.
- Een betrouwbaarheidsinterval van 99% is onnauwkeuriger dan een
betrouwbaarheidsinterval van 95%.
Betrouwbaarheid en nauwkeurigheid werken als communicerende vaten: wat je wint aan het
ene verlies je aan het andere.
Voorbeeld: het is niet moeilijk om met 100% zekerheid (heel zeker ofwel heel betrouwbaar)
de temperatuur op 16 juni volgend jaar om 12 uur ’s middags te voorspellen: deze ligt
namelijk beslist tussen de -2 en +42 (heel onnauwkeurig).
Naarmate een steekproef groter is, kun je beter schatten. Door een grotere steekproef te
trekken maak je de schatting nauwkeuriger of betrouwbaarder.
- Er bestaat ook een verband tussen de spreiding van een variabele en de kwaliteit van
een betrouwbaarheidsinterval. Naarmate de spreiding groter is, hebben
toevalligheden en uitbijters meer kans de steekproef te beïnvloeden en kun je met
minder zekerheid schatten.
9.3 De steekproefverdeling
Wanneer je te maken hebt met een normale verdeling, dan is het mogelijk een
betrouwbaarheidsinterval te construeren rond het steekproefgemiddelde . Om te begrijpen
hoe je dit doet, is het nodig eerst een eigenschap van de normale verdeling te kennen. Deze
betreft de kansverdeling van het gemiddelde ( ) van een steekproef.
Het is duidelijk dat een steekproefgemiddelde zelf ook een bepaalde kansverdeling volgt.
Deze verdeling noem je de steekproevenverdeling. Deze verdeling heeft de volgende
eigenschappen:
- Het is een normale verdeling
- Het gemiddelde is gelijk aan het steekproefgemiddelde
- De standaarddeviatie bedraagt σ/ѴnѴnn
Deze eigenschappen maken het mogelijk om met behulp van de standaardnormale verdeling
de kans op een bepaald steekproefgemiddelde te berekenen.
Het is ook mogelijk om voorspellingsgebieden voor het steekproefgemiddelde op te stellen.
Stel dat je de hiervoor genoemde situatie het 95%-voorspellingsgebied voor wilt
berekenen. Om een interval van 95% te krijgen, moet er zowel links als rechts ervan een
stukje van 2.5% overblijven. Voor de ondergrens (OG) van dat gebied geldt daarom dat de
linkeroverschrijdingskans 2.5% bedraagt.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper veerletp. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,14. Je zit daarna nergens aan vast.