Practicum data-analyse
College 1: Schatten en toetsen
Schatten = op basis van een steekproef een gok doen over een waarde in de populatie
Toetsen = vaststellen of de populatieparameter (waarschijnlijk) afwijkt van een verwachte
waarde
- Voor beiden gebruik je een steekproef/sample
Populatieparameters schatten op basis van de sample:
- Als de sample representatief is voor de populatie, dan kunnen we een ‘’geïnformeerde
gok’’ doen over populatieparameters
- Als een sample random is, dan is het meestal representatief (iedereen even grote kans
om getrokken te worden)
- Samples zijn in de praktijk zelden willekeurig, dus denk na over manieren waarop jouw
sample verschilt van de populatie en daarom wellicht een misleidend beeld geeft
Schatting
- De gemiddelde lengte in de sample (M), weten we nu exact. Hier is geen onzekerheid
over
- Dit gemiddelde is ook onze beste gok voor de gemiddelde lengte in de ‘’populatie’’ (u)
- Dit noem je een schatting
- Er is altijd onzekerheid over schattingen
Sampling error = het verschil tussen de schatting (M) en de populatieparameter (u)
Stel je voor dat je alle mogelijke steekproeven van 5 studenten uit de zaal zou trekken en voor
elke steekproef de gemiddelde lengte zou berekenen:
- Elke steekproef heeft een ander gemiddelde
- Er is een verdeling van steekproefgemiddelden
- Het gemiddelde van ALLE steekproeven is het werkelijke populatiegemiddelde
- De standaardafwijking van deze sampling distribution kan je interpreteren als ‘’de
gemiddelde afwijking van steekproefgemiddelden tov het populatiegmiddelde’’. Ofwel
‘’hoe ver zit ik er gemiddeld genomen naast als ik een steekproef trek uit deze
populatie.
- Dit heet de standard error en het is een maat van onzekerheid over je schatting
Standaardfout schatten
Probleem: we kunnen de standard error niet uitrekenen op basis van één steekproef
- Oplossing: we schatten de standard error op basis van de sample
Standaardafwijking VS standard error
Standaardafwijking
- ‘’Gemiddelde’’ afwijking van observaties t.o.v. het gemiddelde
- Geeft weer hoe gespreid je data is
- Notatie
Standard error
- ‘’Gemiddelde’’ afwijking van steekproefgemiddelden t.o.v. het populatie gemiddelde
- Geeft weer hoe onzeker we zijn over onze schatting van het populatiegemiddelde, op
basis van de steekproef
- Notatie
,Betrouwbaarheidsinterval = een ‘’venster’’ om de schatting, gebaseerd op SE, waarbinnen
de populatieparameter waarschijnlijk valt
Interpretatie
- Als je 100 identieke samples zou trekken, en voor elk een 95%
betrouwbaarheidsinterval zou berekenen, dan bevat 95% van die interval de
populatieparameter. Je weet nooit zeker of dit betrouwbaarheidsinterval de
populatiewaarde bevat of waar die valt
Je kan een betrouwbaarheidsinterval ook gebruiken om te toetsen…
- De interval bevat 95% zekerheid de populatieparameter, dus elke waarde buiten het
interval kan verworpen worden (als nulhypothese) met een foutmarge van 5%
NOIR meetniveau
1. Nominaal = categorisch, verschilt enkel in naam (mannen en vrouwen)
2. Ordinaal = categorieën met volgorde (SES groepen)
3. Interval = continu met betekenisvolle afstanden (stap 1 tot 2 is net zo groot als 2 tot 3)
4. Ratio = heeft een absoluut 0-punt en daarom zijn verhoudingen ook betekenisvol
We gebruiken toetsen wanneer we een uitspraak willen doen over de waarschijnlijke waarde
in de populatie. Omdat we geen data hebben over de gehele populatie, is het onmogelijk om
te bewijzen dat, bijvoorbeeld, het populatiegemiddelde groter is dan 0. Dus we draaien de
boel om: we tonen aan dat het heel onwaarschijnlijk is om onze data te verkrijgen, als het
populatiegemiddelde 0 zou zijn.
- Wat is de kans om data te observeren die ‘’minstens zo extreem zijn’’ als onze
steekproef, als de nulhypothese waar zou zijn dat het populatiegemiddelde 0 is?
Stappenplan toetsen
1. Hypotheses formuleren
- H0: het populatiegemiddelde van lengte is kleiner of gelijk aan
- Ha: het populatiegemiddelde van lengte is groter dan 0
2. Test-statistiek berekenen
- Deze beschrijft hoeveel standaarderrors het steekproefgemiddelde afligt van het
gemiddelde onder de nulhypothese
3. P-waarde uitrekenen (kans op deze data of nog extremer, als H0 waar is)
4. Conclusie trekken over nulhypothese
Hypothese = een toetsbare verwachting over een populatieparameter
- Ha: alternatieve hypothese = wat we denken dat er echt aan de hand is
- H0: nulhypothese = dat er ‘’niets aan de hand is’’
- We proberen de nulhypothese t verwerpen
Non-directionele/ongerichte hypothese
- H0: het gemiddelde van mannen en vrouwen verschilt niet
- Ha: het gemiddelde van mannen en vrouwen verschilt
Directionele/gerichte hypothese
- H0: het gemiddelde van mannen is gelijk of kleiner dan het gemiddelde van vrouwen
- Ha: het gemiddelde van mannen is groter dan het gemiddelde van vrouwen
, Teststatistiek = een waarde die aangeeft hoeveel SE’s je geobserveerde data afliggen van
de verwachting onder de nulhypothese
De standaardfout is
Dan kijken we hoe ‘’ver’’ onze geobserveerde steekproefgemiddelde (M) is t.o.v. de
nulhypothese:
Wanneer we vinden dat de kans op de data onder de nulhypothese zo klein is, dat we H0
kunnen verwerpen?
- We moeten een drempelwaarde afspreken. Als de kans (p-waarde) kleiner is dan deze
drempelwaarde verwerpen we H0
Significantieniveau (alfa)
De drempel waarde voor het verwerpen van H0 noemen we alfa. In de sociale wetenschappen
hanteren we meestal alfa = .05.
Bij een non-directionele hypothese is alfa = .05 verdeeld over beide staarten van de sampling
distribution.
Bij een directionele hypothese ligt alfa = .05 volledig in één staart van de sampling
distribution.
Met een eenzijdige toets heb je meer power om een nulhypothese te verwerpen als het effect
in de verwachtte richting is. Je hebt echter geen power om de nulhypothese te verwerpen bij
een effect in de omgekeerde richting.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper eviedonk. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,16. Je zit daarna nergens aan vast.