Samenvatting statistiek alle werkgroepen
Werkcollege statistiek taak 1
14-04-2021
Assignment 1a
Je veronderstelt dat aantrekkelijke mensen minder streng gestraft zullen worden dan
onaantrekkelijke mensen. Specificeer een passende nulhypothese en alternatieve hypothese. We
gaan de nulhypothese toetsen met behulp van de bijbehorende t-toets. Je zult ofwel met de
independent samples t-test ofwel met de paired samples t-test moeten gaan werken. Welke van de
twee moet je gebruiken en waarom? Waarom gebruiken we hier geen Z-toets? Waarom geen X2-
toets?
• welke test moet je gaan gebruiken hier?
• independent sample t-test gaan gebruiken
• waarom geen paired sample t-test → deze wordt gebruikt bij dependent samples dus
bij dezelfde groep mensen onder twee verschillende condities
• waarom geen z-test → omdat we niet de standaarddeviatie weten van de populatie
o we doen alsof we dit niet weten, want dit is geen echt onderzoek, dus ga
ervan uit dat je het normaalgesproken niet weet
o daarom gaan we nu werken met een t-test
• waarom geen x2-test → vooral gebruikt voor populatiedistributies
o we werken in dit geval met gemiddelden dus dan gebruik je t-test
Assignment 1b en 1c
Ga na of aan de assumpties van de te gebruiken toets is voldaan. (Check internet voor de
assumpties). Verricht voor beide groepen apart een Explore-analyse en vraag daarbij histogrammen
op (zie ook de SPSS-aanwijzingen voor practicum 1 op pagina 11).
Voer nu de t-toets uit, ook als je op basis van de analyses onder b) vermoedt dat er sprake zou
kunnen zijn van schending van assumpties. In dit laatste geval moet je wel melding maken van deze
mogelijke schendingen en de resultaten van de analyse terughoudend interpreteren. Zul je aan de
hand van je analyseresultaat de nulhypothese handhaven of verwerpen? Had je in plaats van de t-
test hier ook variantie-analyse kunnen doen?
Aannames van de independent samples t-test controleren:
1. independent random samples
a. mensen geconfronteerd met aantrekkelijke foto van dader bij crime en
mensen geconfronteerd met onaantrekkelijke foto van dader bij crime
b. deze groepen zijn volledig onafhankelijk van elkaar
2. dependent variable is quantitative
a. afhankelijke variabele is aantal jaar gevangenisstraf en is kwantitatief
3. dependent variable is normally distributed within both subpopulations (via SPSS)
a. vraag of er een normaalverdeling is → gemiddelde +- 1xstandaarddevaiatie =
68% van observaties = normaalverdeling
b. 95% vertrouwensinterval → waarde erbuiten geeft geen plausibiliteit
c. welke gegeven statistieken kunnen informeren over normaalverdeling?
i. skewness → meting die verteld hoe schuin de verdeling is
a. getal bij 0 = normaalverdeling
1
, b. positief getal = distributie skewed to the right
c. negatief getal = distributie skewed to the left
2. confidence interval skewness = skewness +-
2xstandaarddeviatie → geeft plausibele waarden echt
populatie → als 0,00 is inbegrepen in confidence interval → de
aanname dat het van een normaalverdeling komt is plausibel
ii. kurtosis (scheefheid) → gaat over de platheid van een verdeling (buik)
a. positief getal = meer gepiekte verdeling
b. negatief getal = plattere verdeling
2. positief getal in de sample → weer interval maken (op dezelfde
manier als skewness) → 0,00 bij interval dus plausibel dat er
een normaalverdeling is in de populatie
d. het feit dat deze sample van een normaalverdeling komt is plausibel, want de
waarde voor plausibiliteit zit in de intervallen
i. als het niet plausibel is, is er een robuust regel → ALS de groepen
groot genoeg zijn dan is de independent sample t-test robuust tegen
overschrijding van deze regel
4. population variances are equal (variance = standaarddeviatie^2)
a. twee manieren waarop we dit kunnen testen:
i. vertrouwen op een duimregel → zegt dat de grootste
standaarddeviatie kleiner zou moeten zijn dan twee keer de kleinste
standaarddeviatie (grootste std. deviatie < 2x kleinste std. deviatie)
1. als dit het geval is, is de aanname dat de variances equal zijn
op populatielevel, plausibel
ii. equal variances assumed / equal variances not assumed kopje →
lavene’s test kijken en de significantie ervan
1. 0,295 → niet significant → je kan aannemen / het is plausibel
dat de populatievariances gelijk zijn
2. als wel significant is → betekent niet gelijk dat we geen
independent t-test kunnen doen → independent sample t-test
kan hier robuust tegen zijn ALS we heb hebben over even
grote groepen → beide groepen zijn hier N=10, dus in dit geval
is het robuust tegen deze eventuele overschrijding
b. we kunnen dus aannemen dat population variances equal zijn → dan kan je
in de tabel naast het kopje ‘equal variances assumed’ kijken, zo niet moet je
naast het kopje ‘equal variances not assumed’ kijken (aannames)
i. hierin kan je de t-score zien en significantie
2
,→ we werken in de rij ‘equal variances assumed’ want = overschrijding was robuust
→ t-score is -1,494 met significante van 0,153 (niet significant want is groter dan 0,05) → op
deze basis zou je de nullhypothese niet afwijzen → maar je kan zien dat de p-waarde van
significantie 2-taled is → dus HA is niet μ1 < μ2, maar μ1 ≠ μ2 → om de 1-taled p-waarde
van significantie te krijgen moet je delen door 2 → 0, = 0,076 → dit is nog steeds
geen significant resultaat, dus je kan H0 nog steeds niet verwerpen
Had je in plaats van de t-test ook variantieanalyse (ANOVA) kunnen doen?
• ja, dit had gekund → met twee
groepen zijn deze equivalent aan
elkaar
• F die je krijgt bij ANOVA, is gelijk
aan de t-waarde in kwadraat
o F = t2
• voer ANOVA test uit op SPSS
o dus t-waarde (-1,494)2 = 2,231 → dit is gelijk aan de F-waarde in de ANOVA
Assignment 1d
In echt onderzoek ben je je bewust dat je een Type I of een Type II fout zou kunnen maken. Wat zijn
dat ook alweer voor fouten? (Zie Moore, McCabe & Craig, hoofdstuk 6). In ons gekunstelde
voorbeeld weten we eigenlijk al hoe de populatieverdelingen er precies uitzien. Hebben de
statistische analyses ons een goed beeld van die verdelingen geboden? Bijvoorbeeld: onder vraag b
werd gevraagd naar mogelijke schendingen van assumpties. Zijn de conclusies die we daar getrokken
hebben overeenkomstig de werkelijkheid? En wat betreft vraag c: hebben we met onze beslissing
over de nulhypothese een Type I of een Type II fout begaan?
Type I error → we verwerpen de H0, terwijl deze eigenlijk wel waar is
• waarschijnlijkheid van een type I error, is gelijk aan gekozen significantielevel
Type II error → we verwerpen de H0 niet, terwijl deze eigenlijk fout is
• waarschijnlijkheid van een type II error, is ß
• we moeten het werkelijke populatiegemiddelde weten, om de waarschijnlijkheid van
een type II error te vinden
Populatieverdeling heeft normaaldistributie → hier is geen error gemaakt
Populatie heeft equal variances → hier is geen error gemaakt
Geen significant verschil gevonden bij t-test dus H0 wordt niet verworpen → wel error
gemaakt, want we weten dat μ1 = 10 en μ2 = 12 → type II error gemaakt
3
, Assignment 1e
Wat bedoelden we ook weer met de power van een
toets? Hoeveel proefpersonen hadden we moeten
gebruiken om voor onze toets een power van 0.90 te
verkrijgen? Vindt het antwoord op deze vraag met
behulp van het programma Gpower (geïnstalleerd op
het Computerlandschap). Raadpleeg eerst het pdf
document “A short guide to the use of Gpower” Dit
pdf-document is te vinden op de Student Portal onder
Course Material in de map met aanvullende literatuur.
Power van test → waarschijnlijk dat we een valse
nullhypothese kunnen verwerpen
• power = 1 – ß
• als we onderzoek doen, willen we graag
weten wat er gebeurt op populatielevel →
als we een H0 testen, en deze is fout,
willen we in ons onderzoek een goede
waarschijnlijkheid hebben dat we deze H0
ook werkelijk gaan verwerpen
o als de waarschijnlijkheid laag is
hiervan, heeft het geen zin of nut
om het onderzoek te doen
o daarom willen we tenminste een
power van 0,80 hiervoor
• in dit geval van de opdracht willen we een power van 0,90 hebben
o grootte van de sample size kan je verkrijgen door het programma genoemd
o krijgt totaal van 140 subjects, die verdeeld zijn over twee groepen, dus 70
deelnemers per groep
• ‘type of power analyses’ → post hoc nieuw aangeklikt → krijg je de werkelijke
waarden van aantal deelnemers en verkrijg je de twee groepen van 10 deelnemers
→ krijg ook werkelijke waarde van power = 0,28
o dus 28% zal een significant resultaat krijgen = power
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller pleunreijnders. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.97. You're not tied to anything after your purchase.