Samenvatting van het boek (A gentle but critical introduction door de Nooy) en notities van de colleges. Ik vond dit een heel lastig vak. Meerdere keren herkanst. uiteindelijk deze samenvatting gemaakt met hulp van docent. Afgerond daarna met een 8.5
inferentiële statistiek → kansmodellen. gaat over steekproeven. je zegt wat over
een grotere groep (populatie) op basis van resultaten over een kleinere groep
(steekproef).
→ generaliseren.
vaak random steekproef
kansvariabele/sample statistic = 1 getal die een kenmerk beschrijft van de steekproef, geeft
steekproefresultaat. de variabele. an unbiased estimator of the populatiewaarde if the
expected value is equal to the populatie waarde
sampling space = alle mogelijke uitkomsten. dus bijvoorbeeld 1,2,3,4,5,6,7
steekproevenverdeling = outcomes of all possible samples we could have drawn
bij steekproevenverdeling:
steekproef is de case (unit of analysis)
sample characteristics zijn de observations (het aantal gele snoepjes)
sample statistic is de variabele
elke toegevoegde steekproef voegt een observatie toe aan de verdeling
kansverdeling = sampling space with a probability (tussen 0 en 1) for each outcome of the
sample statistic
,populatiewaarde/parameter = gemiddelde van de steekproevenverdeling.
The expected value = het gemiddelde van een steekproevenverdeling van een random
variable.
discrete random variabele heeft een vast getal. 2 snoepjes
continuous random variabele kan elk getal aannemen. gewicht bijvoorbeeld. 128.74535 kilo
wat is de kans dat je 5 gele snoepjes in je zakje hebt? die kans is de proportie van alle
mogelijke steekproeven die kunnen worden getrokken waar 5 gele snoepjes bij zitten.
bij discrete variabele laat de steekproefverdeling de kans zien van individuele uitkomsten
maar voor continue laat het de p-waarde zien. de kans dat een uitkomst een bepaald
minimum/maximum heeft
p-waarde = eigenlijk een range van values. gebruik je wanneer je werkt met continue
variabelen. als je wil weten hoeveel snoepjes 2.8 gram zijn, dan wil je niet 2.801 excluden.
dus werk je met p-waardes. je kiest bijvoorbeeld 2.8 en berekent daarbij de kansen dat het
hoger of lager is dan 2.8. of je kiest 2 waarden en berekent de kans dat het daar binnen valt.
→ kans is daarbij een oppervlakte onder de grafiek
moderatie en mediatie zijn multivariate modellen
moderatie = meerdere lijnen (met verschillende regressievergelijkingen want ze hebben
andere regressiecoëfficiënten) voor meerdere groepen
bijvoorbeeld onafhankelijke variabele blootstelling aan rook reclame. afhankelijke
variabele attitude tegenover roken maar derde modererende variabele roker of niet-roker
mediatie = tussenkomst van derde variabele. 1e onafhankelijke variabele beïnvloedt de
mediator en die beïnvloedt de onafhankelijke variabele. (indirect effect) maar het directe
effect van de onafhankelijke op de afhankelijke blijft wel bestaan.
chapter 2
3 manieren om een steekproevenverdeling te maken als je alleen data hebt van 1 steekproef
van de originele populatie
1) bootstrapping
2) exacte benadering
3) theoretische approximations
bootstrapping
Het kan voorkomen dat je in het kader van een onderzoek slechts de beschikking hebt over
één steekproef, je wilt bijvoorbeeld de gemiddelde lengte weten van alle mannen op de
wereld dus je wil graag meer resultaten hebben maar je kunt nu eenmaal niet de lengte van
alle mannen opmeten. In dit geval biedt bootstrapping uitkomst.
,we do not need the original population. je trekt eerst een steekproef van de echte populatie
(je startpunt) en simuleert die als populatie. de steekproeven daarna zijn bootstrap
steekproeven die je trekt uit de eerste steekproef (iets van 5000).
bij kleinere steekproeven zullen de bootstrap steekproeven meer verschillen van de originele
steekproef dan bij grotere (120 tot 150) steekproeven
een bootstrap steekproef is even groot als de oorspronkelijke steekproef. daarom trekken we
met terugleg
→ alleen als je met replacement steekproef trekt, ontstaan er telkens andere
steekproefresultaten → verschillende bootstrap steekproeven
→ Eigenlijk doen we dit altijd want als je gele knikkers wil trekken uit een
groep is de kans op een gele knikker 0.2 maar bij de volgende knikker die
je trekt is de kans nog steeds 0.2 dus je gaat er dan vanuit dat je een
knikker 2 keer kan trekken.
als je een steekproef trekt uit je originele steekproef zonder replacement (je kan
elke persoon maar 1 keer trekken. bijvoorbeeld bij vragenlijst invoeren wil je dat
elke persoon maar 1 keer invult), dan is die steekproef precies hetzelfde als de
originele steekproef. → geen verschil in bootstrap steekproeven
→ als je een gele knikker hebt getrokken zou de kans dat de volgende
knikker die je trekt geel is kleiner moeten zijn dan 0.2 maar als de
populatie groot genoeg is is dit een minimaal verschil.
grootste voordeel bootstrapping is dat we een steekproef verdeling kunnen krijgen voor elke
sample statistic.
SPSS bootstrapping
analyze → compare means → independent t test → bootstrap number of samples
5000, bias corrected
output lezen:
* kijk naar levene’s toets:
significant → verwerp H0 dat er geen verschil tussen de varianties is in de
populatie. dus er zijn ongelijke varianties in de groepen in populatie, onderste rij
kijken (ook in bootstrap tabel)
niet significant → H0 aangenomen dat er geen verschil tussen de varianties is in
de populatie is. dus gelijke varianties in de groepen in populatie, bovenste rij
(ook in bootstrap tabel)
* lees de bootstrap tabel af
- mean difference: als die positief is is de eerste groep groter. want je doet de eerste groep
min de tweede groep. als het betrouwbaarheidsinterval dus van een negatief tot een positief
getal gaat kan je met 95% zekerheid zeggen dat de eerste groep … kleiner is tot … groter.
- the 95% interval borders can be slightly different because bootstrapping takes random
samples
, exact approach
An exact approach lists and counts all possible combinations.
Bij een exacte benadering kun je een exacte uitkomst van een variabele berekenen, en je
hoeft dus geen benadering/schatting te maken (in tegenstelling tot een theoretische
benadering bij continue variabelen.)
een exact test kan alleen bij categorische discrete variabelen omdat die een
gelimiteerd vast aantal waarden hebben. continue variabelen hebben dat niet.
→ als er heel veel categorieën zijn wordt de approach computer-intensive
fisher-exact test is een exact approach om twee categorische variabelen te vergelijken
→ (Fisher’s) exact test geeft eigenlijk alleen een nog betrouwbaardere p-waarde
SPSS exact approach
analyze → nonparametric → legacy → bijvoorbeeld chi square → exact… →
exact
wat je vaker zal gebruiken is het analyseren van een association:
analyze → descriptive statistics → crosstabs(chi, cramers V, observed, column)
→ exact… → exact
* There is a strong association (Cramer’s V = .52) between candy colour and candy
stickiness, which is statistically significant, p = .010 (exact). Yellow and red candies
are less often sticky than blue, green, and orange candies.
* There is a weak association (Cramer’s V = .27) between candy colour and candy
spottiness, which is not statistically significant, p = .480 (exact) or (using chi-square)
p = .555.
Candy colour may be relevant to having spots (weak association) but we are unsure
(not statistically significant).
→ (Fisher’s) exact test geeft eigenlijk alleen een nog betrouwbaardere p-waarde
Theoretische approximation
als je een theoretische approximation hebt en er wordt voldaan aan de voorwaarden dan
gebruik je altijd theoretische approximation. als de voorwaarden niet worden voldaan gebruik
je exact of bootstrap.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper philippine-ginneken. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.