Nederlandse samenvatting van hoofdstuk 12, Discovering Statistics, Andy Field. Let op, de informatie over hoe je dingen moet invoeren in SPSS is hierin niet meegenomen.
CHAPTER 12: GLM 1: COMPARING SEVERAL INDEPENDENT MEANS
Dit hoofdstuk gaat over de statistische modellen die we gebruiken om situaties te analyseren waarin
we meer dan twee onafhankelijke gemiddelden met elkaar willen vergelijken. Dit wordt over het
algemeen een analysis of variance (ANOVA) genoemd, maar het is eigenlijk gewoon een variatie op
het lineaire model.
12.2 Using a linear model to compare several means
We testen de algemene fit van een lineair model met een F-statistiek, dat is wat we hier ook gaan
doen. We gebruiken een F om te testen of we de uitkomstvariabele significant voorspellen door
groepsgemiddelden te gebruiken (wat ons vertelt of de groepsgemiddelden significant van elkaar
verschillen). Daarna gebruiken we de specifieke parameters van het model (de bs) om ons te vertellen
welk gemiddelde verschilt van welke. Het enige verschil tussen ANOVA en regressie is dat een
ANOVA kijkt naar groepsgemiddelden. In dit hoofdstuk wordt er gebruik gemaakt van een voorbeeld
over puppy’s, waarbij de voorspelling is dat enige vorm van puppy therapie beter is dan geen puppy
therapie, maar ook dat hoe meer puppy therapie hoe beter.
Als we happiness (blij zijn) willen voorspellen vanuit
groepslidmaatschap kunnen we daarvoor dezelfde vergelijking
gebruiken die steeds terugkomt.
In dit voorbeeld kunnen we de controle groep gebruiken als
baseline categorie en de andere twee condities worden dan
dummy variabelen (Long en Short).
Wanneer we een uitkomst van groepslidmaatschap voorspellen, zijn de voorspelde waarden van het
model (de waarde van geluk in de vergelijking) de groepsgemiddelden.
Als we het geluk van een nieuwe persoon proberen te
voorspellen en we weten in welke groep ze zijn
ingedeeld (maar we hebben hun score nog niet), dan is
onze beste gok het groepsgemiddelde, omdat we dan
,gemiddeld, correct zijn. Als we bijvoorbeeld weten
dat iemand 30 minuten puppytherapie krijgt en we
willen hun geluk voorspellen, dan is onze beste gok 5
omdat we weten dat mensen die 30 minuten met een
puppy hebben gemiddeld hun geluk beoordelen als 5.
Als de groepsgemiddelden significant verschillen, dan
zou het gebruik van de groepsgemiddelden een
effectieve manier moeten zijn om scores te
voorspellen.
, We kijken eerst naar het model voor de controle groep. Voor zowel Long en Short zijn de dummy
variabelen hier gecodeerd met 0. De tweede condities van 15 en 30 minuten zijn geen onderdeel meer
van het model omdat ze gecodeerd zijn met 0. De voorspelde
variabele van Happiness is dus het gemiddelde van de controle groep,
dus we kunnen Happiness vervangen door deze waarde. Dit laat ons
zien dat b0 in het model altijd het gemiddelde is van de baseline
categorie (controle groep).
Voor iemand in de 30 minuten groep, is de dummy variabele Long gecodeerd met 1 en de variabele
voor Short met 0. Deze nieuwe vergelijking vertelt ons dat de som van b0
en de b voor de dummy variabele Long (b1) de voorspelde Happiness is
voor iemand in de 30 minuten groep.
We weten al dat b0 het gemiddelde is van de controle groep en dat de voorspelde waarde van
Happiness voor iemand in de 30 minuten groep het gemiddelde van die groep is. Hier kan je de
vergelijking dus op aanpassen. Deze vergelijking laat ons zien dat de b-
waarde van de dummy variabele die de 30 minuten groep representeert, het
verschil is tussen de gemiddelden van de 30 minuten groep en de controle
groep.
Voor iemand in de 15 minuten groep is de dummy variabele Shorts gecodeerd met een 1 en de
dummy variabele Long gecodeerd met een 0. De nieuwe vergelijking vertelt
ons dat voorspelde Happiness voor iemand in de 15 minuten groep, de som is
van b0 en de b voor de dummy variabele Short.
Ook hier vervangen we de b-waarden met de groepsgemiddelden. Dit laat
ons zien dat de b-waarde van de dummy variabele die de 15 minuten groep
representeert, het verschil in groepsgemiddelden is tussen de 15 minuten
groep en de controle groep.
De F-test is significant, wat aangeeft dat het gebruiken van de groepsgemiddelden om Happiness te
voorspellen significant beter is dan wanneer je het gemiddelde van alle scores zou gebruiken. In
andere woorden, de groepsgemiddelden zijn significant verschillend. De model parameters
(coëfficiënten) geven ook nog aan welke groepsgemiddelden verschillen, in vergelijking tot de
controle groep. Hier kan je zien dat de 30 minuten
groep significant verschilt van de controle groep
(p=.008), maar dat de 15 minuten groep niet
significant verschilt van de controle groep
(p=.282).
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper rvw999. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,99. Je zit daarna nergens aan vast.