In dit document zijn de samenvattingen voor Statistiek 3 te vinden. Bijgevoegd zijn hoofdstuk 12, 15, 16, 17 en 19 van Warner, en hoofdstuk 9 & 12 van Agresti. Aanvullende samenvattingen zijn te vinden in de samenvattingen van jaar 1 en 2, die los te koop zijn. Ook is het mogelijk om een bundel te ...
Samenvattingen Agresti Statistiek 3
Hoofdstuk 9 Linear Regression and Correlation
Bij een regressieanalyse wordt onderzocht of er een relatie is tussen de variabelen door het testen
van de hypothese van statistische onafhankelijkheid, dan de sterkte van de associatie door de
correlatie meting van associatie, en vervolgens schatten we een regressievergelijking dat de waarde
van de responsvariabele voorspelt van de waarde van de verklarende variabele. y is de
responsvariabele, x de verklarende variabele. De formule y=α + βx staat voor een lineaire functie
van observaties op x. Het is een rechte lijn met helling bèta (verandering in y voor een eenheid
toename in x) en y-intercept alfa. Wanneer de relatie tussen twee variabelen een rechte lijn volgt
met β > 0, is de relatie positief. Wanneer de relatie tussen twee variabelen een rechte lijn volgt die
daalt, en β < 0, dan is de relatie negatief.
Een model is een benadering van de relatie tussen variabelen in de populatie. De eerste stap in
model fitting is het plotten van de data. Een plot van n observaties als n punten heet een scatterplot.
De vergelijking ^y =a+bx representeert een sample vergelijking dat het lineaire model schat. Het y-
intercept (a) schat het y-intercept van alfa, en de helling (b) de helling bèta. Het heet de
predictievergelijking. b=
∑ (x−x )( y− y ) en a= y−b x. Een regressie outlier valt ver van de
∑ ( x−x )2
trend die de rest van de data volgt. Een observatie is invloedrijk als het verwijderen resulteert in een
grote verandering in de predictie vergelijking. De predictiefouten heten residuals, het verschil tussen
een geobserveerde waarde en de voorspelde waarde van de responsvariabele, y - y . De sum of
2
squared errors is een samenvatting van de grootte van de residuals: SSE=∑ ( y−^y ) . SPSS noemt
het ook wel de residuele som of squares, de variatie van de data rond een predictielijn. De kleinste
kwadraten schattingen a en b zijn de waarden die de predictievergelijking vormen, waardoor de SSE
minimaal is. De predictielijn bij de vergelijking heet de least squares line. De som van residuals is
altijd gelijk aan 0.
Deterministisch is dat elke x-waarde bij één waarde van y hoort. Vaak variëren de y-waarden juist.
Een distributie die verwijst naar de variabiliteit in de y-waarden op een gefixeerde waarde van x, heet
een conditionele distributie. Een probabilistisch model staat variabiliteit in y toe bij elke waarde van
x. E ( y )=α+ βx om de relatie tussen x en het gemiddelde van de conditionele distributie van y te
modelleren. Dit heet ook wel een regressiefunctie, wat beschrijft hoe het gemiddelde van de
responsvariabele verandert volgens de waarde van een verklarende variabele. Het y-intercept en de
helling heten de regressiecoëfficiënten voor de lineaire regressiefunctie. σ is de conditionele
standaarddeviatie, het meet de variabiliteit van de y-waarden voor alle subjecten met dezelfde x-
waarde. Een model is altijd een versimpelde benadering van de realiteit, het klopt niet in het echt.
∑ ( y− ^y )2 , de geschatte conditionele standaarddeviatie. (n-2) zijn de vrijheidsgraden
s=
√ SSE
n−2
=
√ n−2
voor de schatting. In het algemeen geldt, als een regressievergelijking p onbekende parameters
heeft, dan is df = n – p. De mean square error is de s2, de wortel is de schatting van de conditionele
standaarddeviatie van y. √∑ ¿ ¿ ¿ ¿ = s is de puntschatting van de populatie standaarddeviatie, de
y
standaarddeviatie van de marginale distributie van y, omdat het alleen de y-waarden gebruikt. De
∑ ¿¿ is de totale sum of squares.
De correlatie tussen kwantitatieve variabelen is een gestandaardiseerde versie van de helling. Het
√
hangt niet af van de meeteenheden. s x is de marginale sample standaarddeviatie van x: ∑ ¿ ¿ ¿ ¿.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper daniquevandijk1. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,99. Je zit daarna nergens aan vast.