HC 1 kwantitatief multiple regressie
Kwantitatief is verftaalslag van kwalitatief (kindfactoren) naar intelligentie,
leeftijd etc (kwantitatief).
Padmodel multiple regressie;
- 1 afhankelijke variabele (y) schoolprestaties
- 1 of meer onafhankelijke variabelen (x) van interval/ratio meetniveau. Bijv.
intelligentie of leeftijd ( 1 stapje meer gezinsgrootte wat gebeurt er met y)
- 1 of meer dichotome variabelen, wel of niet aanwezig bijv. een huisdier
- E= meetfout
Voorbeeld onderzoeksvraag multiple regressie; kunnen we kennis van
literatuur bij jongvolwassenen voorspellen met persoons,- gezins,- en
schoolkenmerken?
Kwantitatief onderzoek is belangrijk voor generalisatie daarom is populatie
belangrijk.
Afhankelijk is wat je probeert te voorspellen/verklaren/uitkomstmaat (kennis van
literatuur)
Onafhankelijk adhv wat ga je dat verklaren (kenmerken ouderlijk huis, kenmerken
school).
Doelen analyse;
- Beschrijven lineare relatie variabelen (regressiemodel)
- Toetsen hypothesen over relaties, is het relevant (significantie)
- Kwantificeren van relaties, hoe groot is het effect (effectgrootte)
- Kwalificeren van relaties (klein, middel, groot)
- Beoordelen relevantie van relaties. Hoe groot moet effect zijn voordat het
belangrijk is? (subjectief)
- Voorspellen van iemands waarde met regressiemodel (puntschatting en
interval schatting)
!!!! je mag bij statistische samenhang geen causale uitspraak doen !!!!
Regressie 1; uitkomst (y)= model (x) + voorspellingsfout
,Als er geen voorspelling is is er ook geen voorspellingsfout; geschatte uitkomst
(Y^)= model (x)
Multiple regressie formule;
Y= B0 (intercept, constante, als x 0 is) + B1X1( 1 stapje hoger op x welke
invloed op y) +…….. + B6X6 ( 1 stapje meer op X welke invloed op y) + E
B1 is de regressiecoeffiecient.
Bij een spreidingsdiagram is er 1 voorspeller 1 x dus.
B0= intercept of constante B1= regressiecoefficient.
Y^ (voorspelde waarde op y) = B0 + B1X1 (enkelvoudige regressie).
Kleinste kwadraten criterium; de best passende lijn; lijn met zo’n klein mogelijke
voorspellingsfout.
Voorspellingsfout; voor elke respondent; - geobserveerde y
-geschatte y^
-voorspellingsfout Ej= Yj- Y^j
Positieve e; boven de lijn, onderschatting door model, we schatten boven
Negatieve e; onder de lijn. Overschatting door model.
,Voorspelling met kleine residuen is nauwkeuriger.
B0; snijdingsvlak bij y-as.
Goodness of fit model; model (regressielijn) met kleinste residuale
kwadratensom.
Bepalen goodness of fit (R2); vergelijking van linear model (regressiemodel) met
basismodel ( basislijn) pak het gemiddelde.
R2= SSm/ SSt
SSt (totale kwadratensom)= SSm (kwadratensom rechte lijn) + SSr
( kwadratensom voorspellingsfout)
Deviatie; afstand, misfit.
Q
Het bereik van R2 ligt tussen de 0 en 1(perfecte samenhang)
Multiple correlatiecoefficient = R= correlatie y en y^
Determinatiecoefficient R2; propertie y in verklaarde variantie in model is
verklaring y door alle x’en .
Invloed afzonderlijke x op y= B
R2> 0; het regressiemodel verklaart wel variatie in y
B> 0 of B<0 ; er is effect van x op y. het kan positief of negatief zijn. geen 0
B= 0 (nulhypothese); rechte lijn, geen effect, geen informatie.
Multiple regressie; y= B0 + B1X1 + B2X2 + B3X3 + E
, Hypothesen; H0; R2 = 0 ( er is geen verklaarde variantie)
HA; R2 > 0
Toets voor R2 doe je dmv. F- toets en beoordeel je statische significantie (a= .05)
Met grootte van R2 kwalificeer je relatie. p kleiner dan a verwerp H0.
F= MSm/ MSr p= .000 dus H0 verwerpen we geloven HA.
MS= SS/df
Beta = gestandaardiseerde regressie coeficient.
t= toetsingsgrootheid t sig.= overschreidingskans p
de p bij de t is .623 niet significant. H0 houden.
Degene met de grootste beta is de meest invloedrijke voorspeller.’
R2= verschil verklaarde variantie.
Als je 3 extra variabelen erbij invoegt kijk je vervolgens naar de R square change
en is dit groter geworden dan is het toevoegen van de extra variabelen statistisch
zinvol.
HC2 kwantitatief meerweg ANOVA
Multiple regressie; 1 afhankelijke variabele (y) minimaal interval niveau, meer
dan 1 predictor (x1, x2 etc.) meetniveau is interval of dichotoom.
Eenweg ANOVA: 1 afhankelijke variabele (y), 1 factor (one- way ANOVA). We
kijken naar het gemiddelde per groep (x) op y.
Meerweg ANOVA (factorial ANOVA); 1 afhankelijke variabele (y) meer dan één
factor (min. Nominaal) (x1, x2) dit word dan (two- way, three-way……ANOVA).
Kwantitatief is verftaalslag van kwalitatief (kindfactoren) naar intelligentie,
leeftijd etc (kwantitatief).
Padmodel multiple regressie;
- 1 afhankelijke variabele (y) schoolprestaties
- 1 of meer onafhankelijke variabelen (x) van interval/ratio meetniveau. Bijv.
intelligentie of leeftijd ( 1 stapje meer gezinsgrootte wat gebeurt er met y)
- 1 of meer dichotome variabelen, wel of niet aanwezig bijv. een huisdier
- E= meetfout
Voorbeeld onderzoeksvraag multiple regressie; kunnen we kennis van
literatuur bij jongvolwassenen voorspellen met persoons,- gezins,- en
schoolkenmerken?
Kwantitatief onderzoek is belangrijk voor generalisatie daarom is populatie
belangrijk.
Afhankelijk is wat je probeert te voorspellen/verklaren/uitkomstmaat (kennis van
literatuur)
Onafhankelijk adhv wat ga je dat verklaren (kenmerken ouderlijk huis, kenmerken
school).
Doelen analyse;
- Beschrijven lineare relatie variabelen (regressiemodel)
- Toetsen hypothesen over relaties, is het relevant (significantie)
- Kwantificeren van relaties, hoe groot is het effect (effectgrootte)
- Kwalificeren van relaties (klein, middel, groot)
- Beoordelen relevantie van relaties. Hoe groot moet effect zijn voordat het
belangrijk is? (subjectief)
- Voorspellen van iemands waarde met regressiemodel (puntschatting en
interval schatting)
!!!! je mag bij statistische samenhang geen causale uitspraak doen !!!!
Regressie 1; uitkomst (y)= model (x) + voorspellingsfout
,Als er geen voorspelling is is er ook geen voorspellingsfout; geschatte uitkomst
(Y^)= model (x)
Multiple regressie formule;
Y= B0 (intercept, constante, als x 0 is) + B1X1( 1 stapje hoger op x welke
invloed op y) +…….. + B6X6 ( 1 stapje meer op X welke invloed op y) + E
B1 is de regressiecoeffiecient.
Bij een spreidingsdiagram is er 1 voorspeller 1 x dus.
B0= intercept of constante B1= regressiecoefficient.
Y^ (voorspelde waarde op y) = B0 + B1X1 (enkelvoudige regressie).
Kleinste kwadraten criterium; de best passende lijn; lijn met zo’n klein mogelijke
voorspellingsfout.
Voorspellingsfout; voor elke respondent; - geobserveerde y
-geschatte y^
-voorspellingsfout Ej= Yj- Y^j
Positieve e; boven de lijn, onderschatting door model, we schatten boven
Negatieve e; onder de lijn. Overschatting door model.
,Voorspelling met kleine residuen is nauwkeuriger.
B0; snijdingsvlak bij y-as.
Goodness of fit model; model (regressielijn) met kleinste residuale
kwadratensom.
Bepalen goodness of fit (R2); vergelijking van linear model (regressiemodel) met
basismodel ( basislijn) pak het gemiddelde.
R2= SSm/ SSt
SSt (totale kwadratensom)= SSm (kwadratensom rechte lijn) + SSr
( kwadratensom voorspellingsfout)
Deviatie; afstand, misfit.
Q
Het bereik van R2 ligt tussen de 0 en 1(perfecte samenhang)
Multiple correlatiecoefficient = R= correlatie y en y^
Determinatiecoefficient R2; propertie y in verklaarde variantie in model is
verklaring y door alle x’en .
Invloed afzonderlijke x op y= B
R2> 0; het regressiemodel verklaart wel variatie in y
B> 0 of B<0 ; er is effect van x op y. het kan positief of negatief zijn. geen 0
B= 0 (nulhypothese); rechte lijn, geen effect, geen informatie.
Multiple regressie; y= B0 + B1X1 + B2X2 + B3X3 + E
, Hypothesen; H0; R2 = 0 ( er is geen verklaarde variantie)
HA; R2 > 0
Toets voor R2 doe je dmv. F- toets en beoordeel je statische significantie (a= .05)
Met grootte van R2 kwalificeer je relatie. p kleiner dan a verwerp H0.
F= MSm/ MSr p= .000 dus H0 verwerpen we geloven HA.
MS= SS/df
Beta = gestandaardiseerde regressie coeficient.
t= toetsingsgrootheid t sig.= overschreidingskans p
de p bij de t is .623 niet significant. H0 houden.
Degene met de grootste beta is de meest invloedrijke voorspeller.’
R2= verschil verklaarde variantie.
Als je 3 extra variabelen erbij invoegt kijk je vervolgens naar de R square change
en is dit groter geworden dan is het toevoegen van de extra variabelen statistisch
zinvol.
HC2 kwantitatief meerweg ANOVA
Multiple regressie; 1 afhankelijke variabele (y) minimaal interval niveau, meer
dan 1 predictor (x1, x2 etc.) meetniveau is interval of dichotoom.
Eenweg ANOVA: 1 afhankelijke variabele (y), 1 factor (one- way ANOVA). We
kijken naar het gemiddelde per groep (x) op y.
Meerweg ANOVA (factorial ANOVA); 1 afhankelijke variabele (y) meer dan één
factor (min. Nominaal) (x1, x2) dit word dan (two- way, three-way……ANOVA).