Tentamen belangrijkste onderdelen
Overzicht toetsen
Model t-toets voor interactie (laatste regel) = moderatie effect
Test of highest order unconditional interactions F toets voor het
moderatie effect
One way Anova 1 afhankelijke & 1 onafhankelijke variabele
Gemiddelden vergelijken tussen 2 of meer groepen
Assumptie: homogeniteit varianties
Two way Anova 1 afhankelijke & 2 categorische onafhankelijke
variabele
Ancova 2 afhankelijke variabelen, waarvan 1 continue, 1 categorische
onafhankelijke
Repeated measures focus op within onafhankelijke variable
meting van elke respondent minimaal 2 keer vergelijken
Rekening houden met individuele verschillen
Verschillende individuen spelen geen rol gaat om groepsgemiddelde
Bijvoorbeeld hoe een groep scholieren presteert in 4 vakken
Assumpties: !! = sphericiteit
• Normality (zoals bij ANOVA)
• Onafhankelijkheid van scores – (meestal) klopt: score=individu
• Geen assumptie van homogeniteit van variantie
• Assumptie van Sphericiteit (ipv homogeniteit)
Mixed Design 2 onafhankelijke variabelen (within & between)
Herhaaldelijke metingen per proefpersoon, maar ook de verschillen tussen
proefpersonen zijn van belang (between subjects), bijvoorbeeld verschil
jongens/meisjes in verschillende schoolvakken
Assumpties Mixed Design Levene (homogeniteit) & Maughly
(spehericity)test
Manova meerdere afhankelijke variabele (ALLEEN BETWEEN)
De populatie volgt de multivariate normale verdeling
Assumpties van Manova moeten alle 3 voldaan zijn
- Onafhankelijke observaties
- Continue afhankelijke variabelen
- Varianties
o Levene’s test checkt alleen varianties (PER GROEP) , moet niet
significant zijn
o Box test checkt gelijkheid variantie en covariantie niet geschikt
bij gelijke groepsgroottes, moet niet sig zijn
Dependent samples (afhankelijke steekproeven/dezelfde
steekproef in verschillende momenten)
,Onafhankelijke t-toets basis one way anova, vergelijken twee
groepen,
One way anova meer dan 2 groepen, verlenging van de onafhankelijke
Afhankelijke (Paired) t-toets scores vergelijken van 2 afhankelijke
steekproeven of dezelfde steekproef in twee verschillende condities
gaat niet over verschil tussen gemiddelden maar over een gemiddeld
verschil tussen de proefpersonen
Repeated measures scores van dezelfde of afhankelijke steekproef in
meer dan twee condities, is een verlenging van de paired t-test
Week 1: Lineaire regressie
Conditional mean Gemiddelde loon van iedereen die X=… scoort
Is de wenselijke/ideale situatie , verwachte waarden in grote data sets
Platte lijn = geen relatie omdat b=0
Mediaan midden van de verdeling
Mode meest voorkomende
Cases aantal proefpersonen
Constant = a gemiddelde
Ongestandardiseerde coëfficiënten unstandardized B, als de X
(age) met 1 omhoog gaat, gaat de Y (uurloon) met dit getal omhoog
Gestandardiseerde standardized beta hoeveel SD het uurloon
toeneem, als ervaring met 1 SD toeneemt.
Vind een effect = hoeveel meer krijg je per uur als je L jaar ouder wordt
Aantal jaren * coefficient(B 2e regel)
Variantie maat voor spreiding van een reeks, de mate waarin
onderlinge waarden verschillen
Beste lijn kleinste kwadraten methode
Optimale waarde van b0 en b1 vinden
Doel van regressie: b0 en b1 te vinden die (Y -Y^)2 minimaliseren
Oplossing: (optimale waarde voor b1)
Residual/residu de fout, het verschil tussen ware
data en verwachte waarden volgens het model
- Gemiddelde van de residu = 0
- Correlatie residu en ov regressie = 0
- Zijn een onderdeel van de onafhankelijke variabele
- Als we bijvoorbeeld het loon voorspellen aan de
hand van werkervaring is het residu is wat
, overblijft wat niet verklaart wordt door de onafhankelijke variabele
(in dit geval werkervaring)
Gemiddelde van alle residuals is altijd 0
Residu voorspelde waarde – geobserveerde waarde
R is de correlatie tussen geoberveerde waarden (Y) en voorspelde
waarden (Y^)
R2 is de proportie verklaarde variantie door de regressie de proportie
van variantie in de uitkomst verklaard door predictor variabelen
Adjusted R2
R2 is altijd berekend met de steekproef en niet gelijk aan de echte R2 van
de populatie
Oplossing hiervoor: adjusted R2 hoe kleiner de steekproef, hoe groter
het verschil tussen adjusted en normale r2,
K= correctiefactor, aantal afhankelijke
R2 = onze r2
N = predictoren
Is er een verschil in de praktijk tussen R2 en adjusted R2
niet met grote steekproeven
Bijzonderheden adjusted R
- Kan 0 worden, bij normale r ligt hij altijd tussen 0 en 1, maar je zal
nooit 0 of 1 krijgen
- Kan lager worden als een nieuwe predictor in het model komt
- Adjusted is niet helemaal zuiver, sommige suggeren dat de adjusted
R2 de proportie verklaarde variantie is in de populatie (dit klopt niet)
Multiple regressie: regressie met meerdere onafhankelijke variabele
Week 2: Regressie met categorische producten & regressie
assumpties
Regressie met dummies
- Hoogopgeleiden verdienen gemiddeld 2,80 euro meer dan
laagopgeleiden, niet significant!
- Gemiddeld opgeleiden verdienen gemiddeld 5,30 euro minder dan
laagopgeleiden, niet significant!
- Waarom laagopgeleiden omdat hoog en gemiddeld in de
regressie staan
, - Verwachte waarden
Assumpties
Lineariteit of influential observations
geschonden
- Je kan de coefficienten niet meer
vertrouwen,
- als deze assumptie is geschonden is het geen goede afspiegeling
van de werkelijkheid
Normaliteit, homoscedastisch, correlatie of multicollineariteit
geschonden
- Je kan de standaardfouten en t-toetsen niet vertrouwen
- Dus niet generaliseren naar de populatie!! niets te maken met de
b’s,
- Significantietoetsen wel/niet vertrouwen
Lineratiteit: de relatie tussen X en Y moet lineair zijn voor elke waarden
van X
Bij lineaire assumptie conditional mean is gelijk (of bijna gelijk) aan
verwachte waarden (bij grote steekproef), coëfficiënten b zijn juist
Bij niet lineaire assumptie conditional mean niet gelijk aan verwachte
waarden, coëfficiënten b zijn onjuist
Assumpties lineairiteit – hoe te checken
Bivariate regressie: scatterplot X-Y (1 OV)
Multipele regressie: residuenplot
‘Regel’: bij elke waarde van Y ^ moeten even veel positieve en
negatieve residuen zijn (dus boven en onder +- evenveel punten boven en
onder de lijn)
Assumptie afspiegeling werkelijkheid: Outliers en influential
observations
Outliers (uitschieters)
Cook’s D <1 = goed
Mag je residuen generaliseren
standaardfouten en t-toetsen niet vertrouwen en dus niet generaliseren
naar de populatie!! niets te maken met de b’s,
Significantietoetsen wel/niet vertrouwen
Mag je residuen generaliseren: normaliteit van residuen en
homoscedasticiteit
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller teddievdstaak1. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.79. You're not tied to anything after your purchase.