Dit is mijn samenvatting van alle statistiek van het derde blok. Ik heb geprobeerd van met name de colleges een duidelijk en overzichtelijk stappenplan te maken. Het heeft mij in ieder geval geholpen het vak WSR-t met een goed cijfer af te ronden. Ik hoop dat ik hiermee anderen ook kan helpen het v...
4.4 Multivariate Data Analysis - Literature Summary
Summary Applied Data Analyses
All for this textbook (28)
Written for
Universiteit van Amsterdam (UvA)
Psychologie
WSRt
All documents for this subject (4)
1
review
By: mijkenitert • 4 year ago
Seller
Follow
MJO95
Reviews received
Content preview
WSR-t Statistiek
Statistiek van Blok 3
,Correlaties
Correlatie:
• Eenzijdige hypotheses zijn voorspellingen dat de correlatie positief of negatief is. Bij
tweezijdige hypotheses weet je niet hoe de correlatie eruit zal zien.
• De Pearson correlatie (PMCC) is een parametrische toets, net als de andere toetsen die we
tot nu toe hebben gehad. De Spearman Correlatie is een non-parametrische toets. Hier
wordt later nog op in gegaan.
• Wat je wilt weten bij een correlatie is hoe variabelen co-variëren. De variantiemaat is
gestandaardiseerd en deze berekenen we door de co-variantie te delen door de standaard
deviatie van de twee variabelen te vermenigvuldigen. Hierdoor standaardiseren we de
correlatie waardoor deze valt tussen de -1 en 1. De co-variantie hierin is gelijk aan het
kruisproduct van de 2 variabelen.
• Je vindt positieve correlaties wanneer de punten in de groene kwadranten liggen. Dus
wanneer X en Y allebei positief zijn of wanneer zij allebei negatief zijn.
• Als variabelen steeds hetzelfde doen t.o.v. hun gemiddelde, dan levert je dat positieve of
negatieve correlaties op.
• De correlatie waarde tracht een lineair verband weer te geven maar eigenlijk hoeft dit
verband helemaal niet lineair te zijn. Het geeft gewoon het verband aan tussen de punten
in het vlak. Dus of ze in de groene of meer in de rode gebieden liggen.
• Als je een gewone correlatie kwadrateert, dan krijg je de verklaarde variantie.
, • Als je de correltaie tussen 2 variabelen wilt weten, kan het zo zijn dat beide een andere
schaal hebben. Bijvoorbeeld IQ en tentamen cijfer. Om ze naast elkaar te leggen, moet je
deze variabelen eerst standaardiseren. Dit doe je door middel van een z-transformatie:
•
• Je hebt dan twee variabelen waarvan een gezien kan worden als een predictor en de ander
gezien kan worden als de outcom.
• Je kan van een van de variabelen de totale variantie weergeven. Hoeveel
(gestandaardiseerde) variatie zit er in de ene variabele en in de andere variabele? En
hoeveel daarvan wordt verklaard door de andere variabele?
• Het gaat dan weer om de afstand van het gemiddelde tot de gestandaardiseerde score op
de predictor. Dit is het gene dat verklaard wordt. Wat je overhoudt, is de gene dat niet
verklaard wordt. Als je deze verklaarde variantie van iedere waarde bij elkaar optelt, krijg
je de variantie van het model. De som van alles dat niet wordt verklaard is de error.
• De som van alle verklaarde delen (het model) is precies gelijk aan r^2. Je kijkt hier
namelijk naar de samenhang tussen dat wat wordt voorspeld en wat de werkelijke scores
zijn. Dus wat is de proportie van verklaarde variantie van het totaal? Als de r^2 gelijk is aan
1 betekend dit dus dat alles verklaart wordt en wanneer deze gelijk is aan 0, wordt er juist
niks verklaard.
Berekenen Co-variantie:
o Mean.grade = mean(grade, na.rm=T)
Mean.IQ = mean(IQ, na.rm=T)
o Delta.grade = grade – mean.grade
Delta IQ = IQ – mean.IQ
o Prod = (grade – mean.grade) * (N - 1)
o Covariance = sum(prod)/(N - 1)
Berekenen Correlatie:
o Correlation = covariance / (sd(grade) * sd(IQ))
o Of Cor(z.grade, z.IQ) of Cor (grade, IQ). Of je de correlatie berekend met
gecorrigeerde getallen maakt voor de correlatiemaat niks uit. Je kan dus ook de
oorspronkelijke getallen gebruiken.
o Omdat je al gestandaardiseerd hebt, kun je ook de correlatie berekenen door de
gestandaardiseerde waarde van de ene variabele te vermenigvuldigen met de
andere variabele en deel dat door N-1. Dus sum (z.grade * z.IQ) / (N-1)
• Vervolgens willen we nog weten of de correlatie ook significant is. Dat doen we middels
deze formule: de correlatie is r en de verklaarde variantie is r^2. Dus 1- de r^2 is de
onverklaarde variantie. Deze formules leveren een t-waarde op.
•
o Df = N-2
o T.r = (correlation * sqrt(df)) / sqrt(1-correlation^2)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller MJO95. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.26. You're not tied to anything after your purchase.