4.4 C Applied Multivariate Data Analysis (FSWPEM040)
Institution
Erasmus Universiteit Rotterdam (EUR)
Book
Discovering Statistics Using IBM SPSS
Samenvatting van hoofdstukken 2, 5, 7, 8, 10 t/m 15 van Field, de colleges, artikelen, oefeningen, assignment artikelen en SPSS-sessies.
Geschreven in studiejaar 2020/2021
Exam Guide for Applied Multivariate Data Analysis – Get yourself a Wonderful Grade!
Summary of Statistics (IBC), Radboud University
Answers assignment 3 business research methods
All for this textbook (117)
Written for
Erasmus Universiteit Rotterdam (EUR)
Klinische Psychologie
4.4 C Applied Multivariate Data Analysis (FSWPEM040)
All documents for this subject (3)
3
reviews
By: Klietjje • 10 months ago
Translated by Google
In itself, a nice and concise summary, but perhaps a little too concise. I expected more details on the spss assignments and I hope that the material in the summary is sufficient.
By: dylanvdwaal • 1 year ago
By: allashuker • 3 year ago
Seller
Follow
estherseverins
Reviews received
Content preview
Statistiek Blok 4.4
INHOUDSOPGAVE
(Samenvatting van hoofdstukken van Field 4e editie, artikelen, colleges, oefeningen en SPSS-oefeningen)
Bijeenkomst 1 Herhaling en bias 1
Bijeenkomst 2 Correlaties en regressie 11
Bijeenkomst 3 Meer regressie 22
Bijeenkomst 4 Moderator en mediator 25
Bijeenkomst 5 ANOVA en ANCOVA 29
Bijeenkomst 6 Factor ANOVA 37
Bijeenkomst 7 Repeated measures design 43
Bijeenkomst 8 Mixed design 48
Overzichtstabel 52
Assignment artikelen 55
SPSS-meetings 61
,BIJEENKOMST 1 HERHALING EN BIAS
(Field hoofdstukken 2 & 4, college 1, artikel Simmons et al., 2011)
Hoofdstuk 2 Everything you never wanted to know about statistics
Bouwen van statistische modellen
Het testen van hypotheses bestaat ook uit het opbouwen van statistische modellen. Een statistisch
model moet de verzamelde data zo goed mogelijk representeren. In welke mate dit wordt gedaan
wordt ook wel de fit van het model genoemd. Er kan een onderscheid gemaakt worden tussen good
fit, moderate fit en poor fit.
Populaties en samples
Onderzoekers zijn geïnteresseerd in resultaten die toepasbaar zijn op de hele populatie. Een populatie
kan heel breed zijn (bijvoorbeeld alle mensen) of juist heel smal (bijvoorbeeld alle rode katten die Bob
heten). Vaak is het interessanter om iets te kunnen zeggen over een brede populatie.
Het is bijna onmogelijk om de hele populatie te testen voor resultaten. Om dit op te lossen wordt er
gewerkt met een sample. Het is belangrijk dat deze sample een weerspiegeling is van de populatie en
dus representatief is. Hoe groter de sample, hoe groter de kans hierop.
Statistische modellen
Statistische modellen bestaan uit variabelen en parameters. Variabelen zijn de gemeten constructen
en veranderen tussen samples en onderzoeken. Parameters zijn daarentegen constanter en
representeren relaties tussen de variabelen, voorbeelden zijn de mediaan of correlaties.
Þ Gemiddelde: alles bij elkaar optellen en dan delen door het aantal.
Om de fit van een model te berekenen:
Þ Totale error (sum of errors):
o Dus alle errors bij elkaar optellen
Þ Sum of squared errors (SS):
o Elke error wordt eerst in het kwadraat gezet en vervolgens bij elkaar opgeteld.
o Afhankelijk van de data: hoe meer data hoe groter de SS.
Þ Mean squared error (MSE):
o Hierbij deel je de SS door de degrees of freedom (df).
§ De df kan berekend worden door N – 1.
Het principe van het minimaliseren van de SS wordt ook wel method of least squares genoemd.
Verder dan de data
De standaarddeviatie vertelt ons hoe goed het gemiddelde de sample representeert. Wanneer er
meerdere samples genomen worden, zal het gemiddelde elke keer een beetje veranderen. Dit komt
doordat de samples veranderen en wordt sampling variation genoemd. Wanneer alles bij elkaar
gevoegd wordt (alle gemiddeldes) kan er een symmetrische distributie opgesteld worden wat een
sampling distribution heet. Hierdoor wordt het een betere representatie van de populatie.
De standaarddeviatie van een sample gemiddelde wordt ook wel de standaard error van de mean (SE)
genoemd. Vaak is het onmogelijk om alle samples te verzamelen en wordt er uitgegaan van een
‘ongeveer’ standaard error. De central limit theorem stelt dat wanneer een sample groter dan 30 is,
2
,het om een normale verdeling gaat met een gemiddelde die gelijk is aan de populatie gemiddelde en
een standaarddeviatie van .
Wanneer een sample kleiner is dan 30, is de distributie niet normaal verdeeld. Het heeft een andere
vorm waarbij er gesproken wordt van een t-verdeling.
Om een inschatting te maken binnen welke grenzen de populatie zal vallen, kunnen confidence
intervals (CI) ingezet worden. Bij een 95% CI is de kans 95% dat het populatie gemiddelde binnen deze
grenzen valt.
Þ 95% van de z-waarde valt tussen – 1.96 en + 1.96 bij een normale verdeling.
Þ Confidence interval =
o Je vermenigvuldigt de z-waarde met de SE en doet dan het gemiddelde – en + dit
getal.
Þ Z-scores:
Er kan ook gewerkt worden met een 90% of 99% confidence interval. In dit geval wordt er een andere
z-waarde gebruikt. Dit is terug te vinden in de tabel. Bij 99% hoort een z-waarde van 2.58 en bij 90%
1.64.
Wanneer een distributie niet normaal verdeeld is, wordt de t-waarde gebruikt in plaats van de z-
waarde. De df (N – 1) toont in de tabel aan wat de t-waarde is die gebruikt kan worden.
Gebruik van statistische modellen om onderzoeksvragen te testen
Er zijn verschillende benaderingen om hypotheses te testen. Wat het meest geleerd wordt is de
nulhypothese significantie test (NHST). Dit is ontstaan uit twee verschillende benaderingen:
- Ronald Fisher zijn idee van rekenen met kansen.
Þ Wanneer de uitkomst groter is dan kans.
Þ Fisher’s p-waarde: door een kans van 0.05 te nemen zou het niet op toeval kunnen
berusten.
- Neyman en Pearson hun idee van rekenen met hypotheses.
• Alternatieve hypothese (H1) = experimentele hypothese: het effect is aanwezig.
• Nulhypothese (H0): effect is niet aanwezig.
• Bij het testen van hypotheses kunnen er twee fouten gemaakt worden:
§ Type I-fout: H1 aannemen terwijl H0 correct is.
§ Type II-fout: H0 aannemen terwijl H1 correct is.
Het vermogen van een test om een effect te vinden wordt de power genoemd. Het hangt af van een
aantal dingen:
- Hoe groot het effect daadwerkelijk is, grotere effecten vallen meer op = effectgrootte.
- Hoe strikt een significantie is.
- De samplegrootte.
De NHST bevat verschillende basisassumpties:
1. Er wordt verwacht dat de nulhypothese waar is, dus dat er geen effect is.
2. Er wordt een statistisch model toegepast op de data dat de alternatieve hypothese
representeert en er wordt onderzocht hoe goed de fit is.
3. Om na te gaan hoe goed de fit is, wordt de kans (p-waarde) berekend.
3
, 4. Als de kans erg klein is (< .05) is de fit goed en wordt de nulhypothese verworpen (alternatieve
is dan dus waar).
Er kan een onderscheid gemaakt worden tussen twee vormen van variatie. Systematische variatie is
variatie dat uitgelegd kan worden aan de hand van het model dat bij de data past. Onsystematische
variatie kan niet uitgelegd worden aan de hand van het model. Om te concluderen of de hypothese
een goede verklaring biedt, moeten deze twee variaties vergeleken worden.
Þ De ratio hiervan wordt ook wel test statistic genoemd:
Een statistisch model dat een directionele hypothese (effect gaat een kant op) test, is een one-tailed
test. Het testen van een non-directionele hypothese (onduidelijk welke kant het op gaat) is een two-
tailed test.
De NHST heeft twee valkuilen:
1. Onduidelijk wat er uiteindelijk geconcludeerd kan worden: het is niet vanzelfsprekend dat het
effect belangrijk is. Ook betekenen niet-significante resultaten niet altijd dat de nulhypothese
waar is en significante resultaten dat de nulhypothese niet waar is.
2. Alles of niets denken: p < .05 wordt als exacte criteria gebruikt, wat voor misleiding kan
zorgen.
Moderne benaderingen voor theorie testen
Door de valkuilen wordt er anders gekeken naar het bewijs voor een hypothese. NHST wordt nog
steeds gebruikt, maar daarnaast moeten ook confidence levels en effectgroottes vernoemd worden
om een meer volledig beeld te krijgen.
Hoe groot een effect is, staat bekend als de effectgrootte. Dit wordt aangeduid als bijvoorbeeld de
Cohen’s d, de Pearson’s r of de kans ratio.
Þ Cohen’s d:
o Bij 0.2 wordt er gesproken van een klein effect, bij 0.5 van een gemiddeld effect en bij
0.8 van een groot effect.
Þ Pearson’s r:
o Bij .10 wordt er gesproken van een klein effect, bij .30 van een gemiddeld effect en bij
.50 van een groot effect.
Hoofdstuk 5 The beast of bias
Wat is bias?
Bias houdt in dat iemand het bewijs niet op een objectieve manier beoordeelt en dat andere dingen
hier invloed op hebben. Een bias kan optreden in drie gebieden, namelijk (1) parameters, (2)
standaard errors en betrouwbaarheidsintervallen, en (3) test statistieken en p-waardes. Het kan
invloed hebben op elkaar omdat sommige gebieden gebaseerd zijn op anderen.
Bias kan optreden wanneer er niet aan bepaalde assumpties wordt voldoen. Een outlier kan een
groter invloed hebben op bias. Het geeft namelijk een heel ander gemiddelde dan wanneer deze
outlier er niet geweest zou zijn. Ook geeft het een andere SS wat weer invloed heeft op heel veel
andere statistieken.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller estherseverins. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.11. You're not tied to anything after your purchase.