Exam Guide for Applied Multivariate Data Analysis – Get yourself a Wonderful Grade!
Summary of Statistics (IBC), Radboud University
Answers assignment 3 business research methods
All for this textbook (117)
Written for
Radboud Universiteit Nijmegen (RU)
Pre Master Business Administration
Kwantitatieve analyse
All documents for this subject (1)
Seller
Follow
evelienbosboom
Content preview
Inhoud
GEGEVENSVERZAMELING/ REPRESENTATIVITEITSTOETS ....................................................................... 2
BETROUWBAARHEIDSANALYSE ............................................................................................................... 6
FACTORANALYSE ..................................................................................................................................... 7
ANOVA ................................................................................................................................................... 10
TWEEWEG ANOVA ................................................................................................................................ 13
ANCOVA................................................................................................................................................. 15
MANOVA ............................................................................................................................................... 18
REGRESSIEANALYSE ............................................................................................................................... 20
INTERACTIEMODEL; MODEL MET MODERATOR ................................................................................... 24
MEDIATIEMODEL; MODEL MET MEDIATOR .......................................................................................... 26
LOGISTISCHE REGRESSIE........................................................................................................................ 28
EXTRA INFORMATIE ............................................................................................................................... 30
1
,Altijd:
• Observed P value < (kleiner) Alpha = H0 verwerpen (dus H1 accepteren) = Significant
• Observed P value > (groter) Alpha = H0 accepteren (dus H1 verwerpen) = Niet significant
H0 = aannemen dat er geen verschil is
H1 = aannemen dat er wel een verschil is
Wanneer iets valide is, is het ook betrouwbaar. Wanneer iets betrouwbaar is, is het niet persé valide.
GEGEVENSVERZAMELING/ REPRESENTATIVITEITSTOETS
Representativiteit = Mate waarin de steekproef op relevante kenmerken een goede afspiegeling vormt
van de populatie. Kan consequenties hebben voor de externe validiteit. Dus van groot belang voor de
generaliseerbaarheid. De verdeling van de onderzochte variabelen in de steekproef hetzelfde is als in de
populatie.
Bij een representativiteitstoets wil je JUIST dat H0 niet wordt verworpen. P >.30 = REPRESENTATIEF
Representativiteit ALTIJD toetsen met ALPHA van .30. Alleen Chi2 wordt gebruikt voor representativiteit
en kijken naar significantieniveau in de output, wanneer deze waarde (kleiner is) dan <.30 = H0
verwerpen = niet representatief
REPRESENTATIVITEITSTOETS
Doel= kijken of de geobserveerde frequentie gelijk is aan de verwachte frequentie.
Toets Hypothesen Criterium Voldaan aan
criterium
Chi-kwadraat toets H0 Verdeling in Waarde >.30 (groter
steekproef = verdeling in dan) Representatief
populatie
p>.30 = H0 accepteren =
H1 Verdeling in representatief
steekproef ≠ verdeling in
populatie p<.30 = H0 verwerpen =
niet representatief
Je wilt type ll fout
vermijden = te snel
accepteren van H0 terwijl
deze onjuist is
Missing data houdt in dat scores op variabelen ontbreken of dat deze foutief zijn. Twee opties:
MCAR = missing data is volledig verspreid in de datamatrix over verschillende categorieën.
MAR= Op voorhand niet te voorspellen waar de missing data zit maar de kans is groot dat het zich
afspeelt binnen een bepaalde categorie.
Je wilt als onderzoeker dat je data MCAR is. Je gaat dus de missingdata optellen en kijken of het kleiner is
dan <5%.
2
,Algemene regel MAR (wil je liever niet)
1. Steekproeven met N>400, een percentageverschil van >5% = significant
2. Steekproeven met N<400, een percentage verschil van >10% = significant
Algemene regel MCAR
1. Steekproeven met N>400, een percentageverschil van <5% = niet significant
2. Steekproeven met N<400, een percentageverschil van <10% = niet significant
H0 verwerpen, H1 aannemen = MAR (NIET REPRESENTATIEF) p < alpha
H0 accepteren, H1 verwerpen = MCAR (REPRESENTATIEF) p > alpha
Alpha Beta
Alpha Beta
Je wilt normaal de kans op type 1 fout zo klein mogelijk houden alleen bij representativiteitstoetsen wil je
dat de kans op type 2 fout wordt geminimaliseerd. Je kiest een grotere Alpha omdat je niet te snel
ervanuit wilt gaan dat je H0 onterecht accepteert. Hoe lager de alfa waarde wordt gesteld, hoe moeilijker
het wordt om H0 te verwerpen. De kans dat H0 foutief wordt verworpen, wordt dus kleiner wanneer de
gestelde alfa zo klein mogelijk is
Type 1, l: onterecht verwerpen van H0
Type 2, ll: onterecht accepteren van H0
Met missing value analyse gaat de onderzoeker kijken of de ontbrekende scores op variabelen
samenhangen. Missing data hebben praktische consequenties, namelijk dat de steekproefgrootte kan
worden aangetast en dus ook de statistische power. Ook de geldigheid van uitspraken die over de
onderzoekseenheden worden gedaan, kan worden aangetast
Data cleaning:
1. Type missing data vaststellen
• Negeerbaar: routings, non-response, censored data
• Niet negeerbaar: geen antwoorden, missing categorieën, (on)verklaarbaar (hiermee
moet de onderzoeker aan de slag).
2. Omvang van de missing data vaststellen
Indien % missing data <10% dan is het niet problematisch, beschouwen als MCAR. Kijken naar
percentage van variabelen met missing data.
3. Nagaan of de missing data random zijn MAR of MCAR
• MCAR = Missing completely at random = MCAR houdt in dat de ontbrekende scores
willekeurig zijn verdeeld over alle respondenten en variabelen in de steekproef.
Ontbrekende score patronen komen volledig door toeval tot stand.
• MAR = Missing at random = betekent dat de ontbrekende scores op een variabele
afhankelijk zijn van ontbrekende waarden op een andere variabele: er is sprake van
selectiviteit. De kans dat de waarde van een variabele ontbreekt, is deels afhankelijk van
andere geobserveerde data maar is niet afhankelijk van een van de andere waarden die
ontbrekend zijn. Onderliggende patronen zijn aanwezig.
4. Subsitutiemethode kiezen en uitvoeren
Geen methode is best of slechtst dus probeer meer methoden
MCAR = Missing data vervangen en missing data niet vervangen
− Listwise (direct eruit halen, doet niet meer mee)
3
, − Pairwise (correlatie tussen twee variabele vergelijken)
− Mean subsitution (gemiddelde invullen op missings)
− Regression techniques (op basis van andere items regressielijn maken)
MISSING VALUE ANALYSE
Doel= kijken of de ontbrekende scores op variabelen samenhangen.
Stappen Toets/tabel Criterium Voldaan aan
criterium
Omvang van data Univariate statistics <.10 (mits MCAR) Probleem
vaststellen verwaarloosbaar
Nagaan of missing data - Categorievariabelen Kruistabellen:
random zijn = kruistabellen - N>400 verschil van <5% Wijst op MCAR
- N<400 verschil van <10%
- Metrische variabelen Verschil (groter) dan
= T-test T-test: >5%(N>400) of
- T < (kleiner) l 2 l = MCAR >10%(N<400)?
- T > (groter) l 2 l = MAR = significant = MAR
Verschil (kleiner) dan
<5%(N>400) of
<10%(N<400)
= niet significant =
MCAR
Subsitutiemethode - MAR: subsets maken. -
kiezen MCAR: listwise, pairwise,
mean of regressive
Response set = respondenten die een vragenlijst invullen zonder nauwkeurig de vragen te lezen. Ze
neigen ernaar om antwoorden te geven volgens een patroon. Op een bepaalde systematische manier
vragen beantwoorden. Dit heeft effect op de interne validiteit.
Wanneer je response set meent te hebben waargenomen, moet je eerst beoordelen of het gevonden
patroon inhoudelijk toch mogelijk is (door de vragen en gegeven antwoorden naast elkaar te leggen). Is er
inderdaad sprake van response set dan moet je de omvang ervan bepalen. Is het aantal respondenten
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller evelienbosboom. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.02. You're not tied to anything after your purchase.