Exam Guide for Applied Multivariate Data Analysis – Get yourself a Wonderful Grade!
Summary of Statistics (IBC), Radboud University
Answers assignment 3 business research methods
All for this textbook (117)
Written for
Vrije Universiteit Amsterdam (VU)
Communicatiewetenschap
Kwantitatieve Onderzoeksmethoden (S_KWOM)
All documents for this subject (9)
Seller
Follow
lottebartelds
Reviews received
Content preview
Hoofdstuk 1
1.8: Analysing data
Frequentieverdeling/histogram:
- Een grafiek die laat zien hoe vaak elke score voorkomt
- Een grafiek die de waarden van een observatie plot op de horizontale as
- Een bar/staaf laat zien hoe vaak elke waarde in de data set voorkwam
Normale verdeling:
- Klokvormige curve
- Ziet er aan beide zijden hetzelfde uit
- De meeste scores liggen in het midden van de verdeling
- De waarden van scheefheid en kurtosis zijn 0
Redenen waarom een verdeling kan afwijken van normaal:
- Gebrek aan symmetrie (skew/scheef):
o De meeste waarden liggen aan de zijkanten van de verdeling
o Positief scheef = de waarden liggen aan de linkerkant van de verdeling
o Negatief scheef = de waarden liggen aan de rechterkant van de verdeling
- Puntigheid (kurtosis):
o De mate waarin scores zich aan de staarten van de verdeling clusteren
o Positieve kurtosis/leptokurtic = de verdeling is puntig en heeft de meeste
waarden in het midden
o Negatieve kurtosis/platykurtic = de verdeling is platter en de waarden zijn meer
verdeeld over de as
Bepalen van het midden van een frequentieverdeling (central tendency):
- Mode/modus:
o De hoogste staaf van de verdeling
o De score die het meest voorkomt
o Bimodal = als er twee hoogste scores zijn
o Multimodal = als er meer dan twee hoogste scores zijn
- Median/mediaan:
o Kijken naar de middelste score als het gaat om ranking op basis van omvang
o (N + 1)/2 = (aantal scores + 1)/2 het nummer van de score die de mediaan is
o Kan gebruikt worden bij ordinale, interval en ratio data
o Wordt amper beïnvloedt door extreme scores
- Mean/gemiddelde:
o Alle scores bij elkaar optellen en vervolgens door het aantal scores delen
o Kan beïnvloed worden door extreme scores
o Kan gebruikt worden bij interval en ratio data
o Voordelen = het gebruikt elke score en is stabiel in verschillende voorbeelden
Dispersion/verspreiding van scores:
- De grootste score van de laagste score aftrekken
- De range/het bereik van de scores
- Heel erg beïnvloed door extreme scores
- Interquartile range:
o Alleen kijken naar de middelste 50% van de scores
o De bovenste en onderste 25% elimineren
o Kwartielen = de drie waarden die de data in vier delen verdelen
, o Verschil tussen de upper en lower quartile
- Kwartielen:
o Second quartile = mediaan die de waarden door tweeën splitst
o Lower quartile = mediaan van de kleinste groep die door de mediaan is gesplitst
o Upper quartile = mediaan van de grootste groep die door de mediaan is gesplitst
- Kwantielen:
o Waarden die een data set in gelijke porties verdeeld
o Kwartielen zijn kwantielen die data in vier porties verdelen
o Percentielen = punten die data in 100 gelijke porties verdelen
o Noniles = punten die data in 9 gelijke porties verdelen
Deviance/afwijking:
- Verschil tussen elke score en het gemiddelde
- Positief = scores groter dan het gemiddelde
- Negatief = scores kleiner dan het gemiddelde
- Alle scores bij elkaar optellen = 0
- Sum of squares:
o Sum of squared errors (SS)
o De som is altijd groter dan nul, tenzij alle scores hetzelfde zijn
Variantie:
- Niet werken met de totale spreiding van scores, maar alleen met de gemiddelde
spreiding
- Gemiddelde error tussen het gemiddelde en de observatie die wordt gemaakt
- Variantie = sum of squares/het aantal observaties (N)
- Probleem = het kwadrateren van de afwijkingen geeft een meting in kwadraten
- Standaarddeviatie:
o Worteltrekken van de variantie
o Kleine deviatie = de punten liggen dicht bij het gemiddelde
Probability/waarschijnlijkheid:
- Hoe waarschijnlijk is de kans dat deze score voorkomt?
- Voorbeeld van trends en de Ice Bucket Challenge
- Een frequentieverdeling gebruiken om de waarschijnlijkheid ervan te meten
- Probability density functions (PDF):
o Formule waarmee de waarschijnlijkheid van een frequentieverdeling berekent
kan worden
o Waarschijnlijkheidsverdeling = de curve die hieruit voortkomt
o Normale verdeling = is wederom klokvormig
o Vaak wordt er een normale verdeling met een gemiddelde van 0 en een
standaarddeviatie van 1 gebruikt
- Z-scores:
o Wat overblijft wanneer elke score van het gemiddelde van alle scores wordt
afgetrokken
o Vervolgens wordt dit getal gedeeld door de standaarddeviatie
Hoofdstuk 2
2.7: S is for standard error
SPINE:
- S = standaard error (SE)
, - P = parameters
- I = (confidence) interval
- N = nulhypothese significatie testing (NHST)
- E = estimation
Standaard error:
- Populatie gemiddelde = de parameter die geschat wordt
- Sample gemiddelde = de gemiddelde beoordeling
- Sampling variatie = samples verschillen omdat ze verschillende leden van de populatie
bevatten
- Sampling verdeling:
o Totaal van verschillende samples
o Frequentieverdeling van sample gemiddelden van dezelfde populatie
- Standaard error (van het gemiddelde) (SE):
o Standaarddeviatie van het sample gemiddelde
o Berekenen:
Neem het verschil tussen elk sample gemiddelde en het totale
gemiddelde
Kwadrateer ze
Tel ze op en deel ze door het aantal samples
Vervolgens worteltrekken
o Central limit theorem = wanneer samples groot worden (meer dan 30) heeft de
sample verdeling een normale verdeling met een gemiddelde die gelijk is aan het
populatie gemiddelde
2.9: N is for null hypothese significance testing
Nulhypothese significantie testing (NHST):
- Benadering voor het testen van onderzoeksvragen met statistische modellen
- Ontstaan uit twee verschillende ideeën:
o Ronald Fisher’s idee om waarschijnlijkheden samen te nemen om bewijs te
evalueren
o Jerzy Neyman en Egon Pearson idee van concurrerende hypotheses
- Systeem dat aangeeft hoe waarschijnlijk de alternatieve hypothese waar is
- Verwerpen H0 = als p kleiner of gelijk is aan alpha (.05)
- Aannemen H0 = als p groter is dan .05 verwerpen H1
Fisher’s p-waarde:
- 5% is een drempel voor zekerheid
- Wanneer het effect binnen deze range valt weten we dat het effect oprecht is
Neyman en Pearson:
- Wetenschappelijke uitspraken moeten opgedeeld worden in testbare hypotheses
- Alternatieve/experimentele hypotheses (H1) = er is een effect aanwezig
- Nulhypothese (H0) = er is geen effect aanwezig
- Niet praten over het wel of niet verwerpen van een hypothese, maar over de kansen om
het resultaat te behalen, ervan uitgaand dat de nulhypothese waar is
- Hypotheses:
o Directioneel = er is een effect en de richting van dat effect is aangegeven
o Non-directioneel = er is een effect, maar de richting is niet aangegeven
Alpha:
- Hoe vaak ben je voorbereid om verkeerd te zitten?
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lottebartelds. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.87. You're not tied to anything after your purchase.