Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien 4,6 TrustPilot
logo-home
Resume

Kernsamenvatting theorie Multivariate data-analyse (MDA) met opgeloste voorbeeldoefeningen

Note
-
Vendu
1
Pages
29
Publié le
12-03-2018
Écrit en
2016/2017

Dit document is een kernsamenvatting van het theoretische gedeelte van Multivariate data-analyse aangevuld met notities en tips uit de les en de cursus. Ik heb per statistische test één opgeloste voorbeeldoefening toegevoegd die je zeker moet kunnen met de hand voor het theorie examen (enkelvoudige en meervoudige lineaire regressie, logistische regressie, 1-Factor ANOVA, 2-Factor ANOVA, factoranalyse en clyster analyse). Op het einde van het document vind je ook enkele examenvragen terug die in 2016 op het theoretisch en praktisch examen werden gesteld.

Montrer plus Lire moins
Établissement
Cours











Oups ! Impossible de charger votre document. Réessayez ou contactez le support.

École, étude et sujet

Établissement
Cours
Cours

Infos sur le Document

Publié le
12 mars 2018
Fichier mis à jour le
7 juillet 2019
Nombre de pages
29
Écrit en
2016/2017
Type
Resume

Sujets

Aperçu du contenu

Verkennen van data
Doel (1) Data organiseren (grafieken, …)
(2) Data beschrijven (beschrijvende/deductieve statistiek, samenvatten)
(3) Uitspraken doen o.b.v. data (inferentiële/inductieve statistiek, verklaren)

Uitspraken doen over populatie? → inferentiële statistiek (algemeen)
Uitspraken doen over steekproeven? → beschrijvende statistiek (specifiek)




Basisbegrippen Steekproefverdeling (sample distribution)
= frequentieverdeling/omvang van de uitkomsten van de steekproef.
= empirisch, gekend.

Steekproevenverdeling (sampling distribution)
= kansverdeling van alle mogelijke waarden die een steekproefgrootheid
(voor alle mogelijke verschillende steekproeven) kan aannemen.
= theoretisch, benadering.

Centrale limietstelling
= herhaaldelijk toevallige steekproeven met grootte n trekken uit een willekeurig
verdeelde populatie met gemiddelde µ en standaardafwijking ; indien n
voldoende groot is (n ≥ 30), dan benadert de steekproevenverdeling van het
steekproefgemiddelde een normaalverdeling.

Missing data
= gegevens of datapunten van een variabele die ontbreken.
➔ kan praktische impact hebben.

Outliers
= buitenbeentjes of uitbijters die duidelijk anders zijn dan andere observaties
➔ kunnen grote impact hebben op analyse en interpretatie
➔ steeds grondig afwegen of je ze behoudt of verwijdert.


1

, Voorwaarden voor het uitvoeren van multivariate analyses
(1) Normaliteit → Typisch gevormde Gauss curve




→ Indien afwijking voldoende groot, zijn alle statistische tests ongeldig
omdat normaliteit vereist is om F en t statistieken te kunnen gebruiken.

→ Mogelijke afwijkende vormen
(1) Kurtosis: gepiektheid of platheid t.o.v. NVD (hoogte)
(2) Scheefheid: balans van de distributie (rechts of links)

→ Hoe normaliteit bepalen?
(1) Skewness/kurtosis bekijken
(2) Kolmogorov-Smirnov test
(3) Grafisch: Normal Probability Plot
(2) Homoscedasticiteit → De variantie in waarden van de afhankelijke variabele moet
ongeveer gelijk zijn voor elke waarde van de onafhankelijke variabele.




→ Indien dit niet het geval is, spreekt men van heteroscedasticiteit.
(= predicties zijn beter voor sommige waarden van de onafhankelijke
variabele dan voor anderen)




(3) Lineariteit → Recht evenredig en gelijkvormig veranderen met de variatie van een
tweede grootheid (liefst zo sterk mogelijk verband tussen variabelen).




2

, Enkelvoudige lineaire regressie
Doel Lineaire relatie beschrijven tussen afhankelijke/endogene variabele Y en één
onafhankelijke/exogene variabele Xi.
(wat is het verband tussen beiden?)

OPMERKING:
Om regressie-analyse te mogen toepassen zijn er drie voorwaarden
(= werkhypothesen):
(1) Normaliteit: waarden van afhankelijke variabele y zijn normaal verdeeld.
(2) Homoscedasticiteit: gelijke spreiding waarin standaardafwijking in elke
deelpopulatie hetzelfde is.
(3) Lineariteit: recht evenredig en gelijkvormig veranderen met de variatie van
een tweede grootheid (liefst zo sterk mogelijk verband tussen variabelen).
Voordelen (1) Variantie in Y te beschrijven/verklaren i.f.v. variantie in X.
(2) Y te voorspellen o.b.v. (nieuwe) waarden voor X.
(3) Relatieve impact van X op Y na te gaan.


VOORBEELDOEFENING DIE JE MOET KUNNEN MET DE HAND
→ ZIE FORMULARIUM VOOR FORMULES + STATISTISCH MODEL


Op basis van deze ANOVA-output willen we nagaan hoe goed we het wiskundecijfer kunnen
voorspellen aan de hand van de gekende IQ-score.

→ We gaan dus kijken of er een verband bestaat tussen wiskundecijfer en IQ.




B en Std. Error → nemen we op in de formule om het betrouwbaarheidsinterval te berekenen




Mean square, df’s en F-toets zelf kunnen berekenen


3

, SSM = 16,942 (wordt gegeven op het examen in SPSS-output)
SSE = 317,632 (wordt gegeven op het examen in SPSS-output)
SST = SSM + SSE
= 334,574



Hypothese

β1 = 0
β1 ≠ 0



F-toets berekenen (= MSM/MSE)

F(1, 113) = 16,942 / (317,)
= 6,027 → kijken in tabel E: p < 0,05
→ H0 verwerpen



R² (goodness-of-fit van het model) → hoe hoger, hoe beter

R² = 16,,574
= 0,051
➔ Het model verklaart slechts 5,10% van de variantie
➔ Geen goed model



Betrouwbaarheidsinterval berekenen (α = 95% → α = 0,05)

→ BI = 0,021 + (1,98 * 0,008) → α/2 (0,5/2 = 0,025) voor 113 (= DFE) opzoeken in t-tabel ➔ 1,984
= 0,021 - (1,98 * 0,008)
= [0,0052; 0,0368]



Standaard antwoord volgens APA-normen

Enkelvoudige lineaire regressie toonde aan dat er een significant positief lineair verband bestaat
tussen het wiskundecijfer en de IQ-score (β1 = 0,021, t(113) = 2,455, p < 0,05). De IQ-score verklaart
echter slechts een klein deel van de variantie in het wiskundecijfer (R² = 0,051, F(1,113) = 6,027,
p < 0,05).




4
$8.97
Accéder à l'intégralité du document:

Garantie de satisfaction à 100%
Disponible immédiatement après paiement
En ligne et en PDF
Tu n'es attaché à rien

Faites connaissance avec le vendeur

Seller avatar
Les scores de réputation sont basés sur le nombre de documents qu'un vendeur a vendus contre paiement ainsi que sur les avis qu'il a reçu pour ces documents. Il y a trois niveaux: Bronze, Argent et Or. Plus la réputation est bonne, plus vous pouvez faire confiance sur la qualité du travail des vendeurs.
sofie_vdz Vrije Universiteit Brussel
S'abonner Vous devez être connecté afin de suivre les étudiants ou les cours
Vendu
721
Membre depuis
8 année
Nombre de followers
485
Documents
0
Dernière vente
7 mois de cela

4.4

92 revues

5
45
4
38
3
8
2
1
1
0

Récemment consulté par vous

Pourquoi les étudiants choisissent Stuvia

Créé par d'autres étudiants, vérifié par les avis

Une qualité sur laquelle compter : rédigé par des étudiants qui ont réussi et évalué par d'autres qui ont utilisé ce document.

Le document ne convient pas ? Choisis un autre document

Aucun souci ! Tu peux sélectionner directement un autre document qui correspond mieux à ce que tu cherches.

Paye comme tu veux, apprends aussitôt

Aucun abonnement, aucun engagement. Paye selon tes habitudes par carte de crédit et télécharge ton document PDF instantanément.

Student with book image

“Acheté, téléchargé et réussi. C'est aussi simple que ça.”

Alisha Student

Foire aux questions