Samenvatting

Samenvatting/Lesnotities Kwantitatieve Data-analyse (prof: Cecil Meeusen)

3 keer verkocht

Vak
Kwantitatieve Data-analyse

Instelling
Katholieke Universiteit Leuven (KU Leuven)

Dit document omvat de (uitgebreide) samenvatting van al mijn lesnotities, spss-voorbeelden, ppt's, etc. Met het blokken van enkel deze samenvatting heb ik zelf 16/20 behaald.

[Meer zien]

Voorbeeld 4 van de 94 pagina's

Bekijk voorbeeld

Geupload op 20 februari 2023
Aantal pagina's 94
Geschreven in 2022/2023
Type Samenvatting

Volgen

manouswinnen Lid sinds 1 jaar 54 documenten verkocht

€6,99

In winkelwagen

Op verlanglijstje

100% tevredenheidsgarantie
Direct beschikbaar na betaling
Zowel online als in PDF
Je zit nergens aan vast

KWANTITATIEVE DATA-‐ANALYSE

1. INLEIDING + HERHALING BASISCONCEPTEN
INLEIDING
VOORKENNIS
-‐ Univariate statistieken (bv. gemiddelde, standaarddeviatie)
-‐ Bivariate statistieken, samenhang (bv. correlatie, chi-‐kwadraat) -‐ Inductieve statistiek (bv. hypothesetesten)
-‐ Analyse van de afhankelijkheid (bv. regressie analyse)
-‐ Datareductie (bv. exploratieve factor analyse)
-‐ Mediatie & moderatie
-‐ Confirmatorische factor analyse & structurele modellen

INHOUD
1. Nieuwe statistische methode
a. Categorische data: kruistabel, logistische regressie, multinomiale logistische regressie
b. Geclusterde data: multilevel analyse
2. Statistische software: SPSS
3. Vaardigheden
a. Analyseren ruwe data
b. Interpreteren van statistische modellen
c. Rapporteren van resultaten
d. Selecteren van juiste/meest geschikte methode om vraag te beantwoorden

AFHANKELIJKE (Y) VARIABELE IS CONTINU
Meervoudige lineaire regressie = gaat na wat het effect is van OV’s op AV (y). Effect van X op Y (zonder extreme
causaliteit te definiëren). We spreken ook over ‘onder controle van’.

Mediatie: het verband tussen x en y wordt verklaard door z. Het effect van X op Y proberen verklaren aan de hand van
mechanisme. Er zijn tussenliggende mechanisme waarom x gerelateerd is aan y.

Moderatie: verband/effect tussen x en y hangt af van z. Voorbeeld: voor hoog opgeleide is er wel een effect, voor laag
opgeleiden niet. Het bepaalt de sterkte.

Factoranalyse = data-‐reductie: verschillende items samentrekken/reduceren tot één latente variabele/factor.

Structural equation model (SEM) = combi van factor analyse en mediatie modellen.

AFHANKELIJKE (Y) VARIABELE IS CATEGORISCH
Logistische regressie: regressie waarbij AV een categorische variabele is met twee categorieën (dichotoom) (machine
learning)

Multinomiale logistische regressie: regressie waarbij AV een categorische variabele is met meerdere categorieën

ANDER
Multilevel analyse: AV is continu. Je wilt het vergelijken tussen bv. verschillenden landen. Tweede niveau eraan
toevoegen. Gegevens van verschillende niveaus worden in één databestand gezet zodat de gegevens tegelijkertijd in
een analyse kunnen worden opgenomen.

BASISCONCEPTEN
MEETNIVEAU
1. Nominaal: kan je niet ordenen. Classificeren in categorieën. Voorbeeld: gender
2. Ordinaal: categorieën kunnen geïnterpreteerd worden in meer en minder / hoger en lager… MAAR: geen vaste
meeteenheid, verschillen niet in termen van een bepaalde hoeveelheid. Voorbeeld: opleidingsniveau
3. Metrisch: vaste, kwantificeerbare meeteenheid
a. Discreet: geen tussenwaarden tussen categorieën. Voorbeeld: leeftijd
b. Continu: kan alle waarden aannemen en elke waarde zal waarschijnlijk maar 1x waargenomen
worden.
c. Quasi-‐metrisch

à Hiërarchie van meetniveaus: methode waarmee je gaat werken, hangt af van het meetniveau!

1

,à Antwoordschaal altijd interpreteren o.b.v. vraagstelling!! (zie voorbeeld oefening ppt à laatste is nominaal, niet
ordinaal, omdat het een kennisvraag is. Het maakt niet uit welk antwoord je eerst zet, het is niet echt een ordening)

A. CENTRUMMATEN
Centrummaat = Maten om centraliteit van verdeling weer te geven
a. Modus = grootste categorie (categorie die het meest voorkomt)
b. Mediaan = opdelen in twee gelijke delen (aan de ene kant 50% van gegevens en ook aan de andere
kant)
c. Gemiddelde
d. Getrimd gemiddelde = gemiddelde
zonder uitschieters (omdat gemiddelde
zeer afhankelijk is van die uitschieters)
e. Uitschieters = extreme waarden, die niet
hetzelfde patroon volgen als de andere
waarden (kan betekenis hebben OF
meetfout)

B. SPREIDINGSKENMERKEN
a. Interkwartielafstand = verschil tussen het derde en eerste kwartiel = de vijftig procent middelste
gegevens rond de mediaan
b. Bereik = Verschil tussen grootste en kleinste waarden
c. Standaarddeviatie / variantie = Uitdrukking van spreiding rond het gemiddelde

Formule variantie=je gaat voor elk gegeven kijken
wat de deviatiescore is van dat punt, dus kijken
hoeveel de score afwijkt van het gemiddelde (van
elke score het gemiddelde aftrekken). Dat verschil
wordt gekwadrateerd omdat 1) we willen werken
met positieve getallen aangezien je wilt gaan
sommeren en dat is niet mogelijk met – en +
getallen want dan krijg je nul (som van
deviatiescores is altijd nul) en 2) grote verschillen
zullen een groter gewicht krijgen om mee te tellen
in de berekening van de spreiding. Die afstanden ga je sommeren om te kijken hoeveel afwijking je hebt t.o.v. het
gemiddelde. dit deel je door n-‐1 (of n, afhankelijk van of je werkt met populatie of steekproefdata).

2

,à Verschil standaarddeviatie en variantie: standaard-‐afwijking is de vierkantswortel
van de variantie.
à grote SD = grote spreiding = respondenten gaven heel verschillende antwoorden.

Boxplot: gaat visueel weergeven hoe de verdeling van de variabele eruit ziet

C. STANDAARDISEREN
Standaardiseren = wie wijkt relatief gezien het meeste af? Wie het minste?
à Transformatie uitvoeren op onze oorspronkelijke waarde om dat te kunnen
uitdrukken in standaardafwijkingen bv.
Formule:

à Z-‐transformatie: van elke waarde het gemiddelde aftrekken en delen door de SD.
à interpretatie: de respondent wijkt … SD af van het gemiddelde. Zo kan je in één oogopslag concluderen welke
respondent er (minder) fel afwijkt van het gemiddelde.

BELANGRIJK: coderen van missende waarden! Niet vergeten!

D. NORMALE VERDELING
Typisch aan een normale verdeling is dat 68 % van de gegevens
zich bevindt binnen het [gemiddelde – SD; gemiddelde + SD].
95% van de gegevens ligt op het [gemiddelde – 1.96 SD;
gemiddelde + 1.96 SD].
à Er kunnen dus gebieden worden afgebakend die een bepaald
percentage van de respondenten bevat. Voorbeeld: iemand
met een score lager dan 70 of hoger dan 110 is uitzonderlijk. Er
is in totaal maar 5% (2x 2.5%) die dit zouden scoren.

E. STANDAARD NORMALE VERDELING

Standaard normale verdeling = Dichtheidsfunctie van de normale verdeling, maar dan met gestandaardiseerde scores.
We gaan van een normale verdeling naar een standaard normale verdeling door alle geobserveerde waarden te gaan
standaardiseren. Als we die dan plotten, krijgen we deze verdeling. Gemiddelde is steeds 0 en SD 1. Je proporties kan
je uitdrukken in 1 en -‐1 SD bevindt zich 68% van de observaties etc.

3

, INDUCTIEVE STATISTIEK
DOEL
Inductieve statistiek = Van steekproef naar
populatie gaan. Wat zegt die steekproef en
gemiddelde ons over die populatie? We willen
bepaalde kansenuitspraken doen over de
populatie.
à Onzekere factor in kaart brengen: hoe
zeker ben ik van mijn steekproef? Hoe
nauwkeurig is die of hoe ver wijkt die af?

We gaan altijd fouten maken wanneer we dat
doen. De perfecte steekproef bestaat niet (=foutenmarge). Een steekproef is altijd maar een stukje uit de populatie
dus nooit de perfecte weerspiegeling.

Wet van grote aantallen = hoe groter n, hoe dichter het steekproefgemiddelde bij het populatiegemiddelde zal liggen.

HYPOTHESETEST: LOGICA
1. Formuleren van nul-‐ en alternatieve hypothese
o Kan je hetgeen je vindt zomaar veralgemenen naar de populatie?
o Nul-‐ en alternatieve hypothese voor verschil, relatie en effect
o Achter elke p-‐waarde zit een nulhypothese (prof vraagt op examen graag naar wat de nulhypothese is)
o Voorbeelden:
T-‐test: verschil in gemiddelde tussen twee groepen
• H0: Mannen en vrouwen verschillen niet in hun houding tegenover werklozen (μman
= μvrouw)
• Ha: Mannen en vrouwen verschillen in hun houding tegenover werklozen (μman ≠
μvrouw)
Correlatie
• H0: Er is geen correlatie (samenhang) tussen leeftijd en houding tegenover
werklozen (r = 0)
• Ha: Er is een negatieve correlatie (samenhang) tussen leeftijd en houding tegenover
werklozen (r < 0)
Effect
• H0: Opleiding geeft geen effect op houding tegenover werklozen (β = 0)
• Ha: Opleiding heeft een positief effect op houding tegenover werklozen (β > 0)
2. Bepalen van kritieke gebied en significantieniveau
o Hoe aannemelijk is de nulhypothese?
o Wat voor steekproefstatistiek zouden we moeten bekomen, indien de nulhypothese klopt?

3. Bereken steekproefstatistieken, gegeven de nulhypothese en testwaarden bepalen
o Nulhypothese is opgesteld (stap 1)
o Significantie niveau is bepaald (stap 2)
o Nu: steekproef trekken om nulhypothese te evalueren
§ Berekenen steekproefstatistiek (gemiddelde, correlatie, regressie coëfficiënt...)
o Indien nulhypothese klopt, hoe uitzonderlijk is ons steekproefresultaat dan? Voorbeeld: Hoe extreem
is het gevonden steekproefgemiddelde, gegeven het vooropgestelde populatiegemiddelde?

4

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper manouswinnen. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 62774 samenvattingen verkocht

Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen

Start met verkopen

Populaire universiteiten

Populaire hogescholen

Populaire studieboeken voor Communicatie en Taal

Populaire studieboeken voor Economie en Bedrijf

Populaire studieboeken voor Exact en Informatica

Populaire studieboeken voor Gedrag en Maatschappij

Populaire studieboeken voor Gezondheid en Geneeskunde

Populaire studieboeken voor Recht en Bestuur

Verkoper