multivariate data analyse karel neels sociologie schakel sociologie3eba
Written for
Vrije Universiteit Brussel (VUB)
Sociologie
Multivariate Data-analyse
All documents for this subject (1)
Seller
Follow
elisabethleys
Content preview
MULTIVARIATE DATA ANALYSE SAMENVATTING
Deel 1: Probleemstelling
1. Meten
1.1. Meetniveaus
- Nominaal: classificatie o.b.v. verschillen/gelijkenissen
- Ordinaal classificatie + ordening
- Interval: gelijke toename betekent verschil in intensiteit + geen absoluut nulpunt e.g. temp.
- Ratio: absoluut nulpunt e.g. leeftijd en lengte
1.2. Meten
= proces uit twee stappen
- Verdelen van een populatie P van observaties in equivalentieklassen Ek. Een equivalentieklasse is
een deelverzameling uit de populatie die alle observaties groepeert die voor het bestudeerde
kenmerk als gelijkwaardig of equivalent kunnen worden beschouwd.
- Schalen van de klassen aan de hand van een variabele. Aan elke klasse van het opgeschaalde
kenmerk wordt een eigen warde toegekend.
o Kwalitatieve waarden
o Kwantitatieve waarden
Eigen specifiek getal toekennen aan elke klasse (weerspiegelen de relaties die in
realiteit bestaan tussen de klassen
Kan intrinsieke waarde krijgen als de klassen ondenkbaar zijn, maar kan ook
geen intrinsieke waarde krijgen (hier kan je elke waarde aan de klasse geven)
1.3. Eigenschappen van meetschalen
1.3.1. Ordenbaar
- Waarde X1 is groter of kleiner dan X2 en de ordenbaarheid van de waarde kan ook effectief een
bestaande ordening weerspiegelen.
1.3.2. Het bestaan van een meeteenheid
- Een variabele X heeft een meeteenheid wanneer gelijke verschillen tussen de waarden van X,
een gelijk verschil in de intensiteit van het bestudeerde kenmerk weerspiegelen. Voorbeeld:
verschil secundair en hoger onderwijs is niet equivalent aan het verschil tussen waarde 3
(universiteit) en waarde 5(lager secundair onderwijs).
1.3.3. Het bestaan van een absoluut nulpunt
- De waarde nul is de afwezigheid van een kenmerk. Voorbeeld temperatuur heeft geen absoluut
nulpunt 0 graden is nog steeds een temperatuur.
,2. Variabelen
Kwantitatieve variabele: ratio of interval -> rechtstreeks gemeten (Continue)
Categorische variabele: nominaal of ordinaal -> rechtstreeks gemeten (dichotoom)
Polytome categorische variabele -> met 3 of meer categorieën die rechtstreeks gemeten
werden
Latente variabele: ratio of interval -> niet rechtstreeks gemeten e.g. complexe schalen o.b.v.
rechtstreeks gemeten items
2.1. Variabelen en samenhang
2.2.
Variabele en samenhang
, 3. Probleemstelling
3.1. Schijnbare causaliteit
= voorbeeld: inactiviteit en overgewicht. Er blijkt vaker overgewicht te zijn bij mensen die niet
beroepsactief zijn. Nuance: geen rekening gehouden met leeftijd en onderzoek toont dat BMI
toeneemt met leeftijd. Tweede nuance is dat de werkzaamheid lager ligt bij oudere mensen. De
schijnbare causaliteit kan veroorzaakt zijn door leeftijd.
- Oplossing 1: kruistabel opvragen en vergelijking maken tussen
o BMI en activiteit
o BMI, activiteit en afzonderlijke leeftijdsgroepen
- Oplossing 2: Regressietechniek (Multi variate)
3.2. Indirecte causaliteit
= verklaring van het causale verband tussen X en Y middels een derde variabele, de mediator
- Mediator voorwaarden
o X beïnvloedt M en M veroorzaakt Y
o M ligt causaal gezien tussen X en Y bv. In de tijd
- Voorbeeld: negatieve samenhang tussen ouderschap en tevredenheid seksleven
o Minder tijd door kinderen -> lagere frequentie
o Frequentie kan bepalend zijn voor tevredenheid
- Data-analyse
o Kruistabel: tussen ouderschap en tevredenheid (zonder controle voor freq) vergelijken
met kruistabel voor vergelijkbare frequentie
o Lineaire regressie
3.3. Suppressieve van samenhang
= Er is geen (bivariaat) statistisch verband en dus wordt er ten onrechte gesteld dat er ook geen
oorzakelijk verband is.
- Voorbeeld: geslacht en subjectief evenwicht tussen werk en privéleven. Vrouwen werken minder
uren (+ voor evenwicht), maar spenderen meer tijd aan opvoeden (- voor evenwicht). Bij
eenzelfde aantal gewerkte uren, rapporteren vrouwen minder evenwicht.
- Statistische samenhang komt pas aan het licht na controle van derde variabele
3.4. Interactieve structuur
= het verband tussen twee variabelen varieert door een derde variabele
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller elisabethleys. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.89. You're not tied to anything after your purchase.