Statistiek van de sociale wetenschappen
Data-analyse is de kunst en de wetenschap van het verzamelen, organiseren, presenteren,
analyseren en interpreteren van data met als doel inzicht verwerven op basis van deze data.
Les 2
Meten en meetniveaus
1. Probleem -> analyse
Onderzoeksvraag= het probleem dat we willen analyseren
• Probleemkenmerken die voorkomen bv politiek vertrouwen
- centrale vraag: welke factoren verklaren de variatie in dit kenmerk?
➔ Factoren voor verklaring: leeftijd, geslacht, diploma ouders
• Probleemrelatie
- Kijken naar samenhang van kenmerken bv. samenhang opleiding & etnocentrisme
- Centrale vraag: in welke maten kan het verband verklaard worden door andere
relevante kenmerken?
- Hoe komt dat verband tot stand
• Datareductie
- Veelheid aan indicatoren reduceren tot een achterliggend concept bv etnocentrisme
➔ Is niet zo maar te meten door maar 1 vraag te stellen
- Verschillende items bevragen ‘ben je akkoord of niet?’, wat hebben ze
gemeenschappelijk en is dat het achterliggend concept?
- 4 gelijkaardige statements met zelfde achterliggend concept, in welke maten eens
of oneens vb. nostalgie, antisemitisme
Analysetechnieken, afhankelijk van:
1) Onderzoeksvraag: probleem gaat bepalen welke analyse je toepast
2) type variabelen: gaat ook bepalen welke analyse je toepast bv. ja/nee vraag
3) Selectie van onderzoekseenheden: de manier waarop mensen geselecteerd worden bv
in verschillende scholen leerlingen clusteren
4) Aantal variabelen: andere technieken bij hoeveelheid kenmerken
Bv. 1 kenmerk vaccinatie: veel verschillende variabelen, verband tussen meerdere
kenmerken. 2. Verbanden, meerderen factoren: vaccinatiegraad (1 & 2 dit jaar)
➔ Tot inzicht komen
Valkuilen van data-analyse :
• zelfde gemiddelde, verschillende afmetingen. > anders afgebeeld dus andere grafiek,
- Basis v/h presenteren v/d resultaten is belangrijk.
- Op basis v/d zelfde gegevens maar toch andere interpretatie, lezers kunnen ander
verhaal interpreteren. (vb. burgemeester)
• Indirecte verbanden
- vb. drukke agenda-> overgewicht
, - Het kan ook zijn dat iem. Een drukke agenda heeft, daardoor onregelmatig en
ongezond eet en daardoor overgewicht krijgt. Geen direct maar indirect verband.
• Onjuist oorzakelijk verband: het ene kan het andere veroorzaken maar omgekeerd ook.
- Hoe meer connecties, hoe hoger loon <-> hoe hoger loon, succes en daardoor
meer connecties. Trek de juiste conclusies!
Verschil:
Indirect Verband: relatie valt weg wanneer we rekeninghouden met andere mechanisme.
Onjuist Oorzakelijk verband: het verband dat we vonden is niet in die richting te trekken, oorzakelijk
verband kan in andere richting
> kunnen ook samen gaan
factor: context v
datareductie
2. meten en meetniveaus
wat is meten
1) verdeling v/d populatie P in equivalentieklassen E
- Het maken van een deelverzameling van alle elementen die men gaat groeperen, omdat ze
op een bepaald kenmerk gelijkwaardig worden beschouwd.
2) kenmerken of ‘schalen’ v/d equivalentieklassen aan de hand v/e variabele
- waarde toekennen aan elke equivalentieklassen van opgeschaald kenmerk.
Verzameling eenheden-> ongeschaalde variabele -> geschaalde variabele
Bv woonplaats: equivalentieklassen onderscheden in provincie, daarna meetschaal toekennen.
meetschaal: provincies worden benoemd aan de hand van kwalitatieve categorie (letters).
kan ook met cijfers (code), dan spreken we van kwantitatieve waarden
Kwantitatieve vs kwalitatieve waarden
• liever met kwantitatieve waarden
- vlotter: 0/1 invullen is makkelijker
- geen fouten gemaakt worden, eenduidiger bv Antwerpen in verschillende talen of
score examens (spaties, % anders geschreven)
- meer mogelijkheden voor analysen: gegevens kunnen worden samengevat in
simpele mate.
Meten en meetschalen
Toekennen van getallen aan equivalentieklassen. Regels
• aan elke waarde van het ongeschaalde kenmerk wordt eigen, specifiek getal toegekend bv
elk provincie krijgt een specifiek getal
• De waarden die aan equivalentieklassen werden toegekend, weerspiegelen de relaties die in
realiteit bestaan tussen de equivalentieklassen, en enkel die relaties. Geval van woonplaats,
numerieke waarden doet er niet toe bij categorische waarden. Als we Antwerpen 1 of 2
geven doet dat er niet toe, het is arbitrair en heeft geen inhoudelijke betekenis.
• In tegenstelling tot opleidingsniveau: we gaan wel rekening houden met intrinsieke rangordening
van equivalentieklassen omdat die er hier wel toe doet, intrinsieke rangordening in
opleidingsniveau of inkomen hoog ten opzichten van laag.
,Eigenschappen van meetschalen
1. Ordenbaarheid:
• De variabele of meetschaal X is ordenbaar wanneer voor elk paar waarden men
kan besluiten dat 1 waarden groter/ kleiner is dan de andere waarden. Bv
onderwijs: hoger secundair diploma is lager dan hoge school diploma, leeftijd,
lengte, Likert schaal (niet akkoord > akkoord)
• geslacht, woonplaats: niet ordenbaar vrouw: 10, man: 200> geen ordenbaarheid
• merk op: de ordenbaarheid van de waarden weerspiegeld een bestaande
ordening tussen de equivalentieklassen van het bestuurde kenmerk.
2. Het bestaan v/e meeteenheid:
• Zelfde verschillen tussen de waarden van X weerspiegelen zelfde verschillen in de
intensiteit van het bestuurde kenmerk> variabele/ kenmerk heeft een meeteenheid.
• Slechts van toepassing op kwantitatieve variabelen
bv. Celsius of Fahrenheit, leeftijd, opleidingsniveau NIET
• Merk op: gekozen meeteenheid kan arbitrair zijn (C of F)
& de aanwezigheid van een 0 heeft geen bijzondere betekenis bij kenmerken met een
meeteenheid.
Ratios of verhoudingen zijn betekenisloos
bv 10 C=50 F & 20C = 68F > ratio 20/10 is niet gelijk aan ratio 68/50
3. Het bestaan v/e absoluut nulpunt
• Een absoluut nulpunt is een waarde (0) die de afwezigheid van het
bestuurde kenmerk weergeeft
bv lengte heeft absoluut nulpunt want dan is er geen lengte. 0%: geen punten.
bv. 0 = extreem links, dus 0 heeft een betekenis;
• Merk op: negatieve waarden komen niet voor in geval absoluut nulpunt bestaat
bv 0C staat niet voor afwezigheid van temp. Het heeft geen specifieke waarde. Bekijk
Voorbeeld dia’s.
& ratio’s of verhoudingen zijn bepaald
Meterniveau van variabelen
• Naargelang de eigenschappen van de meetschaal kunnen we vier meetniveaus van
variabelen onderscheiden worden: cruciaal, eerste stap van elke analyse.
1. Nominaal:
• classificeren in categorieën, benoemen.
bv. geslacht, nationaliteit, partijvoorkeur
• ordenbaarheid: Niet te interpreteren in termen van meer en minder / groter en kleiner.
> verschil in waarden is geen verschil in kwantiteit maar ik kwalitatief
• geen wiskundige bewerkingen mogelijk
• meetschaal is eindig, exhaustief en exclusief: Categorieën moeten alle mogelijkheden
bevatten, slechts maar één optie aanduiden.
• Codes: arbitrair: letters, cijfers, symbolen doet er niet toe bv. 1, 2, 3/ V, A, M
2. Ordinaal (1)
, • Meetschaal= Elementen van de meetschaal kunnen wel geordend worden
bv. opleiding (laag, hoog, midden), opinie over stelling (oneens,…, eens), volgen nieuws (nooit,
…, elke dag)
• Categorieën kunnen geïnterpreteerd worden in meer en minder / hoger en lager
MAAR geen vaste meeteenheid en verschillen niet in termen van een bepaalde hoeveelheid.
bv. het verschil in helemaal oneens en oneens ≠ oneens en noch eens noch oneens
• Geen wiskundige bewerkingen mogelijk, tenzij bewerkingen die gebruik maken van de ordening
• (2) codes zijn uitdrukkingen van een od-rdeningscriterium (best in
cijfers) bv. opleiding 1: laag, 2: midden 3: hoog; meetschaal (1,2,3)
3. Interval
• Meetschaal met een vaste, kwantificeerbare
meeteenheid bv. Temp, IQ
• Verschil tussen equivalentieklassen kan uitgedrukt worden in hoeveelheden, maar nulpunt is
arbitrair waardoor verhoudingen tussen waarden betekenisloos zijn (= geen absoluut
nulpunt betekenis)
• Wiskundige berekeningen zijn
mogelijk bv. gemiddeldes
• Codes zijn getallen met numerieke betekenis, zijn
meetresultaten bv. graden, IQ-punten
4. Ratio
➔ Ordenbaar & meeteenheid & nulpunt heeft betekenis
• Meetschaal met een vaste kwantificeerbare meeteenheid
Bv. inkomen, aantal kinderen in een gezin, aantal glazen alcohol per week, misdaadcijfers
• kan uitgedrukt worden in hoeveelheden, nulpunt is bepaald waardoor verhoudingen
waarden zinvol zijn
• Wiskundige bewerkingen zijn mogelijk
• Codes zijn getallen met numerieke betekenis, zijn meetresultaten
Noot over kwantitatieve gegevens
• Soms worden kwantitatieve variabelen gegroepeerd tot ordinale/nominale variabele
bv. ipv aantal jaren groeperen in leeftijdsgroepen 18- 30, 31-40, 41-50, 50plus
(ordinaal)
- Voordeel: visueel beter grafisch representeren
- Nadeel: verlies aan informatie
• Soms worden ordinale variabelen (die niet worden uitgedrukt in een bepaalde
meeteenheid) ook wel ‘quasi-interval’ variabelen beschouwd, indien ordinale meetschaal
breed genoeg is. bv. links-rechts meetschaal 0-10, 7-puntenschaal-> gemiddelde berekenen
(ze geven dat ook mee)
Hiërarchie van meetniveaus
Laag Nominale variabelen (classificatie op basis van
gelijkheid/ongelijkheid) Ordinale variabelen (+ ordening)
Interval variabelen (+ meeteenheid)
Hoog Ratio variabelen (+ betekenisvol
nulpunt)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ChimeneKlasen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.42. You're not tied to anything after your purchase.