Hoorcollege 1: Introductie
29 oktober 2024
Aantal variabelen:
- Univariaat: Wat is het gemiddelde cijfer voor OM3? → 1 variabele
- Bivariaat: Verschillen cijfers voor OM3 qua gender? → 2 variabelen
- Multivariaat: Is het cijfer voor OM3 afhankelijk van gender, motivatie van de student,
en geïnvesteerde studietijd? → meerdere variabelen
Beschrijvende en inferentiële statistiek:
- Descriptive statistics: vat verzamelde informatie samen (zoals bv het gemiddelde)
gaat meestal over de steekproef
- Inferential statistics: doet voorspellingen over de populatie op basis van de data uit
de steekproef, parameters benaderen, op basis van steekproefgemiddelde een
voorspelling doen
- Een parameter is een numerieke samenvatting van de populatie (bv
populatiegemiddelde)
- Populatieparameters worden genoteerd met Griekse letters
- μ voor het populatiegemiddelde en
- σ voor standaardafwijking in de populatie.
- Normale letters worden gebruikt voor de steekproef
- 𝒚 voor het steekproefgemiddelde en
- s voor standaardafwijking in de steekproef
Randomisatie:
Om inferenties te kunnen maken over de populatie willen we een representatieve steekproef
- We gebruiken hiervoor randomisatie: het willekeurig kiezen van
onderzoekseenheden (bij een survey mensen) uit een grotere groep om mee te doen
aan je onderzoek. Dit zorgt ervoor dat alle eenheden in de groep een gelijke kans
hebben om geselecteerd te worden
- Mits de steekproef (n) groot genoeg is, is dit een effectieve manier om tot een
representatieve steekproef te komen zonder bias
Steekproeffout (sampling error):
- De fout die we maken bij het voorspellen van de populatie parameter op basis van de
steekproef
- Steekproeffout is onvermijdelijk, je doet dus niet iets “fout” als onderzoeker
- Hoe groter de steekproef, hoe kleiner de steekproeffout → we weten niet hoeveel %
van de populatie op een partij stemt, middels een steekproef kunnen we deze
parameter schatten
,Wat kan er mis gaan?
Bias = vertekening (van je resultaten)
1. Selectie bias
- Een systematische fout die optreedt wanneer de wijze van steekproeftrekking ervoor
zorgt dat bepaalde groepen in de populatie over- of ondervertegenwoordigd zijn
- Bijvoorbeeld vrijwilligers bias: deelnemers melden zichzelf aan
- Bijvoorbeeld online survey op bepaalde platforms
- Het een grote n in zo’n geval? Nee
2. Response bias (bij survey onderzoek)
- Systematische fout die optreedt wanneer de antwoorden van de deelnemers, worden
beïnvloed door bepaalde factoren, waardoor de antwoorden niet de werkelijke
opvattingen, attitudes, of gedrag van de deelnemers weerspiegelen
- Door bepaalde culturele normen het moeilijk vinden om je geaardheid bv uit te
bespreken
- Sociale wenselijkheid bias
- Instemming bias: meegaan met de stelling, mensen zijn geneigd om in te stemmen
met een stelling
- Interviewer bias: interviewer (en wat hij/zij representeert) kan een bepaalde reactie
ontlokken en daardoor de resultaten beïnvloedt
- Voorbeeld: onderzoek naar genderidentiteit en seksuele geaardheid
3. Nonresponse bias
- Systematische fout die optreedt wanneer bepaalde individuen die voor een
onderzoek zijn geselecteerd, niet deelnemen of niet reageren. Als de
niet-respondenten sysrenatuscg verschillen van de respondenten, kan dit leiden tot
een vertekening van de onderzoeksresultaten
- Studentenevaluaties: wie vullen de enquêtes niet in?
- Peiling van de gemeente over nieuw plan: wie reageert er niet op de uitnodiging voor
de inspraakavond?
Variabelen, waarden en eenheid van analyse (unit of analysis)
- Eenheden van analyse: datgene waarover je informatie verzamelt en waar je een
uitspraak over wilt doen → individuen, bedrijven, landen, scholen (kan van allen zijn)
- Variabelen: gemeten kenmerken van een analyse eenheid
- De vragen in je vragenlijst worden bijv. variabelen
- Gender, leeftijd, mening stelling 1, mening stelling 2.
- Waarden (values): de specifieke scores van een analyse eenheid op een variabele
- ‘Vrouw’, ‘38’, ‘grotendeels mee oneens’, ‘volledig eens’
- Variabelen, waarden en eenheid van analyse (unit of analysis)
- Elke kolom vertegenwoordigt een variabele die is gemeten voor die analyse eenheid
(geslacht, leeftijd, inkomen etc)
- Elke rij vertegenwoordigt een afzonderlijke analyse eenheid (bv een respondent,
geval of observatie)
- Voor elke analyse eenheid (rij) en elke variabele (kolom) vind je de specifieke waarde
die die analyse eenheid heeft voor die variabele
,Meetniveaus: we moeten het meetniveau van de variabele weten om te bepalen welke
statistische techniek we moeten gebruiken
Nominaal:
- Categorieën zonder volgorde. Je kunt alleen onderscheid maken, niet ordenen
- voorbeeld: Welke religie heb je? 1 jodendom, 2 christendom etc
- Een nominale variabele met slechts 2 opties, noem je een binaire variabele
- Codering arbitrair maar nodig in SPSS, geen inherente ordening, 2 is niet meer dan 3
Ordinaal:
- Categorieën met een volgorde, maar zonder vaste afstanden tussen de categorieën,
maw verschil tussen 1 en 2 is niet hetzelfde als tussen 2 en 3
- Voorbeeld: Hoe vaak kijk je televisie per week? 1 nooit, 4 iedere dag
Interval: (scale)
- Numerieke waarden met gelijke afstanden tussen de punten, maar zonder een
absoluut nulpunt
- Betekenisvolle ordening (17 is meer dan 16), afstanden zijn gelijk, verschil tussen 14
en 16 is hetzelfde tussen 22 en 24
- Voorbeeld: Temperatuur in graden Celsius op een bepaalde dag
Ratio: (scale)
- Numerieke waarden met gelijke afstanden en een absoluut nulpunt
- Zelfde eigenschappen als interval (afstanden gelijk, natuurlijke ordening). Absoluut
betekenisvol nulpunt. Variabel is “afwezig” bij nul
- Voorbeeld: leeftijd van een persoon, maar bv ook gewicht
Meetniveaus:
- Meetniveaus staan veelal niet vast
- Vaak meerdere opties mogelijk
- Antwoordopties van een vraag bepalen bijvoorbeeld vaak het meetniveau van een
variabele
Ordinaal of interval?
- Soms niet altijd volledig duidelijk
- Soms behandelen onderzoekers een ordinale variabel als interval om bv alsnog een
gemiddelde te kunnen berekenen
- Dit gebeurt vooral bij ordinale schalen met minstens 7 categorieën
1 Zeer sterk mee oneens
7 Zeer sterk mee eens
Meetniveaus: discrete en continue variabelen
- Discreet: kan alleen specifieke, afzonderlijke waarden aannemen. Deze waarden
zijn vaak (maar niet altijd) gehele getallen. Er is geen mogelijkheid om
tussenliggende waarden te hebben tussen 2 opeenvolgende waarden
- Voorbeelden: het aantal kinderen in een gezin (geen 2,5) + het aantal autos
iin een parkeerplaats
, - Continue: kan elke waarde aannemen binnen een bepaald bereik. Dit betekent dat
er oneindig veel mogelijke waarden zijn tussen 2 verschillende waarden
- Voorbeelden: de lengte van een persoon + de tijd die iemand nodig heeft om
een taak te voltooien
- Nominale en ordinale variabelen zijn discreet
- Interval/ratio variabelen kunnen zowel discreet als continue zijn
- Leeftijd = continue
- Aantal broers en zussen = discreet
Validiteit en betrouwbaarheid:
Veel concepten in de sociale wteenschap zijn niet zo eenvoudig te meten (armoede, sociaal
kapitaal, democratie, discriminatie)
- Betrouwbaarheid verwijst naar de consistentie of herhaalbaarheid van een meting.
Een meting is betrouwbaar als je bij herhaling dezelfde resultaten krijgt onder
dezelfde omstandigheden. Het gaat erom dat de meting stabiel en voorspelbaar is
- Consistentie en herhaalbaarheid van de meting? Worden dezelfde artikelen
op dezelfde manier gecodeerd door verschillende codeurs?
- Validiteit in de sociale wetenschappen verwijst naar de mate waarin een test meet
wat het daadwerkelijk zou moeten meten
- Meet je wat je wilt meten?
- Veelvoorkomende problemen tav betrouwbaarheid
- Subjectiviteit onderzoeker
- Ambigue vragen
- Veelvoorkomende problemen tav validiteit:
- Pron;ematische vertaling van theoretisch construct naar operationalisatie
- Operationalisering dekt slechts beperkt aantal relevante aspecten van het
concept
- Note: de eerder genoemde response bias is ook een validiteitsprobleem,
specifiek in een survey/interview
- Onderzoek in de jaren 50 van Samuel Stouter naar politieke intolerantie:
- Vraag aan respondenten: Ben je bereid bepaalde burgerlijke vrijheden - zoals
de mogelijkheid om les te geven op een openbare school, vrij te zijn van het
aftappen van telefoons, en dergelijke - te verlenen aan communisten,
socialisten en atheïsten?
- Probleem: er wordt een aanname gedaan in de vraag
Meten = weten
- Voordat je een meting gebruikt, denk na
- Welk concept wil je meten? Hoe conceptualiseer je dit concept?
- Is de operationalisatie een goede vertaling van dit concept?
- Dekt het voldoende alle onderdelen/dimensies van het concept?
- Is de meting betrouwbaar?