Inleiding onderzoek
Syllabus
1. Meten
1.1 Inleiding
Verhoudingen tussen getallen veranderen niet als alle getallen met een constante vermenigvuldigd
worden, zodat ook in inches uitgedrukt de lengte van de lange stok nog steeds twee keer zo groot is
als de lengte van een korte stok.
Iemand die een aantal stokken ziet, kan niet met het blote oog bepalen hoe lang ze zijn. Wel kan hij
verhoudingen tussen de lengtes van stokken observeren -> empirische waarneming die los staat van
weke meeteenheid of welk meetinstrument dan ook.
Bij lengtemeting is informatie met betrekking tot verhoudingen tussen de lengtes van objecten in de
meting verankerd, niet de informatie met betrekking tot de lengtes zelf. Om die te verankeren moet
er een meeteenheid gekozen worden, bijv. meter.
Bij metingen in de sociale wetenschappen is het met het blote oog zelden te bepalen hoe personen
zich met betrekking tot een bepaalde eigenschap (intelligentie) tot elkaar verhouden.
Verschil intelligentietest en meetlat: de getallen die de intelligentietest als scores op de variabele
intelligentie oplevert, kan niet worden nagegaan welke algebraïsche operaties een pendant in de
empirie hebben, omdat we geen rechtstreekse waarneming van intelligentie hebben.
Binnen de sociale wetenschappen bestaan verschillende methodes om de scores van personen op
een variabele te bepalen.
Kwantitatieve variabelen: de meting levert voor iedere persoon als score een getal op.
Kwalitatieve variabelen: het resultaat van de meetprocedure is in eerste instantie een label
verwijzend naar een categorie van de variabele (haarkleur). Veelal worden deze labels vervangen
door getallen, hetgeen makkelijker is bij de verdere verwerking van de gegevens.
1.2 Meetniveaus
Metingen in de sociale wetenschappen zijn meestal metingen van abstracte begrippen (intelligentie).
Het meetinstrument (intelligentietest) levert getallen, oftewel scores -> scores verwijzen naar de
waarden die de personen op de abstracte variabele hebben. Afhankelijk van de vraag welke
getalsinformatie van de scores, in hun rol van verwijzer naar de waarden op de abstracte variabele,
we serieus nemen, onderscheiden we zogenaamde meetniveaus. Er worden vier meetniveaus
onderscheiden:
- Nominale niveau: wanneer we de scores bij een meting opvatten als labels, en de
getalsinformatie in de labels op geen enkele manier gebruiken (haarkleur).
- Ordinale niveau: wanneer we de scores bij een meting opvatten als geordende labels, en de
getalsinformatie in de labels niet anders gebruiken dan voor die ordening (meting van
zinvolheid van colleges met behulp van driepuntschaal).
- Intervalniveau: men is bereid om (onder meer) aan te nemen dat gelijke verschillen tussen
scores ook inhoudelijk gelijke verschillen impliceren (reactietijd).
- Rationiveau: men is bereid om (onder meer) aan te nemen dat gelijke verschillen tussen
scores ook inhoudelijk gelijke verschillen impliceren (reactietijd).
Hoewel er theoretisch een essentieel verschil is tussen interval niveau en ratio niveau, blijkt ten
eerste dat men in de praktijk vaak moeilijk kan kiezen of men de scores op ratio of internval niveau
wil behandelen, en ten tweede dat het voor analyse van de gegevens in de praktijk zelden uitmaakt
, of men de variabele nu op ratio of interval niveau behandelt: de meeste (en zeker de meest
gangbare) statistische technieken zijn voor beide niveaus even goed (of slecht) bruikbaar.
De meting heeft niet zelf een meetniveau, maar de onderzoeker kiest om de meting te behandelen
op een bepaald meetniveau.
2. Schatten met onzekerheid
2.1 Inleiding
Wanneer we in de sociale wetenschappen gegevens verzamelen doen we dit vaak bij een steekproef
van mensen. De gegevens die we zo krijgen zullen altijd afhangen van welke personen er nu toevallig
in de steekproef zitten.
2.2 Fictieve situatie: hele populatie bekend
Lees voorbeeld syllabus
2.3 Realistischer situatie: we kennen populatie niet, maar kunnen wel meerdere steekproeven
er uit trekken
We moeten niet denken dat we in staat zullen zijn om te bepalen wat precies het middelde in de hele
populatie is, maar het zou al aardig zijn als we een idee kunnen krijgen over hoe groot het
gemiddelde biergebruik in de populatie ongeveer zal zijn, en welke onzekerheidsmarges we daarbij
zouden moeten aanhouden.
Lees voorbeeld syllabus
2.4 Praktijk: we hebben alleen deze ene steekproef
Als we niets over de populatie weten, maar wel weten hoe sterk verschillende steekproeven uit de
populatie kunnen verschillen, dan weten we in elk geval iets over de mate waarin
steekproefgemiddelden kunnen fluctueren, en dus over hoe ver het steekproefgemiddelde
(waarschijnlijk) maximaal afligt van het populatiegemiddelde.
Als we geen nieuwe steekproef kunnen trekken, wordt het moeilijker om wat te zeggen over de mate
waarin steekproefgemiddelden kunnen fluctueren, maar het is niet onmogelijk:
- Een eerste aanzet daartoe kan gegeven worden door in plaats van een nieuwe steekproef te
trekken, de huidige steekproef van 50 studenten in tweeën te knippen.
Wanneer de scores in je steekproef sterk verschillen, dan zul je inschatten dat de gemiddelden van
verschillende willekeurige steekproeven uit die populatie sterker zullen verschillen dan wanneer de
scores in je steekproef weinig verschillen. Met behulp van statistische theorie kunnen we nog een
stap verder gaan, want dan kunnen we zelfs inschatten hoeveel die gemiddelden variëren.
Hoe kunnen we met behulp van onze steekproef een schatting maken van het gemiddelde in de
populatie, en hoe kunnen we aangeven wat de onzekerheidsmarges rond die schatting zijn? De kern-
redenatie in de statistiek is nu dat, als 90% van de steekproefgemiddelden hooguit 0.2 0.2 van het van het
populatiegemiddelde afliggen, dan dus het populatiegemiddelde in 90% van de keren dat je een
steekproef trekt niet meer dan 0.20.2 van het van het steekproefgemiddelde af zal liggen. Oftewel, nu we een
steekproefgemiddelde van 8.98 hebben gevonden, durven we met 90% zekerheid te stellen dat het
populatiegemiddelde tussen 8.98 0.2 = 8.78 en 8.98 + 0.2 = 9.18 zal liggen. Zo’n interval dat aangeeft
waar de populatiewaarde met 90% zekerheid zou moeten liggen heet een ‘’90%
betrouwbaarheidsinterval’’.