Statistical methods for the social sciences
H2: Sampling and measurement
Bij het verzamelen van gegevens moeten we beslissen welke
proefpersonen we willen sampelen (individuen, families, scholen, steden,
ziekenhuizen, registraties van gemelde misdaden). We moeten beslissen
wat we willen meten en hoe. Het moet valide en betrouwbaar zijn.
Statistische methoden helpen ons de factoren te bepalen die de
variabiliteit tussen onderwerpen verklaren.
Elke karakteristiek die we voor elk subject kunnen meten, wordt een
variabele genoemd (inkomen, aantal broers en zussen, of iemand
werkzaam is, geslacht). Manieren om variabelen te classificeren:
- Categorieën of getallen;
- Het aantal niveaus in die schaal.
Kwantitatieve variabelen en categorische variabelen
- Kwantitatieve variabele: wanneer de meetschaal numerieke
waarden (cijfers) heeft (inkomen, het aantal broers en zussen,
leeftijd). Dit is vaak interval want we kunnen uitkomsten vergelijken
in termen van hoeveel groter of hoeveel kleiner de ene is dan de
andere.
Een scatterplot toont de responsvariabele op de y-as en de
verklarende variabele op de x-as (H3)
- Categorische variabel: wanneer de meetschaal een reeks
categorieën is, met verschil in kwaliteit. Bijv. burgerlijke staat
(alleenstaand, getrouwd, gescheiden, weduwe), werkzaam (ja, nee)
of favoriete muzieksoort (klassiek, country, folk, jazz, rock). Vaak
kwalitatief, norminaal en ordinaal.
Een contingentietabel toont het aantal observaties bij de
combinaties van mogelijke uitkomsten voor de 2 variabelen.
Nominale, ordinale en intervalschaal van meetschaal
Nominaal: Wanneer we de scores bij een meting opvatten als labels. Bijv.
meting van haarkleur, waarbij we de scores 1, 2 en 3 gebruiken als labels
voor rood/bruin/zwart.
Ordinaal: Wanneer we de scores bij een meting opvatten als geordende
labels. Bijv. een meting van het nut van colleges met behulp van de
categorieën 1, 2 en 3 die staan voor zeer zinvol, zinvol en zinloos.
Wanneer men wel bereid is om op scores rekenkundige bewerkingen uit te
voeren, vat men de scores kwantitatief op > Het interval en ratio.
Ratio heeft een nulpunt; je kan niet lager dan 0. Bijv. leeftijd, lengte of
gewicht. Bij ratio mag je vermenigvuldigen, zodat je iets kan zeggen over
de verhouding (A is 2x zo groot als B). Dat kan niet bij variabelen die geen
absoluut nulpunt hebben (interval).
Categorische variabelen (bevatten categorie):