100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Inleiding Onderzoek: Statistical Methods for the Social Sciences - Hoofdstuk 2, 3, 4, 9.1, 9.2, 9.3 en 9.4 €4,49   In winkelwagen

Samenvatting

Samenvatting Inleiding Onderzoek: Statistical Methods for the Social Sciences - Hoofdstuk 2, 3, 4, 9.1, 9.2, 9.3 en 9.4

1 beoordeling
 39 keer bekeken  1 keer verkocht

In deze samenvatting worden de hoofdstukken 2, 3, 4, 9.1, 9.2, 9.3 en 9.4 uit het boek Statistical Methods for the Social Sciences van Alan Agresti uitgebreid beschreven. Dit is tentamenstof voor het vak Inleiding Onderzoek dat gegeven wordt aan de SPO en RUG. De samenvatting is geheel in het Neder...

[Meer zien]

Voorbeeld 4 van de 35  pagina's

  • Nee
  • Hoofdstuk 2, 3, 4, 9.1, 9.2, 9.3 en 9.4
  • 24 oktober 2023
  • 35
  • 2023/2024
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (29)

1  beoordeling

review-writer-avatar

Door: isavandamx • 2 weken geleden

avatar-seller
Shanna123
Samenvatting: Statistical Methods for the Social Sciences

Hoofdstuk 2 Steekproeftrekking en meting
Om sociale verschijnselen te analyseren met een statistische analyse, vatten beschrijvende
methoden (descriptive methods) de gegevens samen en gebruiken inferentiële methoden
(inferential methods) steekproefgegevens om voorspellingen te doen over populaties. Statistische
methoden helpen ons de factoren te bepalen die de variabiliteit tussen proefpersonen verklaren.

Een variabele = Een kenmerk waarvan de waarde kan variëren tussen personen in een steekproef of
populatie.
Elk kenmerk dat we voor elk onderwerp kunnen meten, wordt een variabele genoemd. De naam
geeft aan dat de waarden van het kenmerk variëren tussen onderwerpen. Voorbeelden van
variabelen zijn het inkomen, het aantal broers en zussen, of ze al dan niet in dienst zijn en geslacht.

De waarden die de variabele kan aannemen, vormen de meetschaal (measurement scale). Voor
geslacht bestaat de meetschaal bijvoorbeeld uit de twee labels (vrouwelijk, mannelijk). Voor het
aantal broers en zussen is dit (0, 1, 2, 3, 4, enzovoort).

De geldige statistische methoden voor een variabele zijn afhankelijk van de meetschaal. We
behandelen een numeriek gewaardeerde variabele (numerical-valued variable), zoals het
jaarinkomen, anders dan een variabele met een meetschaal die bestaat uit categorieën (scale
consisting of categories), zoals (ja, nee) voor de vraag of je werkt.

Kwantitatieve variabele = Een variabele met een meetschaal met numerieke waarden die
verschillende grootheden van de variabele vertegenwoordigen. Voorbeelden zijn het jaarinkomen,
het aantal broers en zussen, de leeftijd en het aantal voltooide jaren onderwijs.

Categorische/kwalitatieve variabele = Een variabele met een meetschaal die uit een reeks
categorieën bestaat. Voorbeelden zijn burgerlijke staat (alleenstaand, getrouw, gescheiden, weduwe),
provincie (Friesland, Groningen, Drenthe etc.), religieuze overtuiging (Christendom, islam, Joods etc.),
favoriete soort muziek (klassiek, country, jazz, rock etc.) en of er gebruik wordt gemaakt (ja, nee).

We maken onderscheid tussen kwantitatieve en categorische/kwalitatieve variabelen, omdat voor
elk type verschillende statistische modellen van toepassing zijn. Het gemiddelde is bijvoorbeeld een
statistische samenvatting van kwantitatieve variabelen, omdat het numerieke waarden gebruikt.

Van een kwantitatieve variabele wordt gezegd dat de numerieke waarden een intervalschaal (interval
scale) vormen, omdat ze een numerieke afstand of interval hebben tussen elk paar niveaus. Van het
jaarinkomen is het interval tussen €40.000 en €30.000 gelijk aan €10.000. We kunnen de uitkomsten
vergelijken in termen van hoeveel groter of hoeveel kleiner de ene is dan de andere.

Niveaus van nominale schalen zijn kwalitatief en variëren in kwaliteit, niet in kwantiteit.
Niveaus van intervalschalen zijn kwantitatief en variëren in grootte.

De positie van ordinale schalen in de kwantitatief-kwalitatieve classificatie is vaag. Omdat hun schaal
uit een reeks categorieën bestaat, worden ze vaak geanalyseerd met dezelfde methoden als nominale
schalen. Maar in veel opzichten lijken ordinale schalen meer op intervalschalen. Ze bezitten een
belangrijk kwantitatief kenmerk: elk niveau heeft een grotere of kleinere omvang dan een ander
niveau. Cursuscijfers (zoals A, B, C, D, E) zijn ordinaal. Maar we behandelen ze als interval wanneer we
getallen aan de cijfer toekennen (zoals 4, 3, 2, 1, 0) om een cijfergemiddelde te berekenen.

,Categorische/kwalitatieve variabelen hebben twee soorten schalen:
- Nominale schaal (nominal scale): De categorieën zijn ongeordend en de schaal heeft geen ‘hoog’ of
‘laag’ uiteinde. Voorbeelden zijn de primaire manier van vervoer (auto, bus, metro, fiets, lopen). Voor
een nominale variabele is geen enkele categorie groter of kleiner dan welke andere categorie dan
ook. Ze vertegenwoordigen dus GEEN grootheid.
- Ordinale schaal (ordinal scale): Deze type schaal valt in tussen nominaal en interval. Het bestaat uit
categorische schalen met een natuurlijke ordening van waarden. Voorbeelden zijn sociale klasse
(boven, midden, lager), overheidsuitgaven aan het milieu (te weinig, ongeveer goed, te veel) en de
frequentie van een activiteit (nooit, minder dan één keer per maand, ongeveer 1-3 keer per maand,
elke week, meer dan één keer per week). Deze schalen zijn NIET nominaal, omdat de categorieën
geordend zijn. Ze zijn GEEN interval, omdat er geen gedefinieerde afstand tussen niveaus is.

De schalen hebben betrekking op de daadwerkelijke meting en niet op de verschijnselen zelf.
Woonplaats kan een geografische plaatsnaam aangeven, zoals een provincie (nominaal), de afstand
van die plaats tot een punt op de wereldbol (interval), de grootte van de plaats (interval of ordinaal).

Een variabele is discreet als de mogelijke waarden ervan een reeks afzonderlijke getallen vorm, zoals
(0, 1, 2, 3, …). Discrete variabelen hebben een basismeeteenheid die niet kan worden onderverdeeld.
Een voorbeeld van discrete variabelen is het aantal broers of zussen, want je kunt de waarden
opsommen (0, 1, 2, 3, …)., maar je kunt niet 2.571 broers hebben.

Het is continu als het een oneindig continuüm van mogelijke reële getalswaarden kan aannemen.
Voor een continue variabele is er tussen twee mogelijke waarden altijd een andere mogelijke waarde.
Voorbeelden van continue variabelen zijn lengte, gewicht en hoeveelheid tijd. Ook leeftijd is een
continue variabele, want op een goed gedefinieerd punt in het jaar waarin je tussen de 21 en 22 jaar
oud bent, ben je 21,385 jaar oud. Het is onmogelijk om alle verschillende potentiële waarden op te
schrijven, omdat ze een interval van oneindig veel waarden vormen.

Categorische variabelen, nominaal of ordinaal, zijn discreet en hebben een eindige reeks
categorieën. Kwantitatieve variabelen kunnen discreet of continue zijn; de leeftijd is continu en het
aantal broers en zussen in concreet. Het onderscheid hierin is vaag, vanwege de manier waarop
variabelen daadwerkelijk worden gemeten. In de praktijk ronden we continue variabelen af bij het
meten ervan, zodat de meting feitelijk discreet is, dit is het geval bij leeftijd. Aan de andere kant
hebben sommige variabelen, ook al zijn ze discreet, een zeer groot mogelijke waarden, dit is het geval
bij het jaarinkomen.

Inferentiële statistische methoden maken gebruik van steekproefstatistieken om voorspellingen te
doen over de waarden van populatieparameters. De kwaliteit van de gevolgtrekkingen (inferences)
hangt af van hoe goed de steekproef de populatie vertegenwoordigt. Dit heet ook wel randomisatie
(randomization), het mechanisme voor het bereiken van een goede steekproefrepresentatie.

Een eenvoudige willekeurige steekproeftrekking (simple random sampling) van n proefpersonen uit
een populatie is een steekproef waarin elke mogelijke steekproef van die omvang dezelfde
waarschijnlijkheid (probability = kans) heeft om geselecteerd te worden. Als je bijvoorbeeld één
leerling uit een klas van 50 leerlingen wilt selecteren, kun je elk student een nummer geven van 1 tot
en met 60. Je kunt dan blindelings een nummer uit bijvoorbeeld een hoed kiezen. Maar dit is lastig
als de populatiegrootte groot is. Tegenwoordig kunnen we de steekproef eenvoudig selecteren met
behulp van een willekeurige getallengenerator met software.
Het is goed om willekeurige steekproeven (random sampling) te gebruiken, omdat iedereen dezelfde
kans heeft om in de steekproef te worden opgenomen, dit zorgt voor eerlijkheid.

,Om een willekeurige steekproef te kunnen selecteren, hebben we een lijst nodig van alle
onderwerpen uit de populatie. Deze lijst wordt het steekproefkader (sampling frame) genoemd. Stel
dat je van plan bent een steekproef te nemen van leerlingen op je school. De populatie bestaat uit
alle leerlingen van de school. Een mogelijke steekproefkader is de studentengids met alle namen.

De meest gebruikelijke methode voor het selecteren van een willekeurige steekproef is om (1) de
proefpersonen in het steekproefkader te nummeren, (2) op willekeurige wijze een reeks van deze
getallen te genereren en (3) een steekproef te nemen van de proefpersonen waarvan de getallen zijn
gegenereerd. Het gebruik van willekeurige getallen (random numbers) bij het selecteren van een
steekproef zorgt ervoor dat elk onderwerp een gelijke selectiekans heeft.

Willekeurige getallen (random numbers) zijn getallen die door de computer zijn gegenereerd volgens
een schema waarbij het even waarschijnlijk is dat elk cijfer een van de getallen 0, 1, 2 …. 9 is en niet
afhankelijk is van de andere gegenereerde cijfers.

Veel onderzoeken selecteren een steekproef van mensen uit een populatie en interviewen hen. Deze
methode van gegevensverzameling (method of data collection) wordt een steekproefenquête
(sample survey) genoemd. Het interview kan een persoonlijk gesprek, telefonisch interview of een
zelf in te vullen vragenlijst zijn.

In sommige onderzoeken zijn de gegevens het resultaat van een gepland experiment. Het doel van de
meeste experimenten is het vergelijken van de reacties van proefpersonen op een bepaalde
uitkomstmaat, onder verschillende omstandigheden. De voorwaarden zijn niveaus van een variabele
die de uitkomst kunnen beïnvloeden. De wetenschapper heeft de experimentele controle om
proefpersonen aan de voorwaarden toe te wijzen.

De omstandigheden in een experiment worden behandelingen (treatments) genoemd. De
behandelingen kunnen bijvoorbeeld bestaan uit verschillende medicijnen voor de behandeling van
een bepaalde ziekte. Om het experiment uit te voeren, heeft de onderzoeker een plan nodig voor het
toewijzen van proefpersonen aan de behandelingen. Deze plannen worden experimentele
ontwerpen (experimental designs) genoemd. Goede experimentele ontwerpen maken gebruik van
randomisatie om te bepalen welke behandeling een proefpersoon krijgt.

In sociaal onderzoek is het vaak niet haalbaar om experimenten uit te voeren. Het is meestal niet
mogelijk om onderwerpen willekeurig toe te wijzen aan de groepen die we willen vergelijken, zoals
geslacht, opleidingsniveau of jaarinkomen. Veel onderzoeken, zoals steekproefenquêtes, observeren
alleen de uitkomsten voor beschikbare proefpersonen op de variabelen, zonder enige experimentele
manipulatie van de proefpersonen. Dergelijke onderzoeken worden observationele onderzoeken
(observational studies) genoemd. De onderzoeker meet de reacties van proefpersonen op de
relevante variabelen, maar heeft geen experimentele controle over de proefpersonen.

Bij observationeel onderzoek is het vergelijken van groepen moeilijk omdat de groepen
onevenwichtig kunnen zijn op het gebied van variabelen die de uitkomst beïnvloeden. Sommige
sleutelvariabelen zijn dan mogelijk niet in gemeten. Zelfs als een onderzoek verstandig gebruik maakt
van randomisatie, zijn de resultaten van het onderzoek nog steeds afhankelijk van welke
proefpersonen worden bemonsterd. Twee onderzoekers die afzonderlijk willekeurige steekproeven
uit een bepaalde populatie selecteren, kunnen weinig of geen overlap hebben tussen de twee
steekproeflidmaatschappen. Daarom kunnen de resultaten op basis van deze analyse verschillen.

Het vaststellen van oorzaak en gevolg staat centraal in de wetenschap. Maar het is niet mogelijk om
oorzaak en gevolg definitief vast te stellen met een niet-experimenteel onderzoek.

, Om conclusies op basis van statistische gevolgtrekkingen de moeite waard te maken moeten we de
potentiële steekproeffout (sampling error) kennen: hoeveel de statistiek verschilt van de parameter
die deze met zich meebrengt, vanwege de manier waarop resultaten op natuurlijke wijze variatie
vertonen van monster tot monster. De steekproeffout van een statistiek is de fout die optreedt
wanneer we een statistiek op basis van een steekproef gebruiken om de waarde van een
populatieparameter te voorspellen. 58% min 56% = 2% In de praktijk is de steekproeffout onbekend,
omdat de waarden van populatieparameter onbekend zijn.

Willekeurige steekproeven beschermen tegen vertekening, in de zin dat de steekproeffout de neiging
heeft om rond de 0 te schommelen, soms positief en soms negatief. Willekeurige steekproeven
stellen ons ook in staat de waarschijnlijke omvang van de steekproeffout te voorspellen. Voor
steekproefomvang van ongeveer 1000 zullen we zien dat de steekproeffout gewoonlijk niet groter is
dan plus of min 3%. Deze grens is de foutmarge (margin of error). Variabiliteit treedt ook op in de
waarden van steekproefstatistieken bij niet-willekeurige steekproeven, maar de omvang van de
steekproeffout is niet voorspelbaar zoals bij willekeurige steekproeven.

Er zijn drie soorten bias. De eerste wordt sampling bias (steekproefvertekening) genoemd. Bij
eenvoudige willekeurige steekproeven heeft elke mogelijke steekproef van n proefpersonen dezelfde
selectiekans. Dit is een soort waarschijnlijkheidssteekproefmethode (probability sampling method),
wat betekent dat de waarschijnlijkheid dat een bepaalde steekproef zal worden geselecteerd bekend
is. Inferentiële statistische methoden gaan uit van waarschijnlijkheidssteekproeven. Niet-
waarschijnlijke steekproefmethoden (nonprobability sampling) zijn methoden waarbij het niet
mogelijk is de waarschijnlijkheid van de mogelijke steekproeven te bepalen. Gevolgtrekkingen met
behulp van dergelijke steekproeven hebben een onbekende betrouwbaarheid en resulteren in
steekproefvertekening (sampling bias).

De meest voorkomende niet-waarschijnlijke steekproefmethode is de vrijwillige steekproef
(volunteer sampling). Zoals de naam al aangeeft, bieden proefpersonen zich vrijwillig aan voor de
steekproef. Maar de steekproef vertegenwoordigt mogelijk een slechte representatie van de
populatie en levert misleidende conclusies op. Dit houdt in dat de één eerder reageert dan de ander.
Een grote steekproef helpt niet bij het nemen van vrijwillige steekproeven; de bias blijft bestaan.

De steekproefbias die inherent is aan de steekproeftrekking door vrijwilligers wordt ook wel
selectiebias (selection bias) genoemd. Het is problematisch om beleid en programma’s te evalueren
wanneer individuen kunnen kiezen of ze er wel of niet aan willen deelnemen. Helaas is vrijwillige
bemonstering soms onvermijdelijk, vooral bij medische onderzoeken.

Zelfs bij willekeurige steekproeven kan er sprake zijn van steekproefbias (sampling bias). Eén geval
doet zich voor wanneer het steekproefkader te kampen heeft met onderdekking (undercoverage):
het ontbreekt aan vertegenwoordiging van sommige groepen in de bevolking. Een telefonische
enquête zal geen gevangenen of daklozen bereiken, terwijl gezinnen met veel telefoons doorgaans
oververtegenwoordigd zullen zijn. De antwoorden van mensen die geen telefoon hebben, kunnen
vaak heel anders zijn dan de antwoorden die daadwerkelijk in de steekproef zijn opgenomen.

Bij een enquête kan de manier waarop een vraag wordt geformuleerd of gesteld een grote invloed
hebben op de resultaten. Slecht geformuleerde of verwarrende vragen resulteren in response bias.
Zelfs de volgorde waarin de vragen kunnen worden gesteld, kan de resultaten beïnvloeden.
In een interview kunnen kenmerken van de interviewer resulteren in response bias. Respondenten
kunnen liegen als ze denken dat hun overtuiging sociaal onaanvaardbaar is.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Shanna123. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €4,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 75759 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€4,49  1x  verkocht
  • (1)
  Kopen