Wat is het verschil tussen beschrijvende (‘descriptive’) en inferentiële (of toetsende)
statistiek?
Bij beschrijvende statistiek is het doel samenvatten, organiseren of gegevens
vereenvoudigen en bij inferentiële statistiek is het doel om een generalisatie te maken over
een hele populatie aan de hand van een steekproef.
Gravetter & Wallnau hebben het in hoofdstuk 1 over de sampling error (of: meetfout). Wat
beschrijft deze sampling error precies en waardoor onstaat deze? Kun je redenen bedenken
waarom deze sampling error bij sommige getrokken steekproeven wellicht groter uitvalt dan
bij andere?
Een steekproef is niet altijd perfect nauwkeurig voor de gehele populatie waardoor een
discreptantie ontstaat tussen de steekproefstatisstieken de overeenkomstige
populatieparameter. Dit wordt een sampling error genoemd. Dit kan bij de ene steekproef
groter zijn dan bij de andere, door het verschil in grootte van de steekproef en de grootte van
de populatie. De inherente ruis tussen de steekproef en de populatie. Het verschil tussen de
steekproef en de populatie.
Steekproef moet altijd aselect zijn
Wat is een ‘variabele’ precies, en wat is het verschil tussen een onafhankelijke
(‘independent’) en een afhankelijke (‘dependent’) variabele? Geef een (B&O-gerelateerd)
voorbeeld van beiden.
Een variabele is een eigenschap of voorwaarde die kan veranderen of andere waarden kan
hebben. Een onafhankelijke variabele kan door een onderzoeker gemanipuleerd worden. De
afhankelijke variabelen is degene die wordt waargenomen en wordt gemeten.
De standpunten van een politieke partij is de onafhankelijke variabele en het aantal
stemmen die de partij krijgt is een afhankelijke variabele
Wat zijn meetniveaus (‘scales of measurement’ in G&W) en waarom is het belangrijk het
juiste meetniveau (van een variabele) te definiëren?
- Een nominale schaal bestaat uit een reeks categorieën die verschillende namen
hebben. Metingen op een nominale schaal labelen en waarnemingen categoriseren,
maar doen er geen kwantitatief onderscheid tussen waarnemingen. (bv geslacht)
- Een ordinale schaal bestaat uit een reeks categorieën die geordend zijn in een
georganiseerde reeks. Metingen op een ordinale schaal rangschikken waarnemingen
in termen van grootte (bv opleidingsniveau, kledingmaat, functieniveaus) -> geen
gemiddelde berekenen
- Een intervalschaal bestaat uit geordende categorieën die allemaal intervallen zijn van
precies dezelfde maat. Gelijke verschillen tussen getallen op schaal weerspiegelen
gelijke verschillen in grootte. Het nulpunt op een intervalschaal is echter willekeurig
en niet geef een nulwaarde aan van de variabele die wordt gemeten. (geen absoluut
nulpunt). (bv temperatuur)
, - Een ratioschaal is een intervalschaal met als extra eigenschap een absoluut nulpunt
punt (waarin iets niet aanwezig is). Met een verhoudingsschaal geven verhoudingen
van getallen verhoudingen van grootte weer. (bv aantal keer dat je op vakantie bent
gekomen)
Het onderscheid tussen de schalen is belangrijk omdat ze de beperkingen van bepaalde
soorten metingen identificeren en omdat ze er zeker van zijn dat statistische procedures
geschikt zijn voor scores die op sommige schalen zijn gemeten maar niet op anderen.
Geef voor elk van de volgende voorbeelden aan op welk niveau gemeten wordt en motiveer
je antwoord in een of twee zinnen.
- In het nationaal kiezersonderzoek 2021 werd aan kiezers gevraagd: ‘Op welke partij
heeft u uw stem uitgebracht?’.
Op nominale schaal, want partijen zijn categorien die verschillende namen hebben en dat
zijn de variabelen in deze vraag. Geen inherente ordening
- Gerrit Hiemstra presenteerde in het acht uur journaal een grafiek waaruit blijkt dat de
gemiddelde temperatuur de afgelopen decennia elk jaar is gestegen.
Op intervalschaal, want het zijn allemaal intervallen met dezelfde maat en er is geen
nulpunt, want bij nul is er nog steeds een temperatuur
- Het TNS NIPO vroeg duizend gezinnen hoeveel huisdieren zij bezitten.
Op ratio-niveau, want het aantal huisdieren is gemeten in termen van grootte. Er is een
absoluut nulpunt, want als je nul huisdieren hebt is er een afwezigheid.
- Een grootschalige survey onder gemeenteraadsleden vraagt naar hun
opleidingsniveau.
Ordinaal, op niveau
- Het aantal stemmers bij de gemeenteraadsverkiezingen per gemeente in 2018.
Op rationale schaal schaal, want het aantal stemmers is in termen van grootte van het
aantal stemmers. Afstanden zijn gelijk en absoluut nulpunt
- Een survey die uitvraagt welke religie respondenten hebben.
Op nominale schaal, want religies zijn categorie met verschillende namen en dat zijn de
variabelen in deze vraag.
Statistiek werkt met letters van het Nederlandse en Griekse alfabet. Zo zijn er verschillen in
symbolen voor parameters (in een populatie) en statistieken (in een steekproef). Vooral
volgende week gaan we dit terugzien als we het hebben over maten van centraliteit en
spreiding. Voor nu: wat is het symbool voor de volgende waarden?
Grootte (voor populatie en steekproef): populatie N en steekproef n
Sommeringsteken: sigma s, griekse letter sigma Σ
Scores van een variabele: X, bij een tweede variabele Y
De som van ruwe scores:
Gemiddelde van de steekproef: ΣX : n = het gemiddelde (M)
Frequenties kunnen worden weergegeven middels een tabel of grafiek. Het meetniveau van
een variabele bepaalt hierbij hoe de data het best kunnen worden gevisualiseerd. Geef aan
hoe jij de volgende variabelen zou visualiseren en waarom.
Opleidingsniveau van ambtenaren: ordinaal meetniveau -> staafdiagram
Inkomen van huishoudens: ratio meetniveau -> histogram
Lidmaatschap politieke partij (welke): -> staafdiagram
, Scores op het toelatingsexamen voor een vaste baan bij de EU (‘concours’): ratio
meetniveau/interval ratio -> histogram/frequentiepolygoon
Wat betekent het als een verdeling asymmetrisch of scheef is? Kun je een voorbeeld
bedenken van een variabele waarvan jij denkt dat deze een scheve verdeling heeft?
Bij een scheve verdeling zijn bepaalde scores heel veel behaald en bepaalde scores heel
weinig behaald. Bijvoorbeeld hoe lang mensen bij een organisatie werken. Hoe korter
mensen ergens werken, hoe hoger de score.
Wat zijn drie manieren om een “grafieklezer” te misleiden? Zoek bij elke manier een
voorbeeld (NB. Deze vraag refereert aan twee webartikelen over misleidende grafieken
voorgeschreven in de vakwijzer, zie hier en hier). Belangrijk: neem je voorbeelden mee naar
de subgroep.
1. Misleidende perspectieven
2. Gemanipuleerde assen
3.
4. Selectieve presentatie data
5.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Lerenmetfloortje. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.