Samenvatting Analyse 1
Discovering Statistics Using IBM SPSS, Andy Field
Inhoudsopgave
Meten 1
Frequentieverdelingen 5
Centrummaten 10
Spreidingsmaten 16
Correlatie 24
Enkelvoudige regressieanalyse (ERA) 34
Meervoudige regressieanalyse (MRA) 44
Categorische variabelen 53
Kansrekening en kansverdeling 58
Kansverdeling 65
Steekproevenverdeling 72
Betrouwbaarheidsinterval z-toets 1 gemiddelde 79
Onderscheidingsvermogen 87
1. Meten
Fase 1: Conceptualiseren: je hebt iets dat je waarneemt in de
wereld wat een probleem is. Vanuit dit probleem ga je
specificeren totdat je een concrete vraagstelling hebt.
Fase 2: Inrichten/onderzoeksopzet: Nadenken over de
onderzoeksopzet bij wie ga je onderzoeken? Wat ga je
meten? Wanneer ga je dit meten? Hoe ga je dit meten?
Fase 3: Gegevens interpreteren
Rol statistiek bij onderzoeksopzet
Wie: populatie en steekproef trekken Welke selectie uit de populatie ga je onderzoeken, hoe
groot moet die steekproef zijn?
1
, Wat: welke meetinstrumenten (soort en kwaliteit) Stel dat je iets wilt weten over depressie
bij basisschoolleerlingen, welk instrument kun je het beste gebruiken? Maakt hij goed
onderscheid met een vragenlijst bijvoorbeeld.
Wanneer: eenmalig/meerdere momenten Ga je meerdere momenten nemen om onderzoek
te doen etc? Dit heeft gevolgen voor de soort analyses die je gaat doen.
Hoe: Keuze van het onderzoeksdesign en analysemethoden Welke analyse past het beste bij
de gegevens die ik ga verzamelen?
Rol van statistiek in de uitvoeringsfase
Ordenen en presenteren gegevens in samenvattende kerngetallen, tabellen, grafieken en
figuren: beschrijvende (descriptieve) statistiek
Bepalen verband tussen resultaten en theorie: interpretatie van statistische gegevens;
statistische conclusies: toetsende (inductieve) statistiek.
In de laatste fase: voornamelijk beschrijvende en toetsende statistiek. Beschrijvend: hoe ga je alle
gegevens netjes ordenen/samenvatten? Toetsend: hoe kun je op basis van je steekproef uitspraken
over de populatie doen?
Data verzamelen
D.m.v. interviews/enquetes/observaties/experimenten/bronnen etc.
Steekproef: aselect & representatief
Kwantitatief (getalsmatig)
Onderzoek begint vaak met een goede steekproef. Hierbij zijn 2 elementen belangrijk
Aselect: als je goed onderzoek wilt doen moet iedereen in de populatie een even grote kans hebben
om in de steekproef terecht te komen. Het is niet selectief van ik kies wat het makkelijkste is, alles uit
1 stad. Als je bv. basisschoolleerlingen neemt, moeten zij allemaal een even grote kans hebben om in
de steekproef te komen. Alleen als je aselect doet, heb je een representatieve steekproef, je hebt dan
een goede afspiegeling van de totale populatie.
Datamatrix
Voorbeeld van gegevens uit een steekproef onder middelbare scholieren:
Gegevens ordenen. Als je middelbare scholieren hebt onderzoekt, ga je de gegevens ordenen in een
datamatrix. Een kolom is vaak een variabele.
Terminologie
Variabele: een gemeten grootheid die kan variëren Iets wat kan variëren. In tegenstelling tot
een constante.
Onderzoekseenheid (case): eenheid waarbij de variabelen gemeten worden. Een variabele
wordt gemeten bij een bepaalde onderzoekseenheid (‘case’). Heel vaak is dat een persoon.
Maar het kan ook een gezin/school/klas zijn.
2
, Score: waarde van een onderzoekseenheid op een variabele. In iedere kolom staat de
variabele, in iedere rij staat de onderzoekseenheid, en in de variatie daarvan staat een
bepaalde score.
Variabelen: de rol binnen een onderzoek
Is iets een voorspeller/oorzaak of is iets een uitkomst/gevolg?
Afhankelijke variabele: ‘gevolg’; de te verklaren variabele, ‘uitkomst’ Hetgeen wat je wilt
verklaren. Dus als je onderzoek doet naar ‘waarom zijn kinderen depressief?’, het hebben van
een depressie is dan je uitkomstmaat, je gevolg.
Onafhankelijke variabele: ‘oorzaak’, verklaring voor (invloed op) de afhankelijke variabele,
‘predictor’ “Veel negatieve levensgebeurtenis meegemaakt”, kan een verklaring zijn voor
waarom die afhankelijke variabele zo is.
Eenvoudig voorbeeldmodel
Variabelen: causaliteit?
Causaliteit: oorzakelijkheid. Het hoeft niet zo te zijn dat A B veroorzaakt of andersom. Experiment
is een goede manier om causaliteit vast te stellen.
Complexer: meer predictoren
Je kunt meerdere oorzaken hebben op internaliserende problemen. Je meet dan álle variabelen.
Complexer: moderatie
Moderatie: een modererende variabele verzwakt of versterkt het verband tussen twee andere
variabelen. Is een variabele die een relatie/verband wat er bestaat, versterkt of verzwakt. De sociale
3
, steun in het voorbeeld kan bv. de relatie tussen de psychische problemen versterken of verzwakken.
Bij veel steun zullen de problemen verzwakken.
Complexer: mediatie
Mediatie: een mediërende variabele kan (deels) het verband tussen twee andere variabelen
verklaren. Verklaard een bepaalde relatie. Psychische problemen kunnen dus een effect hebben op de
internaliserende problemen van kinderen, maar dit kun je verklaren door als ouders psychische
problemen hebben, zal dit negatief effect hebben op de kwaliteit van opvoeding, en dit heeft weer
effect op kinderen die bv. angstiger/depressiever worden. Je gaat dus opzoek naar een andere
variabele die iets kan verklaren.
Meten – variabelen, discreet versus continu
Discrete variabele: een variabele die slechts een bepaald aantal waarden kan aannemen; een
verschil tussen twee waarden is altijd één eenheid of meer vaste eenheden. Er is een
bepaalde aantal waarden die een variabele kan aannemen, en er zit steeds iets vast tussen.
De variabele zal in stapjes omhoog gaan. Bv. het aantal woorden in een tekst, het aantal
woorden dat iemand goed heeft in een dictée. Dit gaat iedere keer in vaste stappen omhoog,
en er zit niks tussen.
Continue variabele: een variabele waarvoor geldt dat er tussen twee gegeven waarden altijd
een derde ligt; bij het meten van continue variabelen zijn de scores altijd afgeronde getallen
(een benadering van de feitelijke score) Iets wat alle waarden kan aannemen. Dingen als
lengte, gewicht. Dan zijn er niet vooraf al duidelijke stappen waarin die omhoog gaat, hij kan
alles aannemen.
Variabelen: meetniveaus
Nominaal: waarden geven categorieën aan (geen volgorde) Bv. kerkelijke gezindheid. Je bent
bv rooms-katholiek. Er zit geen volgorde in dat het ene geloof hoger of lager is dan het
andere. Omdat er geen volgorde is kun je geen conclusies trekken over meer/minder of
hoger/lager.
Ordinaal: oplopende categorieën (waarden geven volgorde aan) Categorieën met een
duidelijke volgorde. Bv. sociaaleconomische status, vmbo/havo/vwo. Je kunt alleen niet
zeggen hoe groot de afstanden tussen de categorieën zijn.
Interval: waarden geven volgorde aan, bovendien hebben gelijke intervallen tussen waarden
dezelfde betekenis. Hier zijn er waardes die een volgorde aangeven, maar hier zijn de
afstanden wel betekenisvol. Bv. Graden Celsius, de afstand tussen 23 en 24 graden is even
4