Inductieve statistiek voor de gedragswetenschappen
Samenvatting van het vak Statistiek II in de criminologie, gedoceerd door prof. Annelies DE SCHRIJVER. Gebaseerd op het handboek "Inductieve statistiek voor de gedragswetenschappen, Toegepaste hypothesetoetsing met SPSS".
INDUCTIEVE STATISTIEK
VOOR DE
GEDRAGSWETENSCHAPP
EN
H1: INDUCTIEVE STATISTIEK IN ONDERZOEK
1. De empirische cyclus
= de verschillende fasen waaruit wetenschappelijk onderzoek bestaat
- Duidelijk geformuleerde vraagstelling of probleemstelling
- Variabelen uit de vraagstelling operationaliseren of meetbaar maken
- Nodige respondenten verzamelen door een steekproef te trekken (zie aselect/niet-aselect!)
- Gegevens verzamelen
Beschrijvende statistiek => centrummaten en spreidingsmaten bekijken, frequentietabellen maken en grafeken
tonen; maar deze beschrijvingen geven nog geen informatie over verbanden tussen variabelen of verschillen
tussen groepen
Inductieve statistiek => hier kunnen we nagaan of verschillen en verbanden uit onze data betekenisvol genoeg
zijn om te veronderstellen dat ze zich ook in de bredere populatie (waarvan de steekproef deel uitmaakt) op
dezelfde manier voordoen.
2. Het probleem van inductieve statistiek
Aan de hand van inductieve statistiek zullen we vanuit onze zorgvuldig verzamelde maar beperkte dataset
conclusies trekken over de gehele populatie.
- Populatie = alle individuen waarover het onderzoek een uitspraak wil doen
- Steekproef = deel van de populatie die we efectief bestuderen
- Element = case of onderzoekseenheid uit de populatie
Er kunnen om verschillende redenen heel wat toevalligheden in het onderzoek sluipen. Men moet daarom gaan
berekenen hoe groot de kans is dat de getrokken conclusies fout zijn. Later noemen we dit statistische
signifcantie.
3. Statistische signifcantie
Er is a priori een zekere variabiliteit tussen scores, die ervoor zorgt dat er zowel binnen de groepen (tussen de
individuen) als tussen de groepen verschillen zullen zijn. Daarom gaat men gemiddeldes berekenen en deze met
elkaar vergelijken.
Variabiliteit verwijst naar de spreiding van verzamelde gegevens (kan bv. door interkwartielafstand,
standaarddeviatie en variantie aangeduid worden)
De centrale vraag in de toetsende fase van dit onderzoek is nu of dat gevonden verschil tussen beide groepen al
dan niet statistisch signifcant is. Er zijn dan 2 mogelijkheden: ofwel is het verschil tussen de twee gemiddelden
eerder klein en te wijten aan de toevallige variabiliteit in de steekproef, ofwel is het verschil groot genoeg om te
beweren dat het hypothetisch gestelde verschil klopt. Dit is de basis van hypothesetoetsing.
4. Kansberekening
Kansberekening is een hulpmiddel bij hypothesetoetsing.
, 2
om verschil na te gaan draaien we de zaken even om; we veronderstellen dat er in werkelijkheid geen invloed is.
Vervolgens vragen we ons af hoe groot de kans is om de vastgestelde verschillen te observeren. We berekenen
dus de kans dat de verschillen enkel te wijten zijn aan toevallig variabiliteit die nu eenmaal altijd aanwezig is.
Als die kans groot genoeg is kunnen we concluderen dat dat we eigenlijk geen uitzonderlijke observatie hebben
gedaan. De vaststellingen spreken de vooronderstelling die we hebben gedaan dan niet tegen. Is die kans klein,
dan kunnen we argumenteren dat het eerder onwaarschijnlijk is om onze gevonden verschillen te observeren dan
spreken de vaststellingen de veronderstelling wel tegen. We kunnen dan zeggen dat het onhoudbaar wordt om te
beweren dat het ene geen invloed heeft op het andere.
5. Toetsen
Er zijn een aantal verschillende toetsingssituaties en elk van deze situaties zal een lichtjes andere methode vergen
om de bijbehorende onderzoeksvraag op te lossen. We zullen hierbij o.a. rekening houden met het aantal
variabelen, het meetniveau, het aantal deelnemers en de manier waarop de deelnemers verdeeld zijn over het
onderzoek.
6. Misbruik van statistiek
Statistiek is in de eerste plaats een hulpmiddel bij onderzoek en mag nooit overheersen of een doel worden op
zich. (Zie ergernissen; bv. presenteren van statistieken zonder context, ‘onderzoek’ en ‘wetenschappelijk bewezen’
overal in de media, …)
H2: KANSVERDELINGEN EN KANSBEREKENING
1. Kansverdelingen
1.1. Wat is een kansverdeling?
Een kansverdeling is eigenlijk een vorm van een frequentieverdeling.
Hoewel een kansverdeling er gelijkaardig uitziet, geeft ze niet de frequentie maar wel de kans op het voorkomen
van alle mogelijke waarden van een variabele. De hoogte van de grafek geeft dus niet het aantal observaties
weer, maar wel de grootte van de kans om binnen een bepaalde range voor te komen. Om die kans te achterhalen
doen we geen beroep op het verzamelen van data, maar wel op onze theoretische veronderstellingen in verband
met de variabele die we bestuderen.
Hoe meer observaties we doen binnen één steekproef, hoe meer onze frequentieverdeling gaat lijken op de
theoretische kansverdeling. Bij een oneindig aantal zal deze helemaal identiek zijn (zie voorbeeld dobbelstenen!)
Een kansverdeling kan je dus gebruiken om een voorspelling te maken op basis van een theoretische
redenering.
Net zoals we de frequentieverdeling kunnen beschrijven a.d.h.v. gemiddelde en standaarddeviatie, kunnen we ook
voor de kansverdeling gelijkaardige kenmerken berekenen die de verdeling karakteriseren.
1.2. Gemiddelde van de kansverdeling: verwachte waarde
Omdat het in deze context niet gaat over reële observaties spreekt men niet over een gemiddelde maar over een
verwachte waarde (of populatiegemiddelde). Deze krijgt het symbool E(X) of µ
Deze verwachte waarde geeft dus het gemiddelde van de uitkomsten die we zullen observeren als we bv. een
oneindig aantal keren één dobbelsteen opgooien.
Als we dus informatie hebben over de kansen van bepaalde uitkomsten bij een steekproeftrekking, kunnen we de
verwachte waarde berekenen met behulp van deze algemene formule:
Hierbij zijn mogelijk waarden van x.
, 3
Wat we dus nodig hebben om deze formule in te vullen in een kansvariabele (X) en verder elke mogelijk waarde
van de kansvariabele met de bijbehorende kans op die waarden.
1.3. Variantie van de kansverdeling
Een 2de kenmerk dat we kunnen gebruiken om te bepalen hoe een kansverdeling er precies uitziet is de variantie
of standaarddeviatie van die kansverdeling. Deze geeft informatie over de spreiding van de scores rond het
gemiddelde, in dit geval de verwachte waarde.
De vierkantswortel uit deze variantie leidt tot de standaarddeviatie:
2. De kansverdeling van het steekproefgemiddelde
Zie fguur blz. 36. We zouden uit deze grafek kunnen aleiden hoe groot de kans is om een gemiddelde binnen een
bepaalde range te observeren bij het trekken van een steekproef. Belangrijk is dat de horizontale as geen
individuele scores bevat, maar steekproef-gemiddelden.
Tweede fguur is ook smaller dit komt omdat de steekproevenverdeling minder extreme waarden bevat dan de
originele, individuele scores in de populatie.
Deze eigenschap van de steekproevenverdeling van het gemiddelde berust op het zogenaamde “centrale
limiet theorema”.
= wanneer je een groot aantal steekproefgemiddelden berekent vanuit de kansverdeling die niet
noodzakelijk normaal verdeeld is, dat de verdeling van al deze steekproefgemiddelden bij benadering
normaal verdeeld zal zijn. Hoe groter de steekproeven zijn, hoe beter de normale verdeling benaderd zal
worden.
Een bijkomende eigenschap hiervan is dat het gemiddelde van deze hypothetische kansverdeling een
goede weerspiegeling is van het gemiddelde in de populatie.
MAW; als we erin slagen om een betrouwbare schatting te maken van de steekproevenverdeling van het
gemiddelde van een bepaalde variabele (of korter: de steekproevenverdeling van X), dan beschikken we
meteen over een goede schatting van het populatiegemiddelde µ.
Net zoals we beschreven i.v.m. frequentieverdelingen kunnen we genoeg hebben aan enkele kengetallen
om het verloop van de verdeling te kennen. M.a.w. als we weten dat de bestudeerde variabele normaal
verdeeld is, en we kennen het gemiddelde en de standaarddeviatie, kennen we ook de hele verdeling.
2.1Hoe kunnen we E(X) schatten?
We moeten op zoek naar “zuivere schatters”. = er mogen geen systematische afwijkingen bestaan van de schatter
tegenover te populatieparameter.
We nemen aan dat X een zuivere schatter is van E(X).
2.2Hoe goed is onze schatting van E(X)?
We blijven nu achter met de vraag hoe goed een bepaald steekproefgemiddelde het populatiegemiddelde
benadert. hiervoor maken we gebruik van de standaarddeviatie!
We weten immers dat de standaarddeviatie ons een idee geeft van hoe sterk de geobserveerde waarden zich
centreren rond het gemiddelde: een lage standaarddeviatie betekent dat het meeste observaties zich rond het
gemiddelde bevinden, terwijl een hoge duidt op een hoge spreiding rond het gemiddelde.
We berekenen dus de standaarddeviatie van alle steekproefgemiddelden
Deze grootheid krijgt de naam; “standaardfout van het gemiddelde”
(omdat deze aangeeft hoe groot de ‘fout’ is die we mogelijk maken bij het schatten)
Opnieuw krijgen we te maken met het probleem dat we onmogelijk een oneindig aantal steekproeven kunnen
trekken om deze grootheid te berekenen. Er zijn 2 mogelijkheden:
- Als de populatiestandaarddeviatie bekend is, is de formule:
- Als de deze niet bekend is, is de formule:
, 4
Er wordt bij deze berekening een correctie toegepast die de steekproefstandaarddeviatie verkleint: we delen s
namelijk door de vierkantswortel van N, de steekproefgrootte. Dit omdat de steekproefstandaarddeviatie s de
standaardfout systematisch zal overschatten.
2.3De vorm van de steekproevenverdeling van het gemiddelde
Centrale limiet theorema;
Deze zegt dat hoe groter we de steekproeven trekken, hoe meer onze steekproevenverdeling van het gemiddelde
de normale verdeling zal benaderen. (dit geldt ongeacht de vorm van de verdeling van de variabele)
Dit zegt ons in de eerste plaats dat een grote steekproef beter is dan een kleine! (want de normale verdeling is een
voorwaarde bij vele toetsen, die we anders niet zouden kunnen toepassen)
2.4Hoe groot is een steekproef die groot genoeg is?
Vuistregel = steekproef is groot genoeg als ze 30 eenheden of meer bevat, per bestudeerde populatie. (dus bij
verschil tussen 2 populaties; 2x30 eenheden nodig!)
3. Kansen berekenen in de steekproevenverdeling van het gemiddelde
Na het omrekenen van de waarden van de variabele naar z-waarden kunnen we een beroep doen op de tabel van
de standaardnormale verdeling (zie H6 boek 1).
Het komt er dus op neer dat we de oppervlakte onder de normale curve tussen twee waarden moeten te weten
komen. Belangrijk daarbij is te weten dat de totale opp gelijk is aan één en dat de tabel van de standaardnormale
verdeling weergeeft hoe groot de opp links van een bepaalde z-waarde is.
Deze technieken die we hebben toegepast op frequentieverdelingen zullen we nu op dezelfde manier gebruiken bij
de steekproevenverdeling van het gemiddelde. De vraag luidt dan bv. “wat is de kans om een steekproef (dus niet
meer bv. individuele IQ-score) te observeren met een bepaalde gemiddelde IQ-score of hoger?”. Het gaat dus niet
meer om een individuele score maar om een gemiddelde score van een steekproef.
Zoals eerder vermeld kunnen we aan de hand van enkele gegevens de steekproevenverdeling van het gemiddelde
van de scores opstellen. (zo kunnen we nagaan hoe ons waargenomen gemiddelde zich verhoudt ten opzichte van
het algemeen gemiddelde van de populatie)
Het enige wat we nodig hebben is de verwachte waarde van het steekproefgemiddelde E(X), de standaarddeviatie
van het steekproefgemiddelde (σ x) en de aanname dat de steekproevenverdeling normaal verdeeld is.
De formule voor het omrekenen naar z-scores is de volgende:
ruwe scores−gemiddelde van de scores
z-score =
standaarddeviatie van de scores
Als we deze algemene formule toepassen op de steekproevenverdeling van het gemiddelde kunnen we aannemen
dat de ‘ruwe scores’ gelijk zijn aan het gevonden steekproevengemiddelde. Verder weten we dat het gemiddelde
van de scores gelijk is aan het populatiegemiddelde µ. De benodigde standaarddeviatie ten slotte is gelijk aan de
standaardfout van het gemiddelde. Als we dit allemaal invullen krijgen we vervolgens;
HYPOTHESETOETSING EN BETROUWBAARHEIDSINTERVALLEN
Twee soorten vragen worden in dit hoofdstuk behandeld;
-Eerste worden beantwoord adhv betrouwbaarheidsintervallen, waarmee we populatieparameters kunnen schatten
-Tweede soort beantwoorden via hypothesetoetsing, waarmee we nagaan hoe waarschijnlijk of onwaarschijnlijk
een bepaalde bewering is
1. Betrouwbaarheidsintervallen
1.1Wat is een betrouwbaarheidsinterval?
“puntschatting” = specifeke schatting waarbij we een populatieparameter schatten aan de hand van één getal
, 5
We kunnen rond X een interval afbakenen waarbinnen met een bepaalde kans µ zal liggen. Dit is een interval
waarvan we redelijk zeker zijn dat het populatiegemiddelde erin ligt. De zekerheid kunnen we zelf bepalen (bv.
95%)
(belangrijk voorwaarde is dat de steekproef die aan de basis ligt aselect getrokken moet zijn)
Merk op dat de grootte van de steekproef een rol speelt in de mate van nauwkeurigheid van de schatting.
Aangezien de steekproefgrootte in de noemen van de formule staat, betekent dit dat de schatting nauwkeuriger
zal zijn naarmate de steekproef groter wordt.
2. Hypothesetoetsing
Hierbij gaan we uit van een veronderstelling die vanuit een redenering is opgebouwd en heel duidelijke termen
bevat die verwijzen naar meetbare variabelen.
2.1Hypotheses formuleren
Hypotheses worden afgeleid vanuit een theorie en beslaan meestal maar een deel van wat er in de theorie
vermeld wordt; aleidingen hiervan worden dan onderzoekshypotheses. Het is belangrijk dat deze
onderzoekshypotheses duidelijk verwijzen naar variabelen die we kunnen meten en naar populaties die duidelijk
omschreven zijn.
“nulhypothese”
= als we niet kunnen bewijzen dat de onderzoekshypothese waar is, kunnen we misschien wel aantonen
dat het tegenovergestelde weinig waarschijnlijk is.
Als onderzoekt uitwijst dat we de nulhypothese mogen verwerpen zullen we de onderzoekshypothese, of
alternatieve hypothese, aannemen. (nooit met 100% zekerheid!)
2.2Het principe van hypothesetoetsing in woorden
We gaan de nulhypothese verwerpen als de data die we verzameld hebben deze nulhypothese erg onwaarschijnlijk
maken. (zie voorbeeld parachutemoord; teveel tegenbewijzen dus schuldig)
2.3Hypothesetoetsing in cijfers
Hiervoor maken we gebruik van de z-toets voor het gemiddelde.
We spreken van signifcantie als de data die we verzameld hebben het erg onwaarschijnlijk maken dat de
nulhypothese waar is.
We gaan uit van een normale verdeling van steekproefgemiddelden. Op die manier kunnen we z-waarden van
overschrijdingskansen berekenen. Deze z-waarde noemen we de toetsingsgrootheid. We hanteren ook standaard
een niveau van 5% om te bepalen of een resultaat signifcant is of niet. Dat niveau wordt aangeduid met α = 0.05
2.4Eenzijdig en tweezijdig toetsen
De keuze voor een- of tweezijdig toetsen heeft gevolgen voor de manier waarop we de hypotheses formuleren. Bij
eenzijdig toetsen gebruiken we ongelijkheidstekens, terwijl we bij tweezijdig toetsen altijd een gelijkheidsteken in
de nulhypothese zetten.
Ook kan het voorvallen dat bij specifeke gemiddeldes de nulhypothese niet verworpen zal worden bij tweezijdig
toetsen, maar wel bij eenzijdig toetsen. De keuze voor een- of tweezijdig toetsen kan dus gevolgen hebben voor de
conclusies die je trekt uit het onderzoek.
, 6
De keuze voor een of tweezijdig toetsen dien je ook te bepalen VOOR het onderzoek.
2.5Toetsen met kritieke waarden
Vorige manier kan omschreven worden als toetsen via overschrijdingskansen. Nu gaan we toetsen via kritieke
waarden. Hierbij hoef je enkele naar enkele grenswaarden te kijken en de berekende z-waarde hiermee te
vergelijken. De tabel van de standaardnormale verdeling wordt dan overbodig.
In het algemeen gelden volgende basisregels bij het toetsen met kritieke waarden:
2.6Onzekerheden bij hypothesetoetsing
Belangrijk in dit deel is dat signifcantie geen absoluut begrip is. We moeten steeds in het achterhoofd houden dat
onze conclusies gebaseerd zijn op een kansberekening; we kunnen de nulhypothese dus nooit absoluut verwerpen,
er blijft altijd een stukje onzekerheid over.
2.7Effectgrootte
Belangrijk is om in het achterhoofd te houden dat de signifcantie niets zegt over het belang van het efect. Dit
wordt gemeten aan de efectgrootte van een toets.
Deze geeft weer hoeveel variatie in de resultaten verklaard worden door het geobserveerde efect. Terwijl de
signifcantietoets dus een antwoord geeft op de vraag “werkt de behandeling?” geeft de efectgrootte een
antwoord op de vraag “hoe goed werkt de behandeling?”.
Er bestaan verschillende mate om deze efectgrootte te meten, zoals Cohen’s d en de Pearson correlatiecoëfciënt
r.
De correlatiecoëfciënt situeert zich tussen -1 en 1, waarbij beide uitersten op een perfect negatief of
positief verband duiden, terwijl 0 duidt op de afwezigheid van een verband.
Verder hanteren we volgende interpretatieniveaus van r:
Handig is dat dit een gestandaardiseerde maat is. Dat wil zeggen dat we de efectgrootte van verschillende
toetsen en onderzoeken onderling kunnen vergelijken.
3. Parametrische versus non-parametrisch toetsen
Zoals reeds vermeld bestaan er nog veel andere toetsen, die elk hun specifeke toepassingssituatie hebben. Deze
toetsen kunnen allemaal ondergebracht worden in twee overkoepelende categorieën.
- Parametrische toetsen maken gebruik van een normale verdeling
- Non-parametrische toetsen hebben geen specifeke verdeling nodig (“verdelingsvrije toetsen”)
Met andere woorden: om een parametrische toets te kunnen uitvoeren moet aan meer voorwaarden voldaan zijn
dan om een non-parametrische toets te kunnen hanteren;
- Intervaldata
- Normaal verdeelde data
- Homogeniteit van varianties (indien data verzameld uit meer dan één populatie, dan moeten de
steekproeven afkomstig zijn uit populaties met dezelfde varianties)
TOETSEN VOOR ÉÉN POPULATIE
De toetsen uit dit hoofdstuk worden gebruikt bij het bestuderen van één populatie; maw als we ons de vraag
stellen of een bestudeerde steekproef afkomstig is uit de populatie waarover we algemene gegevens hebben: we
kennen een bepaald kenmerk van de populatie en we vragen ons af of de steekproef hetzelfde kenmerk heeft.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller SoVa. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.02. You're not tied to anything after your purchase.