Inductieve statistiek voor de gedragswetenschappen
In deze samenvatting wordt het boek 'inductieve statistiek voor de gedragswetenschappen' te samen met powerpoint uit de les behandeld.
Het gaat hier over het vak statistiek 2 aan de AP hogeschool.
1. Statistiek 1 in vogelvlucht
1.1 variabele operationaliseren en meten
- Met operationaliseren bedoelen we = variabelen meetbaar maken.
- Variabelen kunnen … zijn:
Kwantitatief of kwalitatief
Kwantitatieve: dingen die te maken hebben met cijfers
Kwalitatief: hebben niets te maken met cijfers (haarkleur, geslacht,…) kan je wel
meten maar kan niet uitgedrukt worden in een getal
Continu of discreet
Continu: veel opeenvolgende waarde
Discreet: beperkte keuzemogelijkheden (zoals geslacht en haarkleur daar zijn geen
oneindig veel keuzemogelijkheden in)
Opgedeeld in verschillende meetniveaus (nominaal, ordinaal, interval, ratio)
Nominaal: categoriaal ( geslacht, haarkleur,…)
Ordinaal: rangschikken van klein naar groot
Interval: de verschillen tussen de waarde is betekenisvol en er kunnen bewerkingen
tussen gemaakt worden (temperatuur: wij hebben celsius en fahrenheit beide
hebben een andere nulpunt maar tussen de verschillen is hetzelfde, 1 graad verschil
is in fahrenheit ook 1 graad verschil)
Ratio: er is sprake van een vastnulpunt (er is geen negative equivalent zoals bij
gewicht)
Onafhankelijk of afhankelijk
Onafhankelijk: kan een invloed uitoefenen op de afhankelijke variabele
Afhankelijke: wat je gaat meten
Variabele zijn allerei zaken die je kan meten aan de hand van cijfers, geslacht,… die iets kunnen
zeggen over de persoon of het object
Sommige variabele zijn makkelijker meetbaar dan andere
- Twee voorwaarden voor meten:
Betrouwbaarheid (hoe goed meet de test wat we willen meten?)
Validiteit (meet de test wat we willen meten?)
1.2 Steekproeven
- Definitie: het deel van de populatie dat wordt onderzocht, hierop doen we beroep wanneer de populatie te
groot is om helemaal te onderzoeken
- Belangrijk doel van de inductieve statistiek: verantwoorde uitspraken doen over de populatie aan de
hand van een steekproef.
We willen wél uitspraken doen over de gehele populatie, dus de steekproef moet een goede
afspiegeling zijn van de populatie.
1.2.1 soorten steekproeven
A) aselecte steekproeven
1. volledig aselecte steekproef
= definitie: elk element van de populatie een gelijke kans geven om in de steekproef te worden
opgenomen
nadeel: het is niet altijd representatief
2. gestratificeerde steekproef
= alle deelpopulaties evenredig aan bod laten komen in de steekproeftrekking.
Voordeel: wel mogelijk om representativiteit te bereiken (als de steekproef goed wordt
samengesteld)
3. Clustersteekproef
= populatie verdelen in gelijkaardige clusters en daarna binnen elke geselecteerde cluster een aselecte
steekproef trekken.
Voordeel: spaart kosten en tijd
Nadeel: minder nauwkeurig, minder representatief
B) niet-aselecte steekproeven
1. sneeuwbalsteekproef
= Onderzoeker vertrekt van één respondent aan wie vervolgens gevraagd wordt andere respondenten
te contacteren
Voordeel: mensen die moeilijk bereikbaar zijn worden makkelijker bereikt
Nadeel: kans is groot dat mensen sterk op elkaar lijken
2. Gelegenheidssteekproef
= Keuze van respondenten wordt overgelaten aan ondervrager (nl. mensen die men makkelijk kan
vinden)
1
, Voordeel: goedkoop, snel
Nadeel: niet geschikt voor populatieschattingen
3. Quotasteekproef
= onderzoeker bepaalt kenmerken van de populatie die men ook wil zien in steekproef (bv. verdeling
jongens/meisjes).
- Conclusie: niet-aselecte steekproeven zijn niet altijd geschikt voor inductieve statistiek!
- Belang van goede steekproef
een goede steekproefselectie is essentieel in onderzoek
bewustwording van het belang van steekproefselectie
keuze voor steekproef steeds kunnen onderbouwen of doordacht kunnen bediscussiëren
1.3 frequentieverdelingen
= de eerste verkenning van de data
- Er zijn verschillende soorten frequenties:
Absolute frequenties
je gaat kijken hoeveel keer een bepaalde waarde voorkomt in de steekproef
Relatieve frequenties
het relatieve getal in vergelijking met de waarde van de steekproef
- Verschillende visuele voorstellingen (afhankelijk van meetniveau):
Taartdiagram (nominaal)
Staafdiagram (nominaal of ordinaal)
Stamdiagram/histogram/boxplot (interval)
- Percentielscores: plaats van een score in het geheel
Kwartiel
Deciel
1.4 Centrummaten
- Modus = waarde die het meest voorkomt (elk meetniveau).
- Mediaan = middelste waarde bij gerangschikte waarnemingen (minimum ordinaal).
- Gemiddelde = som van alle waarden gedeeld door aantal waarnemingen (minimum interval).
! Bij een symmetrische verdeling: modus = mediaan = gemiddelde:
Mediaan minder gevoelig voor extreme waarden.
Gemiddelde consistenter over verschillende steekproeven
1.5 Spreidingsmaten
= toont hoe ver scores uit elkaar liggen
Interkwartielafstand = P75 – P25
- Variantie (s²):
afwijking van elke uitslag ten opzichte van gemiddelde
deze afwijking kwadrateren
gemiddelde van deze gekwadrateerde afwijkingsscores
- Standaarddeviatie (s):
de vierkantswortel van de variantie
- Standaardscores (Z-scores):
1.6 De normaal verdeling
- Geobserveerde gegevens die passen in theoretische verdeling
P ro ba bility
0.5
De nsity
(model) bieden meer mogelijkheden voor verwerking.
Veelgebruikt model: normale verdeling. 0.4
Geeft de kans op het voorkomen van een bepaalde waarde. 0.3
- Normale verdelingen verschillen enkel in gemiddelde en 0.2
standaarddeviatie. De curve is altijd klokvormig en 0.1
symmetrisch. 0
Dankzij dit specifieke model kunnen gemakkelijk observaties -4 -3 -2 -1 0 1 2 3 4
afgeleid worden.
1.6.1 Transformaties van verdelingen
- Niet alle data zijn normaal verdeeld, en om makkelijk berekeningen te maken is Histogram
het nuttig om een verdeling te transformeren zodat ze de normale verdeling 45
40
Absolute Frequenties
35
benadert. 30
25
- Vormkenmerken van een verdeling: 20
15
10
Centrummaat (gemiddelde, mediaan, modus) 5
0
Spreidingsmaat (standaard-deviatie)
0 20 40 60 80
Metingen X
Kurtosis: gepiektheid
2
, Skewness: scheefheid
- Lineaire transformaties (bv. standaardiseren): enkel gemiddelde en standaarddeviatie veranderen.
- Normaliserende transformaties: ook kurtosis en skewness veranderen zodat de normale verdeling
benaderd wordt.
1.7 Kruistabellen
= het bestuderen van samenhangen tussen variabele
- Afhankelijk van meetniveau:
Nominaal en nominaal: kruistabel
Nominaal en ordinaal: kruistabel
Interval en interval: correlatie
- Drie maten van samenhang bij kruistabellen:
Chi-kwadraat (niet geschikt voor kleine steekproeven)
Contingentiecoëfficiënt (variabelen met 2 niveaus)
Cramer’s V (variabelen met meer dan 2 niveaus)
1.8 Correlaties
= hebben hetzelfde doel als kruistabellen maar gaan samenhang tussen interval- of ratiovariabelen na.
- Hoge correlatie is bv .75 (positief verband) maar ook -.85 (negatief verband).
- Covariantie: hetzelfde als de correlatie, maar is geen gestandaardiseerde maat (omdat er niet wordt
gedeeld door de standaarddeviatie in de formule)
2. Inductieve statistiek in onderzoek
- Het nut van statistiek: we hanteren statistiek als hulplmiddel bij empirisch onderzoek dat erop gericht is
algemeen geldende uitspraken te doen over wetmatigheden in de realiteit
We willen vanuit een beperkt aantal observaties uitspraken kunnen doen over de mens in het
algemeen
2.1 De empirische cyclus
- vraagstelling
Elk onderzoek moet beginnen met een
duidelijk geformuleerde vraagstelling, het
moet duidelijk zijn wat we bedoelen
Dit heeft als gevolg dat we duidelijk
kunnen vaststellen wat onze variabele
zijn
- Operationaliseren
Na de bepaling van de variabele moeten
we deze kunnen operationaliseren!
Operationaliseren = We hebben
geschikte meetinstrumenten nodig: dit
zijn meestal vragenlijsten
- Steekproef bepalen
Nadat we bepaald hebben hoe we alle
variabele zullenmeten kunnen we de
nodige respondenten of deelnemers verzamelen door een steekproef te trekken
Er zijn verschillende manier van steekproef trekking
- Gegevens verzamelen
Onze gegevens gaan we precies zo verzamelen zoals we onszelf hebben voorgeschreven in de
operationalisatiefase
We behandelen alle deelnemers dus consequent volgens de procedure die we hebben vastgelegd
- Beschrijvende statistiek
Nadat we alle nodige gegevens verzameld hebben zullen we een eerste blik werpen op de resultaten
door de verzamelende gegevens op verschillende manieren te beschrijven
We kunnen centrummaten en spreidingsmaten bekijken
Frequentietabellen maken
Grafieken tonen om een eerst zicht te krijgen op de aard van de gegevens
- Inductieve statistiek
3
, Die beschrijvingen geven ons nog geen informatie over verbanden tussen variabele of verschillen
tussen groepen
We beroepen daarvoor op verdergaande analyses van de gegevens (inductieve statistiek)
Samengevat: we kunnen zeggen dat we met behulp van inductieve statistiek nagaan of de
verschillen en verbanden uit onze data betekenisvol genoeg zijn om te veronderstellen dat
ze zich ook in de bredere populatie op dezelfde manier voordoen
- Conclusies trekken
Op basis van de analyses die we gemaakt hebben kunnen we uiteindelijk een aantal conclusies
trekken en een duidelijk antwoord geven op de vraagstelling die we in fase 1 hebben geformuleerd
2.2 Problemen in de inductieve statistiek
- Er is duidelijk gemaakt dat inductieve statistiek een belangrijk deel uitmaakt van de empirische cyclus
Aan de hand van de inductieve statistiek zullen we vanuit onze zorgvuldig verzamelde maar beperkte
dataset conclusies trekken over de gehele populatie
Hoe nauwgezet en plichtsbewust hebben verzameld hebben, betreft het niet de hele populatie
Het komt erop neer dat we bijna nooit gegevens kunnen hebben over een complete
populatie
Gelukkig kunnen we ons behlepen door het trekken van steekproeven
We verzamelen gegevens over een beperkt aantal onderzoekseenheden en leiden
daaruit conclusies af
- Daar stelt zich het kernprobleem van de inductieve statistiek: “welke garanties hebben we dat onze
conclusies ook geldig zijn voor de rest van de populatie?”
onderzoek meestal in steekproeven
steekproef geen perfecte afspiegeling van populatie
foutieve variatie mogelijk alsook toevallige meetfouten
- We zijn dus nooit 100% zeker van conclusies, statistiek berust daarom op kansberekening
Het is niet erg dat we geen zekerheid hebben over onze conclusies, het is wel belangrijk om te weten
hoe groot onze onzekerheid is
inschatten hoe zeker we zijn van onze conclusies
kansberekening nodig (bv: “We concluderen met 95% zekerheid dat vrouwen meer
levenstevredenheid ervaren dan mannen”)
- Wanneer zijn zulke uitspraken geoorloofd? -> significantie
2.3 Statistische significantie
- Stel we willen een onderzoek en willen te weten komen of het beluisteren van emo-rock leidt tot meer
depressievere gevoelens bij jongeren dan bij het luisteren naar hiphop
Een groep luistert gedurende een uur naar emo-rock de andere naar hiphop
Na dat uur leggen ze een depressievragenlijst af van alle deelnemers, ze krijgen een bepaalde
depressiescore op basis van die vragenlijst
Uiteraard zullen deze scores verschillen ongeacht welke muziek ze hebben beluisterd
Er is dus een zekere variabiliteit zijn in die scores zowel binnen de groepen als tussen de groepen
In eerste instantie zullen we de gemiddelde depressiescores berekenen en met elkaar
vergelijken -> deze zullen niet gelijk zijn aan elkaar
De mate gemiddelde van elkaar verschillen kan echt variëren: het kan gaan over een klein of
een groot verschil
- De centrale vraag in de toetsende fase van dit onderzoek is nu of dat gevonden verschil tussen beide
groepen al dan niet statistisch significant is
Er zijn 2 mogelijkheden:
Ofwel is het gevonden verschil tussen de gemiddelde depressiescore van beide
groepen eerder klein en te wijten aan de toevallige variabiliteit in onze steekproef
Ofwel is het verschil groot genoeg om te beweren dat de verschillende muzikale
behandeling van beide groepen ervoor gezorgd heeft dat de ene groep minder
depressief is dan de andere
In het laatste geval spreken we van een significant verschil
Het beslissen of een verschil significant is of niet doen we aan de hand van
hypothesetoetsing
Statistische significantie helpt ons dus om onze hypothesen te toetsen. Het helpt ons
inschatten wanneer een waargenomen verband/verschil groot genoeg/betekenisvol is.
- Als het verschil statistisch significant is , is het zeer waarschijnlijk dat het toevallige fouten zijn
- Al het niet verschil statistisch significant is, is het verschil zodanig klein
2.4 Kansberekening en hypothesetoetsing
2.4.1 kansberekening
- Kansberekening is ene hulpmiddel bij hypothesetoetsing
ervan uitgaan dat er in
- bij het beantwoorden van een vraag die we stellen bij een
werkelijkheid geen verschil is
onderzoek zullen we de zaken even omkeren:
kans berekenen dat we in dat 4
geval die observaties doen
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller chloegrotelli. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.11. You're not tied to anything after your purchase.