Samenvatting statistiek 1
Hoorcollege 1
Hoofdstuk 1 en 2
Statistiek: de wetenschap van het verzamelen, organiseren en interpreteren van numerieke feiten,
die gegevens of data worden genoemd.
➔ Er zijn hierbij twee soorten statistiek
1. Beschrijvende statistiek: een samenvatting van een steekproef of populatie met nummers,
getallen en grafieken. Je beschrijft wat je ziet in je data: gemiddelde, frequentietabel,
puntenwolk
2. Inferentiele statistiek: maakt voorspellingen over de populatie parameters, gebaseerd op de
steekproefgegevens.
Is het toeval of is het verschil echt waar?
Specifiek bevat de statistische wetenschap methoden voor:
- Je design (een steekproefmethode bijvoorbeeld)
- Het beschrijven
- Toetsen van een hypothese
Kansrekening vs statistiek: deductie en inductie
Kansrekening: dit gaat uit van deductie. Het gegeven dat we alle details van een bepaalde populatie
weten, maar hoe waarschijnlijk is dan een bepaalde (steekproef)uitkomst?
Je weet hier al wat de werkelijkheid is: een vaas met 20 knikkers, waarvan 4x rood. Wat is de kans dat
je knikker rood is? De data is hier al bekend eigenlijk.
Statistiek: dit gaat uit van inductie. Het gegeven dat we een bepaalde (steekproef)uitkomst, maar wat
kan je dan zeggen over de populatie?
Bij statistiek is dit dus nog niet bekend, daarom ook inductie, dat moet dus uit de data blijken.
Kansrekenen Statistiek
Algemeen wordt allemaal wat specifieker Specifieker wordt wat algemener
Populatie wordt een steekproef! De steekproef wordt de populatie!
Een bepaald model zorgt voor data Data zorgt voor het model
Het verschil met methodologie is dat je methodologie je plan is: welk design en steekproef gebruik
ik? Statistiek is dan het gereedschap hoe je dit uitvoert. Beide principes heb je nodig, maar zijn wel
verschillend.
- Kansrekening en statistiek houden rekening met toeval
- Dezelfde technieken worden gebruikt
- Statistiek maakt aannames over de populatie (H0) om deze op basis van een steekproef te
kunnen ontkrachten (falsificeren).
Onderzoeksvraag en data
Vraag: hoe hoog is de werkdruk van Statistiek 1?
Deze vraag onderzoeken we met behulp van data: we observeren dit (karakteristieken)
Bij statistiek gaat het vaak over twee werelden: hetgeen wat je ziet (steekproef) en de wereld
waarover je iets wilt zeggen (populatie)
- Populatie: de totale set van deelnemers. Relevant voor je onderzoeksvraag.
Populatiegrootheid (parameter): gemiddeld aantal uren zelfstudie per week
1
, - Steekproef: een deel van de populatie waarover de data is verzameld
Steekproefgrootheid (statistic): gemiddeld aantal uren zelfstudie per week
Hierom heb je goede data nodig om je onderzoeksvraag te beantwoorden
- Het moet betrouwbaar zijn
- De validiteit moet hoog zijn: interne, externe, constructvaliditeit, aselect
Variabelen, meetniveaus en waardenbereik
Variabele: een gemeten karakteristiek die kan verschillen tussen subjecten
Gedragsvariabelen, stimulusvariabelen, subjectvariabelen, fysiologische variabelen
Meetniveau NOIR Waardenbereik
Categorisch/kwalitatief Numeriek/kwantitatief Discreet/continue
Nominaal: Interval: gelijke Discreet: vaste
ongeordende afstand tussen de waardes
categorie waarden Broers en zussen
Kleur ogen (graden celsius, 11 en
12)
Ordinaal: geordende Ratio: gelijke afstand Continue: niet vaste
categorie en absoluut nulpunt waardes
Opleidingsniveau (kelvin graden) Lichaamslengte
Alle eigenschapen van
NOI
Met de kwantitatieve gegevens kun je het meeste.
2
,Hoorcollege 2
Hoofdstuk 2 en 3
Inferentiele statistiek
Op basis van een steekproef wil je uitspraken doen over de gehele doelpopulatie.
Dit kun je het beste doen middels aselecte toewijzing.
Het verschil tussen de gemeten steekproefgrootheid en de populatiegrootheid komt door de
volgende twee zaken:
- Als het verzamelen van de data fout gaat of er problemen zijn in de steekproef
- Als er toeval is (natuurlijke variatie) in je steekproef
Specifiek bevat de statistische wetenschap methoden voor:
- Je design (welke methode gebruik je voor je steekproef, hoe kom ik aan de steekproef?)
- Beschrijvende statistiek (hoe kan ik data in de steekproef beschrijven; boxplot, histogram etc)
- Inferentiele statistiek (wat kan ik leren over de populatie obv de steekproef?)
Steekproefproblemen bij inferentiele statistiek
Het doel is: je wil een betrouwbare en valide uitspraak over de populatie op basis van je getrokken
steekproef. Hiervoor dient een steekproefgrootte niet te veel verschillen van de populatiegrootheid.
3
, De problemen:
Steekproeffout (sampling error) Toevallige steekproefverschillen
Steekproefvertekening (sampling bias) Selectieve werving
Meetfout (response bias) Incorrect antwoord
Selectieve respons (non-response bias) Selectieve deelname
Steekproefvertekening
Als je steekproef een heel verkeerd beeld geeft en/of niet de juiste mensen bereikt.
Meetfout
Sociale wenselijkheid, een neutraal antwoord op de Likert-schaal, een onduidelijke vraagstelling die
heel leidend kan zijn.
Selectieve respons
De bereidheid tot participatie. Soms zijn mensen tevreden en denken ze vanuit deze tevredenheid dat
ze het wel prima vinden, terwijl mensen die ontevreden zijn altijd wel mee willen doen om hun stem
te laten horen.
Steekproeffout
Een kleine steekproef halen uit een grote populatie. Dat is dan weer niet heel handig, want dit is niet
representatief voor je hele populatie. Er kan soms ook sprake zijn van toeval, waardoor de data niet
klopt.
Je steekproeffout gaat over je betrouwbaarheid. Die wil je hoog hebben.
Wat is de oplossing?
Een aselecte steekproef van voldoende omvang die informatie (data) oplevert over iedereen die
benaderd is, met correcte antwoorden voor alle subjecten van de items.
Steekproefmethoden
1. Enkelvoudige aselecte steekproef
2. Systematisch aselecte steekproef
3. Gestratificeerde steekproef
4. Cluster steekproef
5. Getrapte steekproef
Welke methode dien ik dan te kiezen? Dat ligt aan:
- De samenstelling van de populatie
- Onderzoeksvraag
- De haalbaarheid van de te vormen steekproef
Enkelvoudige aselecte steekproef
Kenmerken:
- Elke combinatie van deelnemers heeft evenveel kans om de steekproef te vormen
-Het is haalbaar als participanten vanuit de gehele doelpopulatie benaderbaar zijn
-Vereist wel veel willekeurige getallen om de steekproef te bepalen
4