Statistiek 1 Recap
Beschrijvende statistiek: samenvattend; aangeven wat je data is en waar dit uit bestaat,
histogrammen, boxplots etc, zoveel % van groep is X, zoveel is Y
Inferentiële statistiek: diepgaander dan alleen onderzoeksgroep beschrijven, je gebruikt
inductie, voorspellingen maken over populatie gebaseerd op sample data. Hierbij komt ook
een foutmarge en mogelijke onzekerheid.
Betrouwbaarheid (relatief groot genoege steekproef) & validiteit (representatief) niet
hetzelgde als bij md; betrouwbaarheid bepaalt niet validiteit maar staat hier los van.
Variabele: gemeten karakteristiek die kan verschillen tussen subjecten. Verschillende
soorten zoals gedrags-, stimulus-, subject variabelen.
Meetschalen / meetniveau (NOIR)
- categorisch/kwalitatief: nominaal; ongeordende categorieën (kleur ogen), ordinaal;
geordende categoriën (opl. niveau)
- kwantitatief/numeriek: interval; gelijke afstand tussen opeenvolgende waarden
(celcius), ratio; gelijke afstand én absoluut nulpunt (Kalvin graden)
Bereik:
t-toets en z-toets gaan er vanuit dat de variabele continu gemeeten zijn (oneindig deelbare
meeteinheid zoals lichaamslengte.
discreet bereik is een meeteenheid die ondeelbaar is (aantal broers/zussen)
Steekproefproblemen:
- sampling error → toevallige steekproef verschillen
validiteits problemen:
- sampling bias → selectieve werving
- response bias → incorrect antwoord
- non-response bias → selectieve deelname
Oplossingen:
- de onderste drie zijn lastig op te lossen, bij de andere kan je de onzekerheid mee
nemen door bijvoorbeeld een zekerheidsinterval te maken
Steekproefmethoden
1. Enkelvoudige aselecte steekproef (simple random sampling)
2. Systematisch aselecte steekproef (systemic ‘’)
3. Gestratificeerde steekproef (stratified ‘’) → groepen die je echt met elkaar wil
vergelijken in het beantwoorden onderzoeksvraag (studenten met vs zonder autisme
qua functioneren op school, dan wil je dat beide groepen groot genoeg zijn)
4. Cluster steekproef (cluster sampling) → alleen bepaalde clusters mee nemen die je
niet gebruikt om met elkaar te vergelijken, maar gebruiken om te kijken of ze
representatief zijn voor de totale populatie, steeds uit verschillende clusers mensen
pakken zodat er overal gelijk mensen van zijn (representatieve steekproef)
5. Getrapte steekproef (multi-stage sampling) → meerdere fases, eerst 100 scholen,
vervolgens binnen scholen weer aantal leerlingen kiezen etc.
,Beschrijvende statistiek: centrum- en spreidingsmaten
- centrummaten - typische observatie; modus, mediaan en (gewogen) gemiddelde
- spreidingsmaten - bereik, SD en interkwartielafstand (verschil tussen Q1 en Q3 bijv)
- positiematen - percentielscore, kwartiel, min/max, mediaan, z-score (aantal SDs
afwijkend t.o.v. gemiddelde)
Populatie-, steekproef en steekproeven-verdeling
populatieverdeling: een kans-/of frequentieverdeling van de verschillende
uitkomstmogelijkheden van een variabele, zoals deze in de totale populatie wordt
waargenomen
steekproefverdeling: ‘’ in een specifieke steekproef wordt waargenomen
steekproevenverdeling: Kansverdeling voor verschillende waarden van een
steekproefgrootheid als je studie zou herhalen en herhalen. Bij groot genoege steekproef is
deze eigenlijk altijd normaal verdeeld.
,Soorten kansverdelingen
z-verdeling gebruik je bij proporties (betrouwbaarheidsinterval, verschil in of tussen
proporties
t-verdeling: betrouwbaarheidsinterval van gemiddelde of verschil tussen gemiddelde. ook bij
toetsen over waarde van/verschil tussen twee gemiddeldes. Ook bij regressie analyses.
Centrale limietstelling (central limit theorem) verdeling van gemiddelden van steekproeven is
zal altijd naar normaal verdeling convergeren ongeacht oorspronkelijke verdeling.
Parameterschatting → twee soorten schattingen voor populatiegrootheden als we deze niet
kennen (pi of mu) (parameters).
1. point estimate; een enkel getal dat de beste schatter is voor de parameter (de SE
geeft aan hoe previes deze schatter is)
2. interval estimate; interval rondom de point estimate, waarbinnen de parameter naar
waarschijnlijkheid zal liggen
Schatters moeten zuiver (unbiased/valide) zijnen doeltreffend (efficient/betrouwbaar) zijn.
Betrouwbaarheidsinterval van 95% is als ik iets 100 keer doe zal ik 95x een goed antwoord
krijgen en 5x niet (type 1 fout).
,