Statistische modellen 1 l Hoorcollege 5 l Pre-master Orthopedagogiek l SPO Groningen l 5-3-2020
College 5, statistische modellen 1, 5-3-2020.
We gaan eerst het PDF van college 4 afmaken. Vervolgens gaan we verder met het PDF van college
5.
Pagina 6, college 4.
Vaak gebruiken we voor gemiddelden een t-procedure en dan kijken we of het gepooled kan worden
of niet.
Pagina 6,7,8,9 van het pdf gaan 2 groepen vergelijken voor een categorische variabelen (niet naar
gemiddelden, maar naar proporties).
Stap 1: Geschatte verschil in populatieproporties = 0.635-0.528 = 0.097. Dit geven we weer aan de
hand van: 0.097 ± m (m is foutmarge).
Stap 2: Spreiding berekenen. Het gaat om schattingen, dus we werken met standaarderror:
Stap 3: Foutmarge
Kritieke waarde bij 95% betrouwbaarheid. We gebruiken bij proporties z-waardes. De
bijpassende z-waarde bij 95% kun je opzoeken en komt uit op 1,96.
Foutmarge berekenen: m= z*SE = 1,96*0.129=0.253.
Foutmarge noteren bij je schatting: 0.097 ± 0.253.
Stap 4: Overschrijdingskans: Bij een 95% betrouwbaarheidsinterval voor het verschil in
populatieproporties (0.097-0.253) < π 1- π 2< (0.097 + 0.253) -> -0.156< π 1- π 2<0.350
Het verschil in proporties is maximaal 0.100 (in dit geval is dit 0.253). Hierdoor kunnen we bij
bovenstaande zeggen dat de foutmarge veel te groot is.
De foutmarge moet naar beneden, dit kan gedaan worden door:
Steekproefgrootte verhogen.
We kunnen zeggen dat relatief gezien school A vaker VMBO adviseert dan school B (62% t.o.v. 52%).
Significant = verschil dat je ziet, berust wat mij betreft niet op toeval. Hierdoor kun je wel zeggen dat
iets relatief gezien klopt, maar significant niet (je kunt niet uitsluiten dat het door toeval komt). Ook
kun je het niet causaal verklaren, omdat het geen experiment is.
Bij categorische variabelen (proporties) HEB JE NOOIT EEN T-PROCEDURE.
, Statistische modellen 1 l Hoorcollege 5 l Pre-master Orthopedagogiek l SPO Groningen l 5-3-2020
College 4, Pagina 7.
De nulhypothese wordt niet verworpen, want de p waarde is niet lager dan 0.05.
Als je de nulhypothese wilt toetsen, dat de proporties even groot zijn, geef je hem tot het einde van
de verhaal de voordeel van de twijfel. We vullen dan 2 even grote proporties in. Dan kijk je naar de
totale groep. Als opsplitsen geen zin heeft, dan zou je verwachten dat bij beide scholen de proportie
gelijk is. Dat is wat de nulhypothese probeert te zeggen (opsplitsen heeft geen zin). We gaan hier nu
een gepoolde proportie maken. Bij toetsing ben je echt met een nulhypothese bezig.
1. Standaardiseer de gevonden afwijking:
Breng het naar een z-score door de statistiek – de nulhypothese te doen en dat te delen door
de standaarderror.
2. Zoek de bijbehorende overschrijdingskans op bij Z=0.74 -> 0.2296 & 0.7704. Het is 0.2296 want
0.7704 kan niet, aangezien het ook tweezijdig moet. Je kunt niet 2 keer 77% hebben binnen 100%.
Zie het plaatje maar.
Hij moet tweezijdig omdat de vraagstelling je vraagt naar een verschil.