Hierbij de aantekeningen van het vak Statistische modellen 2, gegeven tijdens het schakelprogramma Pedagogische Wetenschappen op het SPO. Het zijn hele uitgebreide en geordende aantekeningen, waarmee ik een 8,5 heb weten te halen op het tentamen! Veel succes met het vak!
Alles van de college's staat letterlijk uitgeschreven, ook erg duidelijk.
Verkoper
Volgen
AMBR
Ontvangen beoordelingen
Voorbeeld van de inhoud
Aantekeningen statistische modellen 2
College 1: herhaling statistische modellen 1
Waarom statistiek?
➢ Samenvatting van gegevens: het comprimeert grote hoeveelheden, zodat je bijv. makkelijk
kunt communiceren. Grote hoeveelheid terugbrengen tot een hoeveelheid waar we iets mee
kunnen.
o Beschrijvende statistiek (Inleiding onderzoek). M.n. maken plaatjes, berekenen
samenvattingsmaten
➢ Aangeven van onzekerheid: zeker bij steekproefonderzoek heb je slechts een deel van de
hele populatie. Je hebt per definitie onzekerheid. Je kunt wel iets over de gehele populatie
zeggen, maar daar heb je statistiek voor nodig.
o Inferentiële statistiek (Statistische Modellen 1 en 2). Wat zegt steekproefuitkomst
over de populatie?
Belangrijke termen:
Populatie: groep waarvan onderzoeker eigenschappen wil weten. Bijv. alle Nederlanders, alle
studenten, etc.
Parameter: numerieke samenvatting van eigenschap in populatie. Samenvatting van datgene wat je
wilt weten in je populatie. Bijv. gemiddelde lengte (van alle mannen in Nederland).
Steekproef: subgroep uit populatie die onderzocht wordt. We zijn hier eigenlijk niet heel erg in
geïnteresseerd, maar wel in de populatie. Dus wat zegt die steekproef over de populatie?
Statistic (ook wel schatter): numerieke samenvatting van eigenschap in steekproef. Datgene wat je
wilt weten voor je populatie berekend voor je steekproef. Bijv. gemiddelde lengte (van de mannen in
je steekproef).
Belangrijkst: op basis van de statistic een schatting maken van de parameter. Maar daarvoor heb je
eerst andere informatie nodig. Wat hebben we gevonden in dat ene geval, en wat zegt dat dan?
Inferentiële statistiek
Voorbeeld: het gemiddelde in de steekproef kun je gebruiken om
➢ het gemiddelde in populatie te schatten
➢ kansuitspraken te doen over het gemiddelde in de populatie: hoe waarschijnlijk is iets?
,Nodig om kansuitspraken te doen: steekproevenverdeling: kansverdeling van hoe dicht zitten we bij
de parameter als we heel vaak een steekproef zouden nemen. Wat zou er gebeuren als we heel vaak
een steekproef nemen?
Wat gebeurt er wanneer we het over zouden doen?
Steekproevenverdeling
Waar heb je steekproevenverdelingen voor nodig? Vormen de basis voor de twee meest gebruikte
technieken:
1. Betrouwbaarheidsintervallen: foutenmarge. Indicatie van de parameter (bij herhaald
steekproeftrekken). Intervallen rondom je steekproefuitkomst.
2. Toetsen (significantietoetsten): p-waarde: “de kans op deze steekproefuitkomst is zo klein als
de nulhypothese waar zou zijn, dat het onwaarschijnlijk is dat de populatiegrootheid die
waarde (H0) heeft”. Je probeert aan te tonen dat de nulhypothese heel onwaarschijnlijk is.
Populatie en steekproef
Betrouwbaarheidsintervallen
Bhi gebaseerd op steekproevenverdeling rond parameter (bv. µ, π)
➢ Middelste zoveel % van de verdeling
➢ Afstand tot midden = margin of error (foutenmarge)
➢ Margin of error = kritieke waarde * standaardfout
(standaarddeviatie in de steekproevenverdeling).
Op basis van theorie bepalen we hoe breed een interval is.
Vervolgens leggen we deze afstand om onze eigen uitkomst. Als
we dus een bepaalde verdeling hebben, dan leggen we
daaromheen onze afstand.
Altijd rond steekproefuitkomst: gebaseerd op de middelste 95%.
Iedere keer ander interval, want je hebt iedere keer een andere
steekproefuitkomst.
Doel: schatten parameter
Algemeen: informatiever dan significantietoets
Interpretatie
Wat doen we dan met z’n interval? Hoe interpreteren we dit? Als je onderzoek doet, dan pak je dus
eigenlijk een willekeurige uitkomst, en je hoopt dat de dikke streep in je interval ligt. We weten niet
door slechts naar het interval te kijken of de populatiewaarde erin ligt, je hoopt het alleen, want je
weet de populatiewaarde niet. Je weet alleen dat in 95% van de gevallen de parameter erin ligt.
Wanneer dit is, daar heb je geen idee van.
➢ Als we heel vaak een betrouwbaarheidsinterval op deze manier zouden opstellen, zou dit in
C% (vaak 95%) van de gevallen de parameter omvatten
of
➢ Als ons betrouwbaarheidsinterval de parameter omvat (en dat is het geval in C% van de
steekproeven), dan ligt de parameter tussen [ondergrens] en [bovengrens]
en dus niet
➢ We zijn nu 95% zeker dat de parameter ligt tussen [ondergrens] en [bovengrens]
,Toetsen
Je probeert bewijs te verzamelen tegen een bepaalde stelling.
➢ Nulhypothese: een populatiegrootheid heeft een bepaalde waarde. Nederlandse mannen
zijn 1,80m lang.
➢ Alternatieve hypothese: de populatie-grootheid heeft die waarde niet (groter, kleiner,
ongelijk). Dat is niet waar, mannen zijn langer dan 1,80.
Je zet dus een alternatieve hypothese tegenover de nulhypothese.
Je gebruikt een toets om te proberen de nulhypothese te verwerpen. Je blijft wetenschapper, dus
niet koste wat kost, maar je wil eigenlijk wel een verschil aantonen.
Vb: H0: µ = 0 versus Ha: µ ≠ 0
Toetsingsgrootheid
Gebaseerd op een toetsingsgrootheid (test statistic): hoever zit hetgeen wat wij gevonden hebben
(onze schatting) af van de nulhypothese, uitgedrukt in standaardfouten. Hoeveel standaardfouten zit
er tussen onze nulhypothese en hetgeen wat we gevonden hebben. Stel het verschil is 5 cm, en de
standaardfout is 1, dan zitten er 5 standaardfouten tussen. Vervolgens kijk je hoe bijzonder het is dat
er 5 standaardfouten tussen zitten. ‘
P-waarde (kans)
➢ The probability of getting an outcome as extreme or more extreme than the actually
observed outcome, given H0.
➢ Hoe kleiner p (de kans) des te sterker is het bewijs tegen de nulhypothese, d.w.z. hoe
onwaarschijnlijker de nulhypothese is.
➢ Hoe klein is p?
➢ Score → tussenstap (z-waarde, t-waarde, etc.) → om vervolgens een kans te krijgen. Je kunt
geen score rechtstreeks omzetten in een kans. Je hebt een IQ score gevonden van 120, hoe
groot is die kans? Dat kan niet zomaar, eerst een tussenstap. Soms vervolgens de kans ook
nog eens vergelijken met significantieniveau α (alfa van een bepaald percentage).
Interpretatie uitkomst significantietoets
➢ p < α : significant : “er lijkt bewijs tegen de nulhypothese” (maar dit hoeft niet per se sterk
bewijs te zijn)
➢ p > α : niet significant : “geen idee of er een populatie-effect is” (en dus niet: “er is
waarschijnlijk geen populatie-effect”)
NB: wees voorzichtig! Rigide interpretaties zijn zelden wenselijk. Bij heel sterk uitkomsten is het vaak
duidelijk, maar juist rond een grenswaarde moet je erg voorzichtig zijn.
Vaste opbouw
Test statistic: “hoeveel standaardfouten ligt gevonden uitkomst van de waarde onder de H0 af”?
P-waarde: wat is de kans op minstens de gevonden test statistic?
Problemen met significantietoetsen
1. Complexe redenatie: Heel vaak fouten bij interpretatie van resultaten
, 2. Slechts twee mogelijke uitkomsten (significant/niet significant): Onnodige en schadelijke
reductie van informatie! Te simpel. Je reduceert de wereld tot 2 mogelijke uitkomsten,
terwijl je juist genuanceerd zou moeten kijken.
3. Kan leiden tot gebruik questionable research practices: mensen vinden het fijner om een
significante uitkomst te vinden, omdat de kans dan groter is dat je artikel dan gepubliceerd
wordt.
Analogie van rechtsspraak
Dit maakt het misschien iets minder abstract.
Toets Rechtspraak
Startpunt (“Stel”) H0 is waar De verdachte is onschuldig
Hoe bijzonder is P-waarde: kans om Hoe bijzonder is het bewijsmateriaal als
gevondene? gevondene te vinden als H0 verdachte onschuldig is?
waar
Als “bijzonder” “Significant”: H0 zou wel Waarschijnlijk is de aanname van
eens onwaar kunnen zijn onschuld onterecht
Als “niet zo “Niet significant”: misschien Misschien heft de verdachte het
bijzonder” is H0 waar en misschien niet gedaan, maar misschien ook niet
Bij een rechtsspraak probeert een aanklager aan te tonen dat een verdachte schuldig is (als we
uitgaan van onschuld, is het buitengewoon onwaarschijnlijk dat we dit bewijs hebben gevonden).
Aanname/nulhypothese is altijd dat iemand onschuldig is. Het bewijs moet duidelijk maken dat hij/zij
het misschien toch gedaan heeft.
➢ Ene uitkomst: Dus er is een overval gepleegd, en er is DNA gevonden. We beginnen met dat
de verdachte onschuldig is, maar we hebben wel heel sterk bewijs tegen deze nulhypothese.
➢ Ander uitkomst: De verdachte zou wel eens een groen petje kunnen dragen. Vervolgens
wordt er een verdachte aangehouden met een groen petje. Alleen het feit dat je een groen
petje hebt, is niet genoeg bewijs, dus wordt niet veroordeeld. Misschien heeft hij het wel
gedaan, maar het bewijs is te zwak om de nulhypothese te verwerpen.
Voorbeeld
We zien in SPSS
Sig. = p-waarde
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper AMBR. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,89. Je zit daarna nergens aan vast.