Hierbij de aantekeningen van het vak Statistische modellen 2, gegeven tijdens het schakelprogramma Pedagogische Wetenschappen op het SPO. Het zijn hele uitgebreide en geordende aantekeningen, waarmee ik een 8,5 heb weten te halen op het tentamen! Veel succes met het vak!
Everything about the lectures is written out literally, also very clear.
Seller
Follow
AMBR
Reviews received
Content preview
Aantekeningen statistische modellen 2
College 1: herhaling statistische modellen 1
Waarom statistiek?
➢ Samenvatting van gegevens: het comprimeert grote hoeveelheden, zodat je bijv. makkelijk
kunt communiceren. Grote hoeveelheid terugbrengen tot een hoeveelheid waar we iets mee
kunnen.
o Beschrijvende statistiek (Inleiding onderzoek). M.n. maken plaatjes, berekenen
samenvattingsmaten
➢ Aangeven van onzekerheid: zeker bij steekproefonderzoek heb je slechts een deel van de
hele populatie. Je hebt per definitie onzekerheid. Je kunt wel iets over de gehele populatie
zeggen, maar daar heb je statistiek voor nodig.
o Inferentiële statistiek (Statistische Modellen 1 en 2). Wat zegt steekproefuitkomst
over de populatie?
Belangrijke termen:
Populatie: groep waarvan onderzoeker eigenschappen wil weten. Bijv. alle Nederlanders, alle
studenten, etc.
Parameter: numerieke samenvatting van eigenschap in populatie. Samenvatting van datgene wat je
wilt weten in je populatie. Bijv. gemiddelde lengte (van alle mannen in Nederland).
Steekproef: subgroep uit populatie die onderzocht wordt. We zijn hier eigenlijk niet heel erg in
geïnteresseerd, maar wel in de populatie. Dus wat zegt die steekproef over de populatie?
Statistic (ook wel schatter): numerieke samenvatting van eigenschap in steekproef. Datgene wat je
wilt weten voor je populatie berekend voor je steekproef. Bijv. gemiddelde lengte (van de mannen in
je steekproef).
Belangrijkst: op basis van de statistic een schatting maken van de parameter. Maar daarvoor heb je
eerst andere informatie nodig. Wat hebben we gevonden in dat ene geval, en wat zegt dat dan?
Inferentiële statistiek
Voorbeeld: het gemiddelde in de steekproef kun je gebruiken om
➢ het gemiddelde in populatie te schatten
➢ kansuitspraken te doen over het gemiddelde in de populatie: hoe waarschijnlijk is iets?
,Nodig om kansuitspraken te doen: steekproevenverdeling: kansverdeling van hoe dicht zitten we bij
de parameter als we heel vaak een steekproef zouden nemen. Wat zou er gebeuren als we heel vaak
een steekproef nemen?
Wat gebeurt er wanneer we het over zouden doen?
Steekproevenverdeling
Waar heb je steekproevenverdelingen voor nodig? Vormen de basis voor de twee meest gebruikte
technieken:
1. Betrouwbaarheidsintervallen: foutenmarge. Indicatie van de parameter (bij herhaald
steekproeftrekken). Intervallen rondom je steekproefuitkomst.
2. Toetsen (significantietoetsten): p-waarde: “de kans op deze steekproefuitkomst is zo klein als
de nulhypothese waar zou zijn, dat het onwaarschijnlijk is dat de populatiegrootheid die
waarde (H0) heeft”. Je probeert aan te tonen dat de nulhypothese heel onwaarschijnlijk is.
Populatie en steekproef
Betrouwbaarheidsintervallen
Bhi gebaseerd op steekproevenverdeling rond parameter (bv. µ, π)
➢ Middelste zoveel % van de verdeling
➢ Afstand tot midden = margin of error (foutenmarge)
➢ Margin of error = kritieke waarde * standaardfout
(standaarddeviatie in de steekproevenverdeling).
Op basis van theorie bepalen we hoe breed een interval is.
Vervolgens leggen we deze afstand om onze eigen uitkomst. Als
we dus een bepaalde verdeling hebben, dan leggen we
daaromheen onze afstand.
Altijd rond steekproefuitkomst: gebaseerd op de middelste 95%.
Iedere keer ander interval, want je hebt iedere keer een andere
steekproefuitkomst.
Doel: schatten parameter
Algemeen: informatiever dan significantietoets
Interpretatie
Wat doen we dan met z’n interval? Hoe interpreteren we dit? Als je onderzoek doet, dan pak je dus
eigenlijk een willekeurige uitkomst, en je hoopt dat de dikke streep in je interval ligt. We weten niet
door slechts naar het interval te kijken of de populatiewaarde erin ligt, je hoopt het alleen, want je
weet de populatiewaarde niet. Je weet alleen dat in 95% van de gevallen de parameter erin ligt.
Wanneer dit is, daar heb je geen idee van.
➢ Als we heel vaak een betrouwbaarheidsinterval op deze manier zouden opstellen, zou dit in
C% (vaak 95%) van de gevallen de parameter omvatten
of
➢ Als ons betrouwbaarheidsinterval de parameter omvat (en dat is het geval in C% van de
steekproeven), dan ligt de parameter tussen [ondergrens] en [bovengrens]
en dus niet
➢ We zijn nu 95% zeker dat de parameter ligt tussen [ondergrens] en [bovengrens]
,Toetsen
Je probeert bewijs te verzamelen tegen een bepaalde stelling.
➢ Nulhypothese: een populatiegrootheid heeft een bepaalde waarde. Nederlandse mannen
zijn 1,80m lang.
➢ Alternatieve hypothese: de populatie-grootheid heeft die waarde niet (groter, kleiner,
ongelijk). Dat is niet waar, mannen zijn langer dan 1,80.
Je zet dus een alternatieve hypothese tegenover de nulhypothese.
Je gebruikt een toets om te proberen de nulhypothese te verwerpen. Je blijft wetenschapper, dus
niet koste wat kost, maar je wil eigenlijk wel een verschil aantonen.
Vb: H0: µ = 0 versus Ha: µ ≠ 0
Toetsingsgrootheid
Gebaseerd op een toetsingsgrootheid (test statistic): hoever zit hetgeen wat wij gevonden hebben
(onze schatting) af van de nulhypothese, uitgedrukt in standaardfouten. Hoeveel standaardfouten zit
er tussen onze nulhypothese en hetgeen wat we gevonden hebben. Stel het verschil is 5 cm, en de
standaardfout is 1, dan zitten er 5 standaardfouten tussen. Vervolgens kijk je hoe bijzonder het is dat
er 5 standaardfouten tussen zitten. ‘
P-waarde (kans)
➢ The probability of getting an outcome as extreme or more extreme than the actually
observed outcome, given H0.
➢ Hoe kleiner p (de kans) des te sterker is het bewijs tegen de nulhypothese, d.w.z. hoe
onwaarschijnlijker de nulhypothese is.
➢ Hoe klein is p?
➢ Score → tussenstap (z-waarde, t-waarde, etc.) → om vervolgens een kans te krijgen. Je kunt
geen score rechtstreeks omzetten in een kans. Je hebt een IQ score gevonden van 120, hoe
groot is die kans? Dat kan niet zomaar, eerst een tussenstap. Soms vervolgens de kans ook
nog eens vergelijken met significantieniveau α (alfa van een bepaald percentage).
Interpretatie uitkomst significantietoets
➢ p < α : significant : “er lijkt bewijs tegen de nulhypothese” (maar dit hoeft niet per se sterk
bewijs te zijn)
➢ p > α : niet significant : “geen idee of er een populatie-effect is” (en dus niet: “er is
waarschijnlijk geen populatie-effect”)
NB: wees voorzichtig! Rigide interpretaties zijn zelden wenselijk. Bij heel sterk uitkomsten is het vaak
duidelijk, maar juist rond een grenswaarde moet je erg voorzichtig zijn.
Vaste opbouw
Test statistic: “hoeveel standaardfouten ligt gevonden uitkomst van de waarde onder de H0 af”?
P-waarde: wat is de kans op minstens de gevonden test statistic?
Problemen met significantietoetsen
1. Complexe redenatie: Heel vaak fouten bij interpretatie van resultaten
, 2. Slechts twee mogelijke uitkomsten (significant/niet significant): Onnodige en schadelijke
reductie van informatie! Te simpel. Je reduceert de wereld tot 2 mogelijke uitkomsten,
terwijl je juist genuanceerd zou moeten kijken.
3. Kan leiden tot gebruik questionable research practices: mensen vinden het fijner om een
significante uitkomst te vinden, omdat de kans dan groter is dat je artikel dan gepubliceerd
wordt.
Analogie van rechtsspraak
Dit maakt het misschien iets minder abstract.
Toets Rechtspraak
Startpunt (“Stel”) H0 is waar De verdachte is onschuldig
Hoe bijzonder is P-waarde: kans om Hoe bijzonder is het bewijsmateriaal als
gevondene? gevondene te vinden als H0 verdachte onschuldig is?
waar
Als “bijzonder” “Significant”: H0 zou wel Waarschijnlijk is de aanname van
eens onwaar kunnen zijn onschuld onterecht
Als “niet zo “Niet significant”: misschien Misschien heft de verdachte het
bijzonder” is H0 waar en misschien niet gedaan, maar misschien ook niet
Bij een rechtsspraak probeert een aanklager aan te tonen dat een verdachte schuldig is (als we
uitgaan van onschuld, is het buitengewoon onwaarschijnlijk dat we dit bewijs hebben gevonden).
Aanname/nulhypothese is altijd dat iemand onschuldig is. Het bewijs moet duidelijk maken dat hij/zij
het misschien toch gedaan heeft.
➢ Ene uitkomst: Dus er is een overval gepleegd, en er is DNA gevonden. We beginnen met dat
de verdachte onschuldig is, maar we hebben wel heel sterk bewijs tegen deze nulhypothese.
➢ Ander uitkomst: De verdachte zou wel eens een groen petje kunnen dragen. Vervolgens
wordt er een verdachte aangehouden met een groen petje. Alleen het feit dat je een groen
petje hebt, is niet genoeg bewijs, dus wordt niet veroordeeld. Misschien heeft hij het wel
gedaan, maar het bewijs is te zwak om de nulhypothese te verwerpen.
Voorbeeld
We zien in SPSS
Sig. = p-waarde
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller AMBR. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.24. You're not tied to anything after your purchase.