Dit zijn de college aantekeningen van het vak "Statistische Modellen 1" uit het eerste jaar van de bachelor Pedagogische Wetenschappen. Het bevat de colleges 1 t/m 6a.
Statistische Modellen 1:
Hoorcolleges
Hoorcollege 1A
Bij Statistische Modellen is inferentiële statistiek:
- Houdt zich bezig met generaliseren van uitkomsten
- Veel onderzoeken gebaseerd op steekproeven
- Toch vaak uitspraken over grotere groep
Thema’s in Statistische Modellen:
- Hoe moet dat generaliseren?
- Welke technieken zijn er?
- Hoe kan SPSS helpen bij dit generaliseren?
- Doen onderzoekers het zelf wel altijd goed?
- Wat zijn valkuilen?
- Dus:
o Technische vaardigheden voor eigen onderzoek
o Kritische houding ten opzichte van bestaand onderzoek
Steekproevenverdeling (4.4-4.5)
Terminologie:
- Populatie: groep waarvan onderzoeker eigenschappen wil weten
- Parameter: numerieke samenvatting van eigenschap in populatie
- Steekproef: subgroep uit populatie die onderzocht wordt
- Statistic: numerieke samenvatting van eigenschap in steekproef
Waarom is kansrekening relevant voor ons?
- Gaat uit van random gebeurtenissen
- Voorspelt regelmaat op lange termijn random gebeurtenissen
Kansverdeling:
- Geeft aan wat er op de lange duur gebeurt
- Steekproeftrekking is ook een random gebeurtenis
- Kansrekening gebruikt om hierover kansuitspraken te doen
Steekproevenverdeling vertelt je wat er uit een steekproef zou komen als je hem heel vaak
zou doen.
4.4 Sampling distribution (Steekproevenverdeling -> kansverdeling voor steekproeven)
- Wat is de verdeling als ik heel vaak een steekproef zou trekken? Wat voor waardes
kunnen er allemaal uitkomen?
Voorbeeld
- Stel je bent geïnteresseerd in het deel van de Amerikanen dat in 2012 voor Obama
zou stemmen
- Stel: in werkelijkheid was dit aantal 53,9%
- We nemen een steekproef van 50 mensen. Uitkomst 58% Obama
- Steekproef 2: 48% Obama
, - Steekproef 3: enz.
- Iedere steekproef (net) een andere uitkomst
- Uitkomst is dus een random variabele
Steekproevenverdeling
- Verzameling van veel (hier 100)
van die uitkomsten
- Steekproevenverdeling:
kansverdeling die een kans
aangeven voor iedere mogelijke
uitkomst.
Andere steekproevenverdeling
(proportie)
- Bijvoorbeeld gooien met een
muntje en kijken hoe vaak je kopt gooit
- Er ontstaat dan een soort patroon
- Kansen per staafje in principe los uit
te rekenen (later)
- Hier krijg je dan een normale
verdeling
- Als je een grote steeproef heel vaak
doet, begint het steeds meer te lijken
op een normale verdeling
4.5 Steekproevenverdeling voor gemiddeldes (kan voor iedere ‘statistic’)
Wat kan steekproef uit populatie allemaal zijn?
- Populatie -> gemiddelde 9.0
- Steekproef (n=10) -> gemiddelde 8.5
- Tweede steekproef (n=10) -> gemiddelde 8.7
- Na vele steekproeven zie je dat steekproefgemiddelde varieert over steekproeven
- Zijn zelf random variabelen met verdeling en die verdeling noemen we: ->
steekproevenverdeling van gemiddelde
- Als we heel vaak een steekproef zouden trekken, dan komt er iedere keer iets anders
uit.
Stel je trekt heel vaak een steekproef uit een populatie, dan de volgende bevindingen:
- Steekproefgemiddelden variëren minder dan de losse scores in populatie -> de
extremen komen steeds minder voor als je een grotere groep hebt. Dan vormt er een
figuur, wat lijkt op een normale verdeling -> bij een grotere n, wordt die verdeling
steeds ‘gepiekter’, steeds meer in het midden komt, waar extremen steeds
onwaarschijnlijker zijn.
- Verdeling van steekproefgemiddelden is ‘meer’ normaal verdeeld dan de losse scores
in de populatie. Naarmate je grotere steekproeven neemt, dan komt de massa in het
midden en het begint steeds meer te lijken op een normale verdeling.
,We zien:
- Verdeling van steekproefgemiddelden niet zelfde als verdeling van scores in
populatie
- Variantie van steekproefgemiddelden is kleiner dan variantie van scores
- Gemiddelde van steekproefgemiddelden is zelfde als gemiddelde van scores in
populatie
- -> dit is geen toeval, maar geldt algemeen
De verdeling in de populatie is eigenlijk een soort verdeling van steekproefjes van n=1 (van
losse personen). Terwijl bij steekproevenverdeling vaak kijken naar groepjes personen.
Onafhankelijke van hoe de populatie verdeeld is, dat is wanneer je grotere steekproeven
trekt, dan komt er een normale verdeling uit. De spreiding/standaarddeviatie in die normale
verdeling is kleiner dan bij de originele populatie. Dus minder extreme scores.
Algemeen geldt:
Gemiddelde van steekproefgemiddelden (dus, als je heel vaak steekproef trekt) is hetzelfde
als gemiddelde van scores in populatie. Daarnaast naarmate je n groter wordt, lijkt de
verdeling van de steekproevenverdeling steeds meer op een normale verdeling gaat lijken =
centrale limietstelling (central limit theorem).
Waarom is dat zo?
- Je trekt heel veel steekproeven
- Sommige gemiddelden hoger dan populatiegemiddelde, andere lager
- Gemiddelde van al die steekproefgemiddelden komt uit op populatiegemiddelde
Altijd geldt:
-
- Gemiddelde van steekproevenverdeling is hetzelfde als gemiddelde populatie.
- Standaarddeviatie van steekproevenverdeling is hetzelfde als populatie, maar dan
gedeeld door wortel n.
- Altijd geldt als populatie exact normaal verdeeld is, steekproegemiddelde. Exact
normaal verdeeld
- Als populatie niet normaal verdeeld is en n groot dan is steekproefgemiddelde
ongeveer normaal verdeeld.
De standaardfout geeft aan hoeveel steekproefuitkomsten van elkaar verschillen. Als je heel
veel steekproefuitkomsten hebt, hoeveel liggen die dan uit elkaar. Als standaardfout heel
groot is, dan kan steekproef dus heel erg verschillen in uitkomsten. Het is een soort
standaarddeviatie van de steekproevenverdeling. (zie powerpoint)
Wat kunnen we nu met een steekproevenverdeling?
- Het geeft je inzicht in hoe bijzonder jouw ene uitkomst is
- Gebruikt om jouw uitkomst te vergelijken met andere mogelijke uitkomsten
- Hoe bijzonder is wat ik gevonden heb? Had ik ook iets anders kunnen vinden? Hoe
extreem is mijn uitkomst?
, Hoorcollege 1B
Voorbeeldvraag 2: C
Voorbeeldvraag 3: B
- Als het exact normaal verdeeld is, blijft het exact normaal verdeeld maar steeds
steiler. Maar hier is het al exact normaal verdeeld, dus daarom blijft het normaal
verdeeld.
- Als het niet normaal verdeeld is, wordt het ongeveer normaal verdeeld. Dus bij
benadering
Betrouwbaarheidsintervallen
5.1
Schatten:
- Als je een steekproef trekt vind je een bepaalde uitkomst (statistic)
o Proportie vrouwen bij studenten bedrijfskunde
o Gemiddelde lengte van topsporters
o Gemiddeld verschil tussen jongens en meisjes wat betreft CITO
- De parameter kennen we echter niet! Wat nu?
- Dan moeten we de populatiewaarde (parameter) maar schatten -> twee soorten:
o Puntschatting (point estimate) -> bv. gemiddelde, mediaan, proportie, etc.
o Intervalschatting (interval estimate) -> dit is iets concreter
Hoe goed is je puntschatting? -> hangt af van de mate waarin die biased is
- Bias (vertekening)
o Unbiased estimator: geen structurele vertekening als je het heel vaak zou
herhalen -> dit heb je het liefst. Ook hier zit je er wel eens naast en is er
variatie in de steekproeven, maar gemiddeld genomen zit je goed.
o Biased estimator: structurele vertekening bij herhaling. Voorbeeld is range.
In beide situaties bij 1 steekproef wel over/onderschatting mogelijk (maar niet
per se beide)
- Gemiddelde, proportie en standaarddeviatie ‘unbiased’
Intervalschatters
- Schatter van waar de parameter ongeveer zou kunnen liggen
- Meest gebruikte intervalschatter: betrouwbaarheidsinterval (confidence interval)
Wat is een betrouwbaarheidsinterval?
- Een C%-betrouwbaarheidsinterval (bv. 95%) dekt in (95%) van de intervallen de
parameter. Je kiest van tevoren wat voor betrouwbaarheidsinterval je wilt.
- Het lijntje raakt niet het rode lijntje, dan valt het buiten het
betrouwbaarheidsinterval. Meestal dekt het lijntje wel het betrouwbaarheidsinterval
-> 95% van de gevallen wel en 5% niet.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper karlijnvanesch1. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,99. Je zit daarna nergens aan vast.