100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Statistische Modellen 1 - Hoorcolleges $4.33   Add to cart

Class notes

Statistische Modellen 1 - Hoorcolleges

 30 views  1 purchase
  • Course
  • Institution

Dit zijn de college aantekeningen van het vak "Statistische Modellen 1" uit het eerste jaar van de bachelor Pedagogische Wetenschappen. Het bevat de colleges 1 t/m 6a.

Preview 4 out of 52  pages

  • January 29, 2021
  • 52
  • 2018/2019
  • Class notes
  • R. hoekstra
  • All classes
avatar-seller
Statistische Modellen 1:
Hoorcolleges
Hoorcollege 1A
Bij Statistische Modellen is inferentiële statistiek:
- Houdt zich bezig met generaliseren van uitkomsten
- Veel onderzoeken gebaseerd op steekproeven
- Toch vaak uitspraken over grotere groep

Thema’s in Statistische Modellen:
- Hoe moet dat generaliseren?
- Welke technieken zijn er?
- Hoe kan SPSS helpen bij dit generaliseren?
- Doen onderzoekers het zelf wel altijd goed?
- Wat zijn valkuilen?
- Dus:
o Technische vaardigheden voor eigen onderzoek
o Kritische houding ten opzichte van bestaand onderzoek

Steekproevenverdeling (4.4-4.5)
Terminologie:
- Populatie: groep waarvan onderzoeker eigenschappen wil weten
- Parameter: numerieke samenvatting van eigenschap in populatie
- Steekproef: subgroep uit populatie die onderzocht wordt
- Statistic: numerieke samenvatting van eigenschap in steekproef
Waarom is kansrekening relevant voor ons?
- Gaat uit van random gebeurtenissen
- Voorspelt regelmaat op lange termijn random gebeurtenissen
Kansverdeling:
- Geeft aan wat er op de lange duur gebeurt
- Steekproeftrekking is ook een random gebeurtenis
- Kansrekening gebruikt om hierover kansuitspraken te doen
Steekproevenverdeling vertelt je wat er uit een steekproef zou komen als je hem heel vaak
zou doen.

4.4 Sampling distribution (Steekproevenverdeling -> kansverdeling voor steekproeven)
- Wat is de verdeling als ik heel vaak een steekproef zou trekken? Wat voor waardes
kunnen er allemaal uitkomen?
Voorbeeld
- Stel je bent geïnteresseerd in het deel van de Amerikanen dat in 2012 voor Obama
zou stemmen
- Stel: in werkelijkheid was dit aantal 53,9%
- We nemen een steekproef van 50 mensen. Uitkomst 58% Obama
- Steekproef 2: 48% Obama

, - Steekproef 3: enz.
- Iedere steekproef (net) een andere uitkomst
- Uitkomst is dus een random variabele
Steekproevenverdeling
- Verzameling van veel (hier 100)
van die uitkomsten
- Steekproevenverdeling:
kansverdeling die een kans
aangeven voor iedere mogelijke
uitkomst.



Andere steekproevenverdeling
(proportie)
- Bijvoorbeeld gooien met een
muntje en kijken hoe vaak je kopt gooit
- Er ontstaat dan een soort patroon
- Kansen per staafje in principe los uit
te rekenen (later)
- Hier krijg je dan een normale
verdeling
- Als je een grote steeproef heel vaak
doet, begint het steeds meer te lijken
op een normale verdeling


4.5 Steekproevenverdeling voor gemiddeldes (kan voor iedere ‘statistic’)
Wat kan steekproef uit populatie allemaal zijn?
- Populatie -> gemiddelde 9.0
- Steekproef (n=10) -> gemiddelde 8.5
- Tweede steekproef (n=10) -> gemiddelde 8.7
- Na vele steekproeven zie je dat steekproefgemiddelde varieert over steekproeven
- Zijn zelf random variabelen met verdeling en die verdeling noemen we: ->
steekproevenverdeling van gemiddelde
- Als we heel vaak een steekproef zouden trekken, dan komt er iedere keer iets anders
uit.
Stel je trekt heel vaak een steekproef uit een populatie, dan de volgende bevindingen:
- Steekproefgemiddelden variëren minder dan de losse scores in populatie -> de
extremen komen steeds minder voor als je een grotere groep hebt. Dan vormt er een
figuur, wat lijkt op een normale verdeling -> bij een grotere n, wordt die verdeling
steeds ‘gepiekter’, steeds meer in het midden komt, waar extremen steeds
onwaarschijnlijker zijn.
- Verdeling van steekproefgemiddelden is ‘meer’ normaal verdeeld dan de losse scores
in de populatie. Naarmate je grotere steekproeven neemt, dan komt de massa in het
midden en het begint steeds meer te lijken op een normale verdeling.

,We zien:
- Verdeling van steekproefgemiddelden niet zelfde als verdeling van scores in
populatie
- Variantie van steekproefgemiddelden is kleiner dan variantie van scores
- Gemiddelde van steekproefgemiddelden is zelfde als gemiddelde van scores in
populatie
- -> dit is geen toeval, maar geldt algemeen

De verdeling in de populatie is eigenlijk een soort verdeling van steekproefjes van n=1 (van
losse personen). Terwijl bij steekproevenverdeling vaak kijken naar groepjes personen.
Onafhankelijke van hoe de populatie verdeeld is, dat is wanneer je grotere steekproeven
trekt, dan komt er een normale verdeling uit. De spreiding/standaarddeviatie in die normale
verdeling is kleiner dan bij de originele populatie. Dus minder extreme scores.

Algemeen geldt:
Gemiddelde van steekproefgemiddelden (dus, als je heel vaak steekproef trekt) is hetzelfde
als gemiddelde van scores in populatie. Daarnaast naarmate je n groter wordt, lijkt de
verdeling van de steekproevenverdeling steeds meer op een normale verdeling gaat lijken =
centrale limietstelling (central limit theorem).
Waarom is dat zo?
- Je trekt heel veel steekproeven
- Sommige gemiddelden hoger dan populatiegemiddelde, andere lager
- Gemiddelde van al die steekproefgemiddelden komt uit op populatiegemiddelde

Altijd geldt:


-
- Gemiddelde van steekproevenverdeling is hetzelfde als gemiddelde populatie.
- Standaarddeviatie van steekproevenverdeling is hetzelfde als populatie, maar dan
gedeeld door wortel n.
- Altijd geldt als populatie exact normaal verdeeld is, steekproegemiddelde. Exact
normaal verdeeld
- Als populatie niet normaal verdeeld is en n groot dan is steekproefgemiddelde
ongeveer normaal verdeeld.

De standaardfout geeft aan hoeveel steekproefuitkomsten van elkaar verschillen. Als je heel
veel steekproefuitkomsten hebt, hoeveel liggen die dan uit elkaar. Als standaardfout heel
groot is, dan kan steekproef dus heel erg verschillen in uitkomsten. Het is een soort
standaarddeviatie van de steekproevenverdeling. (zie powerpoint)

Wat kunnen we nu met een steekproevenverdeling?
- Het geeft je inzicht in hoe bijzonder jouw ene uitkomst is
- Gebruikt om jouw uitkomst te vergelijken met andere mogelijke uitkomsten
- Hoe bijzonder is wat ik gevonden heb? Had ik ook iets anders kunnen vinden? Hoe
extreem is mijn uitkomst?

, Hoorcollege 1B
Voorbeeldvraag 2: C
Voorbeeldvraag 3: B
- Als het exact normaal verdeeld is, blijft het exact normaal verdeeld maar steeds
steiler. Maar hier is het al exact normaal verdeeld, dus daarom blijft het normaal
verdeeld.
- Als het niet normaal verdeeld is, wordt het ongeveer normaal verdeeld. Dus bij
benadering

Betrouwbaarheidsintervallen
5.1
Schatten:
- Als je een steekproef trekt vind je een bepaalde uitkomst (statistic)
o Proportie vrouwen bij studenten bedrijfskunde
o Gemiddelde lengte van topsporters
o Gemiddeld verschil tussen jongens en meisjes wat betreft CITO
- De parameter kennen we echter niet! Wat nu?
- Dan moeten we de populatiewaarde (parameter) maar schatten -> twee soorten:
o Puntschatting (point estimate) -> bv. gemiddelde, mediaan, proportie, etc.
o Intervalschatting (interval estimate) -> dit is iets concreter
Hoe goed is je puntschatting? -> hangt af van de mate waarin die biased is
- Bias (vertekening)
o Unbiased estimator: geen structurele vertekening als je het heel vaak zou
herhalen -> dit heb je het liefst. Ook hier zit je er wel eens naast en is er
variatie in de steekproeven, maar gemiddeld genomen zit je goed.
o Biased estimator: structurele vertekening bij herhaling. Voorbeeld is range.
In beide situaties bij 1 steekproef wel over/onderschatting mogelijk (maar niet
per se beide)
- Gemiddelde, proportie en standaarddeviatie ‘unbiased’
Intervalschatters
- Schatter van waar de parameter ongeveer zou kunnen liggen
- Meest gebruikte intervalschatter: betrouwbaarheidsinterval (confidence interval)
Wat is een betrouwbaarheidsinterval?
- Een C%-betrouwbaarheidsinterval (bv. 95%) dekt in (95%) van de intervallen de
parameter. Je kiest van tevoren wat voor betrouwbaarheidsinterval je wilt.
- Het lijntje raakt niet het rode lijntje, dan valt het buiten het
betrouwbaarheidsinterval. Meestal dekt het lijntje wel het betrouwbaarheidsinterval
-> 95% van de gevallen wel en 5% niet.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller karlijnvanesch1. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $4.33. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

79223 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$4.33  1x  sold
  • (0)
  Add to cart