Class notes

Uitgebreide college-aantekeningen Statistische Modellen 2 (SPO/RUG)

18 views 1 purchase

Course
Statistische modellen 2 (PABA2058)

Institution
Rijksuniversiteit Groningen (RuG)

Uitgebreide college-aantekeningen met belangrijke grafieken en schema's vanuit de sheets uitgelegd.

[Show more]

Preview 4 out of 35 pages

View example

Uploaded on June 27, 2023
Number of pages 35
Written in 2022/2023
Type Class notes
Professor(s) Rink hoekstra
Contains All classes

statistische modellen 2
rink
hoekstra
statistiek
college
aantekeningen
spo
rug
samenvatting

Institution
Rijksuniversiteit Groningen (RuG)
Education
Pedagogische Wetenschappen
Course
Statistische modellen 2 (PABA2058)

Christinaortho

Member since 3 year 101 documents sold

$3.81

Also available in package deal from $8.47

Add to cart

Add to wishlist

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Also available in package deal (1)

ALLE modellen van statistische modellen schematisch + Uitgebreide College aantekeningen

$ 9.42 $ 8.47

1x sold

2 items

1. Summary - Alle modellen van statistische modellen 2 schematisch weergegeven in 1 tabel (spo/rug...
2. Class notes - Uitgebreide college-aantekeningen statistische modellen 2 (spo/rug)
Show more

Wat is statistiek (herhaling SM1)

o Samenvatten van gegevens  Beschrijvende statistiek = plaatjes maken, bereken, samenvattingsmaten
o Aangeven van onzekerheid  Inferentiële statistiek = wat zegt de steekproefuitkomst over de populatie

Termen
Populatie = groep waarvan de onderzoeker eigenschappen wil weten
Parameter = numerieke samenvatting van eigenschap in populatie GRIEKSE LETTER = Populatie!
Steekproef = subgroep uit populatie Gewone letter = steekproef
Statistic = Numerieke samenvatting van eigenschap in steekproef

Random steekproef = beter, meer is niet altijd beter (gaat om representatitievteit)

In de praktijk:
Je hebt een statistic en daarmee doe je een schatting van de parameter

Voorbeeld
Gemiddelde in de steekproef gebruik je voor  gemiddelde in populatie + kansuitspraken
Nodig voor kansuitspraken  steekproevenverdeling (wat gebeurt er als we het nog eens doen)
Steekproevenverdeling  nodig voor: BHI (foutenmarge) & Toetsen (p-waarde)

2 maten voor inferentie:
1. Betrouwbaarheidsintervallen = indicatie van parameter (bij herhaald steekproeven)
o Gebaseerd op steekproevenverdeling rond parameter (µ&π)
o Middelste C% van de verdeling
o Afstand tot midden = Margin of Error µ = gemiddelde
o Altijd rond steekproefuitkomst π = proportie
o Iedere keer ander interval
o Doel: schatten parameter
o Algemeen: informatiever dan significantietoets!

Als we heel vaak een BHI zouden opstellen zou dit in C% van de gevallen de parameter omvatten
OF
Als ons BHI de parameter omvat (en dat is het geval in C% van de steekproeven) dan ligt de parameter tussen -
ondergrens- en -bovengrens-
Margin of Error
NIET!  We zijn 95% zeker van dat de parameter tussen de grenzen ligt!!
= kritieke waarde *
BHI = Statistic + Margin of Error standaardfout

2. Toetsen (hypothesetoetsen/significantietoetsen)
o de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou zijn, dat het onwaarschijnlijk is dat
de populatiegrootheid die waarde (h0) heeft
o Nulhypothese = een populatiegrootheid heeft een bepaalde waarde
o Alternatieve hypothese = de populatie-grootheid heeft die waarde niet (groter, kleiner of ongelijk aan)
o Proberen: nulhypothese verwerken

De toetsingsgrootheid is de grootheid die de toets berekent op grond van je gegevens, dit is een maat voor de
afwijking van jouw gegevens van de verwachte waarden. De gevonden toetsingsgrootheid kan worden vergelijken
met de kritische waarde van die grootheid, om te beslissen of de nulhypothese moet worden verworpen. Statistische
programma's geven naast de toetsingsgrootheid zelf ook de overschrijdingskans p daarvan, deze moet worden
vergeleken met het significantieniveau om te beslissen over de nulhypothese.

Voorbeelden:
De toetsingsgrootheid van de Chi-kwadraat toets is X2, die van de t-toets is t, van ANOVA is het F, van correlatie is
het r etc.

,o Gebaseerd op toetsingsgrootheid
o P-waarde
o De waarschijnlijkheid op deze uitkomst zo extreem of meer extreem
dan de geobserveerde uitkomst als H=0 waar is.
o Hoe kleiner p  sterker bewijs tegen nulhypothese
o Vergelijk met significantie niveau α
o Interpretatie P
o P<α  significant  er LIJKT bewijs tegen nulhypothese (niet per se sterk bewijs)
o P>α  niet significant  geen idee of er populatie effect is (NIET er is waarschijnlijk geen!)
o Nooit rigide interpreteren!

Opbouw toets

Test statistic/toetsingsgrootheid = Hoeveel SE ligt de gevonden uitkomst van de waarde onder de H0 af

P-waarde = wat is de kans op minstens de gevonden statistic

o Waarom kansen?
o Je wil kansen verbinden aan scores en dat is niet rechtstreeks op te zoeken maar wel indirect via
toetsingsgrootheid!

Voor beschrijvende statistiek heb je inferentiële statistiek nodig, zonder dat is het niet informatief.
Je bekijkt altijd eerst je data.

Soorten variabelen
NOM = nominaal = categorisch  onderscheidt groepen/condities vb. hechtingsstijl/leiderschapsstijl
DUM = dummy = binair = 2 categorieën vb. geslacht, wel/niet gehaald/behandel
INT = kwantitatief/continue  betekenisvolle intervallen vb. gewicht, citoscore, BDI, IQ

, Enkelvoudige regressieanalyse

Soorten variabelen Onafh. Afh.
NOM = nominaal (labels)
DUM = dummy = binair = 1 (exp.), 0 (contr) X1 X2 Y Model
INT = kwantitatief/continue DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
Relatie tussen intervalvariabelen/Algemeen INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
o Veel onderzoeken met intervalvariabelen
INT DUM DUM logistische regressieanalyse
 Voorbeelden: INT INT t-toets gepaarde waarnemingen
 Lengte, gewicht, leeftijd INT INT INT repeated measures (ANCOVA)
 Schaalscores (introversie,
depressie, coping, attitude)
 Vaardigheidsscores taal, rekenen
o Vanuit de theorie verwachtingen over de relaties tussen variabelen
o Vaak kijk je naar ‘is er een relatie tussen..’
 Kijk naar spreidingsdiagram:
 Richting
 Sterkte
o Een lineaire relatie werkt goed!  kun je samenvatting
 Helling 
 Richting van de relatie (- of +getal)
 Interpretatie aan relatie
o Hoe bereken je de lijn?
 Kleinste kwadratensom van de residuen
 Bereken alle residuen (afstanden van punten tot lijn)
 Kwadrateer alle residuen
 Tel ze op
 Lijn kiezen zodat deze som zo klein mogelijk is
 Kleinste kwadratensom is uniek  unieke lijn
o Met deze lijn kan je 3 dingen voorspellen: r = pearsons correlatie sterkte relatie
r2 = verklaarde variantie 
 1. Is er een lineaire relatie?
gemeenschappelijke variantie
 2. Hoe sterk is deze relatie?  Pearson’s correlatie (r)
var.A en var. B hebben …% variantie
 3. Kan het 1 door het ander voorspeld worden? 
gemeenschappelijk
enkelvoudige regressie-analyse

Statistisch model

,  Je krijgt een geschatte regressielijn = niet direct observeerbaar  kleinste kwadratenmethode

b0 = schatter van β0
b1 = schatter van β1

o Niet alle punten hoeven op de regressielijn
o RESTRICTIE = homoscedasticiteit = verticale spreiding is voor alle waarden ongeveer gelijk

UITLEG TABEL Enkelvoudige regressie-analyse

= geschat intercept = b0
= geschatte helling = b1
= t-toets voor  nulhypothese: intercept = nul met  p-waarde (hoe waarschijnlijk is dit?)
= t-toets voor  nulhypothese: helling = nul met  p-waarde (hoe waarschijnlijk is dit?)
= Waarden voor coëfficenten als alles gestandaardiseerd is (gem: 0, sd: 1) = correlatie!
= verklaarde variantie  hoeveel van a kan verklaard worden door coping?

 Als de t-toets voor het intercept niet significant is  GEEN probleem!  waarschijnlijk een klein intercept
 Als t-toets voor helling significant is  variabele a LIJKT een voorspeller voor variabele b (onderzoeksvraag:
kan het een uit het ander voorspeld worden: ja, uit de t-tioets volgt dat het een WAARSCHIJNLIJK een
voorspeler is van het andere)
 R = positief = er is een positieve correlatie
 Percentage r2 = variantie die verklaard wordt door..

HOGE r2 LAGE r2
kleinere residuen Grote residuen
hoge correlatie Lage correlatie
Residuen dichterbij lijn Residuen verder weg van lijn
Meer verklaarde variantie Minder verklaarde variantie
Je kan de lijn goed voorspellen! Je kan de lijn minder goed voorspellen

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller Christinaortho. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $3.81. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

48298 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 15 years now

Start selling

Popular Universities in the United States

Popular books

Find notes and summaries for these qualifications

Seller