100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Uitgebreide college-aantekeningen Statistische Modellen 2 (SPO/RUG) $3.87   Add to cart

Class notes

Uitgebreide college-aantekeningen Statistische Modellen 2 (SPO/RUG)

 18 views  1 purchase
  • Course
  • Institution

Uitgebreide college-aantekeningen met belangrijke grafieken en schema's vanuit de sheets uitgelegd.

Preview 4 out of 35  pages

  • June 27, 2023
  • 35
  • 2022/2023
  • Class notes
  • Rink hoekstra
  • All classes
avatar-seller
Wat is statistiek (herhaling SM1)

o Samenvatten van gegevens  Beschrijvende statistiek = plaatjes maken, bereken, samenvattingsmaten
o Aangeven van onzekerheid  Inferentiële statistiek = wat zegt de steekproefuitkomst over de populatie

Termen
Populatie = groep waarvan de onderzoeker eigenschappen wil weten
Parameter = numerieke samenvatting van eigenschap in populatie GRIEKSE LETTER = Populatie!
Steekproef = subgroep uit populatie Gewone letter = steekproef
Statistic = Numerieke samenvatting van eigenschap in steekproef

Random steekproef = beter, meer is niet altijd beter (gaat om representatitievteit)

In de praktijk:
Je hebt een statistic en daarmee doe je een schatting van de parameter

Voorbeeld
Gemiddelde in de steekproef gebruik je voor  gemiddelde in populatie + kansuitspraken
Nodig voor kansuitspraken  steekproevenverdeling (wat gebeurt er als we het nog eens doen)
Steekproevenverdeling  nodig voor: BHI (foutenmarge) & Toetsen (p-waarde)

2 maten voor inferentie:
1. Betrouwbaarheidsintervallen = indicatie van parameter (bij herhaald steekproeven)
o Gebaseerd op steekproevenverdeling rond parameter (µ&π)
o Middelste C% van de verdeling
o Afstand tot midden = Margin of Error µ = gemiddelde
o Altijd rond steekproefuitkomst π = proportie
o Iedere keer ander interval
o Doel: schatten parameter
o Algemeen: informatiever dan significantietoets!

Als we heel vaak een BHI zouden opstellen zou dit in C% van de gevallen de parameter omvatten
OF
Als ons BHI de parameter omvat (en dat is het geval in C% van de steekproeven) dan ligt de parameter tussen -
ondergrens- en -bovengrens-
Margin of Error
NIET!  We zijn 95% zeker van dat de parameter tussen de grenzen ligt!!
= kritieke waarde *
BHI = Statistic + Margin of Error standaardfout


2. Toetsen (hypothesetoetsen/significantietoetsen)
o de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou zijn, dat het onwaarschijnlijk is dat
de populatiegrootheid die waarde (h0) heeft
o Nulhypothese = een populatiegrootheid heeft een bepaalde waarde
o Alternatieve hypothese = de populatie-grootheid heeft die waarde niet (groter, kleiner of ongelijk aan)
o Proberen: nulhypothese verwerken

De toetsingsgrootheid is de grootheid die de toets berekent op grond van je gegevens, dit is een maat voor de
afwijking van jouw gegevens van de verwachte waarden. De gevonden toetsingsgrootheid kan worden vergelijken
met de kritische waarde van die grootheid, om te beslissen of de nulhypothese moet worden verworpen. Statistische
programma's geven naast de toetsingsgrootheid zelf ook de overschrijdingskans p daarvan, deze moet worden
vergeleken met het significantieniveau om te beslissen over de nulhypothese.

Voorbeelden:
De toetsingsgrootheid van de Chi-kwadraat toets is X2, die van de t-toets is t, van ANOVA is het F, van correlatie is
het r etc.

,o Gebaseerd op toetsingsgrootheid
o P-waarde
o De waarschijnlijkheid op deze uitkomst zo extreem of meer extreem
dan de geobserveerde uitkomst als H=0 waar is.
o Hoe kleiner p  sterker bewijs tegen nulhypothese
o Vergelijk met significantie niveau α
o Interpretatie P
o P<α  significant  er LIJKT bewijs tegen nulhypothese (niet per se sterk bewijs)
o P>α  niet significant  geen idee of er populatie effect is (NIET er is waarschijnlijk geen!)
o Nooit rigide interpreteren!

Opbouw toets

Test statistic/toetsingsgrootheid = Hoeveel SE ligt de gevonden uitkomst van de waarde onder de H0 af

P-waarde = wat is de kans op minstens de gevonden statistic



o Waarom kansen?
o Je wil kansen verbinden aan scores en dat is niet rechtstreeks op te zoeken maar wel indirect via
toetsingsgrootheid!




Voor beschrijvende statistiek heb je inferentiële statistiek nodig, zonder dat is het niet informatief.
Je bekijkt altijd eerst je data.


Soorten variabelen
NOM = nominaal = categorisch  onderscheidt groepen/condities vb. hechtingsstijl/leiderschapsstijl
DUM = dummy = binair = 2 categorieën vb. geslacht, wel/niet gehaald/behandel
INT = kwantitatief/continue  betekenisvolle intervallen vb. gewicht, citoscore, BDI, IQ

, Enkelvoudige regressieanalyse

Soorten variabelen Onafh. Afh.
NOM = nominaal (labels)
DUM = dummy = binair = 1 (exp.), 0 (contr) X1 X2 Y Model
INT = kwantitatief/continue DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
Relatie tussen intervalvariabelen/Algemeen INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
o Veel onderzoeken met intervalvariabelen
INT DUM DUM logistische regressieanalyse
 Voorbeelden: INT INT t-toets gepaarde waarnemingen
 Lengte, gewicht, leeftijd INT INT INT repeated measures (ANCOVA)
 Schaalscores (introversie,
depressie, coping, attitude)
 Vaardigheidsscores taal, rekenen
o Vanuit de theorie verwachtingen over de relaties tussen variabelen
o Vaak kijk je naar ‘is er een relatie tussen..’
 Kijk naar spreidingsdiagram:
 Richting
 Sterkte
o Een lineaire relatie werkt goed!  kun je samenvatting
 Helling 
 Richting van de relatie (- of +getal)
 Interpretatie aan relatie
o Hoe bereken je de lijn?
 Kleinste kwadratensom van de residuen
 Bereken alle residuen (afstanden van punten tot lijn)
 Kwadrateer alle residuen
 Tel ze op
 Lijn kiezen zodat deze som zo klein mogelijk is
 Kleinste kwadratensom is uniek  unieke lijn
o Met deze lijn kan je 3 dingen voorspellen: r = pearsons correlatie sterkte relatie
r2 = verklaarde variantie 
 1. Is er een lineaire relatie?
gemeenschappelijke variantie
 2. Hoe sterk is deze relatie?  Pearson’s correlatie (r)
var.A en var. B hebben …% variantie
 3. Kan het 1 door het ander voorspeld worden? 
gemeenschappelijk
enkelvoudige regressie-analyse


Statistisch model

,  Je krijgt een geschatte regressielijn = niet direct observeerbaar  kleinste kwadratenmethode


b0 = schatter van β0
b1 = schatter van β1

o Niet alle punten hoeven op de regressielijn
o RESTRICTIE = homoscedasticiteit = verticale spreiding is voor alle waarden ongeveer gelijk


UITLEG TABEL Enkelvoudige regressie-analyse




= geschat intercept = b0
= geschatte helling = b1
= t-toets voor  nulhypothese: intercept = nul met  p-waarde (hoe waarschijnlijk is dit?)
= t-toets voor  nulhypothese: helling = nul met  p-waarde (hoe waarschijnlijk is dit?)
= Waarden voor coëfficenten als alles gestandaardiseerd is (gem: 0, sd: 1) = correlatie!
= verklaarde variantie  hoeveel van a kan verklaard worden door coping?


 Als de t-toets voor het intercept niet significant is  GEEN probleem!  waarschijnlijk een klein intercept
 Als t-toets voor helling significant is  variabele a LIJKT een voorspeller voor variabele b (onderzoeksvraag:
kan het een uit het ander voorspeld worden: ja, uit de t-tioets volgt dat het een WAARSCHIJNLIJK een
voorspeler is van het andere)
 R = positief = er is een positieve correlatie
 Percentage r2 = variantie die verklaard wordt door..


HOGE r2 LAGE r2
kleinere residuen Grote residuen
hoge correlatie Lage correlatie
Residuen dichterbij lijn Residuen verder weg van lijn
Meer verklaarde variantie Minder verklaarde variantie
Je kan de lijn goed voorspellen! Je kan de lijn minder goed voorspellen

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller Christinaortho. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $3.87. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

66579 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$3.87  1x  sold
  • (0)
  Add to cart