o Samenvatten van gegevens Beschrijvende statistiek = plaatjes maken, bereken, samenvattingsmaten
o Aangeven van onzekerheid Inferentiële statistiek = wat zegt de steekproefuitkomst over de populatie
Termen
Populatie = groep waarvan de onderzoeker eigenschappen wil weten
Parameter = numerieke samenvatting van eigenschap in populatie GRIEKSE LETTER = Populatie!
Steekproef = subgroep uit populatie Gewone letter = steekproef
Statistic = Numerieke samenvatting van eigenschap in steekproef
Random steekproef = beter, meer is niet altijd beter (gaat om representatitievteit)
In de praktijk:
Je hebt een statistic en daarmee doe je een schatting van de parameter
Voorbeeld
Gemiddelde in de steekproef gebruik je voor gemiddelde in populatie + kansuitspraken
Nodig voor kansuitspraken steekproevenverdeling (wat gebeurt er als we het nog eens doen)
Steekproevenverdeling nodig voor: BHI (foutenmarge) & Toetsen (p-waarde)
2 maten voor inferentie:
1. Betrouwbaarheidsintervallen = indicatie van parameter (bij herhaald steekproeven)
o Gebaseerd op steekproevenverdeling rond parameter (µ&π)
o Middelste C% van de verdeling
o Afstand tot midden = Margin of Error µ = gemiddelde
o Altijd rond steekproefuitkomst π = proportie
o Iedere keer ander interval
o Doel: schatten parameter
o Algemeen: informatiever dan significantietoets!
Als we heel vaak een BHI zouden opstellen zou dit in C% van de gevallen de parameter omvatten
OF
Als ons BHI de parameter omvat (en dat is het geval in C% van de steekproeven) dan ligt de parameter tussen -
ondergrens- en -bovengrens-
Margin of Error
NIET! We zijn 95% zeker van dat de parameter tussen de grenzen ligt!!
= kritieke waarde *
BHI = Statistic + Margin of Error standaardfout
2. Toetsen (hypothesetoetsen/significantietoetsen)
o de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou zijn, dat het onwaarschijnlijk is dat
de populatiegrootheid die waarde (h0) heeft
o Nulhypothese = een populatiegrootheid heeft een bepaalde waarde
o Alternatieve hypothese = de populatie-grootheid heeft die waarde niet (groter, kleiner of ongelijk aan)
o Proberen: nulhypothese verwerken
De toetsingsgrootheid is de grootheid die de toets berekent op grond van je gegevens, dit is een maat voor de
afwijking van jouw gegevens van de verwachte waarden. De gevonden toetsingsgrootheid kan worden vergelijken
met de kritische waarde van die grootheid, om te beslissen of de nulhypothese moet worden verworpen. Statistische
programma's geven naast de toetsingsgrootheid zelf ook de overschrijdingskans p daarvan, deze moet worden
vergeleken met het significantieniveau om te beslissen over de nulhypothese.
Voorbeelden:
De toetsingsgrootheid van de Chi-kwadraat toets is X2, die van de t-toets is t, van ANOVA is het F, van correlatie is
het r etc.
,o Gebaseerd op toetsingsgrootheid
o P-waarde
o De waarschijnlijkheid op deze uitkomst zo extreem of meer extreem
dan de geobserveerde uitkomst als H=0 waar is.
o Hoe kleiner p sterker bewijs tegen nulhypothese
o Vergelijk met significantie niveau α
o Interpretatie P
o P<α significant er LIJKT bewijs tegen nulhypothese (niet per se sterk bewijs)
o P>α niet significant geen idee of er populatie effect is (NIET er is waarschijnlijk geen!)
o Nooit rigide interpreteren!
Opbouw toets
Test statistic/toetsingsgrootheid = Hoeveel SE ligt de gevonden uitkomst van de waarde onder de H0 af
P-waarde = wat is de kans op minstens de gevonden statistic
o Waarom kansen?
o Je wil kansen verbinden aan scores en dat is niet rechtstreeks op te zoeken maar wel indirect via
toetsingsgrootheid!
Voor beschrijvende statistiek heb je inferentiële statistiek nodig, zonder dat is het niet informatief.
Je bekijkt altijd eerst je data.
Soorten variabelen
NOM = nominaal = categorisch onderscheidt groepen/condities vb. hechtingsstijl/leiderschapsstijl
DUM = dummy = binair = 2 categorieën vb. geslacht, wel/niet gehaald/behandel
INT = kwantitatief/continue betekenisvolle intervallen vb. gewicht, citoscore, BDI, IQ
, Enkelvoudige regressieanalyse
Soorten variabelen Onafh. Afh.
NOM = nominaal (labels)
DUM = dummy = binair = 1 (exp.), 0 (contr) X1 X2 Y Model
INT = kwantitatief/continue DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
Relatie tussen intervalvariabelen/Algemeen INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
o Veel onderzoeken met intervalvariabelen
INT DUM DUM logistische regressieanalyse
Voorbeelden: INT INT t-toets gepaarde waarnemingen
Lengte, gewicht, leeftijd INT INT INT repeated measures (ANCOVA)
Schaalscores (introversie,
depressie, coping, attitude)
Vaardigheidsscores taal, rekenen
o Vanuit de theorie verwachtingen over de relaties tussen variabelen
o Vaak kijk je naar ‘is er een relatie tussen..’
Kijk naar spreidingsdiagram:
Richting
Sterkte
o Een lineaire relatie werkt goed! kun je samenvatting
Helling
Richting van de relatie (- of +getal)
Interpretatie aan relatie
o Hoe bereken je de lijn?
Kleinste kwadratensom van de residuen
Bereken alle residuen (afstanden van punten tot lijn)
Kwadrateer alle residuen
Tel ze op
Lijn kiezen zodat deze som zo klein mogelijk is
Kleinste kwadratensom is uniek unieke lijn
o Met deze lijn kan je 3 dingen voorspellen: r = pearsons correlatie sterkte relatie
r2 = verklaarde variantie
1. Is er een lineaire relatie?
gemeenschappelijke variantie
2. Hoe sterk is deze relatie? Pearson’s correlatie (r)
var.A en var. B hebben …% variantie
3. Kan het 1 door het ander voorspeld worden?
gemeenschappelijk
enkelvoudige regressie-analyse
Statistisch model
, Je krijgt een geschatte regressielijn = niet direct observeerbaar kleinste kwadratenmethode
b0 = schatter van β0
b1 = schatter van β1
o Niet alle punten hoeven op de regressielijn
o RESTRICTIE = homoscedasticiteit = verticale spreiding is voor alle waarden ongeveer gelijk
UITLEG TABEL Enkelvoudige regressie-analyse
= geschat intercept = b0
= geschatte helling = b1
= t-toets voor nulhypothese: intercept = nul met p-waarde (hoe waarschijnlijk is dit?)
= t-toets voor nulhypothese: helling = nul met p-waarde (hoe waarschijnlijk is dit?)
= Waarden voor coëfficenten als alles gestandaardiseerd is (gem: 0, sd: 1) = correlatie!
= verklaarde variantie hoeveel van a kan verklaard worden door coping?
Als de t-toets voor het intercept niet significant is GEEN probleem! waarschijnlijk een klein intercept
Als t-toets voor helling significant is variabele a LIJKT een voorspeller voor variabele b (onderzoeksvraag:
kan het een uit het ander voorspeld worden: ja, uit de t-tioets volgt dat het een WAARSCHIJNLIJK een
voorspeler is van het andere)
R = positief = er is een positieve correlatie
Percentage r2 = variantie die verklaard wordt door..
HOGE r2 LAGE r2
kleinere residuen Grote residuen
hoge correlatie Lage correlatie
Residuen dichterbij lijn Residuen verder weg van lijn
Meer verklaarde variantie Minder verklaarde variantie
Je kan de lijn goed voorspellen! Je kan de lijn minder goed voorspellen
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Christinaortho. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.81. You're not tied to anything after your purchase.