o Samenvatten van gegevens Beschrijvende statistiek = plaatjes maken, bereken, samenvattingsmaten
o Aangeven van onzekerheid Inferentiële statistiek = wat zegt de steekproefuitkomst over de populatie
Termen
Populatie = groep waarvan de onderzoeker eigenschappen wil weten
Parameter = numerieke samenvatting van eigenschap in populatie GRIEKSE LETTER = Populatie!
Steekproef = subgroep uit populatie Gewone letter = steekproef
Statistic = Numerieke samenvatting van eigenschap in steekproef
Random steekproef = beter, meer is niet altijd beter (gaat om representatitievteit)
In de praktijk:
Je hebt een statistic en daarmee doe je een schatting van de parameter
Voorbeeld
Gemiddelde in de steekproef gebruik je voor gemiddelde in populatie + kansuitspraken
Nodig voor kansuitspraken steekproevenverdeling (wat gebeurt er als we het nog eens doen)
Steekproevenverdeling nodig voor: BHI (foutenmarge) & Toetsen (p-waarde)
2 maten voor inferentie:
1. Betrouwbaarheidsintervallen = indicatie van parameter (bij herhaald steekproeven)
o Gebaseerd op steekproevenverdeling rond parameter (µ&π)
o Middelste C% van de verdeling
o Afstand tot midden = Margin of Error µ = gemiddelde
o Altijd rond steekproefuitkomst π = proportie
o Iedere keer ander interval
o Doel: schatten parameter
o Algemeen: informatiever dan significantietoets!
Als we heel vaak een BHI zouden opstellen zou dit in C% van de gevallen de parameter omvatten
OF
Als ons BHI de parameter omvat (en dat is het geval in C% van de steekproeven) dan ligt de parameter tussen -
ondergrens- en -bovengrens-
Margin of Error
NIET! We zijn 95% zeker van dat de parameter tussen de grenzen ligt!!
= kritieke waarde *
BHI = Statistic + Margin of Error standaardfout
2. Toetsen (hypothesetoetsen/significantietoetsen)
o de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou zijn, dat het onwaarschijnlijk is dat
de populatiegrootheid die waarde (h0) heeft
o Nulhypothese = een populatiegrootheid heeft een bepaalde waarde
o Alternatieve hypothese = de populatie-grootheid heeft die waarde niet (groter, kleiner of ongelijk aan)
o Proberen: nulhypothese verwerken
De toetsingsgrootheid is de grootheid die de toets berekent op grond van je gegevens, dit is een maat voor de
afwijking van jouw gegevens van de verwachte waarden. De gevonden toetsingsgrootheid kan worden vergelijken
met de kritische waarde van die grootheid, om te beslissen of de nulhypothese moet worden verworpen. Statistische
programma's geven naast de toetsingsgrootheid zelf ook de overschrijdingskans p daarvan, deze moet worden
vergeleken met het significantieniveau om te beslissen over de nulhypothese.
Voorbeelden:
De toetsingsgrootheid van de Chi-kwadraat toets is X2, die van de t-toets is t, van ANOVA is het F, van correlatie is
het r etc.
,o Gebaseerd op toetsingsgrootheid
o P-waarde
o De waarschijnlijkheid op deze uitkomst zo extreem of meer extreem
dan de geobserveerde uitkomst als H=0 waar is.
o Hoe kleiner p sterker bewijs tegen nulhypothese
o Vergelijk met significantie niveau α
o Interpretatie P
o P<α significant er LIJKT bewijs tegen nulhypothese (niet per se sterk bewijs)
o P>α niet significant geen idee of er populatie effect is (NIET er is waarschijnlijk geen!)
o Nooit rigide interpreteren!
Opbouw toets
Test statistic/toetsingsgrootheid = Hoeveel SE ligt de gevonden uitkomst van de waarde onder de H0 af
P-waarde = wat is de kans op minstens de gevonden statistic
o Waarom kansen?
o Je wil kansen verbinden aan scores en dat is niet rechtstreeks op te zoeken maar wel indirect via
toetsingsgrootheid!
Voor beschrijvende statistiek heb je inferentiële statistiek nodig, zonder dat is het niet informatief.
Je bekijkt altijd eerst je data.
Soorten variabelen
NOM = nominaal = categorisch onderscheidt groepen/condities vb. hechtingsstijl/leiderschapsstijl
DUM = dummy = binair = 2 categorieën vb. geslacht, wel/niet gehaald/behandel
INT = kwantitatief/continue betekenisvolle intervallen vb. gewicht, citoscore, BDI, IQ
, Enkelvoudige regressieanalyse
Soorten variabelen Onafh. Afh.
NOM = nominaal (labels)
DUM = dummy = binair = 1 (exp.), 0 (contr) X1 X2 Y Model
INT = kwantitatief/continue DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
Relatie tussen intervalvariabelen/Algemeen INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
o Veel onderzoeken met intervalvariabelen
INT DUM DUM logistische regressieanalyse
Voorbeelden: INT INT t-toets gepaarde waarnemingen
Lengte, gewicht, leeftijd INT INT INT repeated measures (ANCOVA)
Schaalscores (introversie,
depressie, coping, attitude)
Vaardigheidsscores taal, rekenen
o Vanuit de theorie verwachtingen over de relaties tussen variabelen
o Vaak kijk je naar ‘is er een relatie tussen..’
Kijk naar spreidingsdiagram:
Richting
Sterkte
o Een lineaire relatie werkt goed! kun je samenvatting
Helling
Richting van de relatie (- of +getal)
Interpretatie aan relatie
o Hoe bereken je de lijn?
Kleinste kwadratensom van de residuen
Bereken alle residuen (afstanden van punten tot lijn)
Kwadrateer alle residuen
Tel ze op
Lijn kiezen zodat deze som zo klein mogelijk is
Kleinste kwadratensom is uniek unieke lijn
o Met deze lijn kan je 3 dingen voorspellen: r = pearsons correlatie sterkte relatie
r2 = verklaarde variantie
1. Is er een lineaire relatie?
gemeenschappelijke variantie
2. Hoe sterk is deze relatie? Pearson’s correlatie (r)
var.A en var. B hebben …% variantie
3. Kan het 1 door het ander voorspeld worden?
gemeenschappelijk
enkelvoudige regressie-analyse
Statistisch model
, Je krijgt een geschatte regressielijn = niet direct observeerbaar kleinste kwadratenmethode
b0 = schatter van β0
b1 = schatter van β1
o Niet alle punten hoeven op de regressielijn
o RESTRICTIE = homoscedasticiteit = verticale spreiding is voor alle waarden ongeveer gelijk
UITLEG TABEL Enkelvoudige regressie-analyse
= geschat intercept = b0
= geschatte helling = b1
= t-toets voor nulhypothese: intercept = nul met p-waarde (hoe waarschijnlijk is dit?)
= t-toets voor nulhypothese: helling = nul met p-waarde (hoe waarschijnlijk is dit?)
= Waarden voor coëfficenten als alles gestandaardiseerd is (gem: 0, sd: 1) = correlatie!
= verklaarde variantie hoeveel van a kan verklaard worden door coping?
Als de t-toets voor het intercept niet significant is GEEN probleem! waarschijnlijk een klein intercept
Als t-toets voor helling significant is variabele a LIJKT een voorspeller voor variabele b (onderzoeksvraag:
kan het een uit het ander voorspeld worden: ja, uit de t-tioets volgt dat het een WAARSCHIJNLIJK een
voorspeler is van het andere)
R = positief = er is een positieve correlatie
Percentage r2 = variantie die verklaard wordt door..
HOGE r2 LAGE r2
kleinere residuen Grote residuen
hoge correlatie Lage correlatie
Residuen dichterbij lijn Residuen verder weg van lijn
Meer verklaarde variantie Minder verklaarde variantie
Je kan de lijn goed voorspellen! Je kan de lijn minder goed voorspellen
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Christinaortho. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,59. Je zit daarna nergens aan vast.