College aantekeningen met afbeeldingen ter ondersteuning. College 8 is een herhaling van de stof geweest en in college 9 is het oefententamen besproken. Deze college's zijn daarom niet toegevoegd aan de samenvatting.
Inhoudsopgave
Hoorcollege 1 & 2 13-04-2023........................................................................................................................ 3
Lineaire relaties....................................................................................................................................................5
Statistisch model..................................................................................................................................................6
Analyse.................................................................................................................................................................7
Verklaarde variantie.............................................................................................................................................7
Assumpties...........................................................................................................................................................8
Voorbeeld met vier voorspellers.........................................................................................................................11
Afwijkingen in data en mogelijke oplossingen...................................................................................................11
Hoorcollege 3 20-04-2023 Variantieanalyses (ANOVA)..................................................................................13
T-toets voor onafhankelijke groepen.................................................................................................................13
T-toets voor 2 onafhankelijke groepen..............................................................................................................13
T-toets voor gepaarde waarnemingen..............................................................................................................14
Eénwegvariantieanalyse....................................................................................................................................14
Tweewegvariantieanalyse..................................................................................................................................16
Overig.................................................................................................................................................................17
Interactie-effect..................................................................................................................................................17
Hoorcollege 5 02-04-2023 Regressieanalyse met categorische predictoren...................................................24
Regressielijnen voor verschillende groepen.......................................................................................................24
Analyseplan........................................................................................................................................................25
Analyse...............................................................................................................................................................27
Hoorcollege 8 08-06-2023 (wordt nog toegevoegd)......................................................................................43
,3
Hoorcollege 1 & 2 13-04-2023
Inferentiële statistiek: wat zegt de steekproefuitkomst over de populatie?
- Aangeven van onzekerheid
Terminologie
› Populatie:
§ Groep waarvan onderzoeker eigenschappen wil weten
› Parameter:
§ Numerieke samenvatting van eigenschap in populatie
› Steekproef:
§ Subgroep uit populatie die onderzocht wordt
› Statistic (ook wel schatter):
§ Numerieke samenvatting van eigenschap in steekproef
Inferentiële statistiek
› Voorbeeld: het gemiddelde in de steekproef kun je gebruiken om
§ Het gemiddelde in populatie te schatten
§ Kansuitspraken te doen over het gemiddelde in de populatie
› Nodig om kansuitspraken te doen:
§ Steekproevenverdeling:
Wat gebeurt er wanneer we het over zouden doen?
Twee methoden voor inferentie
1) Betrouwbaarheidsintervallen
Indicatie van de parameter (bij herhaald steekproeftrekken)
2) Hypothesetoetsen (= significantietoetsen)
“de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou zijn, dat het
onwaarschijnlijk is dat de populatiegrootheid die waarde (H0) heeft”
Populatie en steekproef
Betrouwbaarheidsintervallen
› Bhi gebaseerd op steekproevenverdeling rond parameter (bv. µ, π)
§ Middelste C% van de verdeling
§ Afstand tot midden = margin of error
§ Margin of error = kritieke waarde * standaardfout
› Altijd rond steekproefuitkomst
› Iedere keer ander interval
› Doel: schatten parameter
› Algemeen: informatiever dan significantietoets
‘Als we heel vaak een betrouwbaarheidsinterval op deze manier zouden opstellen, zou dit in C% van
de gevallen de parameter omvatten’
‘Als ons betrouwbaarheidsinterval de parameter omvat (en dat is het geval in C% van de
steekproeven), dan ligt de parameter tussen [ondergrens] en [bovengrens]’
Toetsen
› Nulhypothese: een populatiegrootheid heeft een bepaalde waarde
› Alternatieve hypothese: de populatie-grootheid heeft die waarde niet (groter, kleiner, ongelijk)
Probeer de nulhypothese te verwerpen
Vb. H0: = 0 versus Ha: ≠ 0
Uit de steekproef In de populatie
› P-waarde
§ The probability of getting an outcome as extreme or more extreme than the actually
observed outcome, given H0.
§ Hoe kleiner p des te sterker is het bewijs tegen de nulhypothese, d.w.z. Hoe
onwaarschijnlijker de nulhypothese is.
• Hoe klein is p?
Vergelijk met significantieniveau
› P < α : significant : “er lijkt bewijs tegen de nulhypothese” (maar dit hoeft niet per se sterk
bewijs te zijn)
› P > α : niet significant : “geen idee of er een populatie-effect is”
Opbouw toets
› Test statistic: “hoeveel standaardfouten ligt gevonden uitkomst van de waarde onder de H0
af”?
› P-waarde: wat is de kans op minstens de gevonden test statistic?
Problemen bij significantietoetsing
1) Complexe redenatie: Heel vaak fouten bij interpretatie van resultaten
2) Slechts twee mogelijke uitkomsten (significant/niet significant):
Onnodige en schadelijke reductie van informatie!
3) Kan leiden tot gebruik questionable research practices
Belang beschrijvende statistiek
› Beschrijvende statistiek gebruik je vóór inferentiële statistiek, d.w.z.: bekijk eerst je data
voordat je toetst/bhis maakt
§ Beschrijvende maten, zoals gemiddelde, SD, mediaan, minimum, maximum, IQR, etc.
§ Grafische weergaven, zoals histogram, boxplot, spreidingsdiagram, QQ-plot, etc.
› Dit is niet minder, maar een essentiële eerste stap. Toesen/bhi’s zonder beschrijvende
statistiek is vaak niet informatief
Onafh. Afh.
X X Y Model
1 2
DUM INT t-toets voor onafhankelijke
groepen
NOM INT éénwegvariantieanalyse
(ANOVA)
NOM NOM INT tweewegvariantieanalyse
(ANOVA)
INT INT enkelvoudige
regressieanalyse
INT INT INT multipele regressieanalyse
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper veerletp. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.