Uitgebreide aantekeningen colleges SM2 + belangrijke info responsiecollege
77 keer bekeken 5 keer verkocht
Vak
Statistische modellen 2 (PABA2058)
Instelling
Rijksuniversiteit Groningen (RuG)
Dit zijn de aantekeningen van alle colleges van het vak Statistische modellen 2. Ook de aantekeningen van het responsiecollege en de uitleg van de besproken opdrachten van het oefententamen staan hier in. De aantekeningen zijn uitgebreid en voorzien van afbeeldingen.
Inhoudsopgave
College 1 (6 februari) – Regressieanalyse...............................................................................................2
College 2 (13 februari) – Multivariate relaties........................................................................................9
College 3 (20 februari) – Variantieanalyse............................................................................................15
College 4 (27 februari) – Covariantieanalyse........................................................................................24
College 5 (6 maart) – Regressieanalyse met categorische predictoren................................................30
College 6 (13 maart) – Logistische regressieanalyse.............................................................................34
College 7 (20 maart) – Repeated measures ANOVA.............................................................................41
College 8 (24 maart) – Responsiecollege..............................................................................................47
1
,College 1 (6 februari) – Regressieanalyse
Statistische modellen 1 focust zich op het generaliseren (inferentie) van data. Daarvoor maak je
gebruik van een toets of een betrouwbaarheidsinterval. Statistische modellen 2 breidt dit uit.
Soorten variabelen:
- NOM = nominaal (labels). Data kan alleen worden gecategoriseerd. Geen rangorde. Bijv.
jongen/meisje
- DUM = dummyvariabelen ‘zit je wel of niet in een bepaalde groep’, je vergelijkt dus twee groepen
met elkaar. Bijv. Experimentele groep D = 1 of controlegroep D = 0. Simpele variabele
dummy-coderen: je maakt van een nominale variabele een intervalvariabele (alleen met 0 en 1).
- INT = interval/kwantitatieve variabele (kan alle waarden aannemen)
1. Lineaire relaties
Onafhankelijke variabele = X
Afhankelijke variabele = Y (wat je wilt voorspellen op basis van X)
Op basis van een vraag moet je kunnen afleiden wat de variabelen zijn. Aan de hand daarvan kies je
een model om daarmee de vraag te kunnen beantwoorden.
Variabele: iets waarin je kan verschillen (score, leeftijd, ect)
In dit college gaat het over regressieanalyse
Regressieanalyse: een statistische methode die wordt gebruikt om verbanden tussen verschillende
variabelen (X en Y) in bijv. een dataset te vinden.
Lineaire relaties onderzoeken
Voorbeelden van INT (intervalvariabelen): lengte, gewicht, leeftijd, schaalscores voor depressie,
coping, attitude, vaardigheidsscores voor taal, rekenen, ect.
Voorbeeld: onderzoeksvraag: is er een relatie tussen BDI en coping (in de populatie)
N = aantal personen = 84
Twee variabelen:
- BDI (depressie) Y = afhankelijke variabele
- Coping met tegenslag X = afhankelijke variabele
Verwachting is dat wanneer score voor BDI hoog is (hoge depressie), lage score op coping met
tegenslag = te zien in een spreidingsdiagram (puntenwolk rondom een ‘denkbeeldige’ rechte lijn). Je
verwacht dus een negatieve relatie. Je verondersteld dat de relatie lineair is.
In SPSS maak je een spreidingsdiagram.
Met de kleinste kwadratensom van de residuen vind je de unieke lijn. Een lijn waar dus de som van
de residuen geminimaliseerd is. Je kwadrateert om er voor te zorgen dat alle residuen even zwaar
meewegen.
Residu = afstanden punten tot unieke lijn.
Een lijn wordt beschreven door een helling. Dit getal (=parameter) geeft (1) de richting van de relatie
weer en (2) een interpretatie aan de relatie. De exacte waarde van de parameter weten we niet
omdat het een waarde is die de hele populatie beschrijft.
Parameter: waarde die een hele populatie beschrijft (bijv. populatie gemiddelde)
Statistiek: getal dat een steekproef beschrijft (bijv. steekproef gemiddelde)
Met die unieke lijn, de kleinste kwadraten lijn, kun je een aantal vragen beantwoorden:
2
,- Is er een lineaire relatie tussen BDI en coping met tegenslagen?
- Hoe sterk is de lineaire relatie?
Pearson correlatie: maat voor sterke lineaire relaties (uitrekenen met SPSS- t-toets)
Er komt dan een tabel genaamd ‘Correlations’. Daarin vind je:
- Pearson Correlation
Is de correlatie 1 of -1 je kunt alles 100% voorspellen. Je hebt een lineaire lijn.
Is de correlatie 0 (r=0) je kunt niks voorspellen. Er is geen relatie Je hebt een horizontale
lijn.
Hoe kleiner de residuen, hoe beter de voorspellingen.
- Sig. (2-tailed)
Dat is de P-waarde. Vaak geldt p < 0.001 = significante relatie tussen de afhankelijke (Y) en de
onafhankelijke variabele (X).
-N
N= grootte van de steekproef. Bijv. het aantal mensen.
Het kwadraat van de correlatie is de gemeenschappelijke variantie tussen variabelen X en Y
Voorbeeld: r -.088 (haal je uit de tabel ‘Correlations’ in SPSS)
(-.88)2 = 0.774 = 77%
Dus variabele X en Y hebben 77% variantie gemeenschappelijk.
- Kan BDI (Y) voorspeld worden door coping (X)?
Dat onderzoek je met enkelvoudige regressieanalyse: regressieanalyse met één voorspeller.
Als de P-waarde kleiner is dan 0.001 dan is er een hele kleine kans op de aannemelijkheid van de
nulhypothese en kan Y waarschijnlijk voorspeld worden door X.
Toetsen
‘Je vergelijkt wat je gevonden hebt, met wat je zou verwachten als de nulhypothese waar zou zijn.
Dat druk je uit in standaardfouten’.
Nulhypothese: (H0) een populatiegrootheid heeft een bepaalde waarde. Bijvoorbeeld: er is geen
relatie
Alternatieve hypothese: (Ha) een populatie-grootheid heeft die waarde niet (groter, kleiner,
ongelijk). Bijv: de relatie is groter dan 0.
je probeert de nulhypothese te verwerpen.
Hoe bijzonder is hetgeen wat ik gevonden
heb?, afgezet tegen de nulhypothese. Dat druk
je uit in standaardfouten.
Type I-fout: je verwerpt de nulhypothese ten onrechte.
Type II-fout: je verwerpt de nulhypothese ten onrechte niet.
3
, - Gebaseerd op een toetsingsgrootheid.
Toetsingsgrootheid: grootheid die de toets berekent op
grond van je gegevens, dit is een maat voor de afwijking
van jou gegevens van de verwachte waarden
(nulhypothese). Van de t-toets is dit t.
Test statistic = ‘Hoeveel standaardfouten ligt gevonden
uitkomst van de waarde onder de nulhypothese af.
Dus: score (R) test statistic (t) kans (P)
BELANGRIJK: je kunt de nulhypothese NIET bewijzen. Je kan alleen de nulhypothese onaannemelijk
maken.
P-waarde: de kans om een uitkomst te vinden zo extreem of nog extremer dan het gevonden
(toetsingsgrootheid) effect, als H0 (nulhypothese) waar zou zijn. Of: wat is de kans op minstens de
gevonden test statistic indien de nulhypothese waar zou zijn. Dus de p-waarde geeft aan hoe
extreem de gevonden waarde voor de toetsingsgrootheid van de verdeling onder de nulhypothese is.
((P- waarde is Sig. in SPSS))
Hoe kleiner de P-waarde, hoe sterker het bewijs TEGEN de nulhypothese.
Hoe klein is de P-waarde dan? Je vergelijkt het met het significantieniveau alpha (significatietoets).
P > Alpha = geen idee of er een populatie-effect is. = niet significant
P < Alpha = er lijkt bewijs te zijn tegen de nulhypothese. = significant
Alpha (α) wordt vaak vastgesteld op 0.1, 0.05, of 0.01.
Vaste opbouw van een toets
Test statistic (toetsingsgrootheid): hoeveel standaardfouten ligt de gevonden uitkomst van de
waarde onder H0 af?
P-waarde: wat is de kans op minstens de gevonden test statistic indien H 0 waar zou zijn.
2. Statistisch model
Relatie tussen variabelen in de populatie: vergelijking voor regressielijn.
Dit statistisch model heeft de vorm van: data = model + error
Yi = score op afhankelijke variable Y voor persoon i (data)
Xi = score onafhankelijke variabele X voor persoon i
Ei = residu (error, afwijking)
B0 = intercept
B1 = helling (slope)
Model = B0 + BiXi (regressielijn)
Coëfficiënten:
Intercept: snijpunt met de y-as. B0 is de werkelijke waarde, b0 is de geschatte waarde bij de
regressielijn. Bij de vergelijking van een lijn geef je de intercept aan met y.
Helling (slope): geeft de steilheid van de lijn aan. B 1 is de werkelijke waarde, b1 is de geschatte
waarde bij regressielijn. Bij de vergelijking van een lijn geef je de helling aan met a.
De intercept en de helling zijn regressiecoëfficiënten die moeten geschat worden (uit de steekproef).
Dit gebeurt moet de kleinste kwadratenmethode.
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper babettekuiper. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,39. Je zit daarna nergens aan vast.