Uitgebreide aantekeningen colleges SM2 + belangrijke info responsiecollege
77 views 5 purchases
Course
Statistische modellen 2 (PABA2058)
Institution
Rijksuniversiteit Groningen (RuG)
Dit zijn de aantekeningen van alle colleges van het vak Statistische modellen 2. Ook de aantekeningen van het responsiecollege en de uitleg van de besproken opdrachten van het oefententamen staan hier in. De aantekeningen zijn uitgebreid en voorzien van afbeeldingen.
Inhoudsopgave
College 1 (6 februari) – Regressieanalyse...............................................................................................2
College 2 (13 februari) – Multivariate relaties........................................................................................9
College 3 (20 februari) – Variantieanalyse............................................................................................15
College 4 (27 februari) – Covariantieanalyse........................................................................................24
College 5 (6 maart) – Regressieanalyse met categorische predictoren................................................30
College 6 (13 maart) – Logistische regressieanalyse.............................................................................34
College 7 (20 maart) – Repeated measures ANOVA.............................................................................41
College 8 (24 maart) – Responsiecollege..............................................................................................47
1
,College 1 (6 februari) – Regressieanalyse
Statistische modellen 1 focust zich op het generaliseren (inferentie) van data. Daarvoor maak je
gebruik van een toets of een betrouwbaarheidsinterval. Statistische modellen 2 breidt dit uit.
Soorten variabelen:
- NOM = nominaal (labels). Data kan alleen worden gecategoriseerd. Geen rangorde. Bijv.
jongen/meisje
- DUM = dummyvariabelen ‘zit je wel of niet in een bepaalde groep’, je vergelijkt dus twee groepen
met elkaar. Bijv. Experimentele groep D = 1 of controlegroep D = 0. Simpele variabele
dummy-coderen: je maakt van een nominale variabele een intervalvariabele (alleen met 0 en 1).
- INT = interval/kwantitatieve variabele (kan alle waarden aannemen)
1. Lineaire relaties
Onafhankelijke variabele = X
Afhankelijke variabele = Y (wat je wilt voorspellen op basis van X)
Op basis van een vraag moet je kunnen afleiden wat de variabelen zijn. Aan de hand daarvan kies je
een model om daarmee de vraag te kunnen beantwoorden.
Variabele: iets waarin je kan verschillen (score, leeftijd, ect)
In dit college gaat het over regressieanalyse
Regressieanalyse: een statistische methode die wordt gebruikt om verbanden tussen verschillende
variabelen (X en Y) in bijv. een dataset te vinden.
Lineaire relaties onderzoeken
Voorbeelden van INT (intervalvariabelen): lengte, gewicht, leeftijd, schaalscores voor depressie,
coping, attitude, vaardigheidsscores voor taal, rekenen, ect.
Voorbeeld: onderzoeksvraag: is er een relatie tussen BDI en coping (in de populatie)
N = aantal personen = 84
Twee variabelen:
- BDI (depressie) Y = afhankelijke variabele
- Coping met tegenslag X = afhankelijke variabele
Verwachting is dat wanneer score voor BDI hoog is (hoge depressie), lage score op coping met
tegenslag = te zien in een spreidingsdiagram (puntenwolk rondom een ‘denkbeeldige’ rechte lijn). Je
verwacht dus een negatieve relatie. Je verondersteld dat de relatie lineair is.
In SPSS maak je een spreidingsdiagram.
Met de kleinste kwadratensom van de residuen vind je de unieke lijn. Een lijn waar dus de som van
de residuen geminimaliseerd is. Je kwadrateert om er voor te zorgen dat alle residuen even zwaar
meewegen.
Residu = afstanden punten tot unieke lijn.
Een lijn wordt beschreven door een helling. Dit getal (=parameter) geeft (1) de richting van de relatie
weer en (2) een interpretatie aan de relatie. De exacte waarde van de parameter weten we niet
omdat het een waarde is die de hele populatie beschrijft.
Parameter: waarde die een hele populatie beschrijft (bijv. populatie gemiddelde)
Statistiek: getal dat een steekproef beschrijft (bijv. steekproef gemiddelde)
Met die unieke lijn, de kleinste kwadraten lijn, kun je een aantal vragen beantwoorden:
2
,- Is er een lineaire relatie tussen BDI en coping met tegenslagen?
- Hoe sterk is de lineaire relatie?
Pearson correlatie: maat voor sterke lineaire relaties (uitrekenen met SPSS- t-toets)
Er komt dan een tabel genaamd ‘Correlations’. Daarin vind je:
- Pearson Correlation
Is de correlatie 1 of -1 je kunt alles 100% voorspellen. Je hebt een lineaire lijn.
Is de correlatie 0 (r=0) je kunt niks voorspellen. Er is geen relatie Je hebt een horizontale
lijn.
Hoe kleiner de residuen, hoe beter de voorspellingen.
- Sig. (2-tailed)
Dat is de P-waarde. Vaak geldt p < 0.001 = significante relatie tussen de afhankelijke (Y) en de
onafhankelijke variabele (X).
-N
N= grootte van de steekproef. Bijv. het aantal mensen.
Het kwadraat van de correlatie is de gemeenschappelijke variantie tussen variabelen X en Y
Voorbeeld: r -.088 (haal je uit de tabel ‘Correlations’ in SPSS)
(-.88)2 = 0.774 = 77%
Dus variabele X en Y hebben 77% variantie gemeenschappelijk.
- Kan BDI (Y) voorspeld worden door coping (X)?
Dat onderzoek je met enkelvoudige regressieanalyse: regressieanalyse met één voorspeller.
Als de P-waarde kleiner is dan 0.001 dan is er een hele kleine kans op de aannemelijkheid van de
nulhypothese en kan Y waarschijnlijk voorspeld worden door X.
Toetsen
‘Je vergelijkt wat je gevonden hebt, met wat je zou verwachten als de nulhypothese waar zou zijn.
Dat druk je uit in standaardfouten’.
Nulhypothese: (H0) een populatiegrootheid heeft een bepaalde waarde. Bijvoorbeeld: er is geen
relatie
Alternatieve hypothese: (Ha) een populatie-grootheid heeft die waarde niet (groter, kleiner,
ongelijk). Bijv: de relatie is groter dan 0.
je probeert de nulhypothese te verwerpen.
Hoe bijzonder is hetgeen wat ik gevonden
heb?, afgezet tegen de nulhypothese. Dat druk
je uit in standaardfouten.
Type I-fout: je verwerpt de nulhypothese ten onrechte.
Type II-fout: je verwerpt de nulhypothese ten onrechte niet.
3
, - Gebaseerd op een toetsingsgrootheid.
Toetsingsgrootheid: grootheid die de toets berekent op
grond van je gegevens, dit is een maat voor de afwijking
van jou gegevens van de verwachte waarden
(nulhypothese). Van de t-toets is dit t.
Test statistic = ‘Hoeveel standaardfouten ligt gevonden
uitkomst van de waarde onder de nulhypothese af.
Dus: score (R) test statistic (t) kans (P)
BELANGRIJK: je kunt de nulhypothese NIET bewijzen. Je kan alleen de nulhypothese onaannemelijk
maken.
P-waarde: de kans om een uitkomst te vinden zo extreem of nog extremer dan het gevonden
(toetsingsgrootheid) effect, als H0 (nulhypothese) waar zou zijn. Of: wat is de kans op minstens de
gevonden test statistic indien de nulhypothese waar zou zijn. Dus de p-waarde geeft aan hoe
extreem de gevonden waarde voor de toetsingsgrootheid van de verdeling onder de nulhypothese is.
((P- waarde is Sig. in SPSS))
Hoe kleiner de P-waarde, hoe sterker het bewijs TEGEN de nulhypothese.
Hoe klein is de P-waarde dan? Je vergelijkt het met het significantieniveau alpha (significatietoets).
P > Alpha = geen idee of er een populatie-effect is. = niet significant
P < Alpha = er lijkt bewijs te zijn tegen de nulhypothese. = significant
Alpha (α) wordt vaak vastgesteld op 0.1, 0.05, of 0.01.
Vaste opbouw van een toets
Test statistic (toetsingsgrootheid): hoeveel standaardfouten ligt de gevonden uitkomst van de
waarde onder H0 af?
P-waarde: wat is de kans op minstens de gevonden test statistic indien H 0 waar zou zijn.
2. Statistisch model
Relatie tussen variabelen in de populatie: vergelijking voor regressielijn.
Dit statistisch model heeft de vorm van: data = model + error
Yi = score op afhankelijke variable Y voor persoon i (data)
Xi = score onafhankelijke variabele X voor persoon i
Ei = residu (error, afwijking)
B0 = intercept
B1 = helling (slope)
Model = B0 + BiXi (regressielijn)
Coëfficiënten:
Intercept: snijpunt met de y-as. B0 is de werkelijke waarde, b0 is de geschatte waarde bij de
regressielijn. Bij de vergelijking van een lijn geef je de intercept aan met y.
Helling (slope): geeft de steilheid van de lijn aan. B 1 is de werkelijke waarde, b1 is de geschatte
waarde bij regressielijn. Bij de vergelijking van een lijn geef je de helling aan met a.
De intercept en de helling zijn regressiecoëfficiënten die moeten geschat worden (uit de steekproef).
Dit gebeurt moet de kleinste kwadratenmethode.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller babettekuiper. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.99. You're not tied to anything after your purchase.