Statistiek 2
College 1 Herhaling t-test en correlatie
Een statistisch verband ≠ geen daadwerkelijk verband.
Wetenschappelijk onderzoek gaat om verbanden leggen tussen variabelen:
- is een verband in gemeten data betekenisvol? En zo ja, in welke mate? —> statische toetsen
- statistische toetsen: in welke mate de totale spreiding in de gemeten uitkomsten systematisch
is (en niet-systematisch)
Wetenschappelijke onderzoek
1. je hebt een idee dat er ergens een verband is
2. hypothesen opstellen
3. meting uitvoeren
4. analyseren
5. feitelijke meetresultaten interpreteren adhv theorie
6. communiceren/ rapporteren
Stappen statische analyse
1. Onderzoekshypothese in woorden
2. Argumentatie omtrent verwachtingen
3. Hypothesen in statisch model
4. Keuze statistische toets met argumentatie
5. Beschrijvende statistieken
6. Waarde poetsgrootheid
7. P-waarde
8. Statistische conclusie
9. Conclusie in woorden
Hypothesen in statisch model hebben betrekking op populatie (niet steekproef) dus µ en ρ
gebruiken ipv X̄ en r (correlatie coëfficiënt).
Beschrijvende statistieken:
Moet bij hypothesen/ toets passen:
- bij t-toets: gemiddelden en SD
- bij Mann-Whitney: medianen en range
- bij Chi-kwadraat: frequentie/ proporties
- bij correlatie (bv Pearson): de berekende correlatie-coëfficiënt
Keuze van de toets is afhankelijk van:
- je onderzoeksvraag, wat wil je weten?
- vergelijken categorieën is heel anders dan bijvoorbeeld een associatie meten
- gepaarde en ongepaarde waarnemingen
- meetniveau van je variabelen
- verdeling van de waarden van je variabelen
- steekproefomvang
Waarde toetsgrootheid en p-waarde:
- alpha
- p-waarde
- kritieke waarde
- waarde toetsgrootheid
1
,Onafhankelijke t-toets
Hypothese: jongens lager vetpercentage dan meisjes
Onafhankelijke t-toets toetst of de gemiddelden van een variabele in 2 onafhankelijke
steekproeven zodanig van elkaar verschillen dat ze redelijkerwijs niet uit 2 populaties afkomstig
zijn die hetzelfde gemiddelde hebben.
Veronderstellingen onafhankelijke t-toets:
- waarnemingen aselect en onafhankelijk
- 2 onafhankelijke steekproeven
- afhankelijke variabelen minstens interval meetniveau
- waarden afhankelijke variabele normaal verdeeld (in elke groep)
- σ is onbekend
Normaal verdeling:
- het gemiddelde µ ligt precies in het midden
- 68% van de waarnemingen ligt binnen 1σ
- 95% van de waarnemingen ligt binnen 2σ
- 99.7% van de waarnemingen ligt binnen 3σ
Als je hieraan voldoet heb je een perfecte normale verdeling van je waarden.
Bij een perfect normale verdeling van de data:
- gemiddelde = mediaan = modus
- 99.7 % van de waarnemingen binnen 3σ van gemiddelde
- skewness = 0
- kurtosis = 0
Skewness = maat voor scheefheid
Kurtosis = maat voor platheid
Als de skweness/ kurtosis een waarde hebben van boven de 1 of onder de -1 dan moet je goed
gaan kijken of je de t-toets nog wel kan doen.
Correlatie
Bij een spreidingsdiagram ben je op zoek naar de gezamenlijke spreiding (de co-variantie).
Kan alleen bij 2 gepaarde variabelen.
Pearson correlatie
Parametrische veronderstellingen waaraan variabelen moeten voldoen:
- 2 variabelen van minimaal interval meetniveau
- variabelen moeten normaal verdeeld zijn
- er moet een lineair verband (met spreidingsdiagram te controleren)
2
,Definitie correlatiecoëfficiënt: de mate van lineaire relatie tussen 2 variabelen
De correlatie:
- ligt tussen de -1 en +1
- 0 is geen relatie, 1 is grootte correlatie
De gezamenlijke spreiding kan nooit meer zijn dan de totale verspreiding. Dus: -1 ≤ r ≤ 1
Voorbeelden van correlaties:
Een statistische correlatie vinden betekent niet gelijk dat er ook echt een verband is.
Spearman’s rho (rangcorrelatiecoëfficiënt)
- 2 variabelen continu of discreet meetniveau
- maakt gebruikt van rangscores
- kan gebruikt worden als er veel uitbijters zijn
Correlatie: test associatie tussen 2 gepaarde variabelen
- vb: relatie systolische en diastolische bloeddruk
T-test: test verschil in een variabele tussen 2 groepen/ condities
- vb: verschil systolische bloeddruk bij mannen en systolische bloeddruk bij vrouwen
Rol van statistische methoden/ toetsen
= bepalen hoeveel van de spreiding in de uitkomsten systematisch t.o.v. hoeveel niet
systematische spreiding
3
, College 2 Partiële correlatie en enkelvoudige regressie
Partiële correlatie
= correlatie tussen 2 variabelen na correctie voor een derde variabele
- relatie tussen > 2 variabelen
Bijvoorbeeld als je bij oudere mensen de correlatie wilt meten tussen reactietijd en
handvaardigheid, speelt leeftijd ook een grote rol. Dit moet je dus ook testen. Je hebt nu 3
variabelen.
Dus:
T-test = statistisch onderzoeken van verschil tussen 2 groepen/ condities (X en Y)
Correlatie = statistisch onderzoeken van associatie tussen 2 variabelen/ condities (X en Y)
Regressie = onderzoeken of waarde Y statistisch is te voorspellen uit waarde X
Regressie
Als ik een waarde van X weet, kan ik dan de waarde van Y voorspellen? En hoe zeker weet ik dat
dan?
Veronderstellingen voor lineaire enkelvoudige regressie:
- X en Y minstens interval meetniveau
- onafhankelijkheid van waarnemingen
- normaliteit
- homoscedasticiteit
- lineariteit
Homoscedasticiteit = gelijkheid van varianties, voor elke X is spreiding in Y gelijk
Heteroscedastisch = ongelijkheid van varianties, voor elke X is spreiding in Y ongelijk
Bij sprake van heteroscedasticiteit kan je geen lineaire regressie toepassen
VB:
Y = gewicht (afhankelijke variabele)
X = lengte (onafhankelijke variabele)
Kan ik uit de lengte het gewicht voorspellen?
Methode: regressie-analyse
Bij regressie is ook van belang dat er een lineair verband aanwezig is
De rode lijn is de ‘regressie lijn’ (best passende lijn rondom
datapunten)
- lineair model: Y = a + bx + e
- e = error
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper maaikeedam. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,49. Je zit daarna nergens aan vast.