STATISTIEK I – HOC 5 TOT HOC 8 –
TWEEDIMENSIONALE WAARGENOMEN REEKSEN
Samenhang = het samen variëren van twee variabelen; komt tot uiting in een
betere voorspelbaarheid van de ene variabele, gegeven de andere.
- Veelheid aan termen: verband, relatie, correlatie, associatie, hangen
samen, afhankelijk
- Afspraak: men gebruikt de term associatie om te verwijzen naar een
samenhang tussen twee categorische variabelen (nominaal, ordinaal) en men
gebruikt de term correlatie om te verwijzen naar de samenhang tussen twee
numerieke variabelen (interval, ratio).
- De samenhang is afhankelijk van het meetniveau van de variabelen!
Phi-kwadraat Phi-kwadraat Phi-kwadraat
Cramer’s V Cramer’s V Cramer’s V
variabele
Ordinaal Kruistabel Rangcorrelatiecoëfficië Rangcorrelatiecoëfficië
Phi-kwadraat nt nt
Cramer’s V
Interval/ Kruistabel Rangcorrelatiecoëfficië Covariantie
Ratio Phi-kwadraat nt Correlatie
Cramer’s V Regressie
- Causaliteit of causaal verband?
Van een oorzakelijk verband is alleen sprake als verandering in X
altijd een verandering in Y teweegbrengt Y is afhankelijk van X
Drie causaliteitsvoorwaarden:
1e voorwaarde: er bestaat een relatie tussen a en b
2e voorwaarde: a gaat in de tijd vooraf aan b
3e voorwaarde: relatie tussen a en b blijft bestaan wanneer
we controleren voor allerlei andere factoren (c,d,e,etc.)
In de Sociale wetenschappen: moeilijk!
KRUISTABEL
Ook wel frequentietabel of contingentietabel genoemd. Deze tabel geeft de aard
en de richting van een relatie weer.
- 3 doelstellingen:
Beschrijven van aard en richting van verband in onderzochte
steekproef
Berekening van rijpercentages en kolompercentages
Vergelijking van relatieve conditionele verdelingen
Veralgemeenbaarheid van samenhang in steekproef naar
populatie
Berekening verwachte celfrequenties bij onafhankelijkheid
Chi-kwadraattoets en chi-kwadraatverdelling
Bepalen van sterke van de samenhang
1
, Associatiematen voor nominale variabelen
Associatiematen voor ordinale variabelen
Samenhang analyseren:
- Stap 1: kruistabel tussen beide kenmerken opstellen
- Stap 2: asymmetrische relatie
Kenmerk Y (afhankelijk – bv. partijvoorkeur) en kenmerk X
(onafhankelijk – bv. geslacht)
- Stap 3: vergelijken relatieve verdeling van Y naar categorieën van X =
relatieve conditionele verdeling
Onafhankelijke variabelen worden in kolommen geplaatst en afhankelijke
variabelen worden in rijen geplaatst.
Marginale en conditionele verdeling
- Marginale verdeling geeft de univariate verdeling weer van de
variabelen
- De som van de absolute frequenties F(ij) per rij vormt een rijtotaal;
rijtotalen Fi vormen de marginale verdeling van de Y-variabele; de som
van de rijtotalen is gelijk aan het effectief N
- De som van de absolute frequenties F(ij) per kolom vormt een
kolomtotaal; kolomtotalen F.j vormen de marginale verdeling van de X-
variabele; de som van de kolomtotalen is gelijk aan het effectief N
- Conditionele verdeling van Y?
Verdeling rijvariabelen Y voor één bepaalde categorie van
kolomvariabele X vormt de conditionele verdeling van Y gegeven
X
Bv. verdeling van partijvoorkeur bij mannen is de conditionele
verdeling van partijvoorkeur (Y), gegeven geslacht (X) = man
we geven de conditie dat de persoon een man is, wat is de
verdeling naar partijvoorkeur?
- Conditionele verdeling van X?
Verdeling kolomvariabele voor één specifieke categorie van
rijvariabelen Y vormt de conditionele verdeling van X gegeven Y
Bv. verdeling van geslacht bij de Groen-stemmers vormt de
conditionele verdeling van geslacht (X), gegeven partijvoorkeur
(Y) = Groen
Rij- en kolompercentages
- Hoe conditionele relatieve verdeling berekenen?
Verschil tussen symmetrische en asymmetrische relaties
Asymmetrisch
Conventioneel staat afhankelijke variabele Y in rijen van de
tabel en onafhankelijke variabele X in kolommen van de
tabel
In kruistabel worden percentages berekend in de richting
van de onafhankelijke variabele (zijde kolompercentages)
2
, We berekenen dus kolompercentages om de relatieve
verdeling van Y te vergelijken tussen categorieën van X
Kolompercentage = (celfrequentie/kolomtotaal)*100
Rijpercentage = (celfreqientie/rijtotaal)*100
Rij- en kolompercentages steeds vergelijken dwars op de richting
waarin werd gepercenteerd als je kolompercentages gaat
vergelijken vergelijk je per rij, als je rijpercentages gaat
vergelijken vergelijk je per kolom.
- Aard samenhang: rij- en kolompercentages
Kolompercentages: inschatting van de sterkte van het verband
Liggen ze sterk bij elkaar = zwak verband
Liggen ze ver uit elkaar = sterk verband
Heel gebruikelijk en vooral bij niet te grote tabellen
Nadelen?
Omslachtig bij grote tabellen
Als men geen causale orde kan opstellen rijpercentages
of kolompercentages?
We weten niet of verband significant is
Geen synthetische index van de samenhang
Via significatietoets is het verband aan toeval te wijten of
echt?
Via associatiematen hoe sterk is dit verband?
CHI-KWADRAAT
Een significatietoets bestaan steeds uit 5 stappen:
1. Assumpties:
- Om significatietoets te kunnen toepassen: gegevens uit een aselecte
steekproef
- Meetniveau?
- Afhankelijke en onafhankelijke variabele?
- Het verwacht aantal observaties in elke cel van de kruistabel minstens 5
moet bedragen
2. Hypothesen
- De bewering die in een significatietoets wordt getest, heet de
nulhypothese
- Nulhypothese: we vertrekken van de hypothese dat er geen verband
bestaat en dat de waargenomen verbanden (verschillen) louter toeval
zijn = nulhypothese (H0): stelling dat verband niet significant is
- De significatietoets: ontworpen om sterkte van het bewijs tegen de
nulhypothese vast te stellen aantonen dat de nulhypothese niet klopt
en dat er dus wel een verband is
3. Toetsstatistiek: chi-kwadraat
- Hoe berekenen we de Chi-kwadraat teststatistiek?
Voor de toetsing van de H0 in m*n tabel vergelijken we de
geobserveerde celfrequenties met de verwachte celfrequenties
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper joyceroeland02. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €9,49. Je zit daarna nergens aan vast.