STATISTIEK I – HOC 5 TOT HOC 8 –
TWEEDIMENSIONALE WAARGENOMEN REEKSEN
Samenhang = het samen variëren van twee variabelen; komt tot uiting in een
betere voorspelbaarheid van de ene variabele, gegeven de andere.
- Veelheid aan termen: verband, relatie, correlatie, associatie, hangen
samen, afhankelijk
- Afspraak: men gebruikt de term associatie om te verwijzen naar een
samenhang tussen twee categorische variabelen (nominaal, ordinaal) en men
gebruikt de term correlatie om te verwijzen naar de samenhang tussen twee
numerieke variabelen (interval, ratio).
- De samenhang is afhankelijk van het meetniveau van de variabelen!
Phi-kwadraat Phi-kwadraat Phi-kwadraat
Cramer’s V Cramer’s V Cramer’s V
variabele
Ordinaal Kruistabel Rangcorrelatiecoëfficië Rangcorrelatiecoëfficië
Phi-kwadraat nt nt
Cramer’s V
Interval/ Kruistabel Rangcorrelatiecoëfficië Covariantie
Ratio Phi-kwadraat nt Correlatie
Cramer’s V Regressie
- Causaliteit of causaal verband?
Van een oorzakelijk verband is alleen sprake als verandering in X
altijd een verandering in Y teweegbrengt Y is afhankelijk van X
Drie causaliteitsvoorwaarden:
1e voorwaarde: er bestaat een relatie tussen a en b
2e voorwaarde: a gaat in de tijd vooraf aan b
3e voorwaarde: relatie tussen a en b blijft bestaan wanneer
we controleren voor allerlei andere factoren (c,d,e,etc.)
In de Sociale wetenschappen: moeilijk!
KRUISTABEL
Ook wel frequentietabel of contingentietabel genoemd. Deze tabel geeft de aard
en de richting van een relatie weer.
- 3 doelstellingen:
Beschrijven van aard en richting van verband in onderzochte
steekproef
Berekening van rijpercentages en kolompercentages
Vergelijking van relatieve conditionele verdelingen
Veralgemeenbaarheid van samenhang in steekproef naar
populatie
Berekening verwachte celfrequenties bij onafhankelijkheid
Chi-kwadraattoets en chi-kwadraatverdelling
Bepalen van sterke van de samenhang
1
, Associatiematen voor nominale variabelen
Associatiematen voor ordinale variabelen
Samenhang analyseren:
- Stap 1: kruistabel tussen beide kenmerken opstellen
- Stap 2: asymmetrische relatie
Kenmerk Y (afhankelijk – bv. partijvoorkeur) en kenmerk X
(onafhankelijk – bv. geslacht)
- Stap 3: vergelijken relatieve verdeling van Y naar categorieën van X =
relatieve conditionele verdeling
Onafhankelijke variabelen worden in kolommen geplaatst en afhankelijke
variabelen worden in rijen geplaatst.
Marginale en conditionele verdeling
- Marginale verdeling geeft de univariate verdeling weer van de
variabelen
- De som van de absolute frequenties F(ij) per rij vormt een rijtotaal;
rijtotalen Fi vormen de marginale verdeling van de Y-variabele; de som
van de rijtotalen is gelijk aan het effectief N
- De som van de absolute frequenties F(ij) per kolom vormt een
kolomtotaal; kolomtotalen F.j vormen de marginale verdeling van de X-
variabele; de som van de kolomtotalen is gelijk aan het effectief N
- Conditionele verdeling van Y?
Verdeling rijvariabelen Y voor één bepaalde categorie van
kolomvariabele X vormt de conditionele verdeling van Y gegeven
X
Bv. verdeling van partijvoorkeur bij mannen is de conditionele
verdeling van partijvoorkeur (Y), gegeven geslacht (X) = man
we geven de conditie dat de persoon een man is, wat is de
verdeling naar partijvoorkeur?
- Conditionele verdeling van X?
Verdeling kolomvariabele voor één specifieke categorie van
rijvariabelen Y vormt de conditionele verdeling van X gegeven Y
Bv. verdeling van geslacht bij de Groen-stemmers vormt de
conditionele verdeling van geslacht (X), gegeven partijvoorkeur
(Y) = Groen
Rij- en kolompercentages
- Hoe conditionele relatieve verdeling berekenen?
Verschil tussen symmetrische en asymmetrische relaties
Asymmetrisch
Conventioneel staat afhankelijke variabele Y in rijen van de
tabel en onafhankelijke variabele X in kolommen van de
tabel
In kruistabel worden percentages berekend in de richting
van de onafhankelijke variabele (zijde kolompercentages)
2
, We berekenen dus kolompercentages om de relatieve
verdeling van Y te vergelijken tussen categorieën van X
Kolompercentage = (celfrequentie/kolomtotaal)*100
Rijpercentage = (celfreqientie/rijtotaal)*100
Rij- en kolompercentages steeds vergelijken dwars op de richting
waarin werd gepercenteerd als je kolompercentages gaat
vergelijken vergelijk je per rij, als je rijpercentages gaat
vergelijken vergelijk je per kolom.
- Aard samenhang: rij- en kolompercentages
Kolompercentages: inschatting van de sterkte van het verband
Liggen ze sterk bij elkaar = zwak verband
Liggen ze ver uit elkaar = sterk verband
Heel gebruikelijk en vooral bij niet te grote tabellen
Nadelen?
Omslachtig bij grote tabellen
Als men geen causale orde kan opstellen rijpercentages
of kolompercentages?
We weten niet of verband significant is
Geen synthetische index van de samenhang
Via significatietoets is het verband aan toeval te wijten of
echt?
Via associatiematen hoe sterk is dit verband?
CHI-KWADRAAT
Een significatietoets bestaan steeds uit 5 stappen:
1. Assumpties:
- Om significatietoets te kunnen toepassen: gegevens uit een aselecte
steekproef
- Meetniveau?
- Afhankelijke en onafhankelijke variabele?
- Het verwacht aantal observaties in elke cel van de kruistabel minstens 5
moet bedragen
2. Hypothesen
- De bewering die in een significatietoets wordt getest, heet de
nulhypothese
- Nulhypothese: we vertrekken van de hypothese dat er geen verband
bestaat en dat de waargenomen verbanden (verschillen) louter toeval
zijn = nulhypothese (H0): stelling dat verband niet significant is
- De significatietoets: ontworpen om sterkte van het bewijs tegen de
nulhypothese vast te stellen aantonen dat de nulhypothese niet klopt
en dat er dus wel een verband is
3. Toetsstatistiek: chi-kwadraat
- Hoe berekenen we de Chi-kwadraat teststatistiek?
Voor de toetsing van de H0 in m*n tabel vergelijken we de
geobserveerde celfrequenties met de verwachte celfrequenties
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller joyceroeland02. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $10.34. You're not tied to anything after your purchase.