1. SAMENHANG?
tot nu toe: statistische maten ééndimensionale of univariate reeksen
o slechts 1 variabele
o geen analyse van afhankelijkheid/ samenhang tussen 2 variabelen
tweedimensionale of bivariate reeksen
o 2 variabelen: samenhang tussen de variabelen
o Samenhang: variabelen variëren dus samen (komt tot uiting in een betere
voorspelbaarheid van de ene variabelen, gegeven de andere)
Positieve samenhang: als A stijgt, stijgt B ook
Negatieve samenhang: als A stijgt, daalt B ook
Afspraak
Associatie: samenhang tussen 2 categorische variabelen (nominaal/ ordinaal)
Correlatie: samenhang tussen numerieke variabelen
Waarom samenhang bestuderen?
Uitspraken over samenhang = kern van theorievorming in humane wetenschappen
Samenhangend ie theoretisch worden voorgesteld worden empirisch getoetst = kern
van (kwantitatief) sociaalwetenschappelijk onderzoek
o Is de samenhang empirisch terug te vinden wanneer beide kenmerken
worden opgemeten bij een groot aantal respondenten en de associatie
tussen de beide variabelen wordt berekend
Hoe onderzoeken?
Afhankelijk van het meetniveau van de variabelen
Samenhang tussen nominale kenmerken
o Via tweedimensionale frequentietabel (kruistabel)
o Via associatiematen zoals Phi kwadraat en Cramer’s V
Samenhang tussen ordinale kenmerken
o Via tweedimensionale frequentietabel (kruistabel)
o Via associatiematen zoals correlatiecoëfficiënten van Spearman en Kendall
Samenhang tussen interval/ ratio kenmerken
o Via tweedimensionale frequentietabel (kruistabel)
o Via scatterplot
o Via covariantie – correlatie – regressieanalyse
Probleemstelling:
onderzoek heeft vaak
betrekkingen op
variabelen van
verschillende
meetniveaus
, Causaliteit (= een oorzakelijk verband)
Samenhang tussen tussen 2 variablen
o Causalitiet of causaal verband? A kan samengaan met B maar dit wil nog niet zeggen
dat A de oorzaak is van B
o 3 voorwaarden
A en B tonen een relatie => er is een verband tussen A en B
De relatie houdt stand wanneer je controleerd voor andere facroren C, D, E…
Als A een oorzaak moet zijn van B, dan moet A in de tijd vooraf gaan van B
2. SAMENHANG TUSSEN CATEGORISCHE VARIABELEN
Tweedimensionale kruistabel
3 doelstellingen:
o Beschrijven van aard en richting van verband in onderzochte steekproef
Berekening rijpercentage en kolompercentage
Vergelijking van Berekening rijpercentage en kolompercentage
Vergelijking van relatieve conditionele verdelingen
o Veralgmeenbaarheid van semanhang in steekproef naar populatie
Significant verband = verband bestaat echt en is niet aan toeval te weiten
(treed in realiteit op)
Berekening verwavhte celfrequentie bij onafhankelijkheid
Chi-kwadraattoets en chi-kwadraarverdeling (infrentiele statistiek)
o Bepalen van sterkte van de samenhang
Associatiematen voor nominale variabelen
Associatiematen voor ordinale variabelen
Anatomie Kruistabel
Relatiebe conditionele verdeling = vergelijken van de relatieve verdeling van Y naat categorieën van X
Een paar afspraken
o n = verschillende waargenomen waarde van x-variabelen in kolomen
o M = verschillende waargenomen waarde van Y variabelen in de rijen
o Fij = de absolute frequentie van combinatie van waar i voor de Y variabelen en
waarde j voor x-variabelen => de absolute frequenties Fij vormen de cellen van de
tabel
o R x k tabel
R = aantal rijen
K = aantal kolommen
Marginale en conditionele verdeling
o Marginale verdeling van Y = hoe frequent elke waarde i van de Y variabelen
voorkomt zonder rekening te houden met de waarde van de x variablen
Som van de absolute frequentie Fij per rij vormt een rijtotaak Fio=∑ Fij
Rijtotalen Fio vormen de marginale verdeling van de Y variabelen
Som van de rijtotalen is gelijk aan het effectief N
o Marginale verdeling van X = hoe frequent elke waard j van de x variabele voorkomt
zonder rekening te houden met de waarde van de Y variabele
Som van de absolute frequenties Fij per kolom vormt een kolomtotaal
Foj=∑ Fij
Kolomtotalen Foj vormen de marginale verdeling van de x variabelen
Som van de kolomtotalen is gelijk aan het effectief N
, Conditionele verdeling
o Conditionele verdeling van Y
Verdeling kolomvariabele X voor 1 specifieke categorie van rijvariabele Y
vormt de conditionele verdeling van x gegeven y
Voorbeeld: verdeling van geslacht bij de Groen stemmers vormt de
conditionele verdeling van geslacht (X), gegeven stemgedrag (Y) = groen
Statistische afhankelijkheid
Gaan kijken naar de Relatieve condotionele verdeling van afhankelijke variabele (Y) verschilt
binnen categorieën van de onafhankelijke variabele (x) (en omgekeerd)
o Conditionele verdeling relatief maken omdat er niet evenveel mannen als vrouwen
zijn ondervraagt => kolompercentages berekenen
o Er is dus een verband tussen de x en y
Statistische onafhankelijke
Als de relatieev conditionele verdeling van Y dezelfde is binnen de categorieën van X (en
omgekeerd, als de relatieve conditionele verdeling van Y dezelfde is binnen de categorieën
van X) -> geen verband tussen X en Y
Kennis van X helpt niet om Y te voorspellen
Statistische onafhankelijkheid treed alleen op als de conditionele kans op Y gegeven X gelijk
is aan de kans op Y ongeacht X (en omgekeerd, als de conditionele kans op X gegeven Y gelijk
is aan de kans op X ongeacht Y)
o P(Y|X) = P (Y) en P(X|Y) = P (X)
Productieregel: P (X & Y) = P(X)P(Y)
Berekenen van de conditionele verdeling
Conventioneel staat afhankelijke variabele Y in rijen en de onafhankelijke variabele X in de
kolommen
In kruistabel worden percentages berekend in de richting van de onafhankelijke variabele:
o We berekenen dus kolompercentages om de relatieve verdeling van Y te vergelijken
tussen categorieën van X
Kolompercentage
o Kolompercentage = (celfrequentie/kolomtotaal)*100
o Kolompercentages vergelijken binnen eenzelfde rij
Rijpercentage
o Rijpercentages = (celfrequentie/kolomfrequentie)*100
o Rijpercentages vergelijken binnen eenzelfde kolom
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller charlottelutsch. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.85. You're not tied to anything after your purchase.