100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4,6 TrustPilot
logo-home
Samenvatting

samenvatting statistiek I + lesnota's

Beoordeling
-
Verkocht
3
Pagina's
23
Geüpload op
03-01-2021
Geschreven in
2020/2021

samenvatting statistiek I + lesnota's

Voorbeeld van de inhoud

HC 5: tweedimensionale waargenomen reeksen

1. SAMENHANG?
 tot nu toe: statistische maten ééndimensionale of univariate reeksen
o slechts 1 variabele
o geen analyse van afhankelijkheid/ samenhang tussen 2 variabelen
 tweedimensionale of bivariate reeksen
o 2 variabelen: samenhang tussen de variabelen
o Samenhang: variabelen variëren dus samen (komt tot uiting in een betere
voorspelbaarheid van de ene variabelen, gegeven de andere)
 Positieve samenhang: als A stijgt, stijgt B ook
 Negatieve samenhang: als A stijgt, daalt B ook
Afspraak
 Associatie: samenhang tussen 2 categorische variabelen (nominaal/ ordinaal)
 Correlatie: samenhang tussen numerieke variabelen

Waarom samenhang bestuderen?
 Uitspraken over samenhang = kern van theorievorming in humane wetenschappen
 Samenhangend ie theoretisch worden voorgesteld worden empirisch getoetst = kern
van (kwantitatief) sociaalwetenschappelijk onderzoek
o Is de samenhang empirisch terug te vinden wanneer beide kenmerken
worden opgemeten bij een groot aantal respondenten en de associatie
tussen de beide variabelen wordt berekend

Hoe onderzoeken?
 Afhankelijk van het meetniveau van de variabelen
 Samenhang tussen nominale kenmerken
o Via tweedimensionale frequentietabel (kruistabel)
o Via associatiematen zoals Phi kwadraat en Cramer’s V
 Samenhang tussen ordinale kenmerken
o Via tweedimensionale frequentietabel (kruistabel)
o Via associatiematen zoals correlatiecoëfficiënten van Spearman en Kendall
 Samenhang tussen interval/ ratio kenmerken
o Via tweedimensionale frequentietabel (kruistabel)
o Via scatterplot
o Via covariantie – correlatie – regressieanalyse



Probleemstelling:
onderzoek heeft vaak
betrekkingen op
variabelen van
verschillende
meetniveaus

, Causaliteit (= een oorzakelijk verband)
 Samenhang tussen tussen 2 variablen
o Causalitiet of causaal verband? A kan samengaan met B maar dit wil nog niet zeggen
dat A de oorzaak is van B
o 3 voorwaarden
 A en B tonen een relatie => er is een verband tussen A en B
 De relatie houdt stand wanneer je controleerd voor andere facroren C, D, E…
 Als A een oorzaak moet zijn van B, dan moet A in de tijd vooraf gaan van B

2. SAMENHANG TUSSEN CATEGORISCHE VARIABELEN
Tweedimensionale kruistabel
 3 doelstellingen:
o Beschrijven van aard en richting van verband in onderzochte steekproef
 Berekening rijpercentage en kolompercentage
 Vergelijking van Berekening rijpercentage en kolompercentage
 Vergelijking van relatieve conditionele verdelingen
o Veralgmeenbaarheid van semanhang in steekproef naar populatie
 Significant verband = verband bestaat echt en is niet aan toeval te weiten
(treed in realiteit op)
 Berekening verwavhte celfrequentie bij onafhankelijkheid
 Chi-kwadraattoets en chi-kwadraarverdeling (infrentiele statistiek)
o Bepalen van sterkte van de samenhang
 Associatiematen voor nominale variabelen
 Associatiematen voor ordinale variabelen

Anatomie Kruistabel
Relatiebe conditionele verdeling = vergelijken van de relatieve verdeling van Y naat categorieën van X
 Een paar afspraken
o n = verschillende waargenomen waarde van x-variabelen in kolomen
o M = verschillende waargenomen waarde van Y variabelen in de rijen
o Fij = de absolute frequentie van combinatie van waar i voor de Y variabelen en
waarde j voor x-variabelen => de absolute frequenties Fij vormen de cellen van de
tabel
o R x k tabel
 R = aantal rijen
 K = aantal kolommen
 Marginale en conditionele verdeling
o Marginale verdeling van Y = hoe frequent elke waarde i van de Y variabelen
voorkomt zonder rekening te houden met de waarde van de x variablen
 Som van de absolute frequentie Fij per rij vormt een rijtotaak Fio=∑ Fij
 Rijtotalen Fio vormen de marginale verdeling van de Y variabelen
 Som van de rijtotalen is gelijk aan het effectief N
o Marginale verdeling van X = hoe frequent elke waard j van de x variabele voorkomt
zonder rekening te houden met de waarde van de Y variabele
 Som van de absolute frequenties Fij per kolom vormt een kolomtotaal
Foj=∑ Fij
 Kolomtotalen Foj vormen de marginale verdeling van de x variabelen
 Som van de kolomtotalen is gelijk aan het effectief N

,  Conditionele verdeling
o Conditionele verdeling van Y
 Verdeling kolomvariabele X voor 1 specifieke categorie van rijvariabele Y
vormt de conditionele verdeling van x gegeven y
 Voorbeeld: verdeling van geslacht bij de Groen stemmers vormt de
conditionele verdeling van geslacht (X), gegeven stemgedrag (Y) = groen

Statistische afhankelijkheid
 Gaan kijken naar de Relatieve condotionele verdeling van afhankelijke variabele (Y) verschilt
binnen categorieën van de onafhankelijke variabele (x) (en omgekeerd)
o Conditionele verdeling relatief maken omdat er niet evenveel mannen als vrouwen
zijn ondervraagt => kolompercentages berekenen
o Er is dus een verband tussen de x en y




Statistische onafhankelijke
 Als de relatieev conditionele verdeling van Y dezelfde is binnen de categorieën van X (en
omgekeerd, als de relatieve conditionele verdeling van Y dezelfde is binnen de categorieën
van X) -> geen verband tussen X en Y
 Kennis van X helpt niet om Y te voorspellen
 Statistische onafhankelijkheid treed alleen op als de conditionele kans op Y gegeven X gelijk
is aan de kans op Y ongeacht X (en omgekeerd, als de conditionele kans op X gegeven Y gelijk
is aan de kans op X ongeacht Y)
o P(Y|X) = P (Y) en P(X|Y) = P (X)
 Productieregel: P (X & Y) = P(X)P(Y)




Berekenen van de conditionele verdeling
 Conventioneel staat afhankelijke variabele Y in rijen en de onafhankelijke variabele X in de
kolommen
 In kruistabel worden percentages berekend in de richting van de onafhankelijke variabele:
o We berekenen dus kolompercentages om de relatieve verdeling van Y te vergelijken
tussen categorieën van X
 Kolompercentage
o Kolompercentage = (celfrequentie/kolomtotaal)*100
o Kolompercentages vergelijken binnen eenzelfde rij
 Rijpercentage
o Rijpercentages = (celfrequentie/kolomfrequentie)*100
o Rijpercentages vergelijken binnen eenzelfde kolom

Documentinformatie

Geüpload op
3 januari 2021
Aantal pagina's
23
Geschreven in
2020/2021
Type
SAMENVATTING

Onderwerpen

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
charlottelutsch Vrije Universiteit Brussel
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
180
Lid sinds
6 jaar
Aantal volgers
90
Documenten
0
Laatst verkocht
1 maand geleden

4,0

19 beoordelingen

5
8
4
5
3
4
2
2
1
0

Populaire documenten

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen