Leerdoelen:
1. basisvaardigheden in kwantitatieve data-analyse aan te kunnen tonen door kwantitatieve data
te analyseren
Betrouwbaarheid (theorie)
Betrouwbaarheid van onderzoek wordt bepaald door:
1. Nauwkeurigheid
o Betrekking op de meetinstrumenten die de onderzoekers gebruiken
2. Consistentie
o Herhaalbaarheid; onder dezelfde omstandigheden zal dezelfde meting leiden tot
dezelfde bevinding
Als onderzoekers elkaars onderzoek kunnen herhalen, wordt dat replicatie genoemd
Bij een betrouwbaar onderzoek komen bij een ander onderzoek over hetzelfde onderwerp
soortgelijke resultaten naar boven
Chi-kwadraat (theorie)
Als je wil nagaan of twee nominale variabelen afhankelijk van elkaar zijn (of niet), kun je een chi-
kwadraattoets gebruiken.
Dit is dus een meetinstrument voor samenhang: is de afwijking toevallig of significant
Chi-kwadraat geeft het verschil tussen de realistische waarde ten opzichte van de verwachte waarde
Chi-kwadraat (statistisch)
1. Maak een tabel met de waargenomen en verwachte frequenties
2. Bereken de chi-kwadraatwaarde
3. Bepaal de kritieke waarde (in de tabel met vrijheidsgraden)
4. Vergelijk de chi-kwadraatwaarde met de kritieke waarde
5. Bepaal of je de nulhypothese wil verwerpen. Je moet de nulhypothese verwerpen als de chi-
kwadraatwaarde groter is dan de kritieke waarde.
Correlatie & causaliteit (theorie)
Correlatie is de statische samenhang tussen twee variabelen.
Voorbeeld positief verband:
Hoe meer werkervaring, des te hoger je inkomen
Voorbeeld negatief verband:
Naarmate men gemiddeld genomen meer tevreden is, is het ziekteverzuim lager
Correlatiecoëfficiënt kan de richting van het verband (positief, negatief) laten zien en geeft ook aan
hoe sterk het verband is
Waarde van de Pearson correlatiecoëfficiënt:
Groter dan 0,5 = sterk = positief
Tussen 0,3 en 0,5 = matig = positief
Tussen 0 en 0,3 = zwak = positief
Tussen 0 en -0,3 = zwak = negatief
Tussen -0,3 en -0,5 = matig = negatief
Groter dan -0,5 = sterk = negatief
Causaliteit
Als de ene variabele verandert, veroorzaakt dat een verandering in de andere variabele.
Causaliteit kan alleen worden vastgesteld als:
1. Er een verband is tussen X en Y
2. X in de tijd aan Y voorafgaat
3. Er geen derde variabele is die Y veroorzaakt
, Normaalverdeling (theorie)
De normaalverdeling is een klok-kromme.
Regels normaalverdeling:
68% van alle waarnemingen ligt tussen het gemiddelde plus of min één keer de
standaarddeviatie
o 1-sigma
95% van alle waarnemingen ligt tussen het gemiddelde plus of min twee keer de
standaarddeviatie
o 2-sigma
99% van alle waarnemingen ligt tussen het gemiddelde plus of min drie keer de
standaarddeviatie
o 3-sigma
Regressieanalyse (theorie)
De regressieanalyse wordt gebruikt om causale verbaden tussen continue variabelen te analyseren.
Met de resultaten van deze regressiemodellen kunnen voorspellingen worden gedaan over
soortgelijke situaties in de toekomst
Regressieanalyse (statistisch)
Voorwaarde voor een mogelijk causaal effect is dat er een samenhang is tussen twee variabelen. We
kijken naar de correlatiecoëfficiënt. Is er een positief of negatief verband. En hoe sterk is dat
verband.
Significantie (theorie)
Berusten je resultaten niet op toeval, is die kans kleiner dan 5%. Dan spreek je van significantie.
Het significantieniveau geeft de maximale kans weer dat je de nulhypothese ten onrechte verwerpt.
Significantie (statistisch)
Experimenten natuurkunde = 99,99%, dus significantieniveau van 0,1%
Experimenten Sociaal-wetenschappelijk = 95%, dus significantieniveau van 5%
Chi-kwadraat gebruiken, en dan kijken naar aantal vrijheidsgraden.
Spreiding (theorie)
De standaardafwijking / standaarddeviatie wordt gebruikt om de spreiding - de mate waarin de
waarden onderling verschillen - van een verdeling aan te geven
De variantie is een maat voor de spreiding van een reeks waarden, dat wil zeggen de mate waarin de
waarden onderling verschillen.
Variantie berekenen:
Getallenreeks: 3,6,8,9,9,10
Gemiddelde berekenen = (3+6+8+9+9+10) / 6 = 7,5
Variantie: (3-7,5), (6-7,5), (8-7,5) (9-7,5), (9-7,5), (10-7,5).
-4,5, -1,5, 0,5, 1,5, 1,5, 2,5
Afwijkingen ten opzichte van het gemiddelde, het kwadraat berekenen
Steekproeven (theorie):
Het komt bijna nooit voor dat onderzoekers gegevens verzamelen bij de hele populatie. Dit kan
komen doordat niet iedereen te bereiken is. Als je niet de hele populatie hebt, trek je een steekproef.
Bij een selecte steekproef kiest de onderzoeker ervoor om heel gericht bepaalde eenheden te
selecteren, gebeurt vooral als er slechts een beperkt aantal eenheden is om uit te kiezen. Moet wel
gebaseerd zijn op theoretisch relevante criteria.