HC1 - Variabelen, meetniveaus, hypothesen
Unit of analysis is datgene waarover je informatie verzamelt, meestal individuen of landen.
Variabelen zijn de gemeten kenmerken van de unit of analysis, dit zijn de vragen in je
vragenlijst. Values zijn de scores van een unit of analysis op een variabele. DUS:
- Wie/wat wordt in een rij gerepresenteerd? Unit of analysis.
- Kenmerken van unit of analysis = variabelen.
- Individuele scores = values.
Onafhankelijke variabele (X) is de predictor, de vermoedelijke oorzaak. Deze oefent invloed
uit op de afhankelijke variabele (Y). Dit is de outcome of het vermoedelijke gevolg. Hier is er
maar één van in je model, dit is namelijk het concept dat je wilt verklaren door een of
meerdere predictoren. Theorie en hoofdvraag zijn bepalend voor het uikiezen van je
variabelen.
Meetniveas zijn categoriaal of continu. Het meetniveau is bepalend voor welke statistische
toets mogelijk is (o.a. door de antwoordopties). Voor de afhankelijke variabele werken we
het liefst met een interval/ratio variabele, of een schaal samengesteld uit meerdere
Likert-scales (=ordinaal).
- Categoriaal, variabelen zijn onderverdeeld in groepen of categorieën. Respondenten
vallen exclusief in de ene of de andere groep.
- Binair = 2 categorieën.
- Nominaal = meer dan 2 categorieën.
- Ordinaal = inherente orderning in categorieën (vanaf 7 categorieën is een
Likert-scale ook te gebruiken als een interval/ratio).
- Continu, respondenten kunnen alle mogelijke waarden aannemen binnen de
variabele.
- Interval = verschillen op de schaal zijn betekenisvol.
- Ratio = er is een betekenisvol nulpunt.
SPSS onderscheidt alleen nominal/ordinal/scale.
Meetniveau’s zijn niet vaststaand, de antwoordopties van een vraag bepalen het meetniveau
van de variabele.
Centrummaten geven aan waar het centrum ligt van alle variabelen. Dit zijn: mediaan,
modus, gemiddelde.
Spreidingsmaten geven aan of waarden binnen een variabele ver uit elkaar liggen of niet. Dit
zijn: range en
standaarddeviatie
(=gemiddelde afwijking van
het gemiddelde). Deze maat
zegt iets over de spreiding in
de data, en dus ook: maat
voor error in de data en hoe
representatief het gemiddelde
is voor de data.
Standaarddeviatie is kleiner
bij minder spreiding rondom
het gemiddelde.
, - Om de standaarddeviatie te berekenen:
1. Bereken het gemiddelde.
2. Bereken voor iedere score de afstand tot het gemiddelde.
3. Kwadrateer al die getallen.
4. Tel de uitkomsten op.
5. Deel dat getal door het totale aantal scores minus 1.
6. Neem daar de wortel van.
Een kwalitatief toetsbare hypothese is specifiek geformuleerd per toets, beschrijft de
verwachte relatie tussen 2 variabelen en is potentieel falsifieerbaar (=goed of fout, niks er
tussenin).
H1 = Er is wel een effect (dat wat je verwacht o.b.v. je idee).
H0 = Er is geen effect (ontkenning van je idee).
Er zijn twee types hypothesen: (1) verschil tussen twee of meer groepen (2) samenhang
tussen twee variabelen (vaak getoetst met variabelen van interval/ratio meetniveau). Deze
verschil/- of samenhanghypothese kan je vervolgens toetsen op eenzijdige en tweezijdige
manier.
- Eenzijdig toetsen = je hebt een vermoeden over de richting van het verband.
- Tweezijdig toetsen = je hebt geen vermoeden over de richting van het verband.
Dat heeft invloed op hoe je toetst en de overschrijdingskans. Komt tot uiting in je hypothesen
(maar soms ook al zichtbaar in je onderzoeksvraag).
Een hypothese is een idee over de populatie die je gaat toetsen d.m.v. een steekproef om zo
iets over de gehele populatie te kunnen zeggen. In deze steekproef vindt je eigenlijk altijd
een klein effect of verschil, maar d.m.v. toetsen ga je bepalen wat de kans is op het vinden
van een effect in de steekproef terwijl dit er eigenlijk niet is in de populatie.
- Hoe groot is de kans deze waarden in de
steekproef te vinden (H1), terwijl H0 eigenlijk waar
is? Is de kans groot dan verwerpen we H1 (het
effect is dan niet significant, p > 0.05). Als de
kans klein is nemen we H1 aan (het effect is dan
significant).
Waar hangt die kans dan van af? De grootte van het
gevonden effect, het aantal respondenten en de
standaarddeviatie.
De p-waarde geeft aan of het effect significant is. Als p kleiner is dan 0.05 neem je H1 aan,
dan is de kans op een foutieve conclusie voldoende klein. P is afhankelijk van je sample
size, de standaardeviatie en de grootte van het gevonden effect.
Field H1 - Why is my lecturer forcing me to learn statistics?
Independent variable = a variable thought to be the cause of some effect, a variable that
the experiment has manipulated. Predictor.
Dependent variable = a variable thought to be affected by changes in an independent
, variable, think of it as outcome.
Variables can be split into categorical and continuous, within these types there are
different levels of measurement.
- Categorical (distinct categories):
- Binary = only two categories.
- Nominal = more than two categories.
- Ordinal = categories have a logical order.
- Continuous (distinct score):
- Interval = equal intervals on the scale represent equal differences in the
property being measured.
- Ratio = scale must have a meaningful zero point.
The mean is the sum of all scores divided by the number of scores. This value can be
influenced heavily by extreme scores, but it uses every score and is stable in different
samples. The median is the middle score when the scores are placed in ascending order.
It is not as influenced by extreme scores. The mode is the score that occurs most
frequently.
- The deviance of error is the distance of each score from the mean.
- The sum of squared errors is the total amount of error in the mean.
- The variance is the average distance of scores from the mean. It is the sum of
squared errors divided by the number of scores. It tells us about how widely
dispersed scores are around the mean.
- The standard deviation is the square root of the variance. Large standard
deviations suggest data are widely spread around the mean, while small standard
deviations suggest data are closely packed.
- The range is the distance between the highest and the lowest score.
- The interquartile range is the range of the middle 50% of scores.
Scores are sometimes expressed in a standard form, called z-scores. To transform a
score into a z-score you subtract from it the mean of all scores divide the result by the
standard deviation of all scores. The sign of the z-scores tells us wheter the original score
was above or below the mean; the value of z-score tells us how far the score was from the
mean in standard deviation units.
Field H4 - The IBM statistics environment
Zie: SPPS handleiding en werkgroepopdrachten.
HC 2- Steekproef, populatie, significantie
Vraag een frequentieverdeling op om afwijkende data op te sporen en je dataset te checken.
Dit kan van iedere schaalvariabele, niet zo nuttig bij categorische variabelen.
Bell-curve is bruikbaar om
normaalverdeling aan te duiden (niet om
exacte kansen te berekenen). Op basis
hiervan kan wel geconstateerd worden hoe
uitzonderlijk een bepaalde score is.
, Wanneer je data of variabelen normaal verdeelt zijn, kan je deze omvormen tot een
standaard normaalverdeling. Het gemiddelde is dan gelijk aan 0 en de standaarddevatie aan
1. Op deze manier weten we van elke plek in de verdeling de kans is, zie:
overschrijdingskansen.
- Standaard
normaalverdeling is
gebaseerd op Z-scores,
dit is de waarde van een
observatie uitgedrukt in
eenheden
standaarddeviatie. OF het
aantal standaarddeviaties
dat de score verwijderd is
van het gemiddelde. Je
standaardiseert scores op
deze manier t.o.v. andere
scores.
Een Z-tabel bevat alle Z-scores, hierin krijgt elke Z-score een waarde. Deze waarde is
gebaseerd op de kans dat een die waarde lager is dan een bepaalde Z-waarde (en dus in
het grijze gebied van de
normaalverdeling zit).
- Tabel zegt iets over: proportie
boven/onder die specifieke
Z-score en daarmee zijn plaats in
de normaalverdeling.
- Tabel bevat getallen tussen 0 en
1. Een afgelezen score van
0.9131 betekent dat 91% van de
waarden zich onder die Z-score
bevindt en 9% daarboven. De
proportie boven de Z-score zegt
iets over de overschrijdingskans!
- Met Z-scores kan je de kans op
een uitzonderlijke waarde achterhalen, omdat de originele waarden zijn omgezet in
gestandaardiseerde waarden met een gemiddelde van 0 en std.dv. van 1.
Idealiter zit de overschrijdingskans zover mogelijk in de hoek van de normaalverdeling, want
onder de 5% is deze significant (de foutkans is dan kleiner dan 5% en acceptabel).
- Wat is de kans om een bepaalde waarde op een variabele te hebben?
- Hoe uitzonderlijk zijn bepaalde waarden?
Deze vragen kan je met Z-scores beantwoorden, omdat de kansen gebaseerd zijn op
gestandaardiseerde waarden. En dus zijn ze vergelijkbaar.
Wat is de kans dat…?
1. Z-score berekenen (waarde - gemiddelde /
standaarddeviatie).
2. Checken in Z-tabel.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper harmkekoning. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,09. Je zit daarna nergens aan vast.