Dit is een samenvatting van alle colleges met betrekking tot het eerste deeltentamen van Onderzoeksmethoden 3. Allereerst wordt de basis van statistiek besproken en vervolgens wordt er ingegaan op verschillende strategieën. Voorbeelden zijn de T-toets (ongepaard of gepaard), Correlatie, Simpele re...
DEELTENTAMEN 1:
31/10: HET IDEE ACHTER STATISTIEK 1
Algemene kenmerken binnen statistiek:
Unit of analysis is datgene waarover je informatie verzamelt; wie wordt er gerepresenteerd?
Variabelen zijn de gemeten kenmerken van een unit of analysis; bv. vragen in de vragenlijst.
Values zijn de scores van een unit of analysis op een variabele; individuele scores
Value labels laten zien wat de waarden betekenen.
De onafhankelijke variabele is de vermoedelijke oorzaak, de predictor. X; dit kunnen er meer zijn.
De afhankelijke variabele is het vermoedelijke gevolg, de outcome. Y.
Het is afhankelijk van je onderzoeksvraag wat X en Y zijn.
Meetniveaus
Categoriaal houdt in dat er verschillende groepen zijn in je data; iedereen valt binnen een groep (bv.
politieke partij) Continu houdt in dat er een schaal/as is in de data; je kan als persoon overal zitten
(bv. leeftijd).
Categoriaal heeft drie soorten: binair, nominaal en ordinaal.
Binair houdt in dat er twee categorieën of groepen zijn. (corona gehad? : ja/nee)
Nominaal houdt in dat er meer dan twee categorieën zijn. (voorkeur voor politieke partij?)
Ordinaal houdt in dat er een inherente ordening in zit (hoe vaak sporten in de week?)
Continu heeft twee soorten (onderscheid niet echt van belang):
Interval houdt in dat verschillen op schaal betekenisvol zijn.
Ratio houdt in dat er een betekenisvol nulpunt is.
als je kan rekenen met verschillen op de schaal = interval/ratio.
Meetniveaus binnen SPSS: nominal, ordinal en scale.
Scale wordt gebruikt bij 7 of meer categorieën, anders ordinaal.
Binair en nominaal: nominal
Ordinaal: ordinal
Interval en Ratio: Scale
Centrummaten
1. Mediaan: middelste score van alle scores die je hebt
2. Modus: waarde met grootste frequentie
3. Gemiddelde: alle scores opgeteld, gedeeld door het aantal scores dat je hebt
Spreidingsmaten
1. Range: verschil tussen laagste en hoogste waarde
2. Standaarddeviatie is de gemiddelde afwijking van het gemiddelde
De standaarddeviatie laat 3 dingen zien:
De spreiding in de data, een maat voor de error of afwijking in de data en hoe representatief het
gemiddelde is voor de data.
,4/11: HET IDEE ACHTER STATISTIEK 2
Hypothesen
Een hypothese moet op een precieze manier geformuleerd zijn; specifieke formulering per toets
(één relatie of verschil per keer). Het moet toetsbaar zijn met data; een verwachte relatie tussen
twee variabelen. Verder moet het potentieel falsifieerbaar zijn; het is goed of fout, niet iets wat er
tussenin kan zitten.
Op basis van je hypothese twee tegengestelde opties:
H0: er is geen effect (ontkenning van je idee).
H1: er is wel een effect (dat wast je verwacht op basis van je idee).
Deze twee horen altijd bij elkaar. Sluit aan bij idee van falsifieerbaarheid.
Verschilhypothesen: gaat over het verschil tussen twee of meer groepen T-toets.
Samenhangende hypothesen: samenhang tussen twee variabelen Regressie
Eenzijdig betekent dat je een vermoeden hebt over de richting van het verband. Tweezijdig betekent
dat je daar geen vermoeden hebt over de richting van het verband. Dit heeft ook invloed op de
manier waarop je het toetst.
Significantie
Een hypothese is een idee over de populatie dat je gaat toetsen door middel van een steekproef om
zo iets over de hele populatie te zeggen. Het gaat erom de kans te bepalen dat je een effect in de
steekproef vindt, terwijl dat dat effect er in de populatie niet is.
Hoe groot is de kans in de steekproef deze waarden te vinden, terwijl eigenlijk de H0 waar is in de
populatie?
Als die kans groot is, verwerpen we de H1; het effect is niet significant.
Als die kans klein is, nemen we de H1 aan; het effect is significant.
Wanneer een onderzoek significant is, houdt dit in dat de kans groot is dat je het effect in de hele
populatie vindt. In statistiek is er vaak een foutmarge van 5%. Je checkt de significantie onder andere
door middel van de p-waarde. Als die kleiner is dan 0.05, dan is er sprake van een significant effect.
Als de standaarddeviatie groter wordt is, wordt de kans van een significant effect kleiner, omdat het
gemiddelde minder representatief is. De p-waarde wordt dan groter.
Verdelingen
Een frequentieverdeling laat zien hoe vaak verschillende scores voor komen.
De normaalverdeling: meeste mensen vlak rond gemiddelde en bij de uithoeken minder mensen.
We weten hierover dat wanneer een variabele normaal verdeeld is, dat 68% van de scores 1
standaarddeviatie onder het gemiddelde zit en 1 boven het gemiddelde. 95% valt 2
standaarddeviaties onder het gemiddelde en 2 boven het gemiddelde. 99% valt 3 standaarddeviaties
onder gemiddelde en 3 boven het gemiddelde.
De gestandaardiseerde normaalverdeling: een normaalverdeling door middel van z-scores.
Een z-score is de waarde van een observatie uitgedrukt in eenheden standaarddeviatie. Of: het
aantal standaarddeviaties dat een bepaalde waarde van een observatie is verwijderd van het
gemiddelde. Je standaardiseert de score ten opzichte van de andere scores. De verdeling van z-
scores heeft een gemiddelde van 0 en een standaarddeviatie van 1. Bij de normaalverdeling kan je
groffe dingen zeggen, maar bij de standaard normaalverdeling kan je de kansen van de specifieke z-
scores beter inschatten.
,De z-tabel geeft voor elke z-score aan wat de kans is op een bepaalde waarde. Met deze tabel kan je
voor elke z-tabel berekenen wat de kans is dat je erboven of eronder zit: ‘hoe groot is de kans op een
waarde die lager is dan een bepaalde z-waarde?’ Geeft dus waarden ‘eronder’ aan.
De tabel lees je als volgt: verticaal helemaal links moet je letten op het eerste cijfer en horizontaal
naar rechts het tweede cijfer achter de komma.
Deze scores zijn belangrijk voor de significantie: Hoe groot is de kans om in je sample een bepaalde
waarde (een effect, een verschil tussen twee groepen) te vinden, terwijl in werkelijkheid, in de
populatie, dat effect eigenlijk 0 is? Met z-scores kun je die kansen achterhalen, omdat je de originele
waarden van je eigen variabele omzet in gestandaardiseerde waarden met een gemiddelde van 0 en
een standaarddeviatie van 1.
Voorbeeld:
Wat is de kans dat iemand een IQ van hoger dan 103 heeft?
Iemand met dit IQ krijgt een z-score van: 103 (observatie)-100 (gemiddelde) / 15 (sd) = 0.20.
Belangrijke waardes:
In standaard normaalverdeling:
- De middelste 95% van de waarden ligt tussen z-scores van -1.96 en 1.96
- De middelste 99% van de waarden ligt tussen z-scores van -2.58 en 2.58
- De middelste 99.9% van de waarden ligt tussen z-scores van -3.29 en 3.29
Deze drie waarden komen vaker terug (1.96, 2.58 en 3.29).
, Populatie en steekproef
Stel dat je een oneindig aantal steekproeven zou trekken uit een populatie. Je vindt in zo’n
steekproef dan steeds een net iets ander gemiddelde (en sd). Al die gemiddelden vormen een
nieuwe verdeling: de steekproevenverdeling. De imaginaire steekproevenverdeling heeft een eigen
gemiddelde en eigen standaarddeviatie, deze noemen we de standard error (=standaarddeviatie van
de steekproevenverdeling).
De centrale limietstelling levert theoretisch bewijs dat als een steekproef random gekozen is en
meer dan dertig casussen heeft, we de eigenschappen van de normale verdeling kunnen gebruiken
om aan de hand van de steekproef schattingen te maken over de populatie.
Die steekproevenverdeling is fictief, die doe je niet echt en die weten we dus eigenlijk niet. Volgens
de centrale limietstelling kun je met de standaarddeviatie van de steekproef gebruiken om de
standard error te berekenen. Een grote standaard error betekent kleinere kans op significant effect.
Als de standaarddeviatie van de steekproef groter wordt, wordt de standaard error ook groter (en de
kans op vinden van significant effect wordt kleiner). Als de steekproef groter wordt, wordt de
standaard error kleiner.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller charlottedunsbergen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.52. You're not tied to anything after your purchase.