In dit document staan alle aantekeningen van de hoorcolleges inclusief een aantal oefeningen tussendoor. Alle toelichtingen van de docent zijn ook in het document verwerkt. Het lijken veel pagina's, maar ik heb er veel afbeeldingen ter verduidelijking in staan. Samen met de hoorcollege slides en oe...
TiU: Experimentele Onderzoeksmethoden (2020/2021)
Shimara van den Elzen
EXPERIMENTELE ONDERZOEKSMETHODEN
SAMENVATTING VAN DE HOORCOLLEGES
HOORCOLLEGE 1
Beschrijvende statistiek: samenvatten van data.
Data: numerieke gegevens van populatie of steekproef.
- Wat we uiteindelijk willen doen is de resultaten vanuit de steekproef generaliseren
naar de populatie. Dus, op basis van een selectie van de mensen uit de populatie
willen we iets kunnen concluderen naar de populatie toe.
Beschrijvende statistiek:
- Voorbeeld:
o Gegevens uit een steekproef: 1 1 4 4 3 2 3 1 2 1 3 4 4 3 3 4 4 3 1 4 4 4 4 3 4
423134134442424331143413
o Dit is heel erg onoverzichtelijk en het is lastig om hier conclusies over te
trekken.
- Beschrijvende statistiek is belangrijk, omdat we middels de beschrijvende statistiek
snel overzicht krijgen van de data. Beschrijvende statistiek helpt om de data samen
te vatten.
- Twee manieren om dit te doen:
1. Het maken van een verdeling van scores.
2. Steekproefgrootheden.
Hoe de scores van het voorbeeld er in SPSS uit zouden zien:
1
, TiU: Experimentele Onderzoeksmethoden (2020/2021)
Shimara van den Elzen
Verdeling:
- Verdeling: data samenvatten door groeperen van data met dezelfde score.
- Dit kan onder andere door middel van:
o Een frequentieverdeling (links).
▪ Hier zijn de verschillende scores te zien, de frequenties, het
percentage, valid percent (wijkt af van percent als er ‘missing data’ is)
en de cumulative percent (de percentages worden steeds opgeteld).
o Een histogram (rechts).
▪ Op de Y-as staat de frequentie: hoe vaak een bepaalde score
voorkomt. Op de X-as staan de verschillende scores die je kunt krijgen
op de variabelen.
- SPSS syntax om frequentieverdeling en histogram te genereren (syntax is belangrijk
in deze cursus, omdat dit je helpt om snel bepaalde analyses opnieuw te runnen!):
o FREQUENCIES
VARIABLES=x
/HISTOGRAM
/ORDER= ANALYSIS.
o Op het tentamen zal er een vraag (of meerdere) komen over de SPSS syntax.
Steekproefgrootheden:
- Steekproefgrootheden: data samenvatten door kenmerkende eigenschappen van
de verdeling van de data.
- Wat zijn deze kenmerkende eigenschappen?
o Meest kenmerkende score van de verdeling: centrale tendentie.
o Hoeveel wijken scores af van de meest kenmerkende score: spreiding.
- Centrale tendentie:
o Maten voor centrale tendentie zijn gemiddelde (het belangrijkst in deze
cursus), mediaan en modus.
o Gemiddelde van data is de som van alle scores gedeeld door het totaal
aantal scores (N: steekproefgrootte):
- Met de hand:
- Met SPSS:
2
, TiU: Experimentele Onderzoeksmethoden (2020/2021)
Shimara van den Elzen
- Spreiding:
o Maten voor spreiding zijn range, variantie, en standaarddeviatie (variantie en
standaarddeviatie zijn het belangrijkst in deze cursus).
o Variantie: de som van alle gekwadrateerde deviatiescores (sum of squares)
gedeeld door aantal scores min één:
- Met de hand:
- Met SPSS:
- Standaarddeviatie: de wortel van de variantie: 𝑠 = = 1.147
Inferentiële statistiek:
- Beschrijvende statistiek is voldoende als we data hebben van de gehele populatie.
- Maar, bijna altijd hebben we alleen data van een steekproef en niet van de hele
populatie, omdat: te duur, kost veel tijd om te verzamelen en soms onmogelijk.
- Met behulp van inferentiële statistiek kunnen we op basis van een steekproef een
uitspraak proberen te doen over de populatie.
- Er zijn drie “procedures” in de inferentiële statistiek:
1. Hypothese toetsen
2. Puntschatten
3. Intervalschatten → betrouwbaarheidsinterval
Hypothese toetsen:
- Vraag:
o Wat is het gemiddelde van de populatie waaruit die steekproef van 50 cases
is getrokken? (zie eerder genoemd voorbeeld)
- Bij hypothese toetsen ga je na of het gemiddelde in de populatie gelijk is aan een
bepaalde waarde of niet → hypothesen zijn uitsluitend (maar één hypothese is waar)
en uitputtend (alle verschillende waardes moeten mogelijk kunnen zijn).
- Voorbeeld: H0: = 2.5 en H1: ≠ 2.5
- We spreken hier van een tweezijdige toets (H1 staat ≠), later bespreken we ook
éénzijdige toets (H1 staat > of <).
- Je toetst H0, die je kunt verwerpen of niet. Als je H0 verwerpt concludeer je H1 ,
d.w.z., is niet gelijk aan 2.5
- Vuistregels opstellen hypothesen:
1. H0 bevat “=“ → gaat altijd op.
2. H1 bevat verwachtingen van de onderzoeker → gaat bijna altijd op.
Stappen bij hypothese toetsen:
- Stap 1: Formuleren van hypothesen: H0 : = 2.5 en H1 : ≠ 2.5
- Stap 2: Beslissingsregel bepalen wanneer een resultaat statistisch significant is: p
- Stap 3: p-waarde bepalen uit output van SPSS
- Stap 4: Beslissing over significantie en inhoudelijke conclusie
3
, TiU: Experimentele Onderzoeksmethoden (2020/2021)
Shimara van den Elzen
- Toepassen op ons voorbeeld: Syntax
o T-TEST
/TESTVAL=2.5
/MISSING=ANALYSIS
/VARIABLES=x
/CRITERIA=CIN (.95) .
- Output:
Logica toetsen:
- Je maakt een aanname over de waarde van een parameter (hier ) – de
nulhypothese (Stap 1).
- Gegeven dat de waarde juist is, bepaal je de verdeling van de mogelijke waarden die
de steekproefgrootheid (hier ) kan aannemen (de steekproevenverdeling van ) bij
een enkelvoudige toevallige steekproef (“simple random sample”) van N cases.
- Het gemiddelde van de steekproevenverdeling is , de variantie 2/N.
- Met die steekproevenverdeling bepaal je de kans, de zogenaamde p-waarde, dat de
waarde van optreedt of nog extremer.
- In Stap 3 bepaal je de positie van in de steekproevenverdeling, en bepaal je dus
ook impliciet de p-waarde.
- Als de kans kleiner is dan , dan zeg je:
o “Als mijn H0 waar is, dan is de kans dat ik deze waarde voor vind of nog
extremer, kleiner dan . Deze kans is zo klein, dat ik geen vertrouwen meer
heb in mijn nulhypothese. Ik verwerp H0 .”
- Als de kans groter is dan , dan zeg je:
o “Als mijn H0 waar is, dan is de kans dat ik deze waarde voor vind of nog
extremer best groot. Ik heb dus niet genoeg redenen om te twijfelen aan de
juistheid van H0. Ik verwerp H0 dus niet.”
- Dus… In Stap 2 bepaal je en de beslissingsregel, in Stap 4 neem je de beslissing.
- Opmerking:
o Eén van de aannames is dus wel dat de steekproef een ‘simple random
sample’ is. Dat wil zeggen:
▪ Alle cases hebben gelijke kans om in de steekproef te komen.
▪ Cases worden onafhankelijk van elkaar geselecteerd.
o Als niet aan de aanname voldaan is, dan mag de toets strikt genomen niet
gebruikt worden…
Eénzijdig vs. tweezijdig toetsen:
- Logica hetzelfde van éénzijdig en tweezijdig toetsen.
- Echter, output van SPSS is altijd tweezijdig, dus → omzetten van tweezijdige “Sig.” in
SPSS output naar juiste (éénzijdige) p-waarde.
- Dit kunnen we doen a.d.h.v. de beslissingsboom (zie volgende pagina):
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller shimaravdelzen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.12. You're not tied to anything after your purchase.