Gemaakt door Indy Jacobs (tweede jaar Psychologie Bachelor)
Volledige Samenvatting Experimentele Onderzoeksmethoden
• Alle belangrijke namen zijn rood
• Alle begrippen zijn blauw
• Alle kernwoorden zijn onderstreept
• De Engelse vertaling is schuingedrukt
• SPSS output of syntax is roze
Cursusdoelen:
1. Vertalen van verwachtingen van onderzoekers in hypothesen m.b.t. populatiegemiddelden of treatment
effecten
2. Uitvoeren van statistische analyses om populatiegemiddelden en hun verschillen te schatten en te toetsen,
of anders gezegd, om treatment effecten te schatten en te toetsen, in zowel simpele designs (t-toetsen, one-
way ANOVA, contrasten) als complexe designs (two-way ANOVA inclusief simple effects, ANCOVA, repeated
measures ANOVA, mixed-effects ANOVA)
3. Interpreteren van output van statistische analyses genoemd onder 2
4. Onderscheid maken tussen statistische significantie en effect size, en in staat zijn beide concepten accuraat
toe te passen
5. Selecteren en beargumenteren van het meest geschikte design (within- of betweensubjects) voor een
toepassing
Inhoudsopgave: Overzicht hoorcolleges
Hoorcollege 1: Samenvatting stof eerdere cursussen en relatie tot EO ......................................................................... 2
Hoorcollege 2: Onderscheidend vermogen, effectgrootte en één-weg ANOVA deel I .................................................. 9
Hoorcollege 3: Één-weg ANOVA deel II ........................................................................................................................ 17
Hoorcollege 4: Contrasten deel I .................................................................................................................................. 26
Hoorcollege 5: Contrasten deel II ................................................................................................................................. 33
Hoorcollege 6: Twee-weg ANOVA deel I ....................................................................................................................... 42
Hoorcollege 7: Twee-weg ANOVA deel II ...................................................................................................................... 50
Hoorcollege 8: ANCOVA deel I ...................................................................................................................................... 62
Hoorcollege 9: ANCOVA deel II + Repeated measures ANOVA deel I ........................................................................... 72
Hoorcollege 10: Repeated measures ANOVA deel II .................................................................................................... 79
Hoorcollege 11: Design ................................................................................................................................................. 90
1
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Gemaakt door Indy Jacobs (tweede jaar Psychologie Bachelor)
Hoorcollege 1 Samenvatting stof eerdere cursussen en relatie tot EO
Doelen hoorcollege 1: Na afloop van dit college en het bestuderen van de materialen kunnen studenten:
• Een frequentieverdeling interpreteren
• Centrummaten (bijv. gemiddelde) en spreidingsmaten (bijv. variantie) interpreteren en berekenen
• De logica van hypothesetoetsen uitleggen
• De SPSS output van een one-sample t-toets en independent samples t-toets interpreteren
Beschrijvende statistiek
• Beschrijvende statistiek= Samenvatten van data. Wordt gebruikt om een kwantitatieve (in cijfers)
samenvatting, organisatie of versimpeling te maken van informatie/data. Denk aan: summary statistics,
gemiddelde, mediaan, modus, variantie, etc.
• Data= Numerieke gegevens van populatie of steekproef
Populatie Steekproef
Alle leden van gedefinieerde groep Deelverzameling van leden van gedefinieerde groep
Parameters zijn maten voor eigenschappen van de Steekproefgrootheden (“statistics”) zijn maten voor
scores in de populatie eigenschappen van de scores in de steekproef
Griekse letters geven parameters weer Latijnse letters geven steekproefgrootheden weer
(µ = gem, σ = st.dev.) (X = gem, s = st.dev.)
• Syntax helpt om analyses opnieuw te doen.
• Gegevens uit een steekproef: 1 1 4 4 3 2 3 1 2 1 3 4 4 3 3 4 4 3 1 4 4 4 4 3 4 4 2 3 1 3 4 1 3 4 4 4 2 4 2 4 3 3 1 1
43413
• Beschrijvende statistiek helpt om de data samen te vatten -> lijst is onoverzichtelijk
• Twee manieren om dit te doen:
1. Het maken van een verdeling van scores
2. Steekproefgrootheden
Sampling error is een natuurlijke discrepantie of fout die bestaat tussen een sample statistiek en de
corresponderende populatie parameter. Ook moeten we rekening houden met de onzekerheid dat je bij iedere
nieuwe random steekproef een nieuw resultaat kunt krijgen (steekproeffluctuaties). Personen in de groep scores Y
die we observeren zijn niet allemaal gelijk zijn aan de gemiddelde van de groep, de scores wijken daar iets van af.
Er zijn twee soorten variabelen:
1. Discrete random variabelen: Deze bestaan uit aparte, ondeelbare en telbare categorieën. Er kunnen geen
waarden zijn tussen twee nabije categorieën. Nominale/ordinale variabelen zijn over het algemeen discreet.
Discrete variabelen zijn niet per sé nominaal/ordinaal. Bv, aantal kinderen per gezin, sekse categorieën,
categorieën voor haarkleur.
2. Continue random variabelen: Wanneer de mogelijke uitkomsten van de variabele elke waarde kunnen
aannemen binnen een bepaald interval. Het is zeer onwaarschijnlijk dat je twee identieke metingen doet
voor verschillende individuelen.
o Continue variabelen hebben over het algemeen interval/ratio niveaus. Interval/ratio variabelen zijn
niet per sé continu. Bv, leeftijd (geen categorieën), lengte, sekse schalen (van vrouwelijk tot
mannelijk).
o Daarnaast moet men eraan denken om intervallen in te zetten. Iemand die zegt 300 kilo te wegen,
kan ergens tussen de 299.6 en 300.4 kilo wegen, dit zijn de real limits. De upper real limit is aan de
bovenkant, de lower real limit aan de onderkant. 299.5 is in dit geval de boundary en het hangt af
van je afrondingsregels in welke categorie deze valt.
2
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Gemaakt door Indy Jacobs (tweede jaar Psychologie Bachelor)
Random variabelen: Variabelen waarvan de mogelijke uitkomsten het resultaat zijn van een random fenomeen. De
statistische notatie is meestal X of Y, specifieke uitkomsten en specifieke observaties worden opgeschreven met een
kleine x of y.
De N wordt gebruikt voor het identificeren van de hoeveelheid scores in een populatie.
Een n wordt gebruikt voor de hoeveelheid scores in een sample.
De letter sigma Σ staat voor “de som van”.
Verdeling
• Data samenvatten door groeperen van data met dezelfde score
• Dit kan onder andere door middel van een frequentieverdeling of histogram
• Een frequentieverdeling: Een tabel of grafiek die weergeeft hoe vaak een bepaalde uitkomst is
geobserveerd, voor elke mogelijke uitkomst voor die variabele. Bv, voor 57 grote tafels, de frequentie = 57.
• Histogram: Eerst alle scores op de x-as zetten en een balk tekenen boven iedere x-waarde, zodat de hoogte
van de balk overeenkomt met de frequentie voor die categorie.
o Voor continue variabelen strekt de balk tot de real limits van de categorie, voor discrete variabelen
strekt de balk precies tot de helft van de aangrenzende categorie.
o Bij een aangepaste histogram worden blokjes gebruikt om de waardes weer te geven, dit maakt het
erg makkelijk om de waarde af te lezen. Hierdoor is er ook geen y-as meer nodig.
• SPSS syntax om frequentieverdeling en histogram te
genereren (syntax is belangrijk in deze cursus!):
FREQUENCIES
VARIABLES=x
/HISTOGRAM
/ORDER= ANALYSIS .
Grouped frequency distribution table: Als een frequentieverdeling veel scores bevat, is het handiger om deze in
groepen/intervallen te delen. De groepen worden class intervals genoemd.
De richtlijnen voor het maken van een goede gegroepeerde frequentieverdeling:
1. Gebruik ongeveer 10 class intervals.
2. De wijdte van iedere class interval moet een simpel getal zijn, bv 4, 6 of 10.
3. De vloerscore moet beginnen met een tiental. Bv, als de vloerscore 12 is, begint de tabel met 10.
4. Alle intervallen moeten dezelfde wijdte hebben, er moeten geen gaten vallen of overlappingen zijn
Steekproefgrootheden
• Data samenvatten door kenmerkende eigenschappen van de verdeling van de data
• Wat zijn deze kenmerkende eigenschappen?
1. Meest kenmerkende score van de verdeling = centrale tendentie
2. Hoeveel wijken scores af van de meest kenmerkende score = spreiding
3
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Gemaakt door Indy Jacobs (tweede jaar Psychologie Bachelor)
Centrale tendentie:
• Maten voor centrale tendentie zijn gemiddelde, mediaan en modus
• Gemiddelde van data is de som van alle scores gedeeld door het totaal aantal scores
• Met de hand: Met SPSS:
• X = de variabele n = steekproefgrootte
• Mediaan: De waarde die de hoogste helft van de data scheidt van de laagste helft van de data.
Bv, de volgende cijfers zijn gehaald: 7,7, 8, 6, 9, 7, 8, 9. Dan eerst ordenen van de cijfers: 6, 7, 7, 7, 8, 8, 9, 9.
Dan 7 + 8 = 15. 15 delen door 2 is 7,5. Dus mediaan is 7,5.
• Modus: De uitkomst die het vaakst voorkomt, d.w.z. de uitkomst met de hoogste frequentie.
Bv, de volgende cijfers zijn gehaald 7, 7, 8, 6, 9. Dan is de modus 7.
o Het is mogelijk om meer dan 1 mode te hebben, dit gebeurt wanneer twee of meer keer dezelfde
hoogste frequentie voorkomt.
o Bimodaal: Een verdeling met twee modussen
o Multimodaal: Een verdeling met meer dan twee modussen
Spreiding:
• Maten voor spreiding zijn range, variantie, en standaarddeviatie
• Het bereik (the range): Het verschil tussen de laagste en hoogste waarde van de variabele.
Formule: range = Xmax - Xmin .
• Variantie van data: De som van alle gekwadrateerde deviatiescores gedeeld door aantal scores min één:
• Met de hand: Met SPSS:
1. Voor elke observatie berekent men de afwijking (deviatie) van het gemiddelde. Deviatie = Xi – X.
De som van de deviaties is altijd 0.
2. Kwadrateer alle deviaties die je in stap 1 hebt berekend, hierdoor krijg je de SS, som van kwadraten.
3. Neem de som van alle gekwadrateerde deviaties uit stap 2. SS= sum of squares
4. Bepaal het totaal aantal observaties, we noemen dat aantal n of N.
5. Deel de som van de gekwadrateerde deviaties door het totaal aantal observaties (- 1 als het in een
steekproef is).
• Standaarddeviatie is de wortel van de variantie: s = = 1.147
Inferentiële statistiek
• Beschrijvende statistiek volstaat als we data hebben van de gehele populatie
• Bijna altijd hebben we alleen data van een steekproef en niet de van de hele populatie, omdat
1. Te duur
2. Kost veel tijd om te verzamelen
3. Soms onmogelijk
• = van steekproef naar populatie ofwel gebruikmaken van steekproefdata om conclusies te trekken over een
populatie/ Met behulp van inferentiële statistiek kunnen we op basis van een steekproef een uitspraak
proberen te doen over de populatie
• Er zijn drie “procedures” in de inferentiële statistiek:
1. Hypothese toetsen
2. Puntschatten
3. Intervalschatten -> betrouwbaarheidsinterval
4
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.