Statistiek
Hoorcollege 1: Onderzoek & Inleiding in de statistiek (Boek: H.1, H.2, H.3)
Statistiek: verzameling hulpmiddelen waarmee je uitspraken kunt doen over processen waarbij het
toeval een rol speelt.
- Verschillende hulpmiddelen (technieken, toetsen) voor verschillende soorten processen.
- SPSS voor het rekenwerk
De wetenschappelijke methode: proces om te komen tot empirisch oordeel
- Empirisch = op grond van ervaring
- Proces:
o Onderzoeksvraag plus vermoeden over mogelijke oplossing
o Theorie: geheel aan samenhangende en niet onderling strijdige uitspraken over een
waargenomen verschijnsel of proces
▪ Theorie doorgaans gebaseerd op verschillende onderzoeken
o Hypothese: uit de theorie voortvloeiende voorspelling die getoetst kan worden
▪ Moet precies geformuleerd worden
▪ Moet falsifieerbaar zijn (d.w.z. op de feiten stuk kunnen lopen)
• Het moet te testen zijn
o Experiment: verzamelen van gegevens om hypothese te toetsen = meten
▪ Onderzoeksopzet: precies omschrijven wat je gaat meten
▪ Operationalisatie: precies omschrijven hoe je gaat meten
▪ Afhankelijke variabele = beïnvloed door verandering in onafhankelijke variabele →
variabele kan gezien worden als uitkomst/het effect
• Uitkomstvariabele (afhankelijke variabele) = verandert door verandering
predictor-variabele
▪ Onafhankelijke variabele = gemanipuleerde variabele = oorzaak van enig effect
• Predictor-variabele (onafhankelijke variabele) = voorspelt de
uitkomstvariabele
▪ Validiteit = dat je meet wat je wil meten
▪ Betrouwbaarheid = wat je meet is reproduceerbaar in verschillende situaties
o Analyse: nagaan a.d.h.v. meetgegevens of voorspelling uitkomt = Hypothese testen
▪ Histogram/frequency distribution: plot van hoe vaak elke waarde is opgetreden →
Beoordelen van eigenschappen van de verdeling van waardes
• Normaalverdeling: skew en kurtosis waardes zijn 0!!!
o Skew: geen symmetrie
▪ Positieve → staart naar positieve kant
▪ Negatief → staart naar negatieve kant
, o Kurtosis: puntigheid → mate waarin waardes clusteren aan eind van de
verdeling (staart)
▪ Leptokurtic: positieve kurtosis verdeling → zware staartverdeling
(veel geclusterde waardes in de staart)
▪ Platykurtic: negatieve kurtosis → lichte staartverdeling, vlakker
dan normaal
• Centrum frequentieverdeling berekenen
o Mean: gemiddelde score
o Modus/mode: score die het vaakst voorkomt in de dataset → nadeel
dat het op meerdere waardes kan zijn
▪ Bimodaal
▪ Multimodaal
o Mediaan: middelste score als scores worden gerangschikt in volgorde
van grootte → niet te gebruiken bij nominale data, niet beïnvloed door
asymmetrie en skew!
▪ Spreiding van scores: laagste score aftrekken van de hoogste score
▪ Deviatie/error= afstand van elke waarde vanaf het gemiddelde
▪ Sum of squares/ sum of squared errors (SS) = totaal aantal fouten van het
gemiddelde
▪ Variantie = gemiddelde afstand tussen waardes en het gemiddelde → hoe
wijd verspreid de waardes liggen rond het gemiddelde
▪ Standaarddeviatie = afwijking sample gemiddeldes t.o.v. het gemiddelde
▪ Range/bereik = afstand tussen hoogste en laagste waarde
▪ Interquartile range/interkwartiel bereik = bereik van de middelste 50% van
de waardes (verschil tussen upper en lower quartile range)
, ▪ Probability verdeling/ waarschijnlijkheidsverdeling/kansverdeling = vloeiende curve ips
staaf histogram
▪ Verificatie: indien hypothese juist is
▪ Meestal Confirmatie: meting ondersteund de hypothese
▪ Falsificatie: indien hypothese onjuist is
▪ Theorie aanpassen/verwerpen = terugkoppeling analyse --> theorie
Waarden = Ethiek
- Mooi-lelijk
- Goed-fout
Feiten = ‘Dit is een tafel’
- Kunnen juist of onjuist zijn
- Empirische wetenschappen: kennis vergaren door ervaring
Rationalisme: kennis vergaren door te beredeneren
- Aristoteles: Gedachte-experiment
- Zware objecten vallen sneller → ontkracht door Galileo Galilei
Galileo Galilei: zwaartekracht experiment
Wetenschappelijke methode → experimenteel onderzoek doen
- Kijken waar manipulatie tot leidt
- Onafhankelijke variabele: datgene waarvan je de waarde manipuleert
- Afhankelijke variabele: datgene waarvan je de waarde meet
, Levels of measurement/meetniveau = relatie tussen wat wordt gemeten en de getallen die
vertegenwoordigen wat er wordt gemeten
- Categorisch
o Binair
o Nominaal
o Ordinaal
- Continue → continu (alle getallen)/discrete (beperkte waardes) variabelen
o Interval
o Ratio
Variabelen: categorisch of continue en kunnen verschillende meetniveaus hebben
Onderzoeksdesign
- Correlationeel onderzoeksmethode
o Observeren en meten van natuurlijke gebeurtenissen
o Momentopname van veel variabelen op enkel tijdstip
o Longitudinaal onderzoek = variabelen herhaaldelijk meten op verschillende
tijdstippen
o Nadeel: geen informatie over aaneenschakeling tussen variabelen (wat was eerst?)
→ causaal verband moeilijk te bevestigen
o Geen invloed op wat er gebeurt, en de variabelen mogen niet vertekenen door
aanwezigheid van de onderzoeker
- Experimenteel onderzoeksmethode
o Afhankelijke & onafhankelijke variabelen
o Causaliteit afleiden is alleen mogelijk door 2 gecontroleerde situaties te vergelijken
▪ Interventie + controle
o Vergelijking maken van situaties (behandeling/aandoening) waarin voorgestelde
oorzaak aanwezig of afwezig is
o Variatie/variantie
▪ Systematische variatie: komt doordat onderzoeker iets in ene conditie wel
doet, maar niet in de andere conditie
▪ Onsystematische variatie: gevolg van willekeurige factoren die bestaan
tussen de experimentele condities (tijdstip van de dag, natuurlijke verschillen
in bekwaamheid, etc.) → zo klein mogelijk houden!
o 2 manieren om onafhankelijke variabele te manipuleren
▪ Onafhankelijk design/between-groups/between-subject: Verschillende
entiteiten testen: iedere groep neemt deel aan een andere conditie
▪ Within design/repeated-measures/herhaalde metingen: Onafhankelijke
variabele manipuleren met dezelfde entiteiten: elke groep ondergaat elke
conditie
• Bronnen van systematische variatie: oefeneffect (bekendheid met
condities) en vervelingseffect (anders presteren door vermoeidheid)
o Randomisatie: systematische variatie voorkomen en risico verkleinen dat groepen
verschillen op variabelen, anders dan die je wilt manipuleren
Hoorcollege 1: Onderzoek & Inleiding in de statistiek (Boek: H.1, H.2, H.3)
Statistiek: verzameling hulpmiddelen waarmee je uitspraken kunt doen over processen waarbij het
toeval een rol speelt.
- Verschillende hulpmiddelen (technieken, toetsen) voor verschillende soorten processen.
- SPSS voor het rekenwerk
De wetenschappelijke methode: proces om te komen tot empirisch oordeel
- Empirisch = op grond van ervaring
- Proces:
o Onderzoeksvraag plus vermoeden over mogelijke oplossing
o Theorie: geheel aan samenhangende en niet onderling strijdige uitspraken over een
waargenomen verschijnsel of proces
▪ Theorie doorgaans gebaseerd op verschillende onderzoeken
o Hypothese: uit de theorie voortvloeiende voorspelling die getoetst kan worden
▪ Moet precies geformuleerd worden
▪ Moet falsifieerbaar zijn (d.w.z. op de feiten stuk kunnen lopen)
• Het moet te testen zijn
o Experiment: verzamelen van gegevens om hypothese te toetsen = meten
▪ Onderzoeksopzet: precies omschrijven wat je gaat meten
▪ Operationalisatie: precies omschrijven hoe je gaat meten
▪ Afhankelijke variabele = beïnvloed door verandering in onafhankelijke variabele →
variabele kan gezien worden als uitkomst/het effect
• Uitkomstvariabele (afhankelijke variabele) = verandert door verandering
predictor-variabele
▪ Onafhankelijke variabele = gemanipuleerde variabele = oorzaak van enig effect
• Predictor-variabele (onafhankelijke variabele) = voorspelt de
uitkomstvariabele
▪ Validiteit = dat je meet wat je wil meten
▪ Betrouwbaarheid = wat je meet is reproduceerbaar in verschillende situaties
o Analyse: nagaan a.d.h.v. meetgegevens of voorspelling uitkomt = Hypothese testen
▪ Histogram/frequency distribution: plot van hoe vaak elke waarde is opgetreden →
Beoordelen van eigenschappen van de verdeling van waardes
• Normaalverdeling: skew en kurtosis waardes zijn 0!!!
o Skew: geen symmetrie
▪ Positieve → staart naar positieve kant
▪ Negatief → staart naar negatieve kant
, o Kurtosis: puntigheid → mate waarin waardes clusteren aan eind van de
verdeling (staart)
▪ Leptokurtic: positieve kurtosis verdeling → zware staartverdeling
(veel geclusterde waardes in de staart)
▪ Platykurtic: negatieve kurtosis → lichte staartverdeling, vlakker
dan normaal
• Centrum frequentieverdeling berekenen
o Mean: gemiddelde score
o Modus/mode: score die het vaakst voorkomt in de dataset → nadeel
dat het op meerdere waardes kan zijn
▪ Bimodaal
▪ Multimodaal
o Mediaan: middelste score als scores worden gerangschikt in volgorde
van grootte → niet te gebruiken bij nominale data, niet beïnvloed door
asymmetrie en skew!
▪ Spreiding van scores: laagste score aftrekken van de hoogste score
▪ Deviatie/error= afstand van elke waarde vanaf het gemiddelde
▪ Sum of squares/ sum of squared errors (SS) = totaal aantal fouten van het
gemiddelde
▪ Variantie = gemiddelde afstand tussen waardes en het gemiddelde → hoe
wijd verspreid de waardes liggen rond het gemiddelde
▪ Standaarddeviatie = afwijking sample gemiddeldes t.o.v. het gemiddelde
▪ Range/bereik = afstand tussen hoogste en laagste waarde
▪ Interquartile range/interkwartiel bereik = bereik van de middelste 50% van
de waardes (verschil tussen upper en lower quartile range)
, ▪ Probability verdeling/ waarschijnlijkheidsverdeling/kansverdeling = vloeiende curve ips
staaf histogram
▪ Verificatie: indien hypothese juist is
▪ Meestal Confirmatie: meting ondersteund de hypothese
▪ Falsificatie: indien hypothese onjuist is
▪ Theorie aanpassen/verwerpen = terugkoppeling analyse --> theorie
Waarden = Ethiek
- Mooi-lelijk
- Goed-fout
Feiten = ‘Dit is een tafel’
- Kunnen juist of onjuist zijn
- Empirische wetenschappen: kennis vergaren door ervaring
Rationalisme: kennis vergaren door te beredeneren
- Aristoteles: Gedachte-experiment
- Zware objecten vallen sneller → ontkracht door Galileo Galilei
Galileo Galilei: zwaartekracht experiment
Wetenschappelijke methode → experimenteel onderzoek doen
- Kijken waar manipulatie tot leidt
- Onafhankelijke variabele: datgene waarvan je de waarde manipuleert
- Afhankelijke variabele: datgene waarvan je de waarde meet
, Levels of measurement/meetniveau = relatie tussen wat wordt gemeten en de getallen die
vertegenwoordigen wat er wordt gemeten
- Categorisch
o Binair
o Nominaal
o Ordinaal
- Continue → continu (alle getallen)/discrete (beperkte waardes) variabelen
o Interval
o Ratio
Variabelen: categorisch of continue en kunnen verschillende meetniveaus hebben
Onderzoeksdesign
- Correlationeel onderzoeksmethode
o Observeren en meten van natuurlijke gebeurtenissen
o Momentopname van veel variabelen op enkel tijdstip
o Longitudinaal onderzoek = variabelen herhaaldelijk meten op verschillende
tijdstippen
o Nadeel: geen informatie over aaneenschakeling tussen variabelen (wat was eerst?)
→ causaal verband moeilijk te bevestigen
o Geen invloed op wat er gebeurt, en de variabelen mogen niet vertekenen door
aanwezigheid van de onderzoeker
- Experimenteel onderzoeksmethode
o Afhankelijke & onafhankelijke variabelen
o Causaliteit afleiden is alleen mogelijk door 2 gecontroleerde situaties te vergelijken
▪ Interventie + controle
o Vergelijking maken van situaties (behandeling/aandoening) waarin voorgestelde
oorzaak aanwezig of afwezig is
o Variatie/variantie
▪ Systematische variatie: komt doordat onderzoeker iets in ene conditie wel
doet, maar niet in de andere conditie
▪ Onsystematische variatie: gevolg van willekeurige factoren die bestaan
tussen de experimentele condities (tijdstip van de dag, natuurlijke verschillen
in bekwaamheid, etc.) → zo klein mogelijk houden!
o 2 manieren om onafhankelijke variabele te manipuleren
▪ Onafhankelijk design/between-groups/between-subject: Verschillende
entiteiten testen: iedere groep neemt deel aan een andere conditie
▪ Within design/repeated-measures/herhaalde metingen: Onafhankelijke
variabele manipuleren met dezelfde entiteiten: elke groep ondergaat elke
conditie
• Bronnen van systematische variatie: oefeneffect (bekendheid met
condities) en vervelingseffect (anders presteren door vermoeidheid)
o Randomisatie: systematische variatie voorkomen en risico verkleinen dat groepen
verschillen op variabelen, anders dan die je wilt manipuleren