MEGA SAMENVATTING – ONDERZOEKSPRACTICUM 1
BIJEENKOMST 1
Soorten onderzoek zijn beschrijvend, (cor)relationeel, quasi-experimenteel en experimenteel
Doelen van onderzoek zijn beschrijven, voorspellen en verklaren
Theorie bewijzen is logisch gezien onmogelijk en falsificeren is praktisch gezien onmogelijk
Conceptuele definitie = betekenis in concepten operationaliseren naar operationele definitie = meetbaar en
concreet maken
Voorbeelden:
Nominaal - religie
Ordinaal – opleidingsniveau
Interval – IQ
Ratio - leeftijd
Een grafiek is afhankelijk van meetniveau
- Histogrammen en boxplots voor interval en ratio variabelen
- Stem-en-leaf-plot is ook vorm van histogram, boxplot is robuust tegen uitbijters
- Staaf- en cirkeldiagrammen voor ordinale en nominale variabelen
Variabele kunnen onafhankelijk (oorzaak, x) of afhankelijk (gevolg, y) zijn
Discreet gemeten = waarden waar niets tussen zit, dus nominaal of ordinaal
Continu gemeten = waarden waar altijd iets tussen zit, vaak interval of ratio
Centrummaten: gemiddelde, modus en mediaan
Spreidingsmaten:
- Standaarddeviatie (σ/S) = gemiddelde afstand van alle variabelen tot
gemiddelde
- Standaardvariantie (S2) = kwadraat van standaarddeviatie
- Interkwartiel afstand = afstand tussen 1e en 3e kwartiel (Q1 en Q3), hierin is mediaan Q2
- Uitbijter = als score meer dan 1,5 keer de kwartielafstand ligt
Schaaltransformatie = meting omzetten naar andere schaal, dan verandert de spreiding
Let op bij verschuiving verandert de spreiding niet
Centrale tendentie = respondenten kiezen middelste antwoordcategorieën (neutraal)
BIJEENKOMST 2
4 soorten metingen: observatie, fysiologische maten, vragenlijsten en archief
Voor observatie 3 beslissingennemen:
1 Setting: naturalistisch of vooropgezet of veldexperiment (tussenvorm)
2 Onderzoeker: verborgen of openlijk
3 Methode: gestructureerd of ongestructureerd?
Response bias = neiging van respondenten tot bepaald antwoordpatroon
- Halo-effect = vragen over iemand positief beantwoorden omdat je 1 positieve eigenschap van diegene kent,
maar verder ken je diegene niet zo goed
- Leniency bias = vragen over iemand positief beantwoorden doordat je iemand te goed kent
- Logische fout = respondent koppelt twee vragen logisch aan elkaar, terwijl dit niet zo is (assertief en
agressief)
- Plafond- en bodemeffecten = bij herhaald onderzoek de eerste keer te makkelijke test, dan wordt het
moeilijk om in herhaalde metingen verbetering te meten (plafondeffect) of andersom (bodem)
- Sociale wenselijkheid = sociaal gewenst antwoord geven bij gevoelige onderwerpen, dit kan je voorkomen
door anonimiteit of tegenvragen ertussen te doen
- Ja-zeggers/nee-zeggers = alle hoogste en laagste antwoorden invullen
Vanuit ethiek zijn er 3 benaderingen:
1 Deontologische benadering = zwartwit over goed of fout, je doet alleen het goede
2 Utilitaristische benadering = afweging tussen kosten en baten van aanpak
3 Sceptische benadering = geen ethische regels, iedereen zelf bepalen, dit is nu achterhaald
Andere ethische punten zijn: niet verleiden tot deelname door betaling (alleen onkosten, waardebon), rekening met
fysieke en mentale belasting, vertrouwelijk behandelen, passende data-analyse, integriteit en informed consent =
toestemming na informeren over doelen en nut
, Dichtheidscurve = benadering van histogram, totale oppervlakte is de gehele populatie, dus 1 of 100%
Normaalverdeling = vorm van dichtheidscurve met kenmerken: symmetrisch, unimodaal en klokvorming, totale
oppervlakte is 1 en vorm wordt bepaald door µ en σ
Z-score = aantal standaarddeviaties dat individuele score afwijkt van gemiddelde van gehele populatie
Doel hiervan is uitspraken op groepsniveau doen en positie van individuele score bepalen t.o.v. populatie
x i−μ
Formule Z-score = z=
σ
Xi is de individuele score en µ het populatiegemiddelde
Standaardnormaalverdeling = normaalverdeling waarvan alle scores zijn omgezet naar Z-scores, met een
gemiddelde van 0 en standaarddeviatie van 1
BIJEENKOMST 3
Doelen van correlatie en regressie is voorspellen van relaties bij kennis over 1 variabele, dus bij numerieke variabelen
en dan y op basis van x
- Correlatie is gericht op sterkte van verband, zonder richting
- Regressie is gericht op voorspelling van respons uit predictor
Predictor = onafhankelijk, oorzaak, verklaring = y-as
Respons = afhankelijk, gevolg, uitkomst = x-as
Symmetrische samenhang = geen onderscheid, correlatie
Asymmetrische samenhang = wel onderscheid, regressie
Formule rechte lijn = y=a+bx
- a = intercept, dat is het startpunt van de regressielijn
- b = helling, dus hoe steil de lijn loopt
Formule voor voorspelde waarde = regressievergelijking = ^y =b0 +b1 x
- B0 = intercept, dat is de waarde van voorspelde y bij x=0
Dus als x=0 niet in je grafiek ligt, dan ligt je intercept er niet in en is het zinloos
- B1 = het regressiegewicht = helling = regressiecoëfficiënt
Sy
b 0= y−b1 x b 1=
Sx
Correlatiecoëfficiënt (Pearson’s r) = indicatie voor samenhang, waarde tussen -1 en 1
Hoe verder van 0 af, hoe sterker het verband en -1 is perfect negatief en 1 is perfect positief
1
Formule correlatiecoëfficiënt = r = Σ ¿) (¿)
n−1
Je maakt van alle x- en y-waardes Z-scores, optellen bij elkaar en dat delen
door n-1
Voor uitrekenen is gebruik van tabel handig
Verklaarde variantie = correlatiecoëfficiënt in kwadraat r2, zoveel percentage verschil in een verklaart zoveel in het
ander en r2 = 1 is perfect verband, dan 100% sterke relatie
Residu/onverklaarde variantie = verschil tussen voorspelde y en geobserveerde y
- Uniek getal per individu, bij positief residu is jouw voorspelling te laag en bij negatief residu is jouw
voorspelling te hoog
- Hoge r2, dan laag residu en dan past regressie goed bij data
Maar lage r2, grote spreiding rondom regressielijn, dan is verband heel zwak of niet aanwezig
2 S ^y
Formule residu = r = 1 – r2 = wat je overhoudt, dus het residu
Sy