Hoorcollege 1: introductie analyse 1 1 september 2020
Waarom statistiek in opleiding PWO?
• Academisch denkniveau: kritisch omgaan met gegevens en informatie
• Opleiden tot scientist practitioner: verbinden wetenschap en praktijk
• Behandeling kiezen o.b.v. onderzoeks- en testgegevens
• (Beleids)adviezen geven o.b.v. wetenschappelijke literatuur (bijv. SLO)
• Zelf (praktijk)onderzoek doen
Statistiek in het onderzoeksproces:
In welk fase van het onderzoek maak je gebruik van statistiek?
Conceptualiseren – inrichten – uitvoeren → allemaal maar het meeste in de uitvoeringsfase
Statistiek in conceptualiseringsfase:
• Vraagstelling/hypotheses (gericht op toetsen): is deze vraag echt te onderzoeken?
• Feiten versus mening
• Concreet genoeg?
Statistiek in de onderzoeksopzet:
• Wie: steekproefgrootte, kwaliteit steekproef (aselect, representatief)
• Wat: welke meetingsinstrumenten (soort en kwaliteit)
• Wanneer: eenmalig/meerdere meetmomenten
• Hoe: keuze van analysemethoden (bv. welke vragenlijst kies je? Baseer op validiteit en
betrouwbaarheid)
Statistiek in de uitvoeringsfase:
• Ordenen en presenteren gegevens in samenvattende getallen, tabellen, grafieken en figuren:
beschrijvende (‘descriptieve’) statistiek
• Bepalen van relaties tussen concepten onderling en achterhalen in hoeverre gegevens
overeenkomen met de theoretische verwachtingen
Analyse 1: vooral beschrijven
Analyse 2: toetsen, principes leren en leren uitvoeren
➔ Vooral kwantitatief onderzoek
Inhoud analyse 1:
Beschrijven van data
• 1 variabele
• Relatie tussen 2 variabelen
• Visuele weergaven
Uitleg principe van toetsing a.d.h.v.:
• Kansverdelingen
• Z-toets voor 1 gemiddelde
Leren gebruiken van SPSS
1
,Cursushandleiding Analyse 1:
Brightspace: cursushandleiding
1. Doelstellingen cursus
2. Benodigdheden: studieboek, computerprogramma SPSS (downloaden op surfspot),
rekenmachine, Grasple (oefenplatform)
3. Voorlopig rooster
4. Werkwijze/onderwijsvormen
5. Literatuur per week
6. Informatie toetsing
Bijeenkomsten:
• Hoorcolleges op locatie + livestream (dinsdag fysiek)
• Vragenuurtjes online
• Brightspace per week: leerdoelen, dia’s bijeenkomsten, verdiepingsopdrachten (op papier die
dieper op de stof ingaan), link naar weblecture
Hoe cursus met succes afronden?
Tentamen (online) en VSO (om te kijken of je het computerprogramma snapt):
• Hoorcolleges, Grasple, verdiepingsopgaven, studieboek, discussieforum, vragenuur (op
vrijdag), voorbeeldvragen VSO, oefententamen (van eerdere jaren)
Grasple:
• Online oefenplatform: korte herhaling van de stof, oefenen
• Verdiepingsopdrachten op Brightspace zijn moeilijker en lijken meer op het tentamen; Grasple
bereidt hierop voor
Eerst Grasple doen en daarna die verdiepingsopdrachten
Terminologie:
• Variabele: een gemeten grootheid die kan variëren (Field: 1.6.1) (bv. leeftijd)
• Constante: zelfde waarde
• Onderzoekseenheid (case): eenheid waarbij de variabele gemeten wordt (vraag)
• Score: waarde van een onderzoekseenheid op een variabele (antwoord)
• Datamatrix: voorbeeld van gegevens uit een steekproef onder middelbare scholieren
Bv. kind | geslacht | zelfwaardering | schooltype | glazen alcohol
; dit zijn vijf verschillende variabelen
Soorten variabelen:
• Afhankelijke variabele: gevolg, de te verklaren variabele, uitkomst
• Onafhankelijk variabele: oorzaak, verklaring voor (invloed op) de afhankelijke variabele,
predictor
Psychische problemen ouders → internaliserende problemen kinderen
Variabelen: causaliteit?
1. Psychische problemen ouders → internaliserende problemen kinderen
2. Internaliserende problemen kinderen → psychische problemen ouders
3. Derde variabele; psychische problemen ouders → internaliserende problemen kinderen;
oorlogssituatie is de oorzaak van beide
Complexer: meer predictoren
Psychische problemen ouders → & negatieve levensgebeurtenissen → internaliseren problemen
kinderen
Complexer: moderatie
Psychische problemen ouders → internaliserende problemen kinderen → de last die zij ervaren kan
afhankelijk zijn van sociale steun vrienden/familie = de moderator
• Een modererende variabele verzwakt of versterkt het verband tussen twee andere variabelen
2
,Complexer: mediatie
Psychische problemen ouders → kwaliteit van opvoeding → internaliserende problemen kinderen →
kwaliteit van opvoeding = mediator
• Een mediërende variabele kan (deels) het verband tussen twee andere variabelen verklaren
Variabelen: discreet versus continu (Field 1.6.2) de plek
• Discrete variabele: kan slechts een bepaald aantal waarden aannemen. Bijv: aantal fouten,
aantal mensen, prijs van een product. Geen kommagetal; afgerond getal
• Continue variabele: tussen twee gegeven waarden ligt altijd een derde; scores zijn altijd
afgeronde getallen (een benadering van de feitelijke score). Bijv: reactiesnelheid, lengte
Variabelen: meetniveaus (Field 1.6.2)
• Nominaal: waarden geven categorieën aan (geen volgorde). Gaat over groepen. Bijv:
geslacht, experimentele conditie, etniciteit
• Ordinaal: oplopende categorieën (waarden geven volgorde aan), intervallen hoeven niet
gelijk te zijn. Gaat over groepen, maar over subgroepen binnen een groep. Bijv: SES klasse,
opleidingsniveau
• Interval: waarden geven volgorde aan, bovendien hebben gelijke intervallen tussen waarden
dezelfde betekenis. Dit komt het meeste voor. Bijv: graden Celcius, cito scores, IQ-score. Het
is meer dan alleen een ordening; we kunnen er iets mee.
• Ratio: waarden geven volgorde aan, gelijke intervallen tussen de waarden hebben dezelfde
betekenis en absoluut nulpunt. Bijv. aantal mensen, lengte, gewicht (het kan 0 zijn en dit heeft
een betekenis). Maakt het mogelijk te zeggen “A is 2x zo lang als B”
Schema meetniveaus:
• Meetniveau bepaalt o.a. statistische analysemogelijkheden
• Onderscheid interval- en ratio meetniveau meestal niet van belang. (SPSS: beide
meetniveaus aan)
Variabelen: categorisch versus kwantitatief
• Categorische (kwalitatieve) variabelen
• Kwantitatieve variabelen
Wat is het meetniveau van een citoscore? → Interval; het heeft een volgorde (geen groepen)
Een onderzoeker wil weten hoe motivatie uitstelgedrag voorspelt. Wat is de onafhankelijke variabele?
→ Motivatie
Je haalt een 9 op je analyse 1 tentamen. Is je cijfer discreet of continu? → Discreet
Gegevens ordenen/samenvatten met frequentieverdelingen
Doorlopend voorbeeld: “gezin met karakter”
• Kinderen van Ouders met Psychiatrische en/of verslavings-Problemen (KOPP)
• Vergeleken met andere kinderen: KOPP verhoogde kans om zelf ook problemen te
ontwikkelen
• Preventie: bijv. KOPP-groepen voor jongeren
Vraagstellingen KOPP
1. Welke gezinsfactoren zijn risico- en beschermende factoren bij de ontwikkeling van
problemen bij KOPP?
2. Zijn er verschillen in de rol van die factoren tussen KOPP en controle gezinnen?
Onderzoeksopzet KOPP
• Vragenlijstonderzoek: 3 meetmomenten; 1 jaar tussen de meetmomenten
• Vragenlijstboekje: (+- 1 uur) ingevuld door; ouder met problemen en kind
Variabelen KOPP
• Algemeen: geslacht, leeftijd, opleidingsniveau (ouder en kind) etc.
• Informatie van problemen ouders: alcoholgebruik
• Gezinsfactoren
3
, • Informatie kinderen
Zo veel gegevens...
Voorbeeld: leeftijd eerste 20 kinderen in KOPP-groep:
16, 12, 15, 11, 12, 13, 14, 15, 14, 12, 13 etc.
= Kunnen we overzichtelijk maken in een frequentieverdeling
• Absolute frequentie: (fi) het aantal keer dat een bepaalde waarde (Xi) voorkomt
• Relatieve frequentieverdeling; proportie of percentage van maken. Bv 5 procent vd kinderen
heeft leeftijd van 12 jaar
Berekeningen:
1. Proportie: Pi = fi / N (N is aantal kinderen)
2. Percentage: fi / N * 100
• Cumulatieve frequenties; bv hoeveel kinderen <13 jaar
• Cumulatieve relatieve frequentie
Absoluut of relatief?
Absoluut is handig wanneer:
• Je informatie wilt geven over exacte hoeveelheden
• Minder kans op misleiding (vergelijk: 25% van N=4 vs 25% van N=1000)
Relatief is handig wanneer:
• Je scores wilt vergelijken van groepen met ongelijke groepsgrootte
Met cumulatieve relatieve frequenties kun je de relatieve positie van iemand weergeven
Percentielen:
• Percentiel P van een score X: het percentage onderzoekselementen/waarnemingen/cases dat
een score lager dan of gelijk aan X
• Score X die bij een percentiel P hoort: de score X, waarbij een bepaald percentiel hoort
• Aflezen in frequentietabel: kijken bij cumulatief percentage
Varianten percentielscores:
• Decielscore D1, D2, D3 etc. (=P10, P20, P30, enz.)
• Kwartielscore Q1, Q2, Q3, Q4 (=P25, P50 (=mediaan), P75, P100)
Frequentieverdelingen in SPSS:
Twee voorbeelden;
• Leeftijd eerste 20 KOPP kinderen
Percentiel naar beneden afronden; statistisch gezien moet dit
SPPS-output: percentielen
Bij welke score ligt percentiel 75?
• Ofwel, gegeven is P=75, bepaal X
• P75 = 4
Volgende lessen:
• Vrijdag vragenuur: maak modules in Grasple, maak verdiepingsopdrachten, stel vragen in
discussieforum, nog dingen onduidelijk: vragenvuur
• Volgende week: centrummaten, spreidingsmaten
Oefenmodules Grasple:
De variantie is de standaarddeviatie in het kwadraat = standaarddeviatie is 7 cm, dan is variantie 7
kwadraat = 49
4