Samenvatting Statistics for the behavioral sciences
H1-7
Hoofdstuk 1
Statistics = Verwijst naar een set van wiskundige procedures, voor het organiseren,
samenvatten en interpreteren van informatie.
Population/populatie = de gehele groep die een onderzoeker wil onderzoeken.
Sample (steekproef) = een groep individuen geselecteerd uit de populatie deze groep
representeert de gehele onderzoeksgroep).
Variabele = is een karakteristiek of conditie dat verandert of verschillende waarden voor
verschillende individuen kan aannemen. Elementen die bepaalde waarden kunnen aannemen.
Ze kunnen variëren.
Karakteristieken variabelen = geslacht, gewicht
Omgeving condities = Temperatuur, tijd
Data (meervoud) = metingen of observaties
Data-set = Collectie van metingen of observaties
Datum (enkelvoud) = één meting of observatie. Algemeen genoemd = score of raw score
Parameter = een waarde, doorgaans een numerieke waarde, die de populatie beschrijft. Een
parameter is afgeleid van metingen van de individuen in de populatie. = Gemiddelde score van
een populatie.
Statistic = een waarde, numerieke waarde, die een sample (steekproef) beschrijft. Een statistic
is afgeleid van metingen van de individuen in de steekproef. = De gemiddelde score van een
steekproef.
Twee categorieën in de statistiek
- Descriptive statistics (beschrijvende)= statistische procedures gebruikt om data te
samenvatten, organiseren en te vereenvoudigen.
- Inferential statistics = technieken die steekproeven bestuderen en dan generaliseren over de
populatie waaruit ze waren geselecteerd. = interpreteren resultaten.
Sampling error = een natuurlijke voorkomende discrepantie, of fout, dat bestaat tussen een
steekproef statistic en de overeenkomende populatie parameter.
Data structuren, research methods and statistics
Twee datastructuren:
- The correlation method = meten van 2 variabelen voor elk individu, om te bepalen of
er een relatie tussen hen is.
Tekortkomingen van de correlational method:
Voorziet geen verklaring voor de relatie
1
, Kan geen oorzaak - gevolg relatie demonstreren. Daar is de experimental method voor
nodig).
- Experimental and Non-experimental method = Vergelijken van twee of meer groepen
van scores.
Twee categorieën van variabelen welke de onderzoeker moet nagaan:
Participant variabelen
Environmental variabelen
Drie basistechnieken om variabelen te controleren:
1. Random assignment = elke deelnemer heeft een gelijke kans.
2. Matching = om zeker te zijn van equivalente groepen.
3. Holding them constant = alleen maar dezelfde leeftijd nemen (holding age constant).
Termen in de experimentele methode
Specifieke namen voor twee variabelen die bestudeerd worden bij de experimentele methode.
Independent variabele (onafhankelijke) = gemanipuleerd door de onderzoeker. (oorzaak)
Dependent variabele (afhankelijke) = wordt geobserveerd om het effect te schatten van de
behandeling. (gevolg)
Control conditions in een experiment
Control conditions = krijgen geen experimenterende behandeling
Experimential conditions = de individuen ontvangen wel de experimenterende
behandeling
Termen in de niet-experimentele methode
Quasi-independent variabele = in een niet experimenterend onderzoek wordt de
‘independent variabele’ gebruikt om de verschillende groepen van scores te
creëren.
1.4. Variables and measurements
Soorten variabelen
Kwalitatieve variabelen
Variabelen als geslacht, oogkleur, woonplaats, land van herkomst e.d. zijn allemaal voorbeelden
van kwalitatieve variabelen.
Kwantitatieve variabelen
Variabelen als lichaamslengte, aantal kinderen, gewicht, een score op een toets, IQ e.d. zijn
voorbeelden van kwantitatieve variabelen. De waarde van zo'n variabele kan je uitdrukken in een
getal.
Discrete variabelen
Variabelen die geen tussenwaarden kunnen aannemen noemen we discreet. Voorbeelden
daarvan zijn aantal kinderen, een score op een toets van 40 meerkeuzevragen, enz.
Continue variabelen
Variabelen als lengte, gewicht, buitentemperatuur, tijd, e.d. kunnen allerlei tussenwaarden
aannemen. Is deelbaar in meerdere delen.
2
,Real limits
Echte limieten (real limits): zijn regels van intervallen voor scores die gerepresenteerd zijn om
een lijn met nummer. Deze lijn scheidt twee aangrenzende scores en bevindt zich precies in het
midden. Elke score heeft twee real limit.
Upper real limit: Top van de interval. Lower real limit: bodem.
Scales of measurment - Meetniveaus
Bij de statistiek kom je vaak de volgende indeling tegen:
Nominaal
Hier heeft de waarde die een variabele kan aannemen alleen de betekenis van een naam. Er is
geen sprake van een volgorde. Denk bijvoorbeeld aan rugnummers van een voetbalelftal. Je kunt
niet zeggen dat de speler met rugnummer 14 beter is dan de speler met rugnummer 7.
Voorbeeld nominale schaal
Het aantal verkochte ijsjes in een ijskraam per smaak per dag
vanille pistache straciatelle
100 180 110
De categorieën zijn ongeordend!
Ordinaal
Een waarde op ordinaal niveau geeft alleen een volgorde aan. Denk bijvoorbeeld aan opleiding.
Voorbeeld:
1. = VO
2. = MBO
3. = HBO
4. = UNIVERSITEIT
Er is wel sprake van volgorde, een hoger nummer duidt op een hogere opleiding, maar het
verschil tussen bijvoorbeeld 3 en 4 is niet hetzelfde als het verschil tussen 1 en 2.
Voorbeeld ordinale schaal
De indeling van ziekenhuizen in de provincie Utrecht naar hygiëne:
onvoldoende voldoende goed zeer goed
3 6 7 4
De categorieën zijn geordend: onvoldoende < voldoende < goed < zeer goed!
Interval
Bij variabelen op intervalniveau hebben verschillen wel een betekenis. Neem bijvoorbeeld
temperatuur. Het verschil tussen 30° en 40° is hetzelfde als het verschil tussen 70° en 80°. Je
kunt echter niet zeggen dat 80° twee keer zo warm is als 40°.
Voorbeeld interval schaal
3
, Vb. De verdeling van de cijfers bij een wiskundetentamen zijn:
cijfer 1 2 3 4 5 6 7 8 9 10
aantal 0 1 2 7 1 5 8 4 2 2
De categorieën zijn geordend en bestaan elk uit evenveel eenheden!
Ratio
Bij variabelen op rationiveau heb je altijd een nulpunt. Denk aan gewicht, lengte of het aantal
verkochte exemplaren van een product. Je kunt uitspraken doen 'A scoort twee keer zo hoog als
B'.
Voorbeeld ratio schaal
De aanwezigheid van een giftige stof (in mg) in laboranten:
mg gif 0 1 2 3 4 5 6
laboranten 5 10 8 4 3 2 0
De categorieën zijn geordend, bestaan elk uit evenveel eenheden en er is een werkelijk nulpunt
(een laborant uit categorie 2 bevat half zoveel gif als een laborant uit categorie 4)!
Bij variabelen van nominaal niveau kan alleen de modus berekend worden; de modus geeft de
categorie aan die het meest gescoord wordt.
Bij variabelen van ordinaal niveau kan tevens de mediaan worden berekend; dit is de score die bij
ordening precies de middelste is.
Bij variabelen van scaleniveau (interval/ratio) kunnen ook het gemiddelde en
de spreidingsmaten berekend worden.
Nominaal of ordinaal meetniveau: staafdiagram (bar chart), cirkeldiagram (pie chart)
Scale (interval/ratio) meetniveau: histogram, lijndiagram (line chart)
1.5. Statistical notation
X = Scores voor een bepaalde variabele
X en Y worden bij twee variabelen gebruikt
Scores Observatie voor mensen hun lengte (Variabele X) en gewicht
(Variabele Y)
In deze tabel: n = 7
X Y
72 165
68 151
67 160
67 146
70 160
66 133
4