SAMENVATTING STATISTIEK
Deel 1: Beschrijving naar inzicht
Hoofdstuk 2: Data statistisch onder de loep genomen
Datamatrix
Een tabel (bestaande uit rijen en kolommen) die statistische analyses, systematisch geordende,
numerieke gegevens bevat
Onderzoekselementen
Onderzoekselementen als deel van groter geheel
Populatie N: De groep waarover het onderzoek een uitspraak wil doen
bv. ‘de Amerikaanse mannen’ (60 miljoen mensen)
Steekproef n (sample): Een selectie uit de totale populatie, waarop je het onderzoek uitvoert
bv. 5.300 Amerikaanse mannen die geïnterviewd werden
Populatie-onderzoek (bv. volkstelling of census) is duur en dikwijls vertekend (biased)
Soorten steekproeven
Literary Digest – schandaal: tijdschrift probeerde winnaar verkiezingen in de VS te voorspellen door
miljoenen te ondervragen, maar het was niet representatief omdat vooral de hogere klasse (die
meestal rood stemmen) ondervraagd werden
= selectie bias
Straw poll: zoveel mogelijk formulieren uitdelen
Niet iedereen is geïntereseerd in politiek, sommige hebben andere zorgen aan hun hoofd dan politiek
(meestal armere mensen)
= non-respons bias
,George Gallup: Quotasteekproef : maakte wel een representatieve steekproef, met namens veel
minder mensen, 50.000 Amerikanen. Dit zou een “Miniatuurversie van de bevolking” moeten
voorstellen.
Representativiteit is belangrijker dan steekproefgrootte!
Maar als de steekproef random is, is een grote n beter dan een kleine n
= eenvoudige aselecte steekproef (EAS, random sample)
The good (aselect
- EAS: men moet beschikken over een lijst van elementen uit de populatie, hieruit wordt
volledig aselect geselecteerd
- Clustersteekproef: men onderscheid eenheden op verschillende geneste niveaus (bv:
individuen= genest in gemeente= genest in provincie), uit elk niveau wordt random een
aantal eenheden gekozen, beginnen bij hoofste niveau (bv steekproef EU: 100/500 regio’s
kiezen, van die 100 regio’s 1000 mensen kiezen,…)
- Gestratificeerde toevalssteekproef: populatie valt uiteen in verschillende subgroepen die zich
duidelijk onderscheiden verhouden tot het te onderzoeken kenmerk
The bad
- Convenience steekproef: de steekproef bestaat uit onderzoekselementen die je toevallig per
beschikking hebt. Niet uitdrukkelijk op onderzoek gaan.
The ugly
- Quota steeproef: men maakt gebruik van voorkennis bij selectie onderzoekselementen (= niet
betrouwbaar, één bepaalde vriendengroep ondervragen)
- Lijkt op gestratificeerde steeproef, maar discretie van de interviewer is belangrijk om de
onderzoekselementen te selecteren
Onderzoekselementen en hun aggregatieniveau
Aggregatieniveau
Micro: vb. bv’s, burgers, studenten
,Meso: vb. beroepsgroepen, organisaties, scholen
Macro: vb. gemeenten, landen
Ecologische meetfout
Onderzoekers kunnen er vaak niet aan weerstaan om op basis van gegevens op meso- of
macroniveau toch uitspraken te doen op individueel of micro niveau. Er wordt een conclusie gesteld
terwijl er andere variabelen meespelen die voor causaliteit zorgen.
- Bevinding: “in regio’s met meer immigranten ligt ongeletterdheid lager”
- Foute conclusie: “immigranten zijn vaker geletterd dan de autochtone bevolking”
In welk ziekenhuis wil jij je liever laten behandelen?
Hoewel er bij een medische ingreep proportioneel meer slachtoffers overlijden in ziekenhuis A dan in
ziekenhuis B, zou Simpson zich altijd in ziekenhuis B laten behandelen, want als men rekening houdt
met de ernst van de klachten blijkt ziekenhuis B proportioneel altijd beter te scoren.
, Simpson paradox: de ecologische meetfout hangt met andere woorden nauw samen met de
vertekening (bias) die men veroorzaakt door het belang van een bepaalde variabele in de verklaring
te negeren. Naast de onderzoekselementen moet een onderzoeker dus altijd aandacht schenden aan
relevante variabelen.
Variabelen
Variabelen en hun meting
Een variabelen is een kenmerk van de onderzoekselementen dat kan variëren.
Conceptualisering
Wat wil je meten? Het variabele concept gaan we zo goed mogelijk beschrijven. Pas als het duidelijk is
gedefinieerd wat men eigenlijk wil meten, kan men dus aanvangen met de zoektocht naar adequate
meetinstrumenten.
Bv: utilitair individualisme (concept) = houding waarbij men zich in zijn gedrag laat leiden door
eigenbelang en steevast streeft naar persoonlijke materiële voordelen en macht (conceptualisering).
Indicering
Hoe het theoretische concept empirisch meten? Identificatie van een bepaald waarneembaar
verschijnsel als representant voor het theoretische concept.
Bv: de mensheid, onze naaste, solidariteit, wat een onzin, iedereen moet eerst voor zichzelf zorgen en
zijn belangen verdedigen.
- Validiteit: Meet je wat je wilt weten? Sterke overlap tussen conceptuele definitie en de
betekenisinhoud van de indicator.
Operationalisering
Ten eerste: Hoe ga je het registreren? Men moet preciseren hoe men met die indicator moet omgaan
Belang van antwoordschalen (Likert): neutraal, akkoord, helemaal akkoord
Ten tweede: Een volwaardig meetinstrument voor een gelijk abstract concept behelst meerdere
indicatoren. Er moet een grote samenhang zijn tussen antwoorden op verscheiden indicatoren.
Wordt uitgedrukt in betrouwbaarheid: Verschillende metingen, zelfde resultaat?
- Interpersoon – meerdere indicatoren
- Intertemporeel – op verschillende momenten