Hoofdstuk 1: statistiek, gegevens en een kritische houding
De wetenschap statistiek
Statistiek = wetenschap van gegevens.
> Verzamelen, classificeren, samenvatten, organiseren, analyseren van numerieke informatie
Soorten statistische toepassingen
Beschrijvende statistiek:
@
Gebruikt numerieke en grafische methoden om patronen in een gegevensverzameling te
ontdekken.
@
Informatie in een gegevensverzameling samenvatten.
@
Informatie op een overzichtelijk manier presenteren.
VB. Populatie en steekproef, onderzochte variabele(n), numerieke synthesemiddelen (grafieken,
tabellen, maatstaven), opsporen van gegevenspatronen.
Verklarende statistiek:
@
Gebruikt steekproefgegevens voor het schatten.
@
Beslissingen nemen en voorspellen.
= inductieve statistiek / inferentiële statistiek.
VB. Populatie, onderzochte variabele(n), steekproeftrekking uit de populatie (op basis van de
steekproef), betrouwbaarheidsmaat voor de gevolgtrekking.
sowieso
Datamatrix
, Codeboek
Basiselementen van de statistiek
Experimentele eenheden: bestudeerde objecten, waarvan we gegevens vastleggen.
Populatie: verzameling experimentele eenheden, die we willen bestuderen.
>
Volledige populatie =
onmogelijk = te duur
Variabele: kenmerk of eigenschap van een individuele eenheid uit de populatie.
Steekproef: deelverzameling van de eenheden van een populatie.
Statistische gevolgtrekking / conclusie: veralgemening vanuit de steekproef naar de populatie.
Betrouwbaarheidsmaat: kwantitatieve uitspraak over de onzekerheid van de statistische
gevolgtrekking.
in = Aantal elementen in de steekproef .
elementen in de
N = Aantal
populatie .
P = betrouwbaarheidvatio .
Statistisch het
significant =
waargenomen verschil is heel
waarschijnlijk niet te wijten aan
het toeval , maar aan een
systematisch onderliggend verschil .
,Soorten gegevens
Kwantitatieve gegevens:
Meetwaarden die worden geregistreerd op een van nature voorkomende numerieke schaal.
⑧
Geregistreerd op een van nature voorkomende numerieke schaal.
•
Gelijke intervallen op de schaal moeten gelijke betekenissen hebben (om zinvolle
berekeningen te kunnen uitvoeren).
•
Ratioschaal = schaal met een absoluut nulpunt (afwezigheid kenmerk).
•
Intervalschaal = schaal zonder een absoluut nulpunt.
Voorbeelden
Ratio: leeftijd lengte
, ,
gewicht ,
inkomen .
Interval: temperatuur C / of 2)
°
in , verdiepingen ( 0 ,
^ . , tijdstippen .
Kwalitatieve gegevens:
Metingen die niet op een natuurlijke voorkomende numerieke schaal kunnen worden gemeten;
ze kunnen alleen worden ingedeeld in categorieën.
⑧
Zijn niet-numeriek van aard.
⑧
Ordinale gegevens = zinvol ordenbare categorieën.
⑧
Nominale gegevens = niet-ordenbare categorieën.
Voorbeelden
Ordinale: opleidingsniveau ,
score op een toets ,
Nominale: geslacht ,
haarkleur .
, •
Kwalitatieve en kwantitatieve gegevens vereisen verschillende statistische methodes.
•
Kwantitatieve gegevens kunnen omgezet worden naar kwalitatieve gegevens door ze in te delen
in categorieën (verlies aan informatie).
•
Kwalitatieve gegevens zijn niet zinvol om te zetten in kwantitatieve gegevens.
Gegevens verzamelen
1 .
Publicaties >
primaire × secundaire bronnen
2. Ontworpen experiment >effecten behandeling onderzoeken
3. (
Enquête survey) > via
vragenlijsten
4 onderzoek Onder
. Waarnemend >
natuurlijke omstandigheden
Ontworpen experiment: methode van gegevens verzamelen waarbij de onderzoeker de gebruikte
experimentele eenheden behandelingen laat ondergaan.
Waarnemend onderzoek: methode van gegevens verzamelen waarbij de experimentele eenheden
worden waargenomen onder natuurlijke omstandigheden.
Representatieve steekproef: vertoont kenmerken die typerend zijn voor die van de relevante
populatie.
Aselecte steekproef: van n eenheden wordt zo getrokken dat elke deelverzameling van n stuks
uit de populatie dezelfde kans heeft om deel uit te maken van de steekproef.
Blijf kritisch
Systematische afwijking door selectie: wanneer een deelverzameling van de populatie is
uitgesloten van het onderzoek, zodat niet alle eenheden van de populatie in de steekproef terecht
kunnen komen.
Systematische afwijking door non-respons: wanneer de onderzoekers niet in staat zijn om de
gegevens te verkrijgen over alle eenheden in de steekproef.
Meetfouten: slordigheden in de gegevens, dubbelzinnige of suggestieve vragen, fout apparatuur, …
Zelfselectie: wie op een enquête reageert heeft vaak al uitgesproken meningen over het
onderwerp.