Colleges statistiek A uitgewerkt
College 1
11 oktober 2019
Wat is statistiek?
Definitie Statistiek: De wetenschap, de methodiek en techniek van het
verzamelen, samenvatten, presenteren en interpreteren van data.
Statistiek is een essentieel onderdeel bij empirisch kwantitatief
onderzoek. Het wordt voornamelijk gebruikt bij beschrijvend en
toetsend onderzoek.
Statistiek is nodig bij verschillende stadia
binnen onderzoek: opzetten, uitvoeren en
beoordelen van onderzoek. Het begeeft
zich voornamelijk in het proces van data-
analyse. Als je kijkt naar de definitie van
statistiek, is het ook belangrijk bij het
opzetten van een onderzoek. Middels
statistiek kan je voorafgaand al bepalen
of het onderzoek gaat werken of niet.
Een probleemstelling komt meestal vanuit een populatie. De term
populatie wordt in statistiek in bredere zin gebruikt dan normaal. Het is
niet beperkt tot een populatie van mensen, maar kan verwijzen naar elke
verzameling objecten. Een populatie is het geheel of een verzameling
van elementen. Een homogene verzameling van objecten waarop het
onderzoek zich richt. Bijvoorbeeld alle patiënten die in een bepaald jaar in
het ziekenhuis komen. Een steekproef houdt in dat je van een gehele
populatie, een bepaald aantal gaat meenemen in je onderzoek. Wanneer
we dieper in gaan op een steekproef, dan gaat het vaak over statistiek.
Het is gemakkelijk voor te stellen, dat de hele populatie kan worden
vermeld en dat de steekproef er rechtstreeks uit kan worden geselecteerd.
In veel gevallen zijn de populatie en haar grenzen echter minder
nauwkeurig gespecificeerd en moet ervoor worden gezorgd dat de
steekproef de populatie echt
weergeeft waarover informatie
nodig is. Deze populatie wordt soms de
doelpopulatie genoemd.
,Statistiek is belangrijk voor twee typen onderzoek, namelijk toetsend en
beschrijvend onderzoek.
Twee typen variabelen
Het analyseren, interpreteren en presenteren van data wordt bepaald door
het type variabele.
1. Numerieke variabelen: met cijfers (interval en ratio). Data
waarvan de waarden numeriek worden gemeten als hoeveelheden
Continu (bijv. salaris): wil zeggen dat het een variabele is die
bijna iedere waarde kan aannemen. Het gaat om een
onbeperkt aantal mogelijkheden. Data die elke waarde
kunnen aannemen (soms binnen een beperkt gebied), mits ze
met voldoende nauwkeurigheid worden gemeten.
temperatuur, leveringstijd, duur van dienstverband.
Discreet (bijv. aantal huisbezoeken huisdokter): cijfers waarbij
er wel een cijfer op staat, maar waar een beperkt aantal
cijfers aangegeven kan worden. Data waarvan de waarden in
discrete eenheden worden gemeten en die daardoor over een
beperkt gebied slechts een aantal waarden kunnen
aannemen. schoenmaten, aantal klanten en aantal mobiele
telefoons.
Tip: Houdt altijd goed in de gaten welk type variabelen je
gebruikt. Veel testen zijn alleen bedoeld voor een bepaald
soort variabele.
2. Categorische variabelen: (veelvoorkomend: binaire/dummy
variabelen), waarde 0 of 1. Bijvoorbeeld man of vrouw, man = 0
vrouw = 1.
Ongeordend (bijv. stad). Er is geen duidelijke ordening, geen
ordening waarbij duidelijk welke eerst moet.
Geordend (bijv. zelf gerapporteerde gezondheid): Bijvoorbeeld,
wat is jouw gezondheid. Slecht-beetje slecht-gemiddeld etc.
Dan is er een duidelijke ordening in categorieën
3. Proporties (percentages).
,Verschillende meetniveaus
Een belangrijk onderscheid dat gemaakt wordt in de statistiek is tussen
afhankelijke en onafhankelijke variabelen.
De afhankelijke variabele is de o in de PICO, dus de ‘outcome’. Dit is de
verklaren variabele, ook wel de y-variabele. De onafhankelijke
variabele is de x-variabele, dat als verklarende variabele dient.
Het presenteren van variabelen
Categorische variabelen
- Absolute frequenties
- Relatieve frequenties
Voorbeeld frequentietabel.
Vraag: hoe zou u over het algemeen uw gezondheid noemen?
Slecht- matig- goed- zeer goed – uitstekend.
Frequency: het absoluut aantal wat wordt geantwoord per categorie.
Percent: (deel/geheel x100%). Dat wil je weten om te zien wat de
groepsverdeling is.
Cumalitieve percentage, dan ga je de percentages bij elkaar optellen tot
de 100%. Dus 14,4% zegt iets over dat 14,4% van de mensen zijn
gezondheid matig of slecht vindt. Zo kun je waarden samenvoegen.
Grafische weergave; staaf of taartdiagrammen.
, Numerieke variabelen
Frequente verdeling
Grafische weergave; histogram, frequentie polygoon.
Bij statische programma’s kun je automatisch een histogram
laten tekenen, zoals bijvoorbeeld op SPSS.
Frequenties distributies worden voornamelijk geïllustreerd door
histogrammen. Als de aantallen of percentages worden
geïllustreerd, de histogram zal het zelfde blijven. De constructie
van een histogram is recht door zee wanneer de
intervalgroepering van de frequentie distributie gelijk zijn.
Wanneer dit niet het geval is, is het belangrijk om hier rekening
mee te houden bij het tekenen van een histogram. De algemene
regel voor het tekenen van een histogram wanneer de intervallen
niet allemaal even breed zijn, is om de hoogte van de
rechthoeken evenredig te maken met de frequenties gedeeld
door de breedte, dat wil zeggen om de gebieden van de
histogramstaven evenredig te maken met de frequenties.
Vuistregel 1 standaardafwijking: als vuistregel kun je zeggen, 95% van de
steekproef ligt tussen 2xSD + gemiddelde.
Frequentiepolygoon: alle midden punten zijn met elkaar verbonden. Dit is
vooral nuttig als je twee dingen tegelijk wilt weergeven.