Statistiek 1 – Tentamen 16 december 18:45h
Hoorcollege 1
Statistische geletterdheid: kunnen begrijpen, interpreteren en het
correct gebruikmaken van statistische informatie. Kritisch beoordelen
van betrouwbaarheid en rechtvaardiging van conclusies.
Kansrekening: bestuderen van kansen of waarschijnlijkheid.
Deductie: algemeen -> specifiek
Statistiek: verzamelen, interpreteren en organiseren van numerieke
feiten die ook wel gegevens of data genoemd worden.
Inductie: specifiek -> algemeen
Beschrijvende statistiek: samenvatting geven van de steekproef- of
populatiegegevens door middel van getallen, grafieken en tabellen.
Inferentiële statistiek: voorspellingen maken met steekproefdata over
populatieparameters. Populatieparameters: waardes met betrekking tot
de gehele populatie, meestal onbekend.
Methodologie is de systematische wijze van hoe je empirisch onderzoek
zou moeten uitvoeren. Statistiek staat voor het instrumentarium om
empirisch onderzoek uit te kunnen voeren. Ze zijn dus verschillend, maar
wel verwanten.
Populatie: totale set van deelnemers relevant voor de onderzoeksvraag.
Steekproef: een deel van de populatie waarover data verzameld is.
Goede data zijn betrouwbaar en valide.
Problemen binnen een steekproef:
Willekeurige steekproef variatie: door natuurlijke variatie (toeval)
tussen steekproeven
Meetfouten: onnauwkeurigheden in het observeren of meten
Selectieve respons: bepaalde groepen meer of minder geneigd om
mee te doen
Steekproeffouten: toevallige verschillen die in de populatie niet
bestaan
Steekproefvertekening: niet representatief voor de populatie, want
niet gelijke kans om geselecteerd te worden
Variabele: gemeten karakteristiek die kan verschillen tussen subjecten.
Een variabele kan verschillende meetniveaus hebben:
Kwalitatief/categorisch:
, o Nominaal: ongeordende categorieën Geslacht, oogkleur
o Ordinaal: geordende categorieën Rang in een wedstrijd,
opleidingsniveau
Kwantitatief/numeriek:
o Interval: gelijke afstand tussen opeenvolgende variabelen
Graden Celsius
o Ratio: gelijke afstand en absoluut nulpunt Graden Kelvin
De variabelen kunnen in twee verschillende soorten waardebereik vallen:
Discreet: eindig ondeelbare meeteenheid Aantal huisdieren
Continu: oneindig deelbare meeteenheid Lichaamsgewicht
Hoorcollege 2
Er zijn verschillende manieren om een goede aselecte steekproef te
trekken. Welke manier gebruikt wordt, hangt af van de onderzoeksvraag,
doelpopulatie en haalbaarheid van de te vormen steekproef. Verschillende
steekproefmethoden:
Eenvoudige aselecte steekproef (simple random sampling):
Elke combinatie heeft evenveel kans om de steekproef te vormen.
Haalbaar als participanten vanuit de gehele doelpopulatie benaderbaar
zijn. Vereist een groot aantal willekeurige getallen om steekproef te
bepalen.
1. Stel steekproefkader vast
2. Trek aselect steekproef van deelnemers (n)
Systematisch aselecte steekproef (systematic random sampling):
Niet elke combinatie heeft evenveel kans om de steekproef te vormen.
Eenvoudig om uit te voeren en vaak een goede representativiteit.
1. Stel steekproefkader vast
2. Bepaal skipnumber: grootte populatie / grootte steekproef
3. Trek aselect de eerste deelnemer en bepaal vervolgens met skipnumber
de volgende deelnemers
Gestratificeerde steekproef (stratified random sampling):
Op voorhand expliciete groepen die met elkaar vergeleken worden. Binnen
iedere groep wordt een steekproef getrokken. Proportioneel: verhoudingen
van de steekproef hetzelfde als de verhoudingen in de doelpopulatie.
Disproportioneel: verhoudingen anders zijn. Handig bij vergelijken
groepsverschillen in omvang.
1. Stel steekproefkader vast
2. Verdeel populatie in strata Jongens en meiden
3. Trek aselect uit ieder stratum 2 jongens en 2 meiden
, Clustersteekproef (cluster sampling):
Niet elke combinatie heeft evenveel kans om de steekproef te vormen.
Een steekproef van bestaande clusters. Handig als het niet haalbaar is om
deelnemers uit alle clusters te benaderen.
1. Stel steekproefkader vast
2. Verdeel populatie in clusters Scholen
3. Trek aselect aantal clusters 2 scholen
4. Kies alle deelnemers in getrokken clusters
Getrapte steekproef (multi-stage sampling):
Uiteindelijke steekproef wordt in stappen opgesteld. Combinatie van
eenvoudig, cluster- en/of gestratificeerde steekproeftechnieken.
1. Stel steekproefkader vast
2. Verdeel populatie in clusters Scholen
3. Trek aselect aantal clusters 150 scholen
4. Trek aselect binnen gekozen clusters 30 leerlingen per school
Data kan beschreven worden in drie verschillende dimensies:
Centrummaten: typische observatie Gemiddelde, mediaan,
modus
Spreidingsmaten: spreiding observaties Bereik, variantie,
standaarddeviatie
Positiematen: relatieve positie observaties Kwartielen,
percentielen, z-scores
Univariate beschrijvende statistiek: één enkele variabele
geanalyseerd en beschreven. Categorische variabelen (nominaal en
ordinaal) kunnen beschreven worden door een staafdiagram,
taartdiagram, frequentieverdeling, met spreidingsmaten, modus.
Kwantitatieve variabelen (interval en ratio)
kunnen beschreven worden door een
frequentieverdeling, stam-en-blad-diagram,
histogram, mediaan, modus, gemiddelde,
bereik, standaarddeviatie,
interkwartielafstand (middelste 50% van de
waarnemingen), percentielscore, kwartiel, z-
score. Boxplot: de box is de
interkwartielafstand, dus de middelste 50%
van de waarnemingen. Door de box loopt een
lijn, de mediaan. De lijnen boven en onder de
box zijn de whiskers, de data buiten de
interkwartielafstand. Uitschieters zijn losse,
verdere punten.