INLEIDING STATISTIEK – SAMENVATTING
Inhoud
VIDEOCOLLEGE 1 ..................................................................................................................................... 2
VIDEOCOLLEGE 2 ................................................................................................................................... 10
VIDEOCOLLEGE 3 ................................................................................................................................... 17
VIDEOCOLLEGE 4 ................................................................................................................................... 25
VIDEOCOLLEGE 5 ................................................................................................................................... 37
VIDEOCOLLEGE 6 ................................................................................................................................... 48
VIDEOCOLLEGE 7 ................................................................................................................................... 59
VIDEOCOLLEGE 8 ................................................................................................................................... 68
VIDEOCOLLEGE 9 ................................................................................................................................... 79
VIDEOCOLLEGE 10 ................................................................................................................................. 90
VIDEOCOLLEGE 11 ............................................................................................................................... 103
VIDEOCOLLEGE 12 ............................................................................................................................... 113
.................... 113
VIDEOCOLLEGE 13 ............................................................................................................................... 127
1
,VIDEOCOLLEGE 1
Samenhang ≠ dat het ene het andere verklaard/veroorzaakt
→ correlatie ≠ causatie
Statistiek in empirische cyclus
statistiek: observatie → exploratieve analyse (verbanden tussen dingen)
toetsing → op basis van data conclusies trekken
BESCHRIJVENDE EN INFERENTIELE STATISTIEK
- Beschrijvende: SAMENVATTEN kwantitatieve data/informatie van steekproef
- Inferentiele: CONCLUSIES/GENERALISEREN op basis van steekproef
inductieve inferenties van data naar meer algemene situatie (populatie)
Bij 2X steekproef niet precies zelfde resultaat. Rekening houden
met onzekerheid van random steekproef
→ STEEKPROEFFLUCTUATIES
TYPEN RANDOM VARIABELEN
- Dingen die bij data kunnen variëren (geslacht, opleidingsniveau,..)
→ bij proefpersonen kans dat het bv man/vrouw is (=random)
Statische notatie: X of Y
X → onafhankelijke variabele
Y → afhankelijke variabele
Spec. Uitkomsten / observaties: x of y
Als je leeftijd onderzoekt (variabele “age” als “X”), en 4e persoon is bv 23 jaar: x4 = 23
bij woorden: kwantificeren van random variabele
2
, TYPES RANDOM VARIABELEN
MEETNIVEAUS VAN RANDOM VARIABELEN
> meetniveau random variabele bepaald wat voor analyse je beter wel/niet kan uitvoeren
kwalitatief 1. NOMINALE VARIABELEN
a→ toewijzing mutueel exclusieve getallen aan mutueel exclusieve uitkomsten
afzonderlijke categorieën met eigen getallen (ene niet hoger dan andere)
Bv – geslacht: man 0, vrouw 1
Bv – nationaliteit: Nederlands 0, Duits 1, Grieks 2,..
Bv – teamnaam: rocket 0, galactic 1, magma 2
kwalitatief 2. ORDINALE VARIABELEN
a→ toewijzen van mutueel exclusieve getallen aan mutueel exclusieve uitkomsten
b→ betekenisvolle ordening in mogelijke uitkomsten
ordening aanwezig, verschil in niveau, maar verschillen tussen de variabele niet duidelijk
Bv – dosering: laag 0, medium 1, hoog 2
Bv – rangen: 1e plaats 0, 2e plaats 1, 3e plaats 2
Bv – leeftijdscategorieën: 9-13j 0, 14-18j 1, 19-30j 2,..
Bv – likert schalen: zeer oneens 0, oneens 1, neutraal 2, mee eens 3, zeer eens 4
(maar in sociale wetenschappen gezien als interval om mee te rekenen/analyses te doen)
kwantitatief 3. INTERVAL VARIABELE
a→ toewijzen van mutueel exclusieve getallen aan mutueel exclusieve uitkomsten
b→ betekenisvolle ordening in mogelijke uitkomsten
c→ intervallen tussen elk v/d geordende uitkomsten is betekenisvol en van zelfde grootte
Bv – temperatuur in C of F
0 graden is niet dat er geen temperatuur aanwezig is
Verschil tussen 0 graden en 1 graden, is even groot als tussen 1 graden en 2 graden
kwantitatief 4. RATIO VARIABELEN
a→ toewijzen van mutueel exclusieve getallen aan mutueel exclusieve uitkomsten
b→ betekenisvolle ordening in mogelijke uitkomsten
c→ intervallen tussen elk v/d geordende uitkomsten is betekenisvol en van zelfde grootte
d→ “absoluut nulpunt”: 0 = dat de gemeten eigenschap afwezig is
Negatieve waarde niet mogelijk
Bv – dosering in milligram: 0 mg, 1 mg, 2 mg. (0 mg = niks, geen dosering)
Bv – lengte in cm (0 cm = geen lengte)
Bv – temperatuur op Kelvin schaal (0 graden –> geen moleculaire beweging -> geen temperatuur)
BV Interval vs ratio
lengte opmeten van 3 personen met volledig meetlint: 1m, 1.2m, 2m
→ RATIO
verhoudingen/ratio’s bekijken: 3e persoon is 2X zo lang als 1e persoon (gaat niet bij
interval)
lengte opmeten van 3 personen met meetlint dat start vanaf 1m: 0m, 0.2m, 1m
3
, → INTERVAL (0m betekent niet dat er geen lengte is)
verschillen interpreteren (1e persoon 80 cm kleiner dan 3e persoon)
2 TYPE VARIABELEN
> type variabele bepaalt wat voor analyses we er beter wel/niet op uit kunnen voeren
DISCRETE RANDOM VARIABELEN
> de mogelijke uitkomsten voor de variabelen zijn te vangen in een eindige,
telbare lijst van waarden
→ aantal bestellingen per week geven hele waardes aan
(halve niet mogelijk, = telbaar)
> bepaalde waardes met balkjes (balken in grafiek)
Maar: leeftijd niet discreet (oneindig aantal mogelijke leeftijden bij niet afronden)
iemand = 12 jaar (afgerond = discreet) of 12.39584… jaar (niet afgerond = niet discreet)
→ gaat erom hoe je de leeftijd meet
Bv – aantal kinderen per gezin
Bv – dosering categorieën (laag, medium, hoog)
Bv – sekse categorieën (man, vrouw)
Bv – beroepsgroep (docent, advocaat, tandarts,..)
meeste ordinale en nominale zijn discreet maar deze discrete hoeven niet
perse nominaal/ordinaal te zijn.
Bv kinderen per gezin is discreet, maar meetniveau is ratio (intervallen kun je
interpreteren, absoluut 0punt)
CONTINUE RANDOM VARIABELEN
> mogelijke uitkomsten van de variabele kunnen elke waarde aannemen binnen een
bepaald interval (dat interval kan lopen van oneindig tot oneindig).
temperatuur in Fahrenheit tussen -14 tot 45, alle waardes
daartussen zijn mogelijk, omdat alles mogelijk is tellen alle
decimalen mee en heb je dus eigenlijk oneindig.
Dit is ook bij onafgeronde leeftijden.
> alle tussenliggende waardes aanwezig (lijn in grafiek)
interval of ratio’s zijn over het algemeen continue maar continue is niet perse een van
deze twee.
Bv – leeftijd (niet afgerond)
Bv – hoeveelheid gedronken alcohol
Bv – dosering in grammen
Bv – lengte
4