Samenvatting hoorcolleges statisitiek (theorie)
Hoorcollege 1: 23/09/2020
Evaluatie:
- Multiple choice (15/20): 20 meerkeuzevragen met giscorrectie (-0.33)
- Praktische opdracht (5/20): analyse dataset in groep à punten worden overgedragen
naar tweede zit
Samenvatten en beschrijven
Empirisch wetenschappelijk onderzoek
= houdt zichzelf bezig met de werkelijkheid (empirie) van de natuur, mens en maatschappij
bv. natuurkunde, biologie, psychologie, economie
à Kenmerk: theorie wordt getoetst aan feiten/data ( ! Belang statistiek: beste technologie om
data te beschrijven en begrijpen, patronen te ontdekken)
ß à Niet empirische wetenschappen bv. theologie, filosofie, literatuurwetenschap
Regels voor onderzoek
• Objectiviteit
= onderzoek moet integer zijn, hij moet alles doen om te vermijden dat zijn
vooroordelen/belangen de resultaten vh onderzoek vertekenen
• Openbaarheid
= resultaten vh onderzoek moeten openbaar zijn, zodat anderen er kritisch op kunnen
reageren
• Toetsbaarheid
= resultaten vh onderzoek moeten zo worden gepresenteerd dat anderen het
onderzoek kunnen controlen (mbv herhaling/reproductie)
Onderzoek onder te verdelen in:
1. Exploratief onderzoek
• Doel: werkelijkheid verkennen, en daarin wetmatigheden ontdekken
• Methode: inductief
• Centrale vraag: Wat is er aan de hand?
• Techniek: beschrijvende statistiek
2. Inferentieel onderzoek
• Doel: toetsen of wetenschappelijke hypothesen en theorieën al dan niet in
overeenstemming zijn met de werkelijkheid
• Methode: -
• Centrale vraag: Klopt mijn verklaring?
• Techniek: inferentiële statistiek
à Vullen elkaar aan: wetmatigheden worden ontdekt (exploratief onderzoek) à leiden tot
wetenschappelijke theorie à leiden tot hypothesen à worden getoetst op houdbaarheid
(inferentieel onderzoek)
Hypothetisch-deductief model
Theorie
ê
Werkhypothese
ê
Onderzoeksopzet
ê
Data verzameling
, ê
Data analyse
ê
Toetsen hypothese
Empirisch wetenschappelijk onderzoek
Ø Begin: goede vraagstelling
Ø Dataverzameling
Data
= ‘gegevens’, feiten die verzameld worden om antwoord te kunnen geven op vragen
die gesteld worden, vormen basis voor informatie
Onderzoeksheenheden
= wat je wil bestuderen binnen de data
bv. personen, dieren, planten, ziekenhuizen, patiënten, studenten…
Variabele
= kenmerken van de onderzoekseenheid
bv. geslacht, gewicht, leeftijd bij een epidemiologische studie - bloeddruk, cholosterol,
hemoglobine bij een klinische studie – risicovol gedrag, alcoholconsumptie bij
verkeersongevallen…
Metingen van variabelen
= waarde, getal of code die toegekend is aan een variabele
Meetnivau van variabelen
Metingen van variabelen
íî
Kwalitatief Kwantitatief
íî íî
Nominaal Ordinaal Interval Ratio
Kwalitatieve variabelen
Ø Nominale variabele
bv. soort kanker (prostaat, long, darm), geslacht (man, vrouw), afkomst (autochtoon,
allochtoon)
à Kan je labelen/coderen als 1 – 2 – 3, maar is puur label/code en kan geen
interpretatie aan gegeven worden, geen structuur
Ø Ordinale variabele
bv. sportprestatie (1ste, 2de, 3de plaats), sociaal economische status (laag, midden,
hoog), opleiding (lager, middelbaar, universitair)
à Hierbij een volgorde, structuur
à ! Kunnen niet gebruikt worden voor berekeningen
Kwantitatieve variabelen
Ø Interval variabele
bv. temperatuur (vandaag is de temp in Leuven 20°C, in Ieper 10°C), intelligentie
(IQ scores)
à Geen absoluut nulpunt, variabele is continue
! Je kan niet zeggen dit is twee keer warmer, hij is twee keer intelligenter…
Variabele kunnen gebruikt worden voor berekeningen (bv. gemiddelde), maar niet
voor verhoudingen (ratios).
Ø Ratio variabele
bv. lengte (cm of m), gewicht (gr of kg), bloeddruk (mmHg)
, à Absoluut, natuurlijk nulpunt.
Variabelen kunnen gebruikt worden voor berekeningen (bv. gemiddelde)
Soorten statistiek
1. Beschrijvende statistiek
= Analyse begint met samenvatting en beschrijving van de data. Oorspronkelijke
uitkomsten worden samengevat, waardoor details verloren gaan, maar overzicht en
inzicht worden gewonnen.
à Verzamelen, classificeren en presenteren van data
Tellen van uitkomsten
- Frequentietabel: nominaal, ordinaal
- Staafdiagram: nominaal, ordinaal
- Histogram: interval, ratio
- Klassenindeling: interval, ratio
- Tak-blad-grafiek: interval, ratio
2. Inferentiële statistiek
= Doet kwantitatieve uitspraken over de eigenschappen van een populatie op basis
van de uitkomsten van steekproefonderzoek
à Toets van wetenschappelijke hypothesen en theorieën
à Conclusies trekken
Frequentietabel (nominaal/ordinaal)
= verzameling van alle uitkomsten in een onderzoek en de met die uitkomsten
geassocieerde frequenties
à Kan in een frequentietabel of in een grafiek (bv. staafdiagram, histogram) worden
weergegeven
Belangrijkste kenmerken van een frequentieverdeling
- Centrum
= geeft aan rond welke centrale waarden de uitkomsten liggen (bv. gemiddelde)
- Spreiding
= geeft aan hoe ver de uitkomsten uiteen liggen
Twee variabelen:
naam, leeftijd
Scores
= de verschillende waarden
bv. hier wordt de leeftijd gebruikt
Frequenties
= hoeveel keer komt deze waarde voor (hoe frequent
komt deze voor)
Percentages
Cumulatieve percentages
, Staafdiagram (nominaal/ordinaal)
= vat de uitkomsten op een variabele grafisch samen
- Horizontale as
= waarden van de variabelen
- Hoogte staaf
= komt overeen met frequentie – proportie – percentage van de bijhorende waarde
! Om aan te geven dat er tussen twee discrete waarden geen andere waarden mogelijk zijn,
raken de staven elkaar niet
à Geschikt voor (discrete) variabelen met een beperkt aantal verschillende waarden. Indien
aantal staven te groot: overzichtelijkheid neemt af, informatieve waarde neemt af.
Staven staan in niet dwingende volgorde, daarom is staafdiagram ook bruikbaar op nominaal
meetniveau.
Twee verschillende technieken voor dezelfde
informatie
Staafdiagram geeft mooier visueel overzicht
Observaties classificeren in categorieën
à Als er verschillende uitkomsten zijn, is het overzichtelijker de uitkomsten in klassen onder
te brengen en de frequenties voor iedere klasse te bepalen
bv. histogram
Histogram (interval/ratio)
= vat de uitkomsten van een continue variabele samen. Uitkomsten worden door
classificeren in intervallen van gelijke klassenbreedte ingedeeld.
- Horizontale as
= klassen
Boven iederen klasse wordt een kolom getekend
- Hoogte kolom
= frequentie – proportie – percentage van de uitkomsten van die klassen
Om aan te geven dat de variabele continu is, grenzen de kolommen aan elkaar. Intervallen
zijn even breed.
Histogram maken:
Ø Aantal klassen: ongeveer √n (n: aantal waarnemingen)
à min. 4, max. 20
Ø Klassenbreedte: range / aantal klassen
Range
= verschil tussen grootste en kleinste gevonden uitkomst
Ø Klassen zijn even breed
Ø Klassen moeten exclusief en uitputtend zijn
- Exclusief: iedere uitkomst in slechts één klasse
- Uitputtend: iedere uitkomst kan in een klasse worden ingedeeld