Inleiding
Wie of wat = onderzoekseenheden
Kenmerken = variabelen (met spreiding, verschillen voorspellen, afhank./onafhank.)
Onderzoekspopulatie = De verzameling van individuen waarover we een uitspraak willen doen.
Steekproef = Een staal uit de onderzoekspopulatie (random= aselect)
Respondenten = personen die we uiteindelijk bevragen.
Representatief =Een kenmerk even goed vertegenwoordigd is in de steekproef als in de
populatie. (Oververtegenwoordigd/ ondervertegenwoordigd) (afbakening)
Beschrijven, schatten en veralgemenen als statistische bedrijvigheid
Beschrijvende statistiek = Weergeven, datareductie-techniek, … (kwantitatieve reductie!!)
--> resultaten mogen niet veralgemeend worden of gebruikt worden om causaliteit vast te stellen.
Inferentiële statistiek = Veralgemenen
--> onderzoekshypothese = Positieve formuleren dus wel een verband.
Alternatieve hypothese = //
Nulhypothese = Er is geen verband.
Inductieve statistiek = waarheidsgehalte van hypothese nagaan
Statistiek en de beantwoording van beschrijvende en verklarende onderzoeksvragen
Beschrijvende onderzoeksvraag = kwantitatieve beschrijving (makkelijker dan verklarende)
--> opsomming en verband, maar zonder verklaring.
Verkennend/ exploratief onderzoek = het aftasten van veronderstellingen
Verklarende onderzoeksvraag = geobserveerde verschillen/ veranderingen in uitkomstvariabelen
te verklaren vanuit kenmerken die eigen zijn aan een theoretisch paradigma.
Univariate, bivariate en multivariate beschrijvende analyse
Uni = 1 kenmerk --> maten van centraliteit en spreiding
Bi = 2 kenmerken --> samenhang
Multi= meer dan 2 kenmerken -->regressie
Meetniveaus variabelen
Nominaal:
- Elkaar uitsluitende categorieën
- Categorische gegevens = naam/ categorie
, - Intern homogene categorieën
- Geen relatie of rangorde
- Exclusiviteit en exhaustiviteit!!!!
Ordinaal:
- Ordenbaarheid (de mate waarin ze een bepaald kenmerk bevatten)
- Continuüm
- Categorische variabelen --> dichotoom/ polytoom
Interval:
- Intervallen tussen de variabelen hebben een waarde/ exacte betekenis.
- Geen natuurlijk nulpunt
- Afstanden tussen de intervallen zijn altijd even groot.
Ratio:
- Rangordening
- Intervallen hebben betekenis
- Wel nulwaarde!!!! (geen negatieve waarde)
Discreten en continue variabele
Continue = alle mogelijke uitkomsten
Discreet = beperkt tot een telbaar aantal eenheden. (gehele getallen)
Data-matrix
Rijen --> statistische eenheden kolommen= kenmerken van personen
Afrondingsregels
Beneden --> 1 tot 4
Boven --> 5 tot 9
Somatieteken
I = index
M = ondergrens
N = bovengrens
I=m = beginwaarde
I=n = eindwaarde
Tabellen
Frequentietabellen = hoe vaak een variabele voorkomt
Kruistabellen = hoe vaak er een combinatie voorkomt
Variatie
Geen variatie= constante --> kunnen we niets mee
, Statistiek: theorie "univariate beschrijvende statistiek" <--
Over absolute en relatieve freqenties
Onderscheid geldende waarde (degene die niet antw tellen niet mee) en ontbrekende waarden!!!
Percentage = absoluut/ n . 100
N = som van absolute frequenties
Relatieve freq = absoluut/ n
Geldende percentage = absoluut/ niet antw wordt afgetrokken van totaal
Cumulatieve // = de percentages van elke volgende waarde wordt bij de voorgaande
opgeteld. Niet doen op nominaal niv. !!! (Absoluut = K, relatief= k)
Incidentie = nieuwe aantal gevallen in bepaalde periode binnen bepaalde populatie
Prevalentie = totaal aantal personen in een bepaalde conditie binnen een populatie
Staafdiagram
x-as = categorieën
y-as = aantallen
Opp= absolute aantallen/ percentages
Driedimensionaal = blokgrafiek
Nominaal/ ordinaal niv. -->Staafjes los van elkaar
Metrisch niv. --> Staafjes aan elkaar (continuüm)
Cumulatief frequentietabel
- Ordinaal
Histogram
- Metrische niv
- Breedte = klasselengte
- Hoogte = aatal gegevens
- Balkjes moeten raken
Lijndiagram
- Frequentie
Frequentiepolygoon
- Klassemiddens
Parameters van centraliteit
ALGEMENE REGEL: Parameters die op een lager niveau kunnen worden gebruikt, kunnen dit ook op
een hoger niveau, maar in principe nooit omgekeerd.
Modus