Statistiek
H2: Samenvatten en beschrijven
Empirisch
Werkelijkheid: natuur, mens, maatschappij
Theorie getoetst aan feiten/data
Objectief – Openbaar – Toetsbaar
Exploratief = Beschrijvend Inferentieel
Toetsen en concluderen
Inductieve methode
(zie hypothetisch-deductief model)
Data
- Toetsen van wetensch hypothesen en
- verzamelen
theorieën
- classificeren
- Conclusies trekken
- presenteren
Doel: inzicht krijgen, patronen ontdekken Doel: veralgemenen op populatieniveau
Nominaal en ordinaal:
- Frequentietabel
- Staafdiagram
Interval en ratio:
- Histogram
- Klassenindeling
- Tak-blad-grafiek
Beiden vullen elkaar aan
Data
Onderzoekseenheden
Variabelen
o Meting = waarde/getal of code
Meting van variabelen
Kwali
o Nominaal
o Ordinaal
Kwanti
o Interval -> geen absoluut nulpunt -> vb: T°, IQ
Berekeningen
o Ratio -> absoluut nulpunt -> vb: lengte, gewicht, BD
Berekeningen én verhoudingen (bvb dubbel/2xhoger/2xlanger)
Frequentietabel
Centrummaten: centrum en spreiding
Scores, frequenties, %, cumulatieve %
, Staafdiagram
Horizontale as: waarden vd variabelen
Hoogte as: frequentie/proportie/%
Staven raken elkaar NIET -> tussen 2 discrete waarden geen andere waarden mog
Staven niet in dwingende volgorde dus drm ook nominaal mog
Histogram
Categorieën creëren (want veel versch uitkomsten)
Horizontale as: klassen
Hoogte as: frequentie/proportie/%
Kolommen grenzen aan elkaar -> variabele continu
#klassen:
o √ n (n = #waarnemingen)
o Minimum 4, max 20
Klassenbreedte
o = range / #klassen (range = verschil tss grootste en kleinste waarde)
o Gelijke klassenbreedte: klassen/intervallen even breed
o Frequentiedichtheid gebruiken als de intervallen niet even breed zijn
Klassen moeten exclusief en uitputtend zijn
o Exclusief: elke uitkomst in slechts 1 klasse
o Uitputtend: elke uitkomst kan in een klasse w ingedeeld
Klassenindeling
Verschil tss frequentieverdeling en kansverdeling?
-> Frequentieverdeling is gwn een representatie vd data, geen theoretisch model. Histogram idem.
-> Kansverdeling: Als we de klassenbreedte steeds kleiner maken en het #waarnemingen onbeperkt
laten toenemen, ° in de limiet een vloeiende curve -> bell shape
Theoretische modellen om dit soort data te knn beschrijven: normaalverdeling, student’s t-
verdeling, …
Tak-blad-grafiek
Stambreedte: deel getallen door 1 (als alle getallen te groot: delen door 10 of 1000 om mooier op
grafiek te knn zetten)
Takken: cijfers voor de komma
Bladeren: cijfers na de komma (elk blad is 1 meting)
Centrummaten
Modus (bimodale verdeling = verdeling met 2 modi)
Mediaan
Gemiddelde
Spreidingsmaten
Variantie / Standaarddeviatie
o SD geeft idee over hoe ver observaties liggen vh gemiddelde
o Deviatie (d²) = (observatie min gemiddelde)²
² want een observatie kan kleiner dan het gemidd zijn -> hetgeen tss haakjes zou dan
negatief knn zijn, maar je wil de afstand kwantificeren en afstand is altijd positief.
H2: Samenvatten en beschrijven
Empirisch
Werkelijkheid: natuur, mens, maatschappij
Theorie getoetst aan feiten/data
Objectief – Openbaar – Toetsbaar
Exploratief = Beschrijvend Inferentieel
Toetsen en concluderen
Inductieve methode
(zie hypothetisch-deductief model)
Data
- Toetsen van wetensch hypothesen en
- verzamelen
theorieën
- classificeren
- Conclusies trekken
- presenteren
Doel: inzicht krijgen, patronen ontdekken Doel: veralgemenen op populatieniveau
Nominaal en ordinaal:
- Frequentietabel
- Staafdiagram
Interval en ratio:
- Histogram
- Klassenindeling
- Tak-blad-grafiek
Beiden vullen elkaar aan
Data
Onderzoekseenheden
Variabelen
o Meting = waarde/getal of code
Meting van variabelen
Kwali
o Nominaal
o Ordinaal
Kwanti
o Interval -> geen absoluut nulpunt -> vb: T°, IQ
Berekeningen
o Ratio -> absoluut nulpunt -> vb: lengte, gewicht, BD
Berekeningen én verhoudingen (bvb dubbel/2xhoger/2xlanger)
Frequentietabel
Centrummaten: centrum en spreiding
Scores, frequenties, %, cumulatieve %
, Staafdiagram
Horizontale as: waarden vd variabelen
Hoogte as: frequentie/proportie/%
Staven raken elkaar NIET -> tussen 2 discrete waarden geen andere waarden mog
Staven niet in dwingende volgorde dus drm ook nominaal mog
Histogram
Categorieën creëren (want veel versch uitkomsten)
Horizontale as: klassen
Hoogte as: frequentie/proportie/%
Kolommen grenzen aan elkaar -> variabele continu
#klassen:
o √ n (n = #waarnemingen)
o Minimum 4, max 20
Klassenbreedte
o = range / #klassen (range = verschil tss grootste en kleinste waarde)
o Gelijke klassenbreedte: klassen/intervallen even breed
o Frequentiedichtheid gebruiken als de intervallen niet even breed zijn
Klassen moeten exclusief en uitputtend zijn
o Exclusief: elke uitkomst in slechts 1 klasse
o Uitputtend: elke uitkomst kan in een klasse w ingedeeld
Klassenindeling
Verschil tss frequentieverdeling en kansverdeling?
-> Frequentieverdeling is gwn een representatie vd data, geen theoretisch model. Histogram idem.
-> Kansverdeling: Als we de klassenbreedte steeds kleiner maken en het #waarnemingen onbeperkt
laten toenemen, ° in de limiet een vloeiende curve -> bell shape
Theoretische modellen om dit soort data te knn beschrijven: normaalverdeling, student’s t-
verdeling, …
Tak-blad-grafiek
Stambreedte: deel getallen door 1 (als alle getallen te groot: delen door 10 of 1000 om mooier op
grafiek te knn zetten)
Takken: cijfers voor de komma
Bladeren: cijfers na de komma (elk blad is 1 meting)
Centrummaten
Modus (bimodale verdeling = verdeling met 2 modi)
Mediaan
Gemiddelde
Spreidingsmaten
Variantie / Standaarddeviatie
o SD geeft idee over hoe ver observaties liggen vh gemiddelde
o Deviatie (d²) = (observatie min gemiddelde)²
² want een observatie kan kleiner dan het gemidd zijn -> hetgeen tss haakjes zou dan
negatief knn zijn, maar je wil de afstand kwantificeren en afstand is altijd positief.