Samenvatting statistiek 2
Meetniveau’s:
Nominaal = geen volgorde geen verschil geen vast nulpunt modus
Ordinaal= wel volgorde geen verschil geen vast nulpunt median
interval= wel volgorde wel verschil geen vast nulpunt Gem.
ratio = wel volgorde wel verschil wel vast nulpunt Gem.
Vb: allerlei schoenmerken: nominaal, eens/oneens: ordinaal, interval: tijden of IQ, ratio: leeftijd,
percentages etc.
Bij een populatie wordt mu(gem.), sigma (std) en rho(corr) gebruikt.
Bij een steekproef wordt X en r gebruikt. (gemiddelde en correlatie).
Bij een statistische toets wordt altijd gebruik gemaakt van een populatie, er wordt in de
hypothese altijd gewerkt met mu en rho.
Verwerphypothese = H0
Verwachtingshypothese = H1
Gepaarde waarneming: twee toetsen met een verband: vóór en na, afhankelijke groep
Ongepaarde waarneming: 2 verschillende onafhankelijke groepen die niets met elkaar te maken
hebben.
Je kunt eenzijdig of tweezijdig toetsen.
Wanneer men eenzijdig toetst heb je altijd een < of > teken. Je hebt dan een idee over de richting.
H0: spierkracht meisjes ≤ spierkracht jongens. (kleiner of gelijk-aan teken altijd bij H0)
H1: spierkracht meisjes > spierkracht jongens.
Bij een eenzijdige hypothese moet je de p-waarde delen door 2.
Wanneer men tweezijdig toetst heb je altijd een = of ≠ teken.
H0: spierkracht meisjes = spierkracht jongens.
H1: spierkracht meisjes ≠ spierkracht jongens.
Voordat je je toets toe past, eerst de vooronderstellingen checken
Mediaan = middelste waarde
Modus = getal dat het vaakst voorkomt
Skewness = breedte
Kurtosis = platheid, hoge kurtosis houdt hoge piek in, lage kurtosis is plat figuur.
Links/negatief scheef: gemiddelde, mediaan, modus. skewness <0
Rechts/positief scheef: modus, mediaan, gemiddelde skewness >0
, Bij negatieve skewness altijd van links naar rechts eerst het gemiddelde, dan mediaan en dan
modus, bij een positieve skewness altijd modus, mediaan en gemiddelde. Gemiddelde ligt altijd
aan de kant van de staart.
Als je kijkt of je data normaal verdeeld is moet je niet zo zeer kijken of je skewness/ kurtosis
binnen de -1 en 1 liggen, maar ook naar de mediaan/modus/gemiddelde. Deze moeten dicht bij
elkaar liggen (blz 138-139 boek). Skewness en kurtosis kan je namelijk niet goed als indicatie
gebruiken bij veel samples, omdat ze dan sneller significant afwijken. Je kunt van deze waardes
ook z-scores maken door kurtosis/ skewness te delen door de standaard error. Als de waardes dan
groter zijn dan 1.96 (dan is p < 0.05) zijn ze significant afwijkend van normale verdeling.
Alfa/alpha = significantie/overschreidingsgrootheid = 0.05 of 0.01
p-waarde = overschreidingskans, wat er uit je toets komt.
kritieke waarde is een waarde waarbij de H0 wordt verworpen.
toetsgrootheid is de t-waarde
College 2 statistiek 2
Bij een onafhankelijke t-toets: Je toets of de gemiddelden uit twee variabelen zodanig van
elkaar verschillen dat ze redelijkerwijs niet uit twee populaties afkomstig zijn met hetzelfde
gemiddelde.
Vooronderstellingen onafhankelijke t-toets
-onafhankelijke variabelen
-normaal verdeeld
-sigma onbekend (standaarddeviatie)
-afhankelijke variabele minimaal interval meetniveau
-twee onafhankelijke steekproeven
Normaal verdeeld als:
-99.7% van de data binnen 3 sd vallen.
-Gemiddelde = mediaan = modus
-kurtosis en skewness binnen -1 en 1 liggen.
Alternatieven (nonparametrisch) als t-toets niet aan vooronderstellingen voldoet:
Als data is ordinaal niveau
Als kleine n (kleiner dan 30)
Als data niet normaal verdeeld is.
Meetniveau’s:
Nominaal = geen volgorde geen verschil geen vast nulpunt modus
Ordinaal= wel volgorde geen verschil geen vast nulpunt median
interval= wel volgorde wel verschil geen vast nulpunt Gem.
ratio = wel volgorde wel verschil wel vast nulpunt Gem.
Vb: allerlei schoenmerken: nominaal, eens/oneens: ordinaal, interval: tijden of IQ, ratio: leeftijd,
percentages etc.
Bij een populatie wordt mu(gem.), sigma (std) en rho(corr) gebruikt.
Bij een steekproef wordt X en r gebruikt. (gemiddelde en correlatie).
Bij een statistische toets wordt altijd gebruik gemaakt van een populatie, er wordt in de
hypothese altijd gewerkt met mu en rho.
Verwerphypothese = H0
Verwachtingshypothese = H1
Gepaarde waarneming: twee toetsen met een verband: vóór en na, afhankelijke groep
Ongepaarde waarneming: 2 verschillende onafhankelijke groepen die niets met elkaar te maken
hebben.
Je kunt eenzijdig of tweezijdig toetsen.
Wanneer men eenzijdig toetst heb je altijd een < of > teken. Je hebt dan een idee over de richting.
H0: spierkracht meisjes ≤ spierkracht jongens. (kleiner of gelijk-aan teken altijd bij H0)
H1: spierkracht meisjes > spierkracht jongens.
Bij een eenzijdige hypothese moet je de p-waarde delen door 2.
Wanneer men tweezijdig toetst heb je altijd een = of ≠ teken.
H0: spierkracht meisjes = spierkracht jongens.
H1: spierkracht meisjes ≠ spierkracht jongens.
Voordat je je toets toe past, eerst de vooronderstellingen checken
Mediaan = middelste waarde
Modus = getal dat het vaakst voorkomt
Skewness = breedte
Kurtosis = platheid, hoge kurtosis houdt hoge piek in, lage kurtosis is plat figuur.
Links/negatief scheef: gemiddelde, mediaan, modus. skewness <0
Rechts/positief scheef: modus, mediaan, gemiddelde skewness >0
, Bij negatieve skewness altijd van links naar rechts eerst het gemiddelde, dan mediaan en dan
modus, bij een positieve skewness altijd modus, mediaan en gemiddelde. Gemiddelde ligt altijd
aan de kant van de staart.
Als je kijkt of je data normaal verdeeld is moet je niet zo zeer kijken of je skewness/ kurtosis
binnen de -1 en 1 liggen, maar ook naar de mediaan/modus/gemiddelde. Deze moeten dicht bij
elkaar liggen (blz 138-139 boek). Skewness en kurtosis kan je namelijk niet goed als indicatie
gebruiken bij veel samples, omdat ze dan sneller significant afwijken. Je kunt van deze waardes
ook z-scores maken door kurtosis/ skewness te delen door de standaard error. Als de waardes dan
groter zijn dan 1.96 (dan is p < 0.05) zijn ze significant afwijkend van normale verdeling.
Alfa/alpha = significantie/overschreidingsgrootheid = 0.05 of 0.01
p-waarde = overschreidingskans, wat er uit je toets komt.
kritieke waarde is een waarde waarbij de H0 wordt verworpen.
toetsgrootheid is de t-waarde
College 2 statistiek 2
Bij een onafhankelijke t-toets: Je toets of de gemiddelden uit twee variabelen zodanig van
elkaar verschillen dat ze redelijkerwijs niet uit twee populaties afkomstig zijn met hetzelfde
gemiddelde.
Vooronderstellingen onafhankelijke t-toets
-onafhankelijke variabelen
-normaal verdeeld
-sigma onbekend (standaarddeviatie)
-afhankelijke variabele minimaal interval meetniveau
-twee onafhankelijke steekproeven
Normaal verdeeld als:
-99.7% van de data binnen 3 sd vallen.
-Gemiddelde = mediaan = modus
-kurtosis en skewness binnen -1 en 1 liggen.
Alternatieven (nonparametrisch) als t-toets niet aan vooronderstellingen voldoet:
Als data is ordinaal niveau
Als kleine n (kleiner dan 30)
Als data niet normaal verdeeld is.