MOS blok 4
Algemeen
Nominaal -> er zit geen vaste volgorde aan (kleur, lekkerste chocolade)
Ordinaal -> kan op volgorde, maar heeft niet allemaal dezelfde waarde aan een getal hangen
(beoordeling)
Interval/ratio -> is op volgorde, de stappen eertussen hebben een vaste waarde (lengte, reistijd)
Gemiddelde -> som van alle waardes gedeeld door het aantal waardes
Mediaan -> middelste waarde zodra alle getallen gerangschikt staan op volgorde
Modus -> de waarde die het meeste voorkomt
R-formules
C(...) -> vector
Mean() -> gemiddelde
Var() -> variantie van een steekproef berekenen
Sqrt() -> worteltrekken
Quantile(..., 0.25) -> onderste kwantiel
Quantile(..., 0.75) -> bovenste kwantiel
Median() -> mediaan
Sd() -> standaardafwijking
Length() -> aantal elementen in een reeks
Class() -> welk datatype
Summary() -> laagste getal, onderste kwantiel, median, gemiddelde, bovenste kwantiel, grootste
getal
As.Character/numeric/logical -> datatype veranderen
Altijd eerst rij en daarna colom
,Sd -> sd(...)
SE -> sd/sqrt(n)
Pt() -> exacte p-waarde berekenen; vul t-waarde en df als input in. Let soms op lower.tail = F/T.
t.test() -> one-sample t-test en two-sample (t.test(groep1,groep2, var.equal=TRUE))
chisq.test() -> chi2 toets; vul het object als input in (als de waarden characteristic zijn, moeten ze
eerst in een tabel worden gezet om ermee te werken -> table()
Df berekennen voor verschillende t-toetsen:
o Paired t-test/one-sample t-test -> n-1
o Two-sample -> (n1-1)+(n2-1)
Read.table(file.choose(), header = T) -> inladen data
Shapiro.test() -> het uitvoeren van een Shapiro.test; geef als input het object (om te toetsen of een
variabele normaal verdeeld is, zodat de assumpties van de test objectief kunnen worden gemeten.
Voor de assumptie van de normaalverdeling bestaat deze test. Hierbij is H0 altijd dat de vedeling van
de popilatie normaal is. De Ha is dat de verdeling niet normaal is.)
Levene.test() -> het uitvoeren van een levene.test; geef een soortgelijke input als
levene.test(Abba2$score,Abba2$group). (voor het testen van de assumptie van gelijke varianties in
de populatie bestaat de levene’s test. De H0 is hier altijd dat van deze test de varianties gelijk zijn. De
Ha is dat de varianties ongelijk zijn.)
Overig:
o Alfa geeft de kans op een type I fout.
o Type I fout -> H0 wordt verworpen terwijl H0 waar is.
o Type II fout ->
o Power = de kans dat je de nulhypothese verwerpt, als er daadweerkelijk een effect is.
o De p-waarde is de kans op de gevonden data of extremer, gegeven dat de nulhypothese
waar is.
o Als de onafhnakelijke variabele extreem verschilt tussen condities, is het voordeel dat de
power wordt vergroot
o Als de onafhankelike variabele extreem verschilt tussen condities is het nadeel dat er
mogelijk een experimental artifact wordt gecreeerd (zie theorie).
o Wanneer data scheef verdeeld zijn, is een kwadraat transformative van toepassing.
o Gebruik van visuele grafieken:
o Scatterplot -> continue onafhankelijke variabele/continue onafhankelijke variabele.
, o Staafdiagram/boxplot -> catergoriale onafhnakelijke variabele/continue afhankelijke
variabele
o Strip chart -> continue onafhankelijke variabele/catergoriale afhankelijke variabele
o Mozaiekplot -> catergoriale onafhankelijke variabele/categoriale afhankelijke
variabele
Specifiek voor dit blok:
Boxplot() -> het maken van een boxplot. Geef een soortgelijke input als:
boxplot(Rekenvaardigheid$score~Rekenvaardigheid$group, data.frame=data, xlab = 'Muzieksoort',
ylab="Score rekentoets", names=c("Abba", "Bach", "Controle"), main="Invloed van muziek op
rekenvaardigheid",las=1, ylim=c(20,90))
Hist() -> het maken van een sogram. Geef een soortgelijke input als:
Install.packages(‘car’) & library(car) -> in deze packages zit de leveneTest.
pt() -> berekenen van p-waarde. geef een soortgelijke input als: pt(13.536, 2, 39) -> pt(F-ratio, df
numerator/teller, df denominator/noemer)
aov() -> ANOVA test. Geef een soortgelijke input: aov(score ~ as.factor(group),
data=Rekentaak_drinken)
o Vraag vervolgens de summary van aov op voor alle gegevens.
o fit = aov(score ~ group, data=Rekentaak_drinken)
o summary(fit)
o df = 2 en 57
o f-waarde = 590.9
o p<0.001
o De as.factor wordt gebruikt om de groepen als categoriën te beschrijven.
TukeyHSD() -> voor de Tukeykramer test. Geef een soortgelijke input als:
TukeyHSD(Rekentaak_drinken, ordered=F).
Plot() -> om een scatterplot te maken. Geef een soortgelijke input als: plot(Cijfers10$uren,
Cijfers10$cijfer, xlab = 'Cijfer', ylab = 'Uren') -> geef als object eerst de x as, daarna de y-as aan.
Cor() -> berekent correlation coefficient. Geef een soortgelijke input als: cor(Cijfers10$uren,
Cijfers10$cijfer)
Cor.test -> voert een volledige correlatietest uit en geef heel veel gegevens. Geef een soortgelijke
input als: cor.test(Cijfers10$uren, Cijfers10$cijfer)
o Als de correlatie niet 0 is, is er een significant verband.
o Als de correlatie 0 is, is er geen significant verband.
Attach() -> zorgt ervoor dat de data onthouden wordt en je bij formules alleen de kolomnaam
‘hourstv’ hoeft te noteren ipv agressie$hourstv. Geef een soortgelijke inpurt als: attach(agressie).