H0: PROLEGOMENA
0.1 STATISTIEK, PSYCHOMETRIE EN METHODOLOGIE
Methodologie
Het is de taak van de methodologie om te bepalen hoe de steekproef samengesteld wordt en welke
soort van onderzoeksdesign het meest geschikt is om een antwoord te bieden op de
onderzoeksvragen.
Bv. observationeel onderzoek/ experimenteel onderzoek
Psychometrie
Het is de taak van de psychometrie om te bepalen hoe de variabelen het best gemeten kunnen
worden.
Statistiek
Eenmaal de data werd verzameld, is het de taak van de statistiek om met verschillende technieken de
data te analyseren teneinde een antwoord te kunnen formuleren op de vooropgestelde
onderzoeksvragen.
- Beschrijvende statistiek: technieken om de gegevens in een steekproef te beschrijven,
ordenen, presenteren en samenvatten
- Inductieve statistiek: technieken om observaties (op het niveau van de steekproef) te
veralgemenen naar de populatie.
0.2 VARIABELEN
Een variabele is een eigenschap die bij de elementen van de populatie of van de steekproef varieert.
- Numeriek/ niet-numeriek = keuze van de onderzoeker
- Continu/ discreet
ˠ Continu: tussen elke 2 willekeurige waarden ligt een derde waarde
ˠ Discreet: er zijn een eindig aantal waarden
- Een variabele wordt meestal aangeduid door een hoofdletter
- De waarnemingen van een variabele worden aangeduid met de overeenkomende kleine letter
0.3 MEETNIVEAUS
Absolute schaal
De variabele wordt gemeten door gewoon objecten te tellen.
- De meeteenheid is vast
- Het nulpunt is vast
- De variabele is discreet
- Bv.: gezingsgrootte, aantal inwoners, klasgrootte
Ratioschaal
Eerst een meeteenheid kiezen en dan het aantal meeteenheden tellen tussen het object en het vaste
nulpunt
- Vast nulpunt
- Variabele meeteenheid
- Continue variabele
- Bv.: leeftijd, reactietijd, lengte, gewicht, oppervlakte
Laura Deketelaere 2de bach. Pedagogische Wetenschappen UGent
,Statistiek II 2020-2021
Intervalschaal
Eerst een meeteenheid en een referentiepunt kiezen, dan het aantal meeteenheden tellen tussen het
te meten object en het referentiepunt
- Variabel nulpunt
- Variabele meeteenheid
- Continue variabele
- Bv.: temperatuur, datum
Ordinale schaal
De te gemeten objecten kunnen geordend worden, maar er is geen meeteenheid. De waarde van de
variabele bij een object is gewoon zijn plaats of rangnummer in de ordening.
- Geen nulpunt
- Geen meeteenheid
- Discrete of continue variabele
- Bv.: uitslag van een wielerwedstrijd
Nominale schaal
De te meten objecten kunnen niet geordend worden
- Noch continu noch discreet
- Geen nulpunt, geen meeteenheid
- Bv.: postcode, haarkleur, geslacht
Dichotome variabele => variabelen die slechts twee waarden kunnen aannemen
- 0-1 variabelen => dichotome variabele waarvan de 2 waarden 0 of 1 zijn
Continue variabelen
De statistische technieken voor variabelen van interval- of ratiomeetniveau zijn identiek. Dit is niet
100% correct omdat ordinale variabele ook continu kunnen zijn, maar in de praktijk is dit oké.
Categorische variabelen
Nominale en ordinale variabelen.
0.4 ZINVOLHEID
Een bewering of uitspraak is zinvol indien haar waarheidswaarde onafhankelijk is van de meetschaal
die je gebruikt.
Indien de bewering correct is met een bepaalde schaal, dan blijft ze correct met een andere
schaal.
Zinloze uitspraak = de waarheidswaarde hangt af van de gebruikte meeteenheid bv. temperatuur
Zinvolle uitspraak = de waarheidswaarde hangt niet af van de gebruikte meeteenheid bv. jonger zijn
Om zinloze beweringen te vermijden moet je voorzichtig zijn bij het manipuleren van scores.
Nominale en ordinale schaal
- Mag je de scores niet optellen, aftrekken, vermenigvuldigen en delen. Dus ook geen
gemiddelde, variantie, covariantie, correlatie enz.
Intervalmeetniveau
- Je mag de scores optellen en aftrekken
- Delen en vermenigvuldigen zijn riskant
- Logaritmes zijn verboden
Bij variabelen van rationiveau zijn er bijna geen restricties. Bij variabelen van absoluut meetniveau is er
geen restrictie. Het zal dus nooit voorkomen dat een bewering juist is voor 1 iemand en fout is voor
een ander.
Laura Deketelaere 2de bach. Pedagogische Wetenschappen UGent
,Statistiek II 2020-2021
H1: DATA MANIPULATIE
De analyse van data of gegevens gebeurt meestal met behulp van een statistische softwarepakket.
RStudio
Om gegevens m.b.v. R te kunnen analyseren moeten we eerst een databestand aanmaken. Dit kan op
veel verschillende manieren en met veel verschillende softwarepakketten.
We beperken ons tot drie pakketten: R, Excel en SPSS
1.1 DE DATA IN R
Object is hetgeen wat je een naam geeft.
Vector: een reeks objecten die R beschouwt als 1 samengesteld object
- C(…): functie om vectoren aan te maken
- : kent de naam toe aan het object
- Mean (…): gemiddelde
- Length (…): aantal elementen in de vector
- Min (…): kleinste waarde
- Max (…): grootste waarde
- Median (…): mediaan
- […]: de zoveelste waarde
ˠ Als we het volgnummer van een onbestaand object proberen opvragen, dan vertelt R
ons dat dit niet mogelijk is: NA (Not Available)
1.1.1 R en de meetniveaus
Een string is een hele reeks tekens die geen betekenis hebben voor R.
Om verwarring te vermijden
- moet je strings altijd tussen aanhalingstekens zetten. “…”
- factor (c(…)): deze functie zorgt ervoor dat alles tussen de buitenste haakjes beschouwd wordt
als nominaal/ordinaal.
Levels = c(“…”) : geeft aan welke unieke waarden van de string er zijn
Ordered = TRUE: laat R weten dat dit de volgorde is waarin we argumenten willen zien
1.1.2 Data frames
Een data frame is een zeer belangrijk object in R want alle datasets worden gestopt in de vorm van
een data frame.
Data.frame (naam van de vectoren): data frame aanmaken
myData <- data.frame(…) : naam toegekend
naamDataframe$naamvariabele: indien je een specifieke kolom wil raadplegen (bv.: myData$gewicht)
dim(…) : grootte van data frame => geeft de dimensies weer: aantal rijen en kolommen, zo kunnen we
de steekproefgrootte te weten komen.
write.csv (myData, file = ‘myData.csv’, row.names = False) : data frame opslaan
Het data frame wordt dan opgeslaan in de working directory.
Getwd (…): vraagt de locatie van de working directory op
Het data frame inlezen doe je via read.csv(file = ‘naam.csv’). Om de gegevens later te kunnen
gebruiken, moet je ze een naam toekennen.
Laura Deketelaere 2de bach. Pedagogische Wetenschappen UGent
, Statistiek II 2020-2021
1.2 DE DATA IN EXCEL
Excel is een zeer handig softwarepakket om tabellen aan te maken en te editen.
Bestand openen en opnieuw opslaan als een ‘Comma seperated Values’ => .csv
En het opslaan in je working directory (R leest enkel bestanden die daar opgeslagen zijn)
We gaan dit bestand in R importeren.
Data <- read.csv (file= ‘myData.csv’)
Zo heb je een nieuwe data frame in R aangemaakt, met naam data. Het bevat de gegevens van de
Excel file.
1.3 DE DATA IN SPSS
SPPS is een statistische softwarepakket dat ook handig is om data bestanden aan te maken en de
editen. Alhoewel SPSS een goede statistische softwarepakket is, is R op veel vlakken toch beter en
focussen we in deze cursus dus op R. Maar in deze cursus gaan we wel zien hoe je een databestand
kunt aanmaken met SPSS.
- Zie stappen blz. 19-22
1.4 GEIMPORTEERDE DATA EN MEETNIVEAUS
1.4.1 Numerieke variabelen
Numerieke variabelen die uit Excel of SPPS in R geïmporteerd worden, worden automatisch door R als
variabelen van ratio of intervalmeetniveau beschouwd. Dat is niet altijd correct en moeten we dus
expliciet aan R laten weten.
Bv.: data$motivatie <- factor(data$motivatie, levels = c(1,2,3,4,5,6,7), ordered = TRUE)
Indien de variabele motivatie norminaal zou zijn, dan zouden we dit commando gebruiken:
Data$motivatie <- factor (data$motivatie)
1.4.2 Niet numerieke variabelen
Ze worden ook automatisch als nominaal beschouwd. Dat is niet altijd correct: een niet numerieke
variabele kan ook ordinaal zijn. Dat moeten we expliciet aan R laten weten, zoals daarnet.
1.5 HET CODEBOEK
Een codeboek is een document dat beschrijft hoe gegevens in een data bestand gecodeerd worden.
Structuur blz. 24
1.5.2 Codering
Het is aangeraden om vanzelfsprekende codes te gebruiken. probeer een compromis te vinden tussen
bondigheid en duidelijkheid.
1.5.2.1 Missing data
Omwille van allerlei problemen gebeurt het zelfden dat elke variabele van het onderzoek gemeten
wordt bij elk individu in de steekproef.
NA: Not Available
Laura Deketelaere 2de bach. Pedagogische Wetenschappen UGent
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller UGentPedagogische. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.50. You're not tied to anything after your purchase.