1.1 Het onderzoeksproces (Field 1.2-1.4)
1. Het onderzoeksplan > probleemstelling
o Wie: populatie
o Wat: vraagstellingen/ hypothesen (wat je verwacht)
o Waarover: Relevante kenmerken/ variabelen
➢ Rol statistiek: Is de vraagstelling echt te onderzoeken?
2. Onderzoeksplan > probleemstelling
o Methode: hoe (enquête, experiment, observaties, gepubliceerde bronnen, etc. Maar
ook specifiek welke meetinstrumenten en welke analysemethoden).
o Eenheden: wie (steekproef (moet aselect en representatief zijn), populatie)
o Plaats: waar (neem je het onderzoek af?)
o Tijd: wanneer (neem je het onderzoek af?)
➢ Rol statistiek: Keuze meetinstrument (kwaliteit en soort), keuze analysemethoden en
steekproef trekken/ opzet instrument
3. Empirie > gegevensverzameling
o Gegevensverzameling (datamatrix)
o Ordenen en presenteren resultaten op een inzichtelijke manier (beschrijvende
statistiek)
➢ Rol statistiek: Ordenen en presenteren gegevens in samenvattende kerngetallen,
tabellen, grafieken en figuren: beschrijvende ‘descriptieve’ statistiek
➢ Beschrijvende statistiek: grafieken en tabellen
➢ Toetsende statistiek: met behulp van kansrekening een uitspraak doen of je het kan
generaliseren naar de gehele populatie
4. Generalisatie
o Interpreteren
o Vanuit je gegevens ga je terug naar de theorie, terug naar de hypothese die je al
had
o Conclusie trekken
➢ Rol statistiek: Bepalen verband tussen resultaten en theorie: interpretatie van
statistische gegevens. Statische conclusies: toetsende ‘inductieve’ statistiek
1.2 Terminologie
Variabele= Een datamatrix bestaat uit een aantal variabele = een gemeten grootheid die kan
variëren (Field 1.5.1)
Onderzoekseenheid (case)= Eenheid waarbij de variabelen gemeten worden (vaak horizontaal,
bijv. persoon 1, persoon 2, geslacht 1, geslacht 2, school 1, school 2, etc.)
Score= Waarde van een onderzoekseenheid op een variabele (vaak verticaal)
Afhankelijke en onafhankelijke variabele (1.5.1.1)
o Afhankelijke variabele: ‘gevolg’; de te verklaren variabelen
o Onafhankelijke variabele: ‘oorzaak’; verklaring voor (invloed op) de afhankelijke variabele
➢ Afhankelijke variabele is afhankelijk van de onafhankelijke variabele
➢ Voorbeeld: Psychische problemen ouders Internaliserende
problemen kinderen
= =
Onafhankelijke variabele Afhankelijke variabele
Je verwacht dat de psychische problemen van ouders de oorzaak zijn van
de internaliserende problemen bij de kinderen.
Voorbeeld:
o Geslacht (= nominaal) onafhankelijk, leeftijd verlaten ouderlijk huis (= ratio) afhankelijk.
o Wiskundevaardigheid (=interval) onafhankelijk, studieduur (=ratio) afhankelijk.
o IQ (=interval) onafhankelijk, verkoopresultaten (=ratio) afhankelijk.
Discrete en continue variabele (1.5.1.2)
o Discrete variabele: een variabele die slechts een bepaald aantal waarden kan aannemen;
een verschil tussen twee waarden is altijd één eenheid of meer vaste eenheden. Deze
variabele gaat steeds in stapjes omhoog. Tussen deze twee stapjes zit geen waarden.
Bijv. woorden tellen in een Word- document, of het aantal fouten dat iemand maakt met
een tentamen. Het hoeft geen geheel getal zijn, maar het zijn wel vaste eenheden. Het kan
1
, ook steeds met bijvoorbeeld 50 cent omhoog gaan. Maar de stapjes blijven hetzelfde.
Andere voorbeelden: opleidingsniveau, leeftijdsgroep, politieke partijen, etc. (Tellingen)
o Continue variabele: een variabele waarvoor geldt dat er tussen twee gegeven waarden
altijd een derde ligt: bij het meten van continue variabelen zijn de scores altijd afgeronde
getallen (een benadering van de feitelijke score). Bijv. de lengte van een kind (lengte kan
namelijk alles afnemen, je kunt meer getallen achter de komma schrijven), inkomsten,
leeftijd, etc.
Meetniveaus (1.5.1.2)
o Nominaal: waarden geven categorieën aan (geen volgorde, zonder ordening). Je codeert.
Bijv. kerkelijke gezindheid (rooms-katholiek, Nederlands hervormd, etc.), beroepen,
politieke partijen (VVD, PVDA, etc.), geslacht.
o Ordinaal: oplopende categorieën (waarden geven volgorde aan, met ordening). Bijv.
sociaal- economische klassen (laag, midden, hoog) of middelbare school niveaus (VMBO,
HAVO, VWO) of leeftijdsgroepen. Verschil tussen categorieën is niet hetzelfde.
o Interval: waarden geven volgorde aan, bovendien hebben gelijke intervallen tussen
waarden dezelfde betekenis. Afstand is hetzelfde, ze zijn betekenisvol. Bijv. het aantal
graden Celsius (tussen 24-25C en tussen 25-26C zitten evenveel graden tussen),
rapportcijfers (1 t/m 10 in gehele getallen).
o Ratio: waarden geven volgorde aan, gelijke intervallen tussen de waarden hebben dezelfde
betekenis en absoluut nulpunt. Bijv. lengte van een potlood/kind (absoluut nulpunt is 0),
aantal goede antwoorden, inkomsten, leeftijd, gewicht, tijd, aantal kinderen.
Kwalitatieve en kwantitatieve variabele
o Kwalitatieve (categorische) variabelen: nominaal of ordinaal categorieënsysteem. Dus wel
of niet met een ordening erin. Bijv. opleidingsniveau, beroep, leeftijdsgroep, etc.
o Kwantitatieve variabelen: Interval of ratio. Waarden geven hoeveelheid (kwantiteit) aan.
Bijv. aantal kinderen, aantal goed, inkomsten, leeftijden, etc.
Steekproef= Een steekproef moet zowel aselect als representatief zijn.
o Aselect= Ieder individu heeft een gelijke kans om in de steekproef te komen. Willekeurig.
Bijv. iedereen een nummer geven.
o Representatief= Ga je veel meer nadenken over de factoren die een rol kunnen spelen in je
onderzoek. Bijv. mensen uit stad/ platte land, verhouding politieke partijen. Bij
representativiteit ga je meer sturen. Een goede afspiegeling van de populatie (zitten er
even veel mannen/ vrouwen in? Even hoog/laag opgeleide studenten, etc.) Ook bij een
representatieve steekproef heeft ieder element van de populatie een even grote kans om in
de steekproef te worden opgenomen.
➢ Steekproeven zullen doorgaans alleen representatief kunnen zijn t.a.v. een
aantal kenmerken, die in het onderzoek van belang zijn.
➢ Moet je steekproef bijvoorbeeld representatief zijn voor de populatie op
kenmerken als geslacht, leeftijd en economische status, dan kan je dat met
speciale steekproeftechnieken bewerkstelligen (z.g. gestratificeerde
aselecte steekproeven).
➢ De representatieve steekproef moet op relevante kenmerken een goede
afspiegeling zijn van de populatie.
➢ Hoe groter de aselecte steekproef hoe groter de kans op representativiteit.
Meetinstrumenten= Instrumenten die gebruikt worden om data te verzamelen. Bijvoorbeeld
enquête, experiment, observatie. Belangrijkste eisen voor de kwaliteit van een meetinstrument zijn
betrouwbaarheid.
o Betrouwbaarheid= Herhaalbaarheid. Een betrouwbare test moet onder gelijkblijvende
omstandigheden bij hetzelfde subject hetzelfde resultaat opleveren. Hoe betrouwbaar een
test is hangt af van de invloed van toevallige factoren op de resultaten. Dus: hoe minder
invloed toevallige factoren hebben, des te groter is de betrouwbaarheid.
o Validiteit= Meet het instrument datgene wat de onderzoeker bedoelt te meten? Validiteit is
de mate waarin het gelukt is om systematische fouten tot een minimum te bespreken.
Operationaliseren= Omzetten van theoretische begrippen naar praktisch meetbare variabelen.
Begrippen zoals ‘bedoeld’ en ‘bepaald’. Hoe ga je een begrip bepalen/ meten? Meet je het begrip
ook echt zo? Bijv. hoe ga je motivatie meten en meet je dan wel motivatie?
2
,Week 2. Frequentieverdelingen
Hoofdstuk 4: In dit hoofdstuk wordt gebruik gemaakt van de "chart editor" (vanaf paragraaf 4.3).
In de cursus wordt alleen gebruik gemaakt van "legacy dialogs" (voorgeprogrammeerde grafieken).
2.1 Frequentieverdelingen
Frequentieverdelingen= Een methode om de verzamelende data op een fatsoenlijke manier te
presenteren. Dat is ook van belang om te controleren welke waarden er zoal bij variabelen
voorkomen. Frequentieverdelingen zijn belangrijk voor de empirie: ordenen. Door
frequentieverdelingen heb je een overzicht van je variabelen en waarden.
Definitie frequentie: De frequentie (fi) is het aantal keer dat een bepaalde waarde (Xi) voorkomt.
Voorbeeld: leeftijd eerste 20 kinderen in KOPP groep: 16, 12, 15, 11, 12, 13, 13, 14, 15, etc.
Bovenstaande is overzichtelijker in een frequentieverdeling:
Absolute frequentie (fi)= het aantal keer dat een bepaalde waarde
(Xi) voorkomt.
N= totale hoeveelheid (bij elkaar opgeteld)
Relatieve frequentie= frequentie gerelateerd aan het totaal: 2
varianten:
1. Proportie: pi = fi / N
De absolute frequentie (fi) gedeeld door het totaal aantal
waarden (N)
Porporties variëren van 0 tot 1
2. Percentage: fi / N * 100
Percentage = proportie * 100
Percentages variëren van 0 tot 100
Voordelen relatieve frequenties
o Geeft relatieve positie van individu aan
o Vergelijken van scores van groepen met ongelijke groepsgrootte -> als je een ongelijke
groep hebt, kun je door relatieve frequenties toch vergelijken
Cumulatieve absolute frequentie (cfi)= opklimmende
of somfrequenties.
o De frequentie tot en met een bepaalde waarde
(Xi), wanneer de scores van laag naar hoog gerangschikt
zijn.
o Cfi = ∑ f1 + f2 + … + fi
Cumulatieve relatieve frequentie= Cumulatieve absolute
frequentie gerelateerd aan het totaal: 2 varianten:
1. Cumulatieve proportie: cfi / N
De cumulatieve absolute frequentie (cfi) gedeeld door
het totaal aantal waarden (N)
Voordelen cumulatieve frequenties:
o Aflezen hoeveel personen een bepaalde score of lager
heeft
o Cumulatieve relatieve frequenties hebben als voordeel dat je de relatieve positie van
iemand ermee kunt weergeven
3
, Klassen= gegroepeerde frequentieverdeling=
Frequentieverdeling waarbij waarden/scores worden
samengenomen tot klassen van waarden/scores
Voordelen klassen:
o Overzichtelijker
Nadelen klassen:
o Verlies van informatie
o Afwijkingen bij berekeningen centrum- en
spreidingsmaten als je indeling in klassen gebruikt in
plaats van de oorspronkelijke gegevens
Hoe een indeling in klassen maken? Richtlijnen:
o Minimaal 5, maximaal 20 klassen
o Gebruikelijk: klassen even breed
o Gebruikelijk: overzichtelijke klassenbreedte, (bijv. tientallen)
o Zorg dat alle scores erin passen!
Verschil Percent en Valid Percent:
De kolom Percent geeft aan van alle respondenten het percentage dat voorkomt, de kolom “Valid
Percent” alleen van die personen waar iets ingevuld is. De kolom “Valid Percent” is vooral van
belang als er van die vraag heel veel non-respons is (dus missing values).
Klassengrenzen/ klassenbreedte= bepalen klassenbreedte gegeven aantal klassen dat je wilt
maken. Aantal waarden per klasse.
Continue variabele= bijv. lengte. 0,5 eraf en 0,5 erbij.
o X = 172 betekent 171.5 ≤ X < 172.5
o In de klasse 171-180 cm liggen dus eigenlijk waarden vanaf 170.5 tot (niet tot en met)
180.5. Dus 170.5 ≤ X < 180.5
Exacte of ware klassengrenzen
Klassegrenzen in de praktijk= klassengrenzen altijd met 1 decimaal meer weergeven dan hoe de
variabele gemeten is zodat voor iedere waarde/score duidelijk is bij welke klasse hij hoort.
Hoogste score - laagste score + 1 hiervan klassen maken
Variatiebreedte= Wanneer waarden oplopen van 14 tot en met 24 is je variatiebreedte: 42-
14=28
Klassenmidden= Klassenmidden is het punt dat precies midden tussen de klassengrenzen ligt:
𝑂𝑛𝑑𝑒𝑟𝑔𝑟𝑒𝑛𝑠+𝑏𝑜𝑣𝑒𝑛𝑔𝑟𝑒𝑛𝑠
o Klassenmidden=
2
Klassenmidden wordt gebruikt bij berekeningen vanuit een gegroepeerde frequentietabel:
klassenmidden wordt toegekend als substituut score aan alle cases binnen een klasse (maar als
beschikbaar: gebruik ruwe data zonder klassenindeling).
Voorbeeld geclassificeerde frequentieverdeling (continue variabele), gemeten met somscores, dus
gehele getallen
Want als je kijkt naar klasse 1-10: bovengrens =
10,5 en ondergrens = 0,5; 10,5 – 0,5 = 10
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Ambervzandbeek. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.89. You're not tied to anything after your purchase.