In dit document komen de colleges van Hoekstra (bachelor) en Kramer (pre-master) samen. Zowel alle powerpoints van Nestor als de pdf's en colleges van de pre-master zijn hierin opgenomen. Zo vormt dit document een compleet beeld van alle kennis voor het tentamen!
Herhaling Kramer inleiding onderzoek
Inleiding onderzoek: beschrijvingen geven van verdelingen van scores op variabelen in een dataset
Univariate beschrijvingen (je hebt 1 variabele die je bekijkt)
• Boxplot, histogram, stemplot
• Gemiddelde, mediaan, modus
• SD, range, IQR
• Frequentietabellen
Bivariate beschrijvingen (je bekijkt de verhouding van twee variabele tot elkaar)
• Spreidingsdiagram, kruistabellen
• Correlatie, gowers, rho, tau, kappa
Drie soorten kenmerken/variabelen
1. Onafhankelijke variabelen: hebben gevolgen maar zijn geen gevolgen
Vb: al dan niet bijles hebben gehad
2. Afhankelijke variabelen: zijn gevolg
Vb: behaalde tentamencijfers
Causaliteit: bijles veroorzaakt tentamencijfer (Schematisch: A → B)
Niet causaal schematisch: A – B
3. Indirecte controlevariabelen: kenmerken die te onderzoeken relatie beïnvloeden
Vb: collegeaanwezigheid
Meetniveau van een variabele
Soort variabele Meetniveau
Categorische variabelen (ook wel kwalitatieve Nominaal
variabelen genoemd) Ordinaal
Kwantitatieve variabelen Interval
Ratio
➢ Meetniveau ligt niet vast, gebruiker kiest meetniveau
➢ Geeft aan welke informatie in scores op variabele je serieus neemt
Een eerste blik op data (beschrijvend)
Inspecteer scores per variabele
1. Grafisch / Frequentietabel: eerst plaatjes maken. Je zoomt in op het deel waar scores
zichtbaar zijn en uitschieters rapporteer je apart.
2. Samenvattingsmaten: nu ga je dingen uitrekenen.
a. Centrummaten (mediaan, gemiddelde, mode)
b. Spreidingsmaten
i. Spreidingsmaten gebaseerd op hoever scores van elkáár afliggen: Range, Five
number summary, IQR
ii. Spreidingsmaten gebaseerd op hoever scores van gemiddelde afliggen:
Variantie, Standaarddeviatie
Let hierbij op:
1. Verdeling van scores (vorm, uitbijters)
2. Centrum (‘midden’) van scores
3. Spreiding van scores
,Gemiddelde, mediaan, modus
➢ Verdeling symmetisch: mediaan = gemiddelde = modus
➢ Verdeling niet symmetisch = scheve verdeling = mediaan en gemiddelde niet gelijk.
Gemiddelde < mediaan = staart aan de linkerkant (linksscheve verdeling).
Gemiddelde > mediaan = staart aan de rechterkant (rechtsscheve verdeling)
➢ Verdeling scheef? GEMMEDIAANMODUS
Grafische weergave boxplot
Variantie (tussenstap naar standaarddeviatie)
1. Bereken de gemiddelde scoren
2. Bereken de afwijkingen tussen individuele
scores en gemiddelde
3. Bereken het gemiddelde van gekwadrateerde afwijkingen
• Door te kwadrateren tellen extreme scores zwaarder mee
• Uitkomst vertelt je wat de gemiddelde gekwadrateerde afstand
tot het gemiddelde is… wordt daarom alleen gebruikt om mee
door te rekenen → zie volgende
,Variantie en standaarddeviatie
Variantie: Standaarddeviatie:
➢ Let op: Delen door N- 1 (statische reden)
➢ De standaarddeviatie vertelt je dan wat (globaal genomen) de ongekwadrateerde
gemiddelde afstand tot het gemiddelde is. Een grotere standaarddeviatie staat dan dus gelijk
met meer spreiding in scores bij de variabele
Verdelingen – Curves
Curve beschrijft het verloop van de staven ‘heel aardig’.
➢ Soms teken je in een grafiek een curve. Dit hoeft niet helemaal perfect te zijn, maar het
verloop van bijv. staven aardig beschrijven.
➢ Wiskundig model
➢ Ondervangt nadelen van de histogram: je kunt heel makkelijk rekenen welk deel van de
mensen in een bepaald deel of interval passen. Relatief eenvoudig uit te rekenen.
➢ Geeft aan hoeveel van de scores in een willekeurig te kiezen interval vallen
➢ Altijd boven de x-as
➢ Totale oppervlakte onder de curve is op 1 gesteld.
➢ Oppervlakte boven een bepaald interval geeft aan welk deel van de scores in dat specifieke
interval viel.
➢ Curve geeft geen frequenties/getallen. Y-waarde zelf is niet interpreteerbaar. Je moet alleen
naar oppervlaktes onder de curve kijken. Je weet niet hoeveel mensen in een bepaald
gebied/oppervlakte zitten, maar wel welk deel van de mensen.
Voordelen van dichtheidscurve
1. Je kan eenvoudig bepalen hoeveel van de scores in een willekeurig te kiezen interval vallen
2. Je zit niet vast aan de frequentie per klasse van scores
Nadeel: afhankelijk van dikte staafjes.
Kenmerken dichtheidscurve
1. Ligt altijd boven de X-as
2. Totale oppervlakte onder de curve is 1 (= 100%)
3. Oppervlak onder de curve voor een bepaald interval van waarden geeft aan welk deel van de
scores in dit interval valt = ‘dichtheid’ van scores in dat interval
, NB: dichtheidscurve geeft geen frequenties
➢ Y-waarde zelf niet interpreteerbaar
➢ Alleen naar oppervlaktes onder de curve kijken
Symmetrische (unimodale) verdeling
➢ Gemiddelde = mediaan = modus
➢ Standaarddeviatie (s) = afstand tussen midden en buigpunt
Normale verdelingen
➢ Er is niet 1 normale verdeling, maar een hele klasse
➢ Met verschillen in gemiddelde () en standaardafwijking ()
Wat is er zo belangrijk aan die normale verdelingen?
➢ Veel verdelingen in de praktijk (bijv. IQ, lengte per geslacht) zijn ongeveer normaal
➢ Uitkomsten van kansprocessen vaak vrijwel normaal verdeeld
➢ Nuttig bruikbaar bij bepaling van onzekerheidsmarges van betrouwbaarheidsintervallen
(statistische modellen 1)
➢ Ze hebben algemene eigenschappen. Je kunt daar altijd van op aan en mee rekenen.
Echter: ook veel verdelingen in de praktijk zijn niet normaal, maar wel interessant.
Hoe controleer je of verdeling ongeveer normaal is?
1. Maak een histogram en kijk of je ‘klokvorm’ hebt
Maar: histogram is sterk afhankelijk van intervalbreedte (breedte staafjes)
2. Gebruik daarom: ‘Normal Quantile Plot’
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller AMBR. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.26. You're not tied to anything after your purchase.