In dit document komen de colleges van Hoekstra (bachelor) en Kramer (pre-master) samen. Zowel alle powerpoints van Nestor als de pdf's en colleges van de pre-master zijn hierin opgenomen. Zo vormt dit document een compleet beeld van alle kennis voor het tentamen!
Herhaling Kramer inleiding onderzoek
Inleiding onderzoek: beschrijvingen geven van verdelingen van scores op variabelen in een dataset
Univariate beschrijvingen (je hebt 1 variabele die je bekijkt)
• Boxplot, histogram, stemplot
• Gemiddelde, mediaan, modus
• SD, range, IQR
• Frequentietabellen
Bivariate beschrijvingen (je bekijkt de verhouding van twee variabele tot elkaar)
• Spreidingsdiagram, kruistabellen
• Correlatie, gowers, rho, tau, kappa
Drie soorten kenmerken/variabelen
1. Onafhankelijke variabelen: hebben gevolgen maar zijn geen gevolgen
Vb: al dan niet bijles hebben gehad
2. Afhankelijke variabelen: zijn gevolg
Vb: behaalde tentamencijfers
Causaliteit: bijles veroorzaakt tentamencijfer (Schematisch: A → B)
Niet causaal schematisch: A – B
3. Indirecte controlevariabelen: kenmerken die te onderzoeken relatie beïnvloeden
Vb: collegeaanwezigheid
Meetniveau van een variabele
Soort variabele Meetniveau
Categorische variabelen (ook wel kwalitatieve Nominaal
variabelen genoemd) Ordinaal
Kwantitatieve variabelen Interval
Ratio
➢ Meetniveau ligt niet vast, gebruiker kiest meetniveau
➢ Geeft aan welke informatie in scores op variabele je serieus neemt
Een eerste blik op data (beschrijvend)
Inspecteer scores per variabele
1. Grafisch / Frequentietabel: eerst plaatjes maken. Je zoomt in op het deel waar scores
zichtbaar zijn en uitschieters rapporteer je apart.
2. Samenvattingsmaten: nu ga je dingen uitrekenen.
a. Centrummaten (mediaan, gemiddelde, mode)
b. Spreidingsmaten
i. Spreidingsmaten gebaseerd op hoever scores van elkáár afliggen: Range, Five
number summary, IQR
ii. Spreidingsmaten gebaseerd op hoever scores van gemiddelde afliggen:
Variantie, Standaarddeviatie
Let hierbij op:
1. Verdeling van scores (vorm, uitbijters)
2. Centrum (‘midden’) van scores
3. Spreiding van scores
,Gemiddelde, mediaan, modus
➢ Verdeling symmetisch: mediaan = gemiddelde = modus
➢ Verdeling niet symmetisch = scheve verdeling = mediaan en gemiddelde niet gelijk.
Gemiddelde < mediaan = staart aan de linkerkant (linksscheve verdeling).
Gemiddelde > mediaan = staart aan de rechterkant (rechtsscheve verdeling)
➢ Verdeling scheef? GEMMEDIAANMODUS
Grafische weergave boxplot
Variantie (tussenstap naar standaarddeviatie)
1. Bereken de gemiddelde scoren
2. Bereken de afwijkingen tussen individuele
scores en gemiddelde
3. Bereken het gemiddelde van gekwadrateerde afwijkingen
• Door te kwadrateren tellen extreme scores zwaarder mee
• Uitkomst vertelt je wat de gemiddelde gekwadrateerde afstand
tot het gemiddelde is… wordt daarom alleen gebruikt om mee
door te rekenen → zie volgende
,Variantie en standaarddeviatie
Variantie: Standaarddeviatie:
➢ Let op: Delen door N- 1 (statische reden)
➢ De standaarddeviatie vertelt je dan wat (globaal genomen) de ongekwadrateerde
gemiddelde afstand tot het gemiddelde is. Een grotere standaarddeviatie staat dan dus gelijk
met meer spreiding in scores bij de variabele
Verdelingen – Curves
Curve beschrijft het verloop van de staven ‘heel aardig’.
➢ Soms teken je in een grafiek een curve. Dit hoeft niet helemaal perfect te zijn, maar het
verloop van bijv. staven aardig beschrijven.
➢ Wiskundig model
➢ Ondervangt nadelen van de histogram: je kunt heel makkelijk rekenen welk deel van de
mensen in een bepaald deel of interval passen. Relatief eenvoudig uit te rekenen.
➢ Geeft aan hoeveel van de scores in een willekeurig te kiezen interval vallen
➢ Altijd boven de x-as
➢ Totale oppervlakte onder de curve is op 1 gesteld.
➢ Oppervlakte boven een bepaald interval geeft aan welk deel van de scores in dat specifieke
interval viel.
➢ Curve geeft geen frequenties/getallen. Y-waarde zelf is niet interpreteerbaar. Je moet alleen
naar oppervlaktes onder de curve kijken. Je weet niet hoeveel mensen in een bepaald
gebied/oppervlakte zitten, maar wel welk deel van de mensen.
Voordelen van dichtheidscurve
1. Je kan eenvoudig bepalen hoeveel van de scores in een willekeurig te kiezen interval vallen
2. Je zit niet vast aan de frequentie per klasse van scores
Nadeel: afhankelijk van dikte staafjes.
Kenmerken dichtheidscurve
1. Ligt altijd boven de X-as
2. Totale oppervlakte onder de curve is 1 (= 100%)
3. Oppervlak onder de curve voor een bepaald interval van waarden geeft aan welk deel van de
scores in dit interval valt = ‘dichtheid’ van scores in dat interval
, NB: dichtheidscurve geeft geen frequenties
➢ Y-waarde zelf niet interpreteerbaar
➢ Alleen naar oppervlaktes onder de curve kijken
Symmetrische (unimodale) verdeling
➢ Gemiddelde = mediaan = modus
➢ Standaarddeviatie (s) = afstand tussen midden en buigpunt
Normale verdelingen
➢ Er is niet 1 normale verdeling, maar een hele klasse
➢ Met verschillen in gemiddelde () en standaardafwijking ()
Wat is er zo belangrijk aan die normale verdelingen?
➢ Veel verdelingen in de praktijk (bijv. IQ, lengte per geslacht) zijn ongeveer normaal
➢ Uitkomsten van kansprocessen vaak vrijwel normaal verdeeld
➢ Nuttig bruikbaar bij bepaling van onzekerheidsmarges van betrouwbaarheidsintervallen
(statistische modellen 1)
➢ Ze hebben algemene eigenschappen. Je kunt daar altijd van op aan en mee rekenen.
Echter: ook veel verdelingen in de praktijk zijn niet normaal, maar wel interessant.
Hoe controleer je of verdeling ongeveer normaal is?
1. Maak een histogram en kijk of je ‘klokvorm’ hebt
Maar: histogram is sterk afhankelijk van intervalbreedte (breedte staafjes)
2. Gebruik daarom: ‘Normal Quantile Plot’
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper AMBR. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,89. Je zit daarna nergens aan vast.