Hi! Dit zijn aantekeningen van het vak statistiek. Het eerste college ontbreekt omdat dit een introductiecollege was zonder inhoudelijke stof. College 9 is niet helemaal compleet, maar daar is de prijs ook naar. Succes!
College 2:
Cases of units: subjecten of objecten: deelnemers van onderzoek: dieren, mensen, klassen, scholen.
Variabele: kenmerk van een case. Kan verschillende waarden aannemen
- Kwalitatieve/ categorische variabelen: leeftijdsgroep (kleuter, puber, volwassen), plaats in
het gezin ( jongste, middelste, oudste) of cito score A, B, C
2 meetniveaus:
Nominaal (categorisch): geen volgorde, geen meeteenheid en geen nulpunt (bijv.
sekse)
Ordinaal (categorisch): wel volgorde, geen meeteenheid en geen nulpunt (bijv. SES as
laag, middel, hoog.
- Kwantitatief: de waarde kan in een getal worden uitgedrukt: leeftijd, IQ score etc.
Interval:( wel een volgorde, wel een meeteenheid en geen vast nulpunt (gelijke
afstanden tussen de intervallen bijv. temperatuur)
Ratio: wel een volgorde, wel een meeteenheid en een vast nulpunt. (bijv. leeftijd) je
zou het kunnen verdubbelen.
Label: speciaal soort variabele om cases of units uniek van elkaar te omschrijven. Bijvoorbeeld
leerling nummer. Unieke waarde voor ieder persoon
Verdelingen: verschillende weergaven
Je begint met een grafische weergave:
- Verdeling van een variabele: hierin zie je welke waarden voorkomen en hoe vaak deze
voorkomen. De keuze hangt af van het type variabele.
Voor kwalitatieve/ categorische variabelen (nominaal of ordinaal) heb je pie chart of bar
graph = taartdiagram of staafdiagram.
Voor kwantitatieve variabelen:
1. Histogram ( zie plaatje 2): meest gebruikte weergave voor kwantitatieve variabelen.
Verschillende vormen: symmetrisch, left skewed of right skewed.
2. Steelblad (zie plaatje 1) Bij grote aantallen wordt dit al snel onoverzichtelijk.
Daarna geef je een numerieke samenvatting: beschrijven met cijfers.
Je hebt er 3 centrummaten:
- Modus: meest voorkomende score. Gebruiken bij nominale, ordinale en ook bij de 2
kwantitatieve.
- Mediaan: middelste score, je hebt een rangorde nodig. Dus alleen te berekenen voor
ordinale variabele en voor de interval en ratio. 50 procent van de scores zijn hoger en 50
procent van de scores zijn lager.
.
, Te berekenen door de data te ordenen. (n+1)/2
- Gemiddelde: vraagt om een getal. Te berekenen voor interval en ratio.
- Interkwartiel range (IQR): verschil tussen 3e en 1e kwartiel (boxplot)
Outliers berekenen: Q3 +( 1,5 x IQR) ( alle scores hoger dan deze uitkomst zijn outliers aan
de bovenkant)
of Q1 – (1,5 x IQR) (alle scores hoger dan deze uitkomst zijn outliers aan de onderkant)
Standaarddeviatie berekenen:
1. Bereken het gemiddelde van scores
2. Bekijk voor elke score de afwijking van het gemiddelde
3. Kwadrateer al deze afwijkingen en tel dat bij elkaar op
4. Deel door n-1 nu heb je de variantie
5. Trek de wortel daarvan nu heb je de standaarddeviatie
Hoe groter die is, hoe groter de spreiding.
Discrete variabelen: de waarden bestaan uit beperkte getallen. Zoals bijvoorbeeld een cijfer op een
toets. Je haalt bijvoorbeeld niet een 6,2364234
Continue variabelen: er zijn heel veel tussenwaarden mogelijk. Bijvoorbeeld bij tijd.
College 3
Relaties tussen variabelen
Vraag: als X veranderd, wat doet Y dan?
2 manieren om relaties tussen 2 variabelen weer te geven:
- Twee-wegs tabel/ kruistabellen (categorische
variabelen)
Kolommen en rijen, die beiden een variabele
vertegenwoordigen.
Marginalen: randen van de kolommen en de rijen.
Joint distribution: alle cellen samen, dus totale
aantal is 100 procent.
Marginal distribution: het aandeel van een kolom of rij ten opzichte van het totaal in
percentage.
Conditional distribution: het percentage van een cel ten opzichte van het marginaal. Zie
plaatje.
- Scatterplot (2 kwantitatieve continue variabelen)
Continu: heel veel tussenwaarden mogelijk. Bijvoorbeeld tijd: jaren, maanden, weken, dagen
etc.
Discreet: beperkt aantal waarden komt voor, bijvoorbeeld alleen hele getallen
X as: onafhankelijke variabele (explanitory/predictor/independent) is de verklarende
variabele.
Y as: afhankelijke variabel (response/creterion/dependent) is het gevolg van de
onafhankelijke variabele.
In theorie kunnen deze twee variabelen ook omgedraaid worden.
Aan de vorm kan je een aantal dingen afleiden:
Is het lineair: er is sprake van een rechte lijn
Richting: positief of negatief? Positief betekent dat hoge waarden op de ene waarde
gaan samen met hoge waarden op de andere variabele. Of lage waarden op de ene is
.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller sifragraaf. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.24. You're not tied to anything after your purchase.