3.1 Assumpties met betrekking tot steekproeven...................................................16
, 3.2 Populatieverdeling vs verdelingen van een steekproef vs steekproevenverdelingen
.......................................................................................................................17
,Maaike Beckers 6
Inleiding
Statistiek is nodig om technieken te leren die je kan gebruiken in de literatuur. Het is
belangrijk om een goede BS-radar te ontwikkelen en het is handig voor je basiskennis
zodat je later geavanceerde statistische technieken kan gebruiken om het beste uit je
data te halen. Methodologie is een onderzeksveld opzich.
1 HC1, H1
1.1 Beschrijvende en inferentiele statistiek
Statistiek is de wetenschap, de methodiek en de techniek van
het verzamelen, bewerken, interpreteren en presenteren van
gegevens. Het gaat altijd over kwantitatieve data.
Statistiek in de empirische cyclus:
Statistiek vindt plaats bij toetsing en bij de observatie.
1.1.1 Beschrijvende statistiek
Deze wordt gebruikt om data samen te vatten. Vaak een voorkeur van een paar cijfers.
Het is een kwantitatieve samenvatting van informatie en data. Hierbij horen verschillende
jargon: gemiddelde, mediaan etc
1.1.2 Inferentiele statistiek
We gebruiken beschrijvende statistiek voor inferentiele statistiek. Deze inferentiele
statistiek gebruiken we om inferenties te maken op basis van data´s, van steekproef
naar een algemenere populatie. De jargon die hierbij hoort is de sampling error,
standaard fout, schatten, confidence intervals. Het gaat dus echt erom dat men de data
wilt generaliseren! Inferentiele statistiek probeert rekening te houden met de
onzekerheid van een random sample. Het is dus niet zo dat als je meerdere samples doet
dat er elke keer hetzelfde resultaat uitkomt (= steekproef fluctuaties).
Als je een slechte steekproef hebt dan krijg je ook een slechte analyse. Statistiek gaat
je niet redden. Het is dus belangrijk dat het design etc goed in elkaar zit.
1.2 Typen random variabelen
Random variabelen zijn variabelen waarvan de uitkomsten het resultaat zijn van iets
met kansen, dit schrijf je als X. Bijvoorbeeld als je een steekproef neemt en je hebt de
proefpersoon nog niet gezien is er 50% kans dat diegene man of vrouw is. We noteren
die random variabelen dus met een X en soms met een Y. Specifieke uitkomsten, een
specifieke waarde van die variabele, wordt een kleine letter x of y. Dus bijvoorbeeld
leeftijd = X, en X4 = 23 (de 4de proefepersoon is 24 jaar oud).
, Maaike Beckers 7
Je kan niet rekenen met tekst, alleen met cijfers. Zo kan je niet met ´man/vrouw´
werken. We moeten die random variabelen dus kwantificeren, cijfers toekennen aan elke
mogelijke uitkomst. Het meetniveau van een variabele bepaalt wat voor betekenis de
nummers die we toewijzen hebben. Je kan man dus 0 geven en vrouw 1, dan kan je er
wel mee rekenen. Het meetniveau bepaalt dus de betekenis. We hebben 4 verschillende
meetniveaus die cumulatief zijn. Elke level heeft dus de eigenschappen van de vorige
levels. Dus interval heeft eigenschappen van nominaal en ordinaal. Het meetniveau van
de variabele bepaalt welke analyses je wel of niet kan toepassen.
Nominaal
Hierbij wijzen we mutueel exclusieve getallen toe aan de mutueel exclusieve
uitkomsten. Mutueel exclusief betekent dat als je in de ene categorie zit, je niet
ook in de andere kan zitten.
VB: Man, vrouw: o, 1 (Je wijst dus een getal toe aan elke categorie, maakt niet
uit welk getal)
Ordinaal
1. Dus eerst wijs de mutueel exclusieve getallen toe aan de mutueel exclusieve
uitkomst.
2. Er is een betekenisvolle volgorde in de mogelijke uitkomsten. Die getallen
moeten dus ok die volgorde aanhouden.
VB: laag, medium, hoog: 0, 1, 2 of likertschaal 0, 1, 2, 3, 4
Je mag een ordinale variabele behandelen als een interval variabele als het
meer dan 5-7 schalen heeft. Omdat hoe meer variabelen je hebt hoe minder het
verschil tussen de afstanden uitmaakt.
Interval
1. Eerst toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten.
2. Er is een betekenisvolle volgorde in de mogelijke uitkomsten.
3. De intervallen tussen elk van de geordende uitkomsten is betekenisvol en
dezelfde grootte.
VB: temperatuur in graden celsius (niet heel veel voorbeelden). De afstanden
tussen de ordinale variabelen moet gelijk zijn. als er bijvoorbeeld een race is en
de 1ste is 1 minuut sneller dan de 2 de maar de 2de is 2 minuten sneller dan de 3 de
dan is het geen interval variabele want de afstanden zijn niet evengroot.
Ratio
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller maaikebeckerss. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.90. You're not tied to anything after your purchase.