In deze samenvatting wordt een korte herhaling gegeven over statistiek 1 & 2, die de basis vormen voor de rest van de theorie die behandeld wordt in statistiek 3. In deze samenvatting komen belangrijke begrippen terug, die wellicht een beetje zijn weggezakt. Altijd fijn om een samenvatting als deze...
Statistiek is de wetenschap van het verzamelen, organiseren en interpreteren van
numerieke feiten, die we data noemen.
Stappen voor het toepassen van statistiek:
1. Selecteren van een steekproef uit de populatie.
2. Beslissen of een steekproef representatief is.
3. Het doen van beschrijvende statistiek of inferentiële statistiek.
4. Meetniveaus (NOIR) en typen variabelen (categorisch/kwantitatief).
5. Kiezen van de juiste statistische analyse.
6. Experimenteel onderzoeksdesign versus een niet-experimenteel onderzoeksdesign
Methoden vakken gaan over design van onderzoek, statistiek is je toolkit voor het uitvoeren
van onderzoek.
Statistiek is van belang in pedagogische wetenschappen, er is belang bij goed empirisch
onderzoek.
→ In de pedagogiek kan je te maken krijgen met regression to the mean, dit houdt
in dat als onderzoek nogmaals wordt uitgevoerd, de effecten minder extreem zijn
(meer gemiddeld) dan in eerste instantie leek. Dit statistische feit kan ertoe leiden dat
interventies voor zeer effectief worden aangenomen, maar die na een tweede keer
testen minder effectief zijn dan in eerste instantie werd gedacht.
Statistiek bestaat uit methoden voor het verzamelen en analyseren van data om…:
→ Een onderzoeksstudie op te zetten → Uitkiezen van een design (dit is wat je leert
bij methodologie vakken)
→ Data te beschrijven (beschrijvende statistiek)
→ Conclusies te trekken o.b.v. de data (inferentiële statistiek)
Belangrijke concepten in statistiek
Beschrijvende statistiek (descriptive statistics): De populatie/steekproef samenvatten
d.m.v. grafieken, tabellen, etc.
Inferentiële statistiek (inferential statistics): Doet voorspellingen over populatie parameters,
a.d.h.v. (random) steekproefdata (je wilt uitspraken doen over de populatie en deze
uitspraken baseer je op een willekeurige steekproef).
Populatie: De totale set van participanten die relevant zijn voor de onderzoeksvraag
→ Bijv. Populatie parameter: Gemiddelde uur aan zelfstudie per week voor alle
studenten.
Steekproef (sample): Een subset van de populatie waar je data van verzameld (ofwel een
willekeurige selectie van je populatie).
→ Bijv. Steekproef statistiek: Gemiddelde uren aan zelfstudie per week van een
random geselecteerde steekproef van 800 studenten.
Om correcte uitspraken te doen over je populatie is het van belang dat je goede data hebt en
dus ook een goede steekproef, dit kan je samenvatten in 2 verschillende dimensies:
→ Betrouwbaarheid (reliability): Gaat over precisie / mate van consequentie
→ Validiteit (validity): Gaat over bias / storing (meet je gemiddeld genomen wat je
wilt meten?)
,Beschrijvende statistiek
Variabele: Meet kenmerken die kunnen verschillen tussen subjecten.
Meetschalen (NOIR):
Categorisch/kwalitatief:
→ Nominaal: Ongeordende categorieën, volgorde in categorieën maakt niet uit (bijv.
oogkleur, geslacht, etc.)
→ Ordinaal: Geordende categorieën, volgorde speelt wel een rol bij de categorieën
(bijv. niet mee eens/neutraal/mee eens)
Kwantitatief/numeriek:
→ Interval: Gelijke afstand tussen waarden (bijv. graden Celsius)
→ Ratio: Absoluut nulpunt (bijv. leeftijd)
Range = bereik van een de variabele
→ Discreet: Meeteenheid die ondeelbaar is, je kan geen halve hebben (bijv. aantal
broers of zussen; je kan niet anderhalve broer hebben)
→ Continue: Oneindig deelbare meeteenheid (ofwel oneindig nauwkeurig meten;
heel veel cijfers achter de komma zijn mogelijk) (bijv. lichaamslengte)
Drie belangrijke dimensies bij beschrijvende statistiek:
→ Central tendency: Typische observatie, wat komt het meest voor? (als je naar je
data kijkt en je zou er een observatie uit moeten pikken die het meest zegt over je
data)
Maten: Gemiddelde, Modus, Mediaan
→ Dispersion (spreiding): Variatie in observaties
Maten: Standaard deviatie, Variantie, Interkwartiel range
→ Position: Relatieve positie van observatie(s) (als je twee observaties eruit pikt wat
is dan de relatieve positie?)
Maten: Percentiel, Kwartiel
, Deze twee verdelingen hebben hetzelfde gemiddelde (central tendency) maar verschillen in
spreiding (dispersion); land A heeft meer spreiding dan land B (variantie en
standaarddeviatie verschillen dus).
Inferentiële statistiek
Doel van inferentiële statistiek: Betrouwbare en valide verklaringen/conclusies over de
populatie gebaseerd op de steekproef.
→ Steekproef statistiek zou hierbij niet moeten verschillen van de populatie
parameters.
Problemen bij inferentiële statistiek
Problemen die we hebben bij inferentiële statistiek hebben vooral betrekking op de
steekproef die gebruikt wordt.
→ Sampling error: Fout in de steekproef (denk aan standaardfout). Dit is de
natuurlijke variatie omdat je willekeurig een steekproef trekt. De ene keer zit je iets
dichter bij de populatie parameter dan de andere keer. Dit is gewoon de fout omdat je
een steekproef gebruikt en dit is ook niet zo’n groot probleem.
→ Sampling bias: Een storing in het trekken van je steekproef door selectief een
steekproef te trekken (Bijv. Je wilt de politieke voorkeur van de Nederlandse
bevolking achterhalen, maar je bevraagt hierover alleen Nederlanders in de
Randstad. Dit geeft jou geen representatief beeld van de politieke voorkeur van de
gemiddelde Nederlander).
→ Response bias: Participanten geven onjuiste antwoorden (Bijv. participant geeft
aan dat hij op partij A stemt, terwijl hij in werkelijkheid op partij B stemt).
→ Non-Response bias: Selectieve participatie (Bijv. jongeren zijn minder geneigd je
vragenlijst in te vullen, waardoor je gemiddelde leeftijd hoger ligt dan in je populatie)
Er is een belangrijk verschil tussen betrouwbaarheid (error) en validiteit (bias).
→ Betrouwbaarheid gaat meer over je standaardfout en statistische power
(onderscheidend vermogen van je test en de grootte van je steekproef).
→ Validiteit gaat echt over een storing (bias) in je steekproef
Verschillende verdelingen
Populatieverdeling (population distribution): Bijv. de proportie studenten die extra onderwijs
nodig hebben voor wiskunde (deze schat je a.d.h.v. je steekproef d.m.v. inferentiële
statistiek).
Data verdeling in je steekproef (sample data distribution): Bijv. de proportie studenten in de
steekproef (n = 1000) die extra onderwijs nodig hebben voor wiskunde
→ A.d.h.v. de steekproef schat je de populatieverdeling
Steekproevenverdeling (sampling distribution): Verdeling van de schatters (elke keer dat je
een verschillende steekproef trekt heb je een bepaalde schatter, elke keer is deze schatter
net iets anders en een verdeling van al deze schatters is je steekproevenverdeling).
→ De standaarddeviatie van de steekproevenverdeling noem je ook wel de
standaardfout en dit zegt iets over de betrouwbaarheid van je schatter.
Standaarddeviatie
π = proportie
√ π (1−π )
n
Deze formule staat op het formuleblad
Centrale limiet theorie (voor steekproevenverdeling)
Als je gaat testen wil je een standaard normaal verdeling gebruiken
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lisaroos2001. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.95. You're not tied to anything after your purchase.