Statistiek ≠ Wiskunde
Maar we maken wel gebruik van wiskundige inzichten en concepten (“wiskundige
wetenschap”)
Ø Statistiek is de wetenschap van het verzamelen, organiseren en presenteren van
gegevens of data volgens een numerieke logica.
- Historische context.
Statisticum (Latijn) = van de staat; Statista (Italiaans) = staatsman
- Technologische vooruitgang: Rekenmachines software (SPSS, SAS, Stata, R….)
- Secundaire analyse en data archieven
Statistiek
= de wetenschap van het verzamelen, organiseren, presenteren, analyseren en interpreteren
van gegevens of data volgens een numerieke logica.
- Beschrijvende statistiek
- Inferentiële statistiek
Waarom statistiek?
1. Om bestaand onderzoek te begrijpen en te bekritiseren en om je eigen onderzoek te
kunnen uitvoeren.
2. Statistiek is overal!
Paradox 1
Statistici zijn wereldvreemde en saaie ‘number crunchers’ versus de populariteit van
statistische gegevens
Paradox 2
Statistiek is een ‘harde’ wetenschap versus met statistiek kan je alles bewijzen
Paradox 3
Statistiek en wiskundige angst versus het relatief hoge niveau van de wiskundige kennis van
onze studenten
1
, 2/10
H2: Data statistisch onder de loep genomen
2 soorten van statistiek
Beschrijvende statistiek: Het beschrijven van de gegevens van een steekproef of populatie met
behulp van tabellen, grafieken en kengetallen.
Inferentiële statistiek: Op basis van steekproefgegevens uitspraken doen over de populatie.
Variabelen: Kenmerken van
Datamatrix de onderzoekselementen
Onderzoeks
elementen
of cases:
Datgene
waar we
iets over
willen Meetwaarden of observaties:
zeggen Waarde van een onderzoekselement op
een variabele
Voorbeelden datamatrix
Ø 1: welke data van mezelf komt hierin terecht? Ze zijn nooit onschuldig.
Ø 2: cases = landen
Onderzoekselementen (1)
Steekproef (sample) n: De onderzoekselementen vormen een deel van een groter geheel
aan elementen (v.b. 1000 Vlaamse burgers)
Populatie N: Alle mogelijke onderzoekselementen (v.b. alle Vlaamse burgers à Census; staat
tegenover de steekproef)
2
,Onderzoekselementen (2)
Populatie of steekproef?
Ø Tijd en geld
Ø Risico op selectiebias (zeker bij Census)
Ø Steeds meer gebruik van steekproeven, zeker bij grote populaties.
Bias = vertekening in het resultaat van een steekproef.
Sampling (1)
Literary Digest-schandaal (1936)
= over de amerikaanse verkiezingen. 1936. Tussen Alfred lennon en Franklin Rooseveld.
Rooseveld was gewonnen.
= Dit was een tijdschrift dat over elke verkiezing sprak en voorspelde wie het ging halen etc.
LD voorspelde dat Alfred het ging halen, ze stuurden 100den interviews op pad en stuurde
die interviews naar treinen. De kans was veel groter dat mensen meededen. Zij inspecteerde
automobiele registraties.
ð Probleem? Hoe kan je verklaren dat LD ernaast de verkiezingsuitslag zat?
= Rooseveld was een democraat. Alfred was een republikein.
Sampling (2)
Literary Digest: Straw poll
§ Selectiebias
§ = Je strooit zoveel mogelijk formuleren rond. Zo denk je dat het antwoord
goed zal zijn. Als je het meer bij de republikeinen laat terecht komen zal daar
een uitkomst uitkomen.
§ Je moet aselect werken. Juiste aanpak.
George Gallup
§ Enkelvoudige aselecte steekproef (EAS)
§ Random sample
§ Fenomeen dat je wilt bestuderen hangt niet persé samen met de mensen die
je ondervraagt.
§ Steekproef = random – best om een grote steekproef te nemen
Randomness/aselectie is belangrijker dan steekproefgrootte!
Maar als de steekproef random is, is een grote n beter dan een kleine n
Zomertijd/wintertijd
= zij/hij heeft een vraag voorgelegd aan alle Europeanen. 84 procent was er tegen.
3
, Sampling (3): EAS
Undercoverage: niet iedereen heeft een pc, internet…
Selectie bias en non-respons bias: waarom zijn mensen geneigd of niet geneigd om mee te
doen?
Populatie (mogelijke bias)
è Undecoverage
Steekproefkader
è Selectie bias
Steekproef
è Non-respons bias
è Face-to-face, Telefoon,
Vragenlijst
Deelnemers/respondenten
è Respons bias
Sampling (4)
The good:
Ø Enkelvoudige aselecte steekproef: elk individu heeft een even grote kans om
geselecteerd te worden.
Ø Clustersteekproef (genest - tweetrapssteekproef): getrapt aselect werken, lijst maken
van alle x’n, daaruit trekt men een geselecteerde steekproef – dan trekt men daaruit
aselecte individuen. Niveaus zijn genest. Uit verschillende niveaus.
Ø Gestratificeerde steekproef (voorkennis – pres. verk. VS): je maakt gebruik van a
priori voorkennis. Je houdt rekening dat bepaalde groepen apart moeten bevraagd
worden. Je houdt rekening met voorkennis van belang van bepaalde variabelen.
(Bijna alle steekproeven zijn cluster/gestratificeerde die we onderzoeken.)
The bad:
Ø Convenience steekproef: ‘Ik maak het mij gemakkelijk’.
The ugly:
Ø Quota steekproef: vaak aanwezig. Je cumuleert 2 soorten van bias (= vertekening) die
heel verschillend kunnen zijn. Weinig voorbereiding & cheap capitalisme.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller jadesmeulders. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.63. You're not tied to anything after your purchase.