In dit document vind je alle college aantekeningen van Ilja Cornelisz zijn hoorcollege. Hierbij is alles overgenomen van de powerpoint en hieraan zijn verduidelijkingen aan toegevoegd, waardoor alles begrijpelijk is.
Legenda aantekeningen
Begrippen – Dikgedrukt en blauw
Voorbeeld – Schuin
Namen – Onderstreept
Tussenkopjes - Dikgedrukt
Samenvatting
Hoorcollege 1: Kansverdeling en statistiek
Gebruik en misbruik van statistiek: visualisatie van data
Statistische geletterdheid ‘is het vermogen om statistische resultaten die ons dagelijks leven
doordringen te begrijpen en kritisch te evalueren – gekoppeld aan het vermogen om de bijdragen te
waarderen die statistisch denken kan leveren aan publieke en private, professionele en persoonlijke
beslissingen’ (Wallman, 1993).
Een gebrek aan statistische kennis kan gemakkelijk leiden tot “misverstanden, misvattingen,
wantrouwen en twijfels over de waarde van statistieken als leidraad bij publieke en private keuzes”
(Wallman, 1993).
Vooruitgang in het gebruik van statistieken gaat hand in hand met een toename van misbruik en
statistische misvattingen (Hooke, 1983)
Kansrekening gaat veelal uit van deductie. Gegeven dat we alle details weten van een bepaalde
populatie, hoe waarschijnlijk is dan een bepaalde (steekproef-)uitkomst? (i.e. algemeen -> specifiek).
Statistiek gaat veelal uit van inductie. Gegeven een bepaalde (steekproef-) uitkomst, wat kunnen we
dan met welke waarschijnlijkheid zeggen over de populatie? (i.e. specifiek -> algemeen).
Wat zegt de steekproef over de populatie?
Kansverdeling Statistiek
Algemeen naar specifiek Specifiek naar algemeen
Populatie naar steekproef Steekproef naar populatie
Model naar Data Data naar model
Overeenkomsten
Houden allebei rekening met toeval (randomness)
Zelfde technieken (bijvoorbeeld gemiddelde) voor zowel steekproef als populatie
Statistiek maakt aannames over populatie (bijvoorbeeld nulhypothese) om deze op basis van
een steekproef te kunnen weerleggen (falsificeren) - Als het onwaarschijnlijk is dat de
nulhypothese klopt, dan verwerpen we dat deze waar is.
Definitie Statistiek
Methodologie is hoe je empirisch onderzoek zou moeten uitvoeren.
, “Statistiek is de wetenschap van het verzamelen, organiseren en interpreteren van
numerieke feiten, die gegevens of data worden genoemd.” - Het instrumentarium om
empirisch onderzoek uit te kunnen voeren.
A&F: Statistiek bestaat uit een geheel van methoden voor het verkrijgen en analyseren van
gegevens
Beschrijvende Statistiek vatten steekproef- of populatiegegevens samen met cijfers, tabellen en
grafieken. (Zeker over resultaten in de steekproef.)
Inferentiële Statistiek maken voorspellingen over populatieparameters, op basis van
voorbeeldgegevens. (Kleine onzekerheid.)
Onderzoeksvraag en data
Q: Hoe hoog is de werkdruk van Statistiek 1?
Onderzoeken met behulp van data: observaties van karakteristieken
Populatie: de totale set van deelnemers, relevant voor de onderzoeksvraag
Voorbeeld populatiegrootheid (parameter): gemiddeld aantal uren zelfstudie per week
Parameter is een numerieke samenvatting van de populatie
Steekproef: een deel van de populatie waarover data verzameld is
Voorbeeldsteekproefgrootheid (statistic): gemiddeld aantal uren zelfstudie per week
Goede statistiek is:
-> Betrouwbaar (reliable): Er komt bij elke
meting hetzelfde uit
-> Valide (valid): Meet je wat je wilt meten? Hoe
representatief zijn de mensen die meedoen aan
je steekproef naar de populatie toe?
Variabele: gemeten karakteristiek die kan verschillen tussen subjecten
Soorten: gedrags-, stimulus-, subject-, fysiologische-variabelen
Meetniveaus (NOIR):
1. Categorisch/kwalitatief (categorical/qualitative)
-> Nominaal (nominal) : ongeordende categorieën (kleur ogen of politieke partijen)
-> Ordinaal (ordinal) : geordende categorieën (opleiding Niveau of Likertschaal)
2. Kwantitatief/numeriek (quantitative/numerical)
-> Interval (interval) : gelijke afstand tussen opeenvolgende waarden (°C of Lickertschaal als je de
bijvoegelijknaamwoorden een cijfer geeft)
-> Ratio (ratio): gelijke afstand én absoluut nulpunt (K)
Waardenbereik:
-> Discreet (discrete): eindig ondeelbare meeteenheid
(hoeveelheid broers/zussen)
-> Continu (continuous): oneindig deelbare meeteenheid (lichaamslengte)
,Inferentiële statistiek; Op basis van een
steekproef uitspraken doen over gehele
(doel-)populatie.
Verschil tussen gemeten steekproefgrootheid
en populatiegrootheid:
Door natuurlijke variatie (toeval)
tussen steekproeven
Door problemen/fouten met/binnen
de steekproef
Steekproefproblemen bij inferentiële statistiek
Doel: betrouwbare en valide uitspraken over populatie obv een steekproef
-> Steekproefgrootheden dienen dan niet te verschillen van populatiegrootheden
Problemen:
-> Steekproeffout (sampling error) - “toevallige steekproefverschillen”
-> Steekproefvertekening (sampling bias) - “selectieve werving”
-> Meetfout (response bias) - “incorrect antwoord”
-> Selectieve respons (non-response bias) - “selectieve deelname”
Oplossing:
-> “Een aselecte (of andere probabilistische) steekproef van voldoende omvang die informatie (data)
oplevert over iedereen die benaderd is, met correcte responses voor alle subjecten op alle items.”
Voorbeelden
Steekproefvertekening (sampling bias)
-> Bijvoorbeeld Landon vs. Roosevelt — 1936 Literary Digest verzamelde liefst 2.4 miljoen
antwoorden onder eigen lezers, car club members en huishoudens geregistreerd in het telefoonboek.
Meetfout (response bias)
-> Bijvoorbeeld sociale wenselijkheid, neutraal antwoord op Likert-schaal, suggestieve of onduidelijke
vraagstelling
Selectieve respons (non-response bias)
-> Bijvoorbeeld bereidheid tot participatie, gevoelige informatie
Steekproeffout (sampling error)
-> Bijvoorbeeld kleine steekproef uit grote populatie
, Hoorcollege 2: Steekproefmethode
Een oplossing kan zijn door een aselecte (of andere probabilistische) steekproef van voldoende
omvang die informatie (data) oplevert over iedereen die benaderd is, met correcte responses voor
alle subjecten op alle items.
Steekproefmethode
Kiezen tussen de steekproefmethoden hangt af van
I. Samenstelling doelpopulatie
II. Onderzoeksvraag
III. Haalbaarheid van de te vormen steekproef.
1. Enkelvoudige aselecte steekproef (simple random sampling)
Kenmerken
Elke combinatie van deelnemers heeft evenveel kans om steekproef te vormen.
Haalbaar als participanten vanuit gehele doelpopulatie benaderbaar zijn.
Vereist groot aantal willekeurige getallen om steekproef te bepalen.
Stap 1: stel steekproefkader vast (sampling frame), een lijst met alle studentnamen uit de
studentadministratie
Stap 2: trek willekeurig/aselect steekproef van n deelnemers, een nummer toewijzen aan iedere
student en dan met n willekeurige getallen studenten kiezen voor steekproef
2. Systematisch aselecte steekproef (systematic random sampling)
Kenmerken
Niet elke combinatie van deelnemers heeft evenveel kans om steekproef te vormen
Eenvoudig om uit te voeren en vaak goede representativiteit
Stap 1: stel steekproefkader vast (sampling frame)
Stap 2: bepaal stapgrootte k=N/n “skip number”. Steekproef n=4, populatie N=20, k=20/4=5
Stap 3: kies eerste deelnemer aselect en bepaal vervolgens deelnemers met deze stapgrootte k:.
Voor eerste student willekeurig nummer bepalen (bv. 3) en dan elke k ’e student includeren.
3. Gestratificeerde steekproef (stratified random sampling)
Kenmerken
Op voorhand expliciete groepen die met elkaar vergeleken
worden
Binnen iedere groep (stratum) wordt steekproef getrokken
Kan proportioneel of disproportioneel
Handig met name bij vergelijken groepen die verschillen in
omvang
Stap 1: stel steekproefkader op
Stap 2: verdeel populatie in strata, ‘jongens’ en ‘meiden’
Stap 3: trek aselect uit ieder stratum, 2 jongens en 2 meiden
4. Cluster steekproef (cluster sampling)
Kenmerken
Niet elke combinatie van deelnemers heeft evenveel kans om
steekproef te vormen.
Een steekproef van bestaande clusters.
Handig als het niet haalbaar is om deelnemers uit alle clusters te
benaderen.
Stap 1: stel steekproefkader op
Stap 2: verdeel populatie in clusters, bijvoorbeeld scholen
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller annnesnel12. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.33. You're not tied to anything after your purchase.