Statistical Methods for the Social Sciences, Global Edition
Dit is een korte samenvatting van het vak statistiek 1 uit het schooljaar 2020/2021, destijds gegeven door Ilja Cornelisz. Er is meegetypt met de hoorcolleges en aangevuld met de literatuur uit het boek. Met deze samenvatting heb ik voor het tentamen een 10 gehaald (mede doordat 3 vragen later alsn...
Week 1
Lecture 1 + hoofdstuk 1 & 2
Statistiek is een wetenschap over het verzamelen, organiseren, interpreteren van cijfers, die we data
noemen.
Rationalisme bestaat uit logisch redeneren en dit moet leiden tot nieuwe kennis.
Empirisme is zintuigelijk waarnemen, dus kijk en observeer en vergelijk deze data met elkaar. Er
wordt gezocht naar verbanden aan de hand van getallen.
Er wordt gesproken over deductie als je precies weet precies hoe de wereld eruit ziet. Uit de
bekende situatie wil je voorspellingen doen over een specifiek geval. Je wilt deduceren wat de kans is
dat iets voorkomt
Statistiek maakt vaak gebruik van inductie. Er komt een uitkomst uit je steekproef, dit wil je
generaliseren over je populatie. Je wilt iets leren over de algemene wereld om je heen.
Er kan altijd verschil zijn tussen de uitkomst van je steekproef en de parameter.
Falsificatie is het proberen te weerleggen van je hypothese. Als dit weerleggen niet lukt, komt de
uitspraak sterker over. Er wordt als het ware op gezocht naar de zwarte zwaan in een populatie, er
moet juist niet gezocht worden naar de witte zwanen die je denkbeeld bevestigen.
Beschrijvende statistiek is de statistiek die de data samenvat en beschrijft in bijvoorbeeld
gemiddeldes, de mediaan en de modus. Ook statistisch toetsen valt onder de beschrijvende
statistiek.
inferentiële statistiek (inductief) is de statistiek die voorspellingen probeert te doen aan de hand van
de data. Men probeert de uitkomsten van de steekproef te generaliseren over de doelpopulatie, dit
brengt enige onzekerheid met zich mee. Tijdens de statistiek probeert men ook rekening te houden
met die onzekerheid.
De populatiegrootheid is de parameter, dit doet men aan de hand van deductie. Als iets over de
steekproef gaat, noemt men dit een steekproefgrootheid.
Griekse symbolen worden gebruikt om populatiesymbolen aan te geven, zoals een gemiddelde van
een populatie mu.
Normale symbolen worden gebruikt om steekproefsymbolen aan te geven, zoals het gemiddelde van
je steekproef M.
Betrouwbaarheid van data komt voor als er uit verschillende metingen ongeveer dezelfde uitkomst
komt, de uitkomsten zijn enigszins consistent. De uitkomsten zijn betrouwbaar. Een grotere
steekproef leidt vaak tot een grotere betrouwbaarheid.
Validiteit geeft aan in welke mate je steekproef representatief is voor de populatie. Mensen moeten
bijvoorbeeld random gekozen zijn. Men moet nagaan of het gene dat gemeten wordt, ook echt
representatief is voor het construct dat men wil meten.
Kwalitatieve variabele is categorische data en zijn variabelen die geen numerieke waarde
vertegenwoordigen. Ze worden onderscheiden aan de hand van eigenschappen, maar er kan geen
rangorde van opgesteld worden:
- Nominaal: Er wordt onderscheid gemaakt tussen categorieën, er komen geen getallen aan te pas.
- Ordinaal: Er kan een orde worden opgesteld tussen bepaalde categorieën.
,Kwantitatieve variabele zijn variabelen die vaak betrekking hebben op getallen, er kan ook een
rangorde worden opgesteld:
- Interval: Iedere stap in je variabele komt overeen met een even grote stap tussen je variabelen,
zoals de likert scale. Ook bij temperatuur is een enkele graad omhoog of omlaag een even grote stap.
- Ratio: Er wordt rekening gehouden met een absoluut nulpunt, hier zijn ook intervallen.
Discrete variabele is een variabele die op een bepaalde wijze ondeelbaar is, het zijn hele getallen.
Men heeft nooit 2,3 broers. Je hebt een eindig aantal observaties.
Continious variabele is een variabele die oneindig deelbaar is. Dit zijn variabelen die achter de
komma oneindig door zouden kunnen gaan.
Het doel is altijd om de uitkomst van de steekproef zo dicht mogelijk te laten komen bij de
parameter. Er zijn alleen wel veel voorkomende problemen:
- Steekproeffout (sampling error): Puur toevallige steekproefvariatie, dit ontstaat vaak tussen
verschillende steekproeven. Dit kan men verkleinen door een grotere steekproef te nemen. De
uitkomst van de steekproef is in dat geval niet representatief voor de populatie, maar een
uitzondering. Sampling error = gevonden uitslag – parameter. Bij grotere steekproeven is de margin
error vaak kleiner, de veiligheidsmarge tussen de gevonden data en de parameter.
- Steekproefvertekening (sampling bias): Als er selectief proefpersonen worden getrokken,
proefpersonen hebben dan niet allemaal een even grote kans om gekozen te worden.
- Meetfout (response bias): Meetfouten door verkeerde instrumenten of een slechte vragenlijst. Dit
kan komen door onduidelijke vragen of er wordt niet gemeten wat men wil meten.
- Selectieve respons (non-responsive bias): Niet iedereen doet even goed mee, dit geeft een
vertekenend beeld van de steekproef. Sommige dingen worden bijvoorbeeld niet gedaan of niet
ingevuld.
Oplossingen zijn aselecte steekproeven, dit kan bijvoorbeeld gedaan worden door oversampling in
de eerste instantie. Je gaat er dan al een beetje van uit dat een groot deel niet komt opdagen.
Een aselecte steekproef met voldoende omvang die informatie (data) oplevert over iedereen die
behandeld is, met correcte responsen voor alle subjecten op alle items.
Bij een sampling survey worden mensen ondervraagd, op deze manier kan er data worden
verzameld van mensen.
Er zijn verschillende vormen van nonprobability sampling, hier heeft niet iedereen een even grote
kans om gekozen te worden uit een populatie:
- Volunteer bias: Mensen worden geselecteerd voor een onderzoek, omdat ze dit zelf willen.
- Selection bias: Mensen kunnen niet random worden toebedeeld aan groepen, bijvoorbeeld bij
medicijnonderzoek. Mensen moeten hier onderverdeeld worden op basis van hun kenmerken en
niet random. Voor de rest moet er zoveel mogelijk gerandomiseerd worden.
- Undercoverage: Als bepaalde groepen niet de kans krijgen om mee te gelden in het onderzoek. Als
men een poll houdt over de presidentsverkiezingen, wordt de mening van de gevangenen vaak
overgeslagen. Sommige mensen of groepen mensen zijn ondervertegenwoordigd in een onderzoek.
, Lecture 2 + Hoofdstuk 3
Dichotome variabele is een variabele die slechts twee waardes kan aannemen, zoals man en vrouw.
Proportie is een getal tussen de 0 & 1.
Percentage is een getal tussen de 0 & 100.
Alles dat ordinaal is, moet discreet zijn.
Interval kan discreet zijn of continu en is altijd kwantitatief.
Nominale variabelen zijn kwalitatieve variabelen en zijn daarom altijd categorisch en omdat er een
vast aantal categorieën is, ook altijd discreet.
Opzet van een onderzoek:
- opzet van je onderzoek
- beschrijf de steekproef
- conclusies trekken over de populatie.
Steekproefmethoden:
- Enkelvoudige aselecte steekproef (simple random sampling): Er moet een lijst zijn waar alle
mensen in de populatie op staan, een sampling frame. Deze mensen moeten gelinkt worden aan een
nummer en een aantal van deze nummers worden random getrokken. Men moet dus van tevoren
weten wie allemaal in de populatie zitten. Iedereen heeft zo een even grote kans om gekozen te
worden uit de populatie.
- Systematische aselecte steekproef (systematic random sampling): Er wordt gewerkt met een
skipgetal. Ook hier wordt aan elke persoon een nummer verbonden en er wordt een random getal
bedacht. Vervolgens wordt een random persoon gekozen en skipgetal wordt gebruikt als
intervalnummer, skipgetal. Dus stel het skipgetal is vier, dan kies je bijvoorbeeld random de eerste
persoon, vervolgens skip je vier mensen en zit de vijfde persoon in je steekproef, vervolgens de
tiende etc. Op deze manier is niet elke combinatie van een steekproef mogelijk, mensen die naast
elkaar zitten worden vrijwel nooit beide getrokken. Door de technologische ontwikkeling wordt deze
techniek niet heel veel meer gebruikt.
- Gestratificeerde steekproef (stratified random sample): Wordt gebruikt als je verschillende
groepen wil onderzoeken en/of die groepen vertegenwoordigd wil hebben in je steekproef. De
groepen moeten echt onderscheiden worden, niemand kan tot beide groepen behoren. Er vindt een
aselecte steekproef plaats binnen deze straten, zodat ze vergeleken kunnen worden. Uiteindelijk kan
er een uitspraak gedaan worden over beide groepen. Bij een proportionele steekproef komen de
verhoudingen tussen groepen in de populatie voor in de steekproef. Bij een disproportionele
steekproef komen bepaalde groepen uit de populatie buiten proportie voor in een steekproef. Kleine
groepen worden vaak oversampled om duidelijkheid te krijgen over de verschillende groepen.
- Cluster steekproef (cluster sampling): Worden gebruikt als de populatie zich bevindt in clusters,
zoals leerlingen op scholen of gemeentes, deze kunnen vaak niet allemaal onderzocht worden. Er
worden dan random scholen getrokken, deze clusters moeten dan representatief zijn voor alle
scholen. Van deze clusters worden dan alle leerlingen van onderzocht. Er worden geen groepen met
elkaar vergeleken, zoals bij een gestratificeerde steekproef, het is vooral om het voor gemakkelijker
te maken. Deze methode is puur voor gemak.
- Getrapte steekproef (multi-stage sampling): Dit is een combinatie van de vorige methode. Er
worden opnieuw clusters gevormd en er wordt random een aantal clusters gekozen. Uit deze clusters
kan weer een random sample gekozen worden, dit is bijvoorbeeld een two-stage-multi-stage
sampling. Dit kan men uiteraard ook vaker toepassen, totdat de steekproef klein genoeg is. Er wordt
als het ware een random sample getrokken in de clusters enz. Deze methode is puur voor gemak.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller davyhickmann. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.50. You're not tied to anything after your purchase.