Statistical Methods for the Social Sciences, Global Edition
n deze samenvatting krijg je alle stof die nodig is om te weten voor het tentamen van Statistiek 1. Vorig jaar heb ik mijn propedeuse behaald en dat met mijn eigen samenvattingen. Deze samenvatting bestaat uit alle hoorcolleges (volledig uitgetypt) en aanvulling vanuit de literatuurboeken. Literatu...
Samenvatting Statistiek 1
Hoofdstuk 1: introductie
Belang van statistische geletterdheid:
Laatste jaren wordt er steeds vaker gebruik gemaakt van statistische methodes. We leven in
een datageleerde maatschappij en daardoor is statistiek belangrijk omdat je in het dagelijks
leven statistische data moet gebruiken. Het is dus belangrijk dat je statistisch geletterd bent.
Vaak wordt u blootgesteld aan communicatie die statistische argumenten bevat, zoals in
advertenties, nieuwsverslaggeving en opiniepeilingen. De statistische wetenschap helpt je
deze informatie te begrijpen en te beoordelen welke argumenten geldig en ongeldig zijn.
Statistiek is ook van belang in de klinische praktijk. Als behandelaar krijg je meerdere soorten
therapieën en het is belangrijk om dan verschillende data te kunnen verzamelen zodat je een
goede therapie kan bieden aan de cliënt.
Data: de observaties/informatie die zijn verzameld van de subjecten van interesse in het
onderzoek. De data van een subject bestaat uit observaties. Door het observeren van data is
het mogelijk om bepaalde associaties te onderzoeken. Om gegevens te genereren, gebruiken
de sociale wetenschappen een grote verscheidenheid aan methoden, waaronder enquêtes
met behulp van vragenlijsten, experimenten en directe observatie van gedrag in natuurlijke
omgevingen. Bovendien analyseren sociale wetenschappers vaak gegevens die al voor
andere doeleinden zijn vastgelegd. Bestaande archiveerde collecties van data worden
databases genoemd. Veel van deze databases zijn op internet te vinden. Elke rij in een
dataset staat voor een persoon, dus het aantal rijen in een dataset is gelijk aan het aantal
deelnemers in het onderzoek. Elke kolom staat voor een variabele.
Kansrekening: gaat veelal uit van deductie. Je weet hoe de wereld eruitziet en dan kan je
een bepaalde kans best goed berekenen. Dat is van algemene informatie naar specifieke
informatie. Gegeven dat we alle details weten van een bepaalde populatie, hoe waarschijnlijk
is dan een bepaalde (steekproef-) uitkomst? Algemene informatie specifieke informatie.
Populatie steekproef. Model data.
Statistiek: gaat veelal uit van inductie. We weten dat er een wereld is met bepaalde
subjecten maar weten niet hoe het gesteld is met de kans. Dus we nemen een steekproef
waar we metingen in doen en vervolgens gebruiken we die kleine steekproef om de grotere
groep te begrijpen. We gaan van specifieke informatie naar algemene informatie. Gegeven
een bepaalde (steekproef-) uitkomst, wat kunnen we dan met welke waarschijnlijkheid
zeggen over de populatie? Specifieke informatie algemene informatie. Steekproef
populatie. Data model
Overeenkomsten tussen kansrekening en statistiek:
Kansrekening en statistiek houden beide rekening met toeval (randomness). Want
hoe zeker zijn je uitkomsten?
Zelfde technieken (bijv. gemiddelde) voor zowel steekproef als populatie
Statistiek maakt aannames over de populatie (bijv. nulhypothese) om deze op basis
van een steekproef te kunnen weerleggen (falsificeren).
,Methodologie is de systematische wijze van hoe je (empirisch) onderzoek zou moeten
uitvoeren. Een theorie voorspelt data, data toetst een theorie. Statistiek is het
instrumentarium om empirisch onderzoek uit te kunnen voeren. Methodologie en statistiek
gaan goed samen.
Statistiek: de wetenschap van het verzamelen, organiseren en interpreteren van numerieke
feiten, die gegevens of data worden genoemd.
Beschrijvende statistiek: samenvatten van de data in de steekproef of populatie met
getallen, tabellen en grafieken en gemiddeldes en percentages. Beschrijvende
statistiek is heel zeker. We gebruiken beschrijvende statistiek om de data makkelijker
en begrijpbaarder te maken zonder belangrijke informatie weg te laten.
Inferentiële statistiek: verwachtingen maken over populatie parameters, doet
uitspraak over de populatie als geheel, gebaseerd op steekproeven/
steekproefgemiddeldes. Dit is een waarschijnlijkheid, maar geen zekerheid. Door
inferentiële statistiek willen we een voorspelling maken over de populatie. We weten
niet hoe nauwkeurig onze steekproefstatistieken zijn dus is dit onzeker.
Statistische wetenschap bevat methodes voor:
Design: plannen hoe je data gaat verzamelen voor je onderzoek om interessante
vragen te onderzoeken
Description: het samenvatten van de data wat verkregen is uit het onderzoek. Wat
ervoor zorgt dat de informatie uit de data duidelijker te begrijpen is.
Inference: voorspellingen maken op basis van de data, wat helpt bij onzekerheden.
Voorspellingen die zijn gemaakt op basis van data worden statistische inferences
genoemd.
Onderzoeken met behulp van data: observaties en karakteristieken. We willen een bepaald
fenomeen meetbaar krijgen, er zijn verschillende manieren om dit fenomeen te meten.
Populatie: de totale set van deelnemers relevant voor de onderzoeksvraag.
Parameter (populatiegrootheid) is de waarde van deze karakteristiek in de populatie.
Steekproef: een deel van de populatie waarover data verzameld is.
Een representatieve steekproef is een van de twee eisen voor een goede steekproef. Ook al
verzamelen we de data van de subjecten uit de steekproef, uiteindelijk is onze interesse in de
populatie die de steekproef representeert.
We gebruiken een steekproef in onderzoeken omdat het soms niet mogelijk is om de gehele
populatie te onderzoeken. Dit kan verschillende redenen hebben: te veel deelnemers,
onethisch om iedereen aan het onderzoek bloot te stellen etc. Dus binnen de steekproef is
om een oordeel te kunnen doen over de hele populatie. In de steekproef is er geen sprake
van een parameter maar van een steekproefgemiddelde. Een statistiek is het resultaat van de
steekproef wat je gebruikt voor de grotere populatie.
Naast het feit dat een steekproef representatief moet zijn, moet een steekproef ook valide
en betrouwbaar zijn. Goede statistiek is betrouwbaar en valide. Validiteit beschrijft of er
echt gemeten wordt wat het doel is van de meting. Betrouwbaarheid verwijst naar de mate
van consistentie, bij herhaalde metingen zou hetzelfde resultaat behaald moeten worden.
Betrouwbaarheid is een voorwaarde voor validiteit. Maar niet altijd in deze hoorcolleges.
,Hoofdstuk 2: steekproeven en metingen
Variabele: gemeten karakteristiek die kan verschillen tussen subjecten in een steekproef of
populatie. Iets dat je kan meten en variëren tussen subjecten. De verschillen kunnen op
verschillende schalen gemeten worden: nominaal, ordinaal, interval en ratio (meetschalen).
Categorisch/kwalitatieve variabelen: de metingen worden herkend door categorieën.
Nominale variabele: ongeordende categorieën, de schaal heeft geen rangorde van
hoog of laag. Een bepaalde categorie is niet hoger of lager als een andere categorie.
(Bijvoorbeeld kleur ogen)
Ordinale variabele: (natuurlijk) geordende categorieën (bijvoorbeeld
opleidingsniveau). Likertschaal is een kwalitatieve ordinale variabele.
Numeriek/kwantitatieve variabelen: de metingen worden herkend door cijfers.
Interval variabele: gelijke afstand tussen opeenvolgende waarden en negatieve
waardes kunnen ook voorkomen er is geen sprake van een absoluut nulpunt (°C)
Ratio variabele: gelijke afstand en absoluut nulpunt (K)
We maken onderscheid tussen categorische en kwantitatieve variabelen omdat op elk type
verschillende statistische methoden van toepassing zijn. Gemiddelde is een statistische
samenvatting voor kwantitatieve variabelen omdat er gebruik wordt gemaakt van numerieke
waarden. Het is mogelijk om het gemiddelde te vinden voor een kwantitatieve variabele,
maar niet voor een categorische variabele.
Sommige variabelen komen alleen voor in gehele variabelen. De meetschaal heeft een
bepaald waardenbereik:
Discreet: ondeelbare meeteenheid. Tussen twee waardes kan je niks anders
observeren. Alleen hele aantallen kunnen waargenomen worden. (Broers/zussen)
Categorische variabelen zijn altijd discreet, bij kwantitatief hangt het er dus vanaf of
er sprake kan zijn van tussenwaardes of niet.
Continu: oneindig deelbare meeteenheid. Tussen twee waardes zijn veel meer
waardes te observeren. Als er sprake is van kommagetallen heb je te maken met
continue variabelen. (Lichaamslengte)
Modus: de waarde die het vaakst voorkomt in de data, meest handig voor categorische data
, Mediaan: de middelste waarde als je de data van kleinste naar grootste waarde rangschikt
Gemiddelde: de som van alle waarden gedeeld door het totaal aantal waarden
Observationele onderzoeken: observeer de resultaten voor beschikbare proefpersonen op
de variabelen zonder enige experimentele manipulatie van de proefpersonen. De
onderzoeker meet de reacties van proefpersonen op de relevante variabelen, maar heeft
geen experimentele controle over de proefpersonen. Bij observationeel onderzoek is het
vergelijken van groepen moeilijk omdat de groepen onevenwichtig kunnen zijn op het gebied
van variabelen die de uitkomst beïnvloeden, zelfs bij willekeurige steekproeven.
Het vaststellen van oorzaak en gevolg staat centraal in de wetenschap. Maar het is niet
mogelijk om oorzaak en gevolg definitief vast te stellen met een niet-experimenteel
onderzoek, of het nu een observationeel onderzoek is met een beschikbare steekproef of
een steekproefonderzoek waarbij gebruik wordt gemaakt van willekeurige steekproeven.
Een observationeel onderzoek heeft altijd de mogelijkheid dat een niet-gemeten variabele
verantwoordelijk kan zijn voor patronen die in de gegevens worden waargenomen. Bij een
experiment waarbij proefpersonen willekeurig aan behandelingen worden toegewezen,
moeten die behandelingen daarentegen in evenwicht zijn met niet-gemeten variabelen.
Het doel van inferentiële statistiek is dat je op basis van je steekproef een betrouwbare en
valide uitspraak kan doen over de gehele (doel-)populatie. Je wilt de uitkomsten van je
steekproef kunnen generaliseren naar je gehele (doel-)populatie. Steekproefgrootheden
dienen dan niet te verschillen van populatiegrootheden.
Er zijn bepaalde onzekerheden als je een steekproef wilt generaliseren naar een populatie.
Dit zijn de verschillen tussen gemeten steekproefgrootheid en de populatiegrootheid:
Er kan sprake zijn van natuurlijke variatie (toevalstreffers) tussen de steekproeven
Door problemen/fouten binnen je steekproef. Mogelijke problemen zijn een
steekproeffout, steekproefvertekening, meetfout of selectief respons.
Om betrouwbare en valide uitspraken te kunnen doen over de populatie door middel van
een steekproef is het belangrijk dat de steekproefgrootheden niet verschillen van
populatiegrootheden. Het is dus van belang dat er een aselecte steekproef met voldoende
omvang die informatie (data) oplevert over iedereen die benaderd is, met correcte
responses voor alle subjecten op alle items. Mogelijke fouten die gemaakt kunnen worden:
Steekproefvertekening: selectieve werving. Fout die optreedt uit het gebruik van
niet-waarschijnlijke steekproeven, zoals de selectiebias die inherent is aan
steekproeven van vrijwilligers. Undercoverage is ook een steekproefvertekening, het
ontbreekt aan vertegenwoordiging van sommige groepen in de bevolking.
Steekproefvertekening kan worden beperkt door een aselecte steekproef te trekken.
Meetfouten: incorrect antwoord. Fout die optreedt wanneer de proefpersoon een
onjuist antwoord geeft (misschien liegt), of de formulering van de vraag of de manier
waarop de interviewer de vraag stelt misleidend of verwarrend is.
Selectieve respons: selectieve deelname. Fout die optreedt wanneer sommige
proefpersonen niet kunnen worden bereikt, weigeren deel te nemen of bepaalde
vragen niet beantwoorden.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Maximevv. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.57. You're not tied to anything after your purchase.