Statistical Methods for the Social Sciences, Global Edition
Een uitgebreide samenvatting van het vak Introduction to Statistics (In het Nederlands) met een inhoudsopgave voorin om het overzicht te bewaren. Alle opgegeven hoofdstukken zijn samengevat en alle hoorcolleges ook.
Introduction to Statistics
Semester 1, blok 3
2021 – 2022
Samenvatting Nederlandstalig
1
,Statistical Methods for the Social Sciences – Agresti...........................................................3
Hoofdstuk 1 – Inleiding.......................................................................................................3
Hoofdstuk 2 – Steekproeftrekking en meting......................................................................5
Hoofdstuk 3 – Beschrijvende statistiek................................................................................9
Hoofdstuk 4 - Waarschijnlijkheidsverdelingen...................................................................14
Hoofdstuk 5 – Statistical Inference Estimation...................................................................20
Hoofdstuk 6 – Statistical inference: significance tests........................................................28
Hoofdstuk 7 – vergelijking van twee groepen....................................................................38
Hoofdstuk 8 – Het analyseren van het verband tussen categorische variabelen................43
Hoofdstuk 9 – Lineaire regressie en correlatie...................................................................49
Lectures............................................................................................................................58
Lecture 0 – Introduction to Statistics [Thijs Bol].................................................................58
Lecture 1 – GOD ; On probability, z-scores and distributions..............................................62
Lecture 2:..........................................................................................................................62
Lecture 3...........................................................................................................................65
Lecture 4...........................................................................................................................69
2
,Statistical Methods for the Social
Sciences – Agresti
Hoofdstuk 1 – Inleiding
Inleiding tot de statistische methodologie
Dit hoofdstuk introduceert "statistiek" als wetenschap die zich bezighoudt met het beschrijven van
gegevens en het doen van voorspellingen die een veel ruimer bereik hebben dan het louter
samenvatten van de verzamelde gegevens.
Steeds meer banen voor sociale wetenschappers vereisen kennis van statistische
methoden als basiswerkinstrument. Zoals het grapje luidt: "Wat zei de socioloog die slaagde voor
statistiek tegen de socioloog die er niet voor slaagde? Ik wil een Big Mac, friet en cola."
Gegevens
Het verzamelen van informatie vormt de kern van alle wetenschappen en levert de
waarnemingen die in statistische analyses worden gebruikt. De verzamelde waarnemingen over
de kenmerken van belang worden collectief gegevens genoemd.
Om gegevens te verzamelen gebruiken de sociale wetenschappen een grote
verscheidenheid van methoden, waaronder enquêtes met vragenlijsten, experimenten en directe
observatie van gedrag in een natuurlijke omgeving. Bestaande gearchiveerde
gegevensverzamelingen worden databanken genoemd. Veel databanken zijn nu beschikbaar op
het internet.
Wat is statistiek?
In dit boek wordt statistiek in een veel ruimere zin gebruikt - als een wetenschap die ons
manieren geeft om gegevens te verkrijgen en te analyseren.
In het bijzonder biedt de statistische wetenschap methoden voor:
Ontwerp: Het plannen van hoe gegevens te verzamelen voor een onderzoeksstudie om
vragen te onderzoeken die voor ons van belang zijn.
Beschrijving: Het samenvatten van de gegevens die in het onderzoek zijn verkregen, om
te helpen begrijpen welke informatie de gegevens hebben opgeleverd. Een analyse van het
aantal goede vrienden op basis van de GSS-gegevens zou bijvoorbeeld kunnen beginnen met
een lijst van het aantal dat voor elke ondervraagde persoon wordt gerapporteerd. De ruwe
gegevens zijn dan een volledige lijst van waarnemingen, persoon per persoon. Voor de
presentatie van de resultaten zouden we, in plaats van alle waarnemingen op te sommen, de
gegevens kunnen samenvatten met een grafiek of tabel die de percentages weergeeft van 1
goede vriend, 2 goede vrienden, 3 goede vrienden, enzovoort. Grafieken, tabellen en numerieke
samenvattingen zoals gemiddelden en percentages worden beschrijvende statistieken genoemd.
Inferentie: Het doen van voorspellingen op basis van de gegevens, om ons te helpen op
een objectieve manier met onzekerheid om te gaan. Voorspellingen op basis van gegevens
worden statistische gevolgtrekkingen genoemd.
Beschrijving en gevolgtrekking zijn twee soorten manieren om de gegevens te analyseren.
Sociale wetenschappers gebruiken beschrijvende en inferentiële statistieken om vragen over
sociale verschijnselen te beantwoorden.
Beschrijvende en inferentiële statistiek
Een statistische analyse wordt ingedeeld in beschrijvende of inferentiële statistieken, naargelang
het hoofddoel ervan is de gegevens te beschrijven of voorspellingen te doen. Om dit onderscheid
nader toe te lichten, definiëren wij hierna de populatie en de steekproef.
3
, Populaties en steekproeven
De entiteiten waarover een studie waarnemingen doet, worden de proefpersonen van de studie
genoemd. Hoewel wij gegevens verkrijgen over de proefpersonen, gaat onze belangstelling
uiteindelijk uit naar de populatie die de steekproef vertegenwoordigt.
Populatie en steekproef: De populatie is de totale verzameling van onderwerpen die in
een studie van belang zijn. Een steekproef is de deelverzameling van de populatie waarover in
het onderzoek gegevens worden verzameld.
Beschrijvende statistieken: vatten de informatie in een gegevensverzameling samen
Hoewel er meestal alleen gegevens beschikbaar zijn voor een steekproef, zijn
beschrijvende statistieken ook nuttig wanneer er gegevens beschikbaar zijn voor de hele
bevolking, zoals bij een volkstelling.
Inferentiële statistieken: geven voorspellingen over een populatie, gebaseerd op gegevens uit
een steekproef van die populatie.
Parameters en statistieken
Een beschrijvende statistiek is een numerieke samenvatting van de steekproefgegevens. De
overeenkomstige numerieke samenvatting voor de populatie wordt een parameter genoemd.
In de praktijk zijn wij vooral geïnteresseerd in de waarden van de parameters, en niet
alleen in de waarden van de statistieken voor de specifieke steekproef die is genomen.
Bijvoorbeeld, bij het bekijken van de resultaten van een opiniepeiling voor een verkiezing zijn wij
meer geïnteresseerd in de percentages van de populatie die voor de verschillende kandidaten
zijn dan in de percentages van de steekproef voor de ondervraagde personen.
Populaties definiëren: feitelijke en conceptuele
Gewoonlijk is de populatie waarop conclusies van toepassing zijn een feitelijke groep personen,
zoals alle volwassen inwoners van de Verenigde Staten. Soms echter hebben de generalisaties
betrekking op een conceptuele populatie - een populatie die niet echt bestaat maar hypothetisch
is.
De rol van computers in de statistiek
In de loop van de tijd is krachtige en gemakkelijk te gebruiken software ontwikkeld voor de
toepassing van statistische methoden. Deze software is een enorme stimulans voor het gebruik
van statistiek.
Statistische software
Statistische softwarepakketten zijn onder meer R, SPSS, SAS en stata. In bijlage A wordt per
hoofdstuk uitgelegd hoe ze moeten worden gebruikt.
Een van de doelstellingen van dit leerboek is u te leren wat u in output moet zoeken en
hoe u deze moet interpreteren. Kennis van computerprogrammering is niet noodzakelijk voor het
gebruik van statistische software.
Gegevensbestanden
Statistische software analyseert gegevens die zijn georganiseerd in de spreadsheetvorm van een
gegevensbestand.
Elke rij bevat de waarnemingen voor een bepaald onderwerp in de steekproef
Een kolom bevat de waarnemingen voor een bepaald kenmerk
Gebruik en misbruik van statistische software
Een opmerking van voorzichtigheid: De gemakkelijke toegang tot statistische methoden met
behulp van software heeft zowel gevaren als voordelen. Het is eenvoudig om ongeschikte
methoden toe te passen. Een computer voert de gevraagde analyse uit, ongeacht of aan de voor
het juiste gebruik ervan vereiste hypothesen is voldaan.
Het is van vitaal belang de methode te begrijpen alvorens ze te gebruiken.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller maartjepaauw. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.71. You're not tied to anything after your purchase.