Samenvatting

volledige samenvatting Statistiek van de sociale wetenschappen

7 keer bekeken 1 keer verkocht

Instelling
Katholieke Universiteit Leuven (KU Leuven)

De samenvatting omvat de volledige cursus van het vak Statistiek van e sociale wetenschappen alsook aangevuld met lesnotities. Het vak wordt gegeven door Prof. dr. Meeusen aan de KUL in de eerste fase van de bachelor pol & soc + com.

[Meer zien]

Voorbeeld 8 van de 89 pagina's

Bekijk voorbeeld

Geupload op 3 december 2024
Aantal pagina's 89
Geschreven in 2022/2023
Type Samenvatting

statistiek
sociale statistiek
statistiek van de sociale wetenschappen

€9,46

In winkelwagen

Op verlanglijstje

100% tevredenheidsgarantie
Direct beschikbaar na betaling
Zowel online als in PDF
Je zit nergens aan vast

INHOUDSOPGAVE

Hoofdstuk 1: van probleemstelling naar data-analyse 3
1.1 Doel van de statistiek 3
1.1.1 Statistiek is overal 3
1.1.2 Het doel van data- analyse 3
1.2 Van probleemstelling naar data-analyse 3
1.2.1 Probleemstelling 3
1.2.2 Data verzamelen 4
1.2.3 Meten van gegevens 5
1.2.4 Data cleaning, transformeren en operationaliseren 8
1.2.3 Presenteren, visualiseren en statistische analyse 10
1.2.5 Interpreteren en rapporten 12
Hoofdstuk 2: frequentie verdelingen 13
2.1 Nominale variabelen 13
2.1.1 Absolute en relatieve frequenties 13
2.1.2 Staaf- en cirkeldiagrammen 14
2.2 Ordinale variabelen 14
2.2.1 Absolute en relatieve frequenties 14
2.2.2 Cumulatieve frequenties 14
2.2.3 Kwantielfunctie 15
2.3 Kwantitatieve variabelen 16
2.3.1 Absolute, relatieve en cumulatieve frequenties 16
2.3.2 In klassen groeperen 18
2.3.3 Histogram 19
2.4 Vormen van frequentieverdelingen 20
2.4.1 Symmetrische verdelingen 20
2.4.2 Asymmetrische verdelingen 20
Hoofdstuk 3: centrummaten, spreidingskenmerken en vormmaten 21
3.1 Centrumkenmerken 21
3.1.1 Modus 22
3.1.2 Mediaan 22
3.1.3 Gemiddelde 23
3.2 Spreidingskenmerken 25
3.2.1 Bereik 25
3.2.2 Kwantielafstanden 25
3.2.3 Variantie en standaardafwijking 26
3.3 Vormmaten 28
3.3.2 Scheefheid en gepiektheid 29
3.3.3 Boxplot 29
3.4 Vormmaten 30
3.4.1 Lineaire transformaties 31
3.4.2 Z-transformatie 32
3.4.3 De standaard normale verdeling 33

,Hoofdstuk 4: kansen en kansverdelingen 34
4.1 Kansbegrip 34
4.2 Kansverdelingen voor discrete toevalsvariabele 37
4.3 Kansverdelingen voor continue toevalsvariabelen 38
4.4 Bijzondere kansverdelingen 38
4.4.1 Bernoulli-verdeling 38
4.4.2 Binomiale verdeling 39
4.4.3 (Standaard) Normaal verdeling 40
4.5 Kansen berekenen onder de (standaard) normale verdeling 42
4.5.1 Kansen berekenen onder een (standaard) normale verdeling 43
4.5.2 Kansen berekenen onder een binomiaal verdeling 45
Hoofdstuk 5: inductieve statistiek 46
5.1 Basisconcepten van de inductieve statistiek 48
5.1.1 De steekproevenverdeling en Centrale Limietstelling 48
5.1.2 Toepassingen van de Centrale Limietstelling 52
5.1.3 Eigenschappen van schatters 53
5.2 Hypothesetesten 53
5.2.1 Structuur van een hypothesetest: test voor het populatiegemiddelde mét gekende
populatievariantie 𝜎2 54
5.2.2 Onzekerheid en fouten bij hypothesetesten 60
5.2.3 Test voor het populatiegemiddelde met onbekende populatievariantie 𝛔2 62
5.2.3 Test omtrent een proportie 63
5.3 Betrouwbaarheidsintervallen 64
5.3.1 Logica van een betrouwbaarheidsinterval 64
5.3.2 Betrouwbaarheidsinterval voor het populatiegemiddelde μ met gekende
populatievariantie σ² 64
5.3.3 Betrouwbaarheidsinterval voor het populatiegemiddelde μ met onbekende
populatievariantie σ² 66

66
5.3.4 Betrouwbaarheidsinterval voor een proportie 66
Hoofdstuk 6: samenhang tussen twee variabelen 66
6.1 Samenhang tussen twee kwantitatieve variabelen 67
6.1.1 Visualisatie via scatterplot 67
6.1.2 Covariantie 70
6.1.3 Correlatie 72
6.1.4 Hypothesetest omtrent correlatie 73
6.2 Gemiddelden vergelijken in twee onafhankelijke groepen: ongepaarde t-test 75
6.2.1 Visualisatie via histogram en boxplot 75
6.2.2 Hypothesetest voor vergelijken van gemiddelde tussen twee groepen 76
Hypothesetest voor vergelijken van de variantie tussen twee groepen: Levene’s test 80
6.3 Samenhang tussen twee kwalitatieve variabelen 81
6.3.1 Visualisatie via geclusterde staafdiagram 81
6.3.2 Anatomie van een kruistabel 82

, 6.3.3 Hypothesetest over samenhang tussen twee kwalitatieve variabelen: Chi-kwadraat test 84
6.3.4 Associatiematen: odds, odds-ratio en Cramer’s V 86

HOOFDSTUK 1: VAN PROBLEEMSTELLING NAAR DATA -ANALYSE

1.1 DOEL VAN DE STATISTIEK

1.1.1 STATISTIEK IS OVERAL

Dataficatie = de trend waarbij dagdagelijkese acties en interacties worden omgezet in data die kunnen worden
opgevolgd, geanalyseerd en geoptimaliseerd

Binnen de sociale wetenschappen domineert kwantitatief onderzoek = data wordt omgezet in nummers zodat
deze kunnen worden ganalyseerd dmv statistische methoden

Social data science = combinatie tussen domein specifieke kennis, computerkennis en data-wetenschappen

→ taak van sociale wetenschapper: bruggen bowuen tussen deze disciplines → toepassing binnen de
samenleving

1.1.2 HET DOEL VAN DATA- ANALYSE

Data-analyse = de kunst en de wetenschap van het evrzamelen, meten, organiseren, presenteren, analyseren
en interpreteren van data met als doel inzicht verwerven op basis van deze data

- Inzicht: onderzoeksvragen beantwoorden op basis van data
- Wetenschap: objectief, onafhankelijk van de beoefenaar
- Kunst: creatief, interpretatief, afhankelijk van de beoefenaar
o Beslissingen van de onderzoeker
o Meten van bep kenmerken en vraagformulering ervan
o Analyseren en interpreteren van de data
- Data: veel verschillende soorten data uit verschillende soorten bronnen → hebben verschillende
vormen: numeriek, tekst, afbeeldingen, audio

1.2 VAN PROBLEEMSTELLING NAAR DATA-ANALYSE

1.2.1 PROBLEEMSTELLING

Bij wie of wat verzamelen we welke gegevens? → afhankelijk van de onderzoeksvraag → onderzoeksvraag
start altijd vanuit een probleemstelling

,1.2.2 DATA VERZAMELEN

Data wordt verzameld bij onderzoekseenheden = eenheden of objecten waarop het onderzoek betrekking
heeft en waarbij kenmerken gemeten worden → kunnen personen zijn, maar zijn niet altijd mensen

Een populatie = een verzameling van alle onderzoekseenheden die gekenmerkt worden door een afbakening in
tijd en ruimte

→ volstaat om een goede steekproef uit populatie te selecteren

Een steekproef = een deelverzameling van onderzoekseenheden uit de populatie

- Een willekeurige steekproef = elke onderzoekseenheid heeft een even grote kans om geselecteerd te
worden
- Een steekproef is representatief op een kenmerk als het kenmerk in gelijke mate voorkomt in de
steekproef als in de populatie
- Omvang of grootte van een steekproef: symbool n

Na omschrijving populatie → gegevens verzamelen

• Data die je nodig hebt is ergens beschikbaar
o Data archieven, publieke overheidsinfrastructuren, …
• Data zelf verzamelen
o Vragenlijsten, handmatige codering, experimenten, …

Data = informatie en kenmerken gemeten bij onderzoekseenheden

→ kunnen uit verschillende bronnen komen:

• Surveys: respondenten krijgen enkele gesloten/open vragen die demigrafische kenmerken, attitudes
en gedragen pogen te meten
• Experimenten: oorzaak-gevolg verband in kaart brengen → onderzoekseenheden willekeurig over
verschillende groepen te verdelen en ze aan verschillende omstandigheden/interventies blootstellen
(= manipulatie) → verschillen betekent oorzakelijk verband

Big Data: volume, veranderlijkheid en verscheidenheid

• Data is heel groot
• Data wordt aan een sneltempo geproduceerd
• Data heeft verschillende soorten en vormen
- Voorbeelden:

, o Sociale media data, geodata, data uit medische dossiers, administratieve data, ..

1.2.3 METEN VAN GEGEVENS

CLASSIFICATIE VAN GEGEVENS

Na selectie steekproef uit populatie → kenmerken meten bij onderzoekseenheden

Deze kenmerken zijn variabelen

- Notatie: hoofdletters X,Y,Z,…

Uitkomstenverzameling = de verzameling van alle mogelijke uitkomsten voor een variabele

- Notatie: 𝝋

Geobserveerde waarnemingen = de uitkomsten die daadwerkelijk geobserveerd zijn in de steekproef of
populatie

Vb. uitkomstenverzameling kan 𝝋 = {man, vrouw, andere} zijn maar in de steekproef zitten uiteindelijk alleen
maar vrouwen

Aard en omvang van de uitkomsten hebben een grote invloed bij bepalen van de statistische techniek:

1) Aard = onderliggende meetniveau
• Kwanititatief meetniveau
→ kan zowel discreet als continu zijn
o Interval
o Ratio
• Kwalitatief meetniveau
→ altijd discreet
o Nominaal
o Ordinaal
2) Omvang
• Discreet : de uitkomstenverzameling is eindig
- Notatie: 𝝋 = {m1, m2, m3, …, mk} waarbij k oneindig is
→ niet mogelijk om tussen tweeopeenvolgende uitkomsteen derde uitkomst te bedenken
Vb. aantal juiste antwoorden op 10, aantal kinderen
• Continu: de uitkomstenverzameling is oneindig (niet telbaar) groot
- Notatie: 𝜑 = {ℝ}
→ steeds een derde uitkomst te bedenken tussen twee opeenvolgende uitkomsten
Vb. variabele gewicht of tijd
→ vaak voorgesteld als discrete gegevens: meestal afgerond → blijven wel continue gegevens!

Vb. gewicht wordt weegegeven als 67kg en niet als 67,373562772kg

,MEETNIVEAU

KWALITATIEF MEETNIVEAU:

Nominaal meetniveau

- Meetprocedure: classificeren in categoriën, benoemen
o Niet te interpreteren in meer en minder
o Verschil in waarden representeert geen verschil in kwantiteit → enkel een kwalitatief verschil
o Geen wiskundige bewerkingen mogelijk
o Codes: kunnen eender welk symbool aannemen: letters, cijfers, woorden
Vb. 𝜑 = {𝐵𝑒𝑙𝑔, 𝑁𝑒𝑑𝑒𝑟𝑙𝑎𝑛𝑑𝑒𝑟, 𝐵𝑟𝑖𝑡, 𝐴𝑛𝑑𝑒𝑟𝑒}, of 𝜑 = {𝐵𝐸, 𝑁𝐿,𝑈𝐾, 𝐴}, of 𝜑 = {1, 2, 3, 8} met 1 =
Belg, 2 = Nederlander, 3 = Brit, 8 = Andere
- Meetschaal: eindig, exhaustief en exclusief → elke observatie hoort maar thuis in één categorie en
alle mogelijke categoriën zijn gegeven in de meetschaal
o Dichotome meetschaal = wanneer de nominale meetschaal slechts twee waarden kan
aannemen (en observaties dus slechts in twee categoriën kunnen worden opgedeeld)

Ordinaal meetniveau

- Meetprocedure: elementen van de uitkomstenverzameling kunnen geordend worden
o Kunnen geïnterpreteerd worden als meer en minder, hoger of lager

Vb. politieke interesse met 𝜑 = {𝑁𝑖𝑒𝑡 𝑔𝑒ï𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒𝑒𝑟𝑑, 𝑒𝑒𝑛 𝑏𝑒𝑒𝑡𝑗𝑒 𝑔𝑒ï𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒𝑒𝑟𝑑,
𝑔𝑒ï𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒𝑒𝑟𝑑, ℎ𝑒𝑒𝑙 𝑔𝑒ï𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒𝑒𝑟𝑑}

o Geen vaste meeteenheid
o Verschillen niet in vastgelegde hoeveelheden
o Geen wiskundige bewerkingen mogelijk tenzij oerdening van de meetschaal
Vb. mediaan
- Meetschaal: eindig, exhaustief en exclusief

Likertschaal = een veelgebruikte meetschaal in sociaalwetenschappelijk onderzoek om houdingen, attitudes en
ovetuigingen te meten

, - Bestaat meestal uit 5, 7 of 11 antwoordcategoriën

Vb. ‘helemaal eens’ tot ‘helemaal oneens’, ‘nooit’ tot ‘altijd’, …

- Intristiek ordinaal: de antwoordcategoriën hebben een kwalitatieve betekenis en zijn geordend, maar
ze hebben geen meeteenheid
→ in de praktijk vaak als kwantitatief meetniveau gebruikt waneer de schaal breedt genoeg is

KWANTITATIEF MEETNIVEAU:

- De geobserveerde gegevens sluiten dicht aan bij wat letterlijk ‘gemeten’ wordt
- Vaste, kwantificeerbare meeteenheid
- Verschil tussen geobserveerde waarden wordt uitgedrukt in hoeveelheden
- Codes: getallen met een nummerieke betekenis
- Kunnen zowel een discrete als continue uitkomstenverzameling hebben

Interval meetniveau

- Meetprocedure: vaste, kwantificeerbare meeteenheid
Vb. temperatuur, IQ
o Verschil kan uitgedrukt worden in hoeveelheden, maar nulpunt is arbitrair
→ verhoudingen tussen waarden zijn betekenisloos
o Wiskundige bewerkingen zijn mogelijk
▪ Optellen en aftrekken toegestaan
▪ Multiplicatie en delen niet mogelijk vanwege arbitriar nulpunt
- Codes: getallen met numerieke betekenis, meetresultaten

Ratio meetniveau

- Meetprocedure: kwantificeerbaare meeteenheid
o Verschil kan uitgedruk worden in hoeveelheden en verhoudingen tussen waarden zijn wel
zinvol → absoluut nulpunt
o Alle wiskundige bewerkingen zijn mogelijk
- Codes: getallen met numerieke betekenis, meetresultaten

GROEPEREN VAN KWANTITATIEVE GEGEVENS

Vaak worden kwantitatieve variabelen gegroepeerd tot nominale of ordinale meetschalen

→ typisch voorbeeld: leeftijd dat initieel een ratio meetschaal heeft maar gegroepeerd wordt in
leeftijdscategoriën en zo een ordinale meetschaal kent

Vb. 𝜑 = {[0, 20],[21, 40],[41, 60],[61, 80],[> 80]}

Voordelen van opdelen in klassen:

• Data kunnen op snelle en overzichtelijke manier worden weergegeven
• Bewaakt privacy van respondenten

Nadeel opdelen in klassen:

• Gedetailleerde informatie wordt vereenvoudigd tot klassen → er gaat informatie verloren

, Quasi-metrische variabelen = schalen die intristiek ordinaal zijn, want geen meeteenheid bezitten, maar door
de omvang van de uitkomstenverzameling toch als een kwantitatieve variabele gebruikt worden

Vb. Iemands houding op de links-rechts as → doorgaans gemeten op een 11-punt schaal die gaat van 0 tot 10,
→ waarde ‘0’ staat voor ‘links’ en de waarde ‘10’ staatvoor ‘rechts’. Respondenten kunnen eigen houding
positioneren. De meetschaal heeft geen vaste meeteenheid, maar door de breedte van de schaal (11
categorieën)kunnen berekeningen zoals het gemiddelde wel zinvol zijn. Een uitspraak als ‘Walen zijn
gemiddeldlinkser dan Vlamingen’ is niet ongewoon.

HIËRARCHIE VAN DE MEETNIVEAU’S

Meetniveau van een variabele is bepalend voor de keuze van analysetechniek

→ hiërarchie van de meetniveau’s bepaald door het aantal bewerkingen die er mogelijk zijn op de betrokken
variabele

→ bewerkingen en analysetechnieken die zijn toegelaten voor variabelen van een laag meetniveau mogen ook
toegepast worden op variabelen van een hoger meetniveau, omgekeerd geldt dit niet

Overzicht van beschrijvende statistieken per meetniveau:

1.2.4 DATA CLEANING, TRANSFORMEREN EN OPERATIONALISEREN

Datamatrix

- Bestaat uit rijen, kolommen en cellen
o Rij: alle waarden gemeten voor 1 kenmerk bij alle eenheden
▪ Rij i omvat alle waarden xi
o Kolommen: alle waarden gemeten bij 1 onderzoekseenheid
▪ Kolom j omvat alle waarden xj
o Cel: specifieke waarde van respondent i voor een bepaald kenmerk j

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper StudentPolWetKUL. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €9,46. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 57413 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen

Populaire universiteiten

Populaire hogescholen

Populaire studieboeken voor Communicatie en Taal

Populaire studieboeken voor Economie en Bedrijf

Populaire studieboeken voor Exact en Informatica

Populaire studieboeken voor Gedrag en Maatschappij

Populaire studieboeken voor Gezondheid en Geneeskunde

Populaire studieboeken voor Recht en Bestuur

Verkoper