100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Sociale statistiek - Prof Dr Meeusen - KUL $6.51   Add to cart

Summary

Samenvatting Sociale statistiek - Prof Dr Meeusen - KUL

 63 views  5 purchases
  • Course
  • Institution

Het document omvat een volledige samenvatting van het vak statistiek voor de sociale wetenschappen aan de KUL. Gedoceerd door prof Cecil Meeusen in academiejaar . De samenvatting behandeld alle theorie, formules en voorbeelden uit de cursus. Incl voorbeelden!

Preview 4 out of 67  pages

  • January 26, 2023
  • 67
  • 2022/2023
  • Summary
avatar-seller
Hoofdstuk 1: van probleemstelling naar data-analyse
1.1 Doel van de statistiek
1.1.1 Statistiek is overal
Dataficatie = de trend waarbij dagdagelijkese acties en interacties worden omgezet in data die kunnen
worden opgevolgd, geanalyseerd en geoptimaliseerd

Binnen de sociale wetenschappen domineert kwantitatief onderzoek = data wordt omgezet in nummers
zodat deze kunnen worden ganalyseerd dmv statistische methoden

Social data science = combinatie tussen domein specifieke kennis, computerkennis en data-
wetenschappen
 taak van sociale wetenschapper: bruggen bowuen tussen deze disciplines  toepassing binnen de
samenleving
1.1.2 Het doel van data- analyse
Data-analyse = de kunst en de wetenschap van het evrzamelen, meten, organiseren, presenteren,
analyseren en interpreteren van data met als doel inzicht verwerven op basis van deze data
- Inzicht: onderzoeksvragen beantwoorden op basis van data
- Wetenschap: objectief, onafhankelijk van de beoefenaar
- Kunst: creatief, interpretatief, afhankelijk van de beoefenaar
o Beslissingen van de onderzoeker
o Meten van bep kenmerken en vraagformulering ervan
o Analyseren en interpreteren van de data
- Data: veel verschillende soorten data uit verschillende soorten bronnen  hebben verschillende
vormen: numeriek, tekst, afbeeldingen, audio
1.2 Van probleemstelling naar data-analyse
1.2.1 Probleemstelling
Bij wie of wat verzamelen we welke gegevens?  afhankelijk van de onderzoeksvraag  onderzoeksvraag
start altijd vanuit een probleemstelling




1.2.2 Data verzamelen
Data wordt verzameld bij onderzoekseenheden = eenheden of objecten waarop het onderzoek betrekking
heeft en waarbij kenmerken gemeten worden  kunnen personen zijn, maar zijn niet altijd mensen

Een populatie = een verzameling van alle onderzoekseenheden die gekenmerkt worden door een
afbakening in tijd en ruimte
 volstaat om een goede steekproef uit populatie te selecteren

Een steekproef = een deelverzameling van onderzoekseenheden uit de populatie
- Een willekeurige steekproef = elke onderzoekseenheid heeft een even grote kans om geselecteerd
te worden
- Een steekproef is representatief op een kenmerk als het kenmerk in gelijke mate voorkomt in de
steekproef als in de populatie
- Omvang of grootte van een steekproef: symbool n

,Na omschrijving populatie  gegevens verzamelen
 Data die je nodig hebt is ergens beschikbaar
o Data archieven, publieke overheidsinfrastructuren, …
 Data zelf verzamelen
o Vragenlijsten, handmatige codering, experimenten, …

Data = informatie en kenmerken gemeten bij onderzoekseenheden
 kunnen uit verschillende bronnen komen:
 Surveys: respondenten krijgen enkele gesloten/open vragen die demigrafische kenmerken,
attitudes en gedragen pogen te meten
 Experimenten: oorzaak-gevolg verband in kaart brengen  onderzoekseenheden willekeurig over
verschillende groepen te verdelen en ze aan verschillende omstandigheden/interventies
blootstellen (= manipulatie)  verschillen betekent oorzakelijk verband

Big Data: volume, veranderlijkheid en verscheidenheid
 Data is heel groot
 Data wordt aan een sneltempo geproduceerd
 Data heeft verschillende soorten en vormen
- Voorbeelden:
o Sociale media data, geodata, data uit medische dossiers, administratieve data, ..
1.2.3 Meten van gegevens
Classificatie van gegevens
Na selectie steekproef uit populatie  kenmerken meten bij onderzoekseenheden
Deze kenmerken zijn variabelen
- Notatie: hoofdletters X,Y,Z,…

Uitkomstenverzameling = de verzameling van alle mogelijke uitkomsten voor een variabele
- Notatie: 𝝋

Geobserveerde waarnemingen = de uitkomsten die daadwerkelijk geobserveerd zijn in de steekproef of
populatie
Vb. uitkomstenverzameling kan 𝝋 = {man, vrouw, andere} zijn maar in de steekproef zitten uiteindelijk
alleen maar vrouwen

Aard en omvang van de uitkomsten hebben een grote invloed bij bepalen van de statistische techniek:
1) Aard = onderliggende meetniveau
 Kwanititatief meetniveau
 kan zowel discreet als continu zijn
o Interval
o Ratio
 Kwalitatief meetniveau
 altijd discreet
o Nominaal
o Ordinaal
2) Omvang
 Discreet : de uitkomstenverzameling is eindig
- Notatie: 𝝋 = {m1, m2, m3, …, mk} waarbij k oneindig is
 niet mogelijk om tussen tweeopeenvolgende uitkomsteen derde uitkomst te bedenken
Vb. aantal juiste antwoorden op 10, aantal kinderen
 Continu: de uitkomstenverzameling is oneindig (niet telbaar) groot

, - Notatie: 𝜑 = {ℝ}
 steeds een derde uitkomst te bedenken tussen twee opeenvolgende uitkomsten
Vb. variabele gewicht of tijd
 vaak voorgesteld als discrete gegevens: meestal afgerond  blijven wel continue gegevens!
Vb. gewicht wordt weegegeven als 67kg en niet als 67,373562772kg




Meetniveau
Kwalitatief meetniveau:
Nominaal meetniveau
- Meetprocedure: classificeren in categoriën, benoemen
o Niet te interpreteren in meer en minder
o Verschil in waarden representeert geen verschil in kwantiteit  enkel een kwalitatief
verschil
o Geen wiskundige bewerkingen mogelijk
o Codes: kunnen eender welk symbool aannemen: letters, cijfers, woorden
Vb. 𝜑 = {𝐵𝑒𝑙𝑔, 𝑁𝑒𝑑𝑒𝑟𝑙𝑎𝑛𝑑𝑒𝑟, 𝐵𝑟𝑖𝑡, 𝐴𝑛𝑑𝑒𝑟𝑒}, of 𝜑 = {𝐵𝐸, 𝑁𝐿,𝑈𝐾, 𝐴}, of 𝜑 = {1, 2, 3, 8} met 1 =
Belg, 2 = Nederlander, 3 = Brit, 8 = Andere
- Meetschaal: eindig, exhaustief en exclusief  elke observatie hoort maar thuis in één categorie en
alle mogelijke categoriën zijn gegeven in de meetschaal
o Dichotome meetschaal = wanneer de nominale meetschaal slechts twee waarden kan
aannemen (en observaties dus slechts in twee categoriën kunnen worden opgedeeld)

Ordinaal meetniveau
- Meetprocedure: elementen van de uitkomstenverzameling kunnen geordend worden
o Kunnen geïnterpreteerd worden als meer en minder, hoger of lager
Vb. politieke interesse met 𝜑 = {𝑁𝑖𝑒𝑡 𝑔𝑒ï𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒𝑒𝑟𝑑, 𝑒𝑒𝑛 𝑏𝑒𝑒𝑡𝑗𝑒 𝑔𝑒ï𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒𝑒𝑟𝑑,
𝑔𝑒ï𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒𝑒𝑟𝑑, ℎ𝑒𝑒𝑙 𝑔𝑒ï𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒𝑒𝑟𝑑}
o Geen vaste meeteenheid
o Verschillen niet in vastgelegde hoeveelheden
o Geen wiskundige bewerkingen mogelijk tenzij oerdening van de meetschaal
Vb. mediaan
- Meetschaal: eindig, exhaustief en exclusief

Likertschaal = een veelgebruikte meetschaal in sociaalwetenschappelijk onderzoek om houdingen,
attitudes en ovetuigingen te meten
- Bestaat meestal uit 5, 7 of 11 antwoordcategoriën
Vb. ‘helemaal eens’ tot ‘helemaal oneens’, ‘nooit’ tot ‘altijd’, …
- Intristiek ordinaal: de antwoordcategoriën hebben een kwalitatieve betekenis en zijn geordend,
maar ze hebben geen meeteenheid
 in de praktijk vaak als kwantitatief meetniveau gebruikt waneer de schaal breedt genoeg is

, Kwantitatief meetniveau:
- De geobserveerde gegevens sluiten dicht aan bij wat letterlijk ‘gemeten’ wordt
- Vaste, kwantificeerbare meeteenheid
- Verschil tussen geobserveerde waarden wordt uitgedrukt in hoeveelheden
- Codes: getallen met een nummerieke betekenis
- Kunnen zowel een discrete als continue uitkomstenverzameling hebben

Interval meetniveau
- Meetprocedure: vaste, kwantificeerbare meeteenheid
Vb. temperatuur, IQ
o Verschil kan uitgedrukt worden in hoeveelheden, maar nulpunt is arbitrair
 verhoudingen tussen waarden zijn betekenisloos
o Wiskundige bewerkingen zijn mogelijk
 Optellen en aftrekken toegestaan
 Multiplicatie en delen niet mogelijk vanwege arbitriar nulpunt
- Codes: getallen met numerieke betekenis, meetresultaten

Ratio meetniveau
- Meetprocedure: kwantificeerbaare meeteenheid
o Verschil kan uitgedruk worden in hoeveelheden en verhoudingen tussen waarden zijn wel
zinvol  absoluut nulpunt
o Alle wiskundige bewerkingen zijn mogelijk
- Codes: getallen met numerieke betekenis, meetresultaten

Groeperen van kwantitatieve gegevens
Vaak worden kwantitatieve variabelen gegroepeerd tot nominale of ordinale meetschalen
 typisch voorbeeld: leeftijd dat initieel een ratio meetschaal heeft maar gegroepeerd wordt in
leeftijdscategoriën en zo een ordinale meetschaal kent
Vb. 𝜑 = {[0, 20],[21, 40],[41, 60],[61, 80],[> 80]}

Voordelen van opdelen in klassen:
 Data kunnen op snelle en overzichtelijke manier worden weergegeven
 Bewaakt privacy van respondenten

Nadeel opdelen in klassen:
 Gedetailleerde informatie wordt vereenvoudigd tot klassen  er gaat informatie verloren

Quasi-metrische variabelen = schalen die intristiek ordinaal zijn, want geen meeteenheid bezitten, maar
door de omvang van de uitkomstenverzameling toch als een kwantitatieve variabele gebruikt worden
Vb. Iemands houding op de links-rechts as  doorgaans gemeten op een 11-punt schaal die gaat van 0 tot
10,  waarde ‘0’ staat voor ‘links’ en de waarde ‘10’ staatvoor ‘rechts’. Respondenten kunnen eigen
houding positioneren. De meetschaal heeft geen vaste meeteenheid, maar door de breedte van de schaal
(11 categorieën)kunnen berekeningen zoals het gemiddelde wel zinvol zijn. Een uitspraak als ‘Walen zijn
gemiddeldlinkser dan Vlamingen’ is niet ongewoon.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller inakeuppens. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.51. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

79202 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling

Recently viewed by you


$6.51  5x  sold
  • (0)
  Add to cart