Statistiek I - samenvatting
H1: inleiding
= gegevens synthetiseren, analyseren, interpreteren en presenteren
(veel databronnen: surverygegevens, administratieve data, big data= veel registratie zonder
besef, bv. Sensoring in verkeer/smartphones etc.)
= statistiek als wetenschappelijke discipline – kennismethode om wereld beter te kunnen
begrijpen – empirisch OZ
kennis obv wetenschappelijk OZ: dataverzameling
Soorten statistiek
1) Beschrijvende statistiek
de wereld in cijfers beschrijven
basis: frequentievragen
samenvatten in ‘kengetallen’
gebruik van grafische gegevens
ordenen en synthetiseren van (grote hoeveelheid) gegevens – herleiden tot
– samenvattende maten (bv. Percentages, mediaan, kwantielen…)
– grafieken
2) inferentiële statistiek
middel om met beperkt aantal gegevens uitspraken te doen over breder
geheel/volledige populatie (generaliseren/extrapoleren)
extrapolatie: uitspraken over volledige bevolking obv steekproef (
representatief: aselect + genoeg ondervragen)
voorspellingen
veralgemeenbaarheid steekproefresultaten
3) verklarende statistiek
gericht op verklaring van verschillen en samenhang
bivariate regressie, multivariate regressie; survival anaylse…
bv.: Wat is de relatie tussen opleidingsniveau en inkomen?
Hans Rosling: Zweedse dokter, ‘statisticus’ – ontwikkkelaar ‘gapminder’ = organisatie die
misvattingen over mondiale onwtikkelingen wil tegengaan obv data
Misleiden door statistiek?
Uitkomsten van OZ kunnen gemanipuleerd worden bij (stadia van misleiding bij stat):
1. verzamelen van gegevens
– slechte selectie OZspersonen (niet representatief – probleem bij
online surveys verspreid via sociale media)
– te klein aantal OZSpersonen
– slechte vraagstelling (gestuurd/subjectief)
1
, – slechte operationalisatie (= vertaling van concepten naar
meetinstrumenten) of vergelijking van verschillende
operationalisaties (bv. Metingen COVID-19 in België vs andere
landen)
2. presentatie van de uitkomsten
– deel grafiek verwijderen (bv. Oorsprong)
– schaal manipuleren
– grafische aanpassingen
3. omschrijven van de conclusies
Oorsprong van statistiek
à ontstaan midden 18e eeuw
à 19e eeuw: steeds grotere verzameling gegevens – ook analyse en presentatie van data
– Royal Statistical Society (1834)
à Adolphe Quetelet: organiseert eerste internationale conferentie over statistiek (1853)
à Florence Nightingale:
o Grondlegster moderne verpleegkunde en sociaal hervormster
o Introduceert gebruik van statistieken in gezondheidszorg, uitvindster
pooldiagram
o Eerste vrouwelijke lid RSS
Belang nieuwe cijfersymbolen
(huidig systeem: Hindu-Arabisch systeem)
– Efficiënt voor complexe bewerkingen
– Getallen in cijfersymbolen sneller te lezen
– Enige universele taal
– Cruciaal voor start wetenschappelijke revolutie in EU en opkomst moderne
natuurwetenschap vanaf 17e E
H2: Meten en meetschalen
Terminologie en kernbegrippen
Onderzoekspopulatie: alle leden van een welomschreven groep die je wil
onderzoeken
Statistische eenheid of case: element uit de bestudeerde bevolking (mensen,
woningen, landen…) – statistiek bestudeert de kenmerken van die bevolking
Let op: statistische eenheid bepaalt je analyseniveau (binnen analyseniveau blijven
wanneer besluiten nemen)
– Microniveau: individuen
– Tussenniveau: scholen
– Macroniveau: landen
– Ecological fallacy: bevindingen op hoog niveau toepassen op individuen
Variabele: kenmerken van onderzoekseenheden waarin we geïnteresseerd zijn
– bij sommige kenmerken zijn de waarden al een getal, bij andere
kenmerken dit niet het geval (bv. Geslacht)
datamatrix:
2
, – cases (waarnemingseenheden/statistische eenheid): in rijen = records
– variabelen/kernmerken (waarde varieert): in kolommen
– waarden: in cellen
parameters: kengetallen die de verdeling weergeven van een kenmerk in een
populatie (volledige populatie parameters – steekproef statistische
maten/schatters)
steekproeven: onderzoek mtb specifieke bevolkingsgroep (populatie) vaak
onmogelijk te onderzoeken steekproef: deel van de populatie (inferentiële
statistiek: conclusies trekken over volledige populatie pbv steekproefOZ)
steekproefstatistieken (statistics): statistische kengetallen van een steekproef of
schatters = een numerieke samenvatting van de steekproef uit de populatie
statistische reeks: reeks waarnemingen
tijdreeks: reeks waarnemingen in de tijd – ogenblik van waarneming is belangrijk
voor de interpretatie van de gegevens (bv. Evolutie van iets doorheen de tijd – vaak
trendsanalyses)
dimensie van een reeks: aantal variabelen dat simultaan wordt waargenomen of
bestudeerd
– unidimensionale of univeratie reeks 1 variabele bekijken
– tweedimensionale of bivariate reeks vergelijken tussen 2 groepen
– multidimensionale of multivariate reeks meerdere variabelen in
rekening brengen
Waarom meten?
à Laat ons toe om vergelijkingen te maken
à Standaarden nodig om te vergelijken (bv. Cm, km…)
à Statistiek heeft nood aan standaarden; gestandaardiseerde meetschalen en
gestandaardiseerde indicatoren = meetschaal die toelaat meetwaarden op een
consistente en vergelijkbare manier te interpreteren, ongeacht context
Wat is meten?
Operationalisatie:
– Meetbaar maken van variabelen dmv 1 of meerdere vragen
– Bepalend voor rest van OZ
– Meesatl obv voorafgaand OZ of obv een theorie
– Sommige variabelen hoeven niet onderbouwd te zijn (bv. geslacht),
andere wel (bv. armoede, seksisme…)
Variabele: een afbeelding van een bevolking P in een verzameling X van warden
gemeten eigenschap of kenmerk
Afhankelijke en onafhankelijke variabelen:
– In OZ variabele verklaren obv een andere/relaties met andere
variabelen in kaart brengen (afhankelijke = variabele die je wil
verklaren)
Meten: verdelen van de populatie P in equivalentieklassen = deelverzameling van P
die alle elementen groepeert die equivalent (gelijk) zijn voor het bestudeerde
kenmerk
3
, Schalen: toekennen van een eigen waarde (kwalitatief of kwantitatief) aan elke
equivalentieklasse van het ongeschaalde kenmerk
Meetschaal (van de variabele): de verzameling X van waarden
Meten & meetschalen
à Toekennen van getallen aan equivalentieklassen
à Hoe? 2 regels:
1) Aan elke waarde van het ongeschaalde kenmerk een unieke, specifieke
‘code’ toekennen
2) De toegekende waarden aan equivalentieklassen weerspiegelen de relaties
die in realiteit bestaan tussen de equivalentieklassen, en énkel die relaties
Kwantitatieve vs kwalitatieve waarden
à In sociale wetenschappen vaak kwantitatieve waarden
à Voordelen?
o Eenduidiger dan kwalitatieve waarden
o Verwerking van kwantitatieve waarden via computer vlotter
o Meer mogelijkheden tot analyse
Gegevens kunnen worden samengevat in simpele beschrijvende maten
Relaties tussen kenmerken kunnen als algebraïsche functies uitgedrukt
worden
Eigenschappen van variabelen en meetniveaus
Meetniveau: de manier waarop je een variabele meet, bepaalt het meetniveau of de
meetschaal van de variabelen
meetniveau bepaalt welke statistische analyses mogelijk zijn en welke niet
4 meetschalen:
1) Nominaal
2) Ordinaal
3) Interval
4) Ratio
hiërarchie van de meetschalen/meetniveaus: NOIR; bewerkingen toegelaten voor
variabelen v/e bepaald meetniveau mogelijk worden toegepast op variabelen van een
hiërarchisch hoger meetniveau, maar niet op variabelen van een lager meetniveau
Eigenschappen van variabelen
Nominale variabelen:
– Classificatie
– Numerieke waarde = slechts een naamgeving (je kunt niet rekenen met de waarden
die je aan de variabelen gegeven hebt)
Ordinale variabelen:
– Classificatie + rangorde
– De variabele of meetschaal X is ordenbaar wanneer voor elk baar elementen x1 en x2
van X, men kan bepalen of x1 > x2 dan wel x2 < x1
– Bv. opleidingsniveau
– Opmerking:
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller silkelievens2005. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $14.74. You're not tied to anything after your purchase.