Statistiek I - samenvatting
H1: inleiding
= gegevens synthetiseren, analyseren, interpreteren en presenteren
(veel databronnen: surverygegevens, administratieve data, big data= veel registratie zonder
besef, bv. Sensoring in verkeer/smartphones etc.)
= statistiek als wetenschappelijke discipline – kennismethode om wereld beter te kunnen
begrijpen – empirisch OZ
kennis obv wetenschappelijk OZ: dataverzameling
Soorten statistiek
1) Beschrijvende statistiek
de wereld in cijfers beschrijven
basis: frequentievragen
samenvatten in ‘kengetallen’
gebruik van grafische gegevens
ordenen en synthetiseren van (grote hoeveelheid) gegevens – herleiden tot
– samenvattende maten (bv. Percentages, mediaan, kwantielen…)
– grafieken
2) inferentiële statistiek
middel om met beperkt aantal gegevens uitspraken te doen over breder
geheel/volledige populatie (generaliseren/extrapoleren)
extrapolatie: uitspraken over volledige bevolking obv steekproef (
representatief: aselect + genoeg ondervragen)
voorspellingen
veralgemeenbaarheid steekproefresultaten
3) verklarende statistiek
gericht op verklaring van verschillen en samenhang
bivariate regressie, multivariate regressie; survival anaylse…
bv.: Wat is de relatie tussen opleidingsniveau en inkomen?
Hans Rosling: Zweedse dokter, ‘statisticus’ – ontwikkkelaar ‘gapminder’ = organisatie die
misvattingen over mondiale onwtikkelingen wil tegengaan obv data
Misleiden door statistiek?
Uitkomsten van OZ kunnen gemanipuleerd worden bij (stadia van misleiding bij stat):
1. verzamelen van gegevens
– slechte selectie OZspersonen (niet representatief – probleem bij
online surveys verspreid via sociale media)
– te klein aantal OZSpersonen
– slechte vraagstelling (gestuurd/subjectief)
1
, – slechte operationalisatie (= vertaling van concepten naar
meetinstrumenten) of vergelijking van verschillende
operationalisaties (bv. Metingen COVID-19 in België vs andere
landen)
2. presentatie van de uitkomsten
– deel grafiek verwijderen (bv. Oorsprong)
– schaal manipuleren
– grafische aanpassingen
3. omschrijven van de conclusies
Oorsprong van statistiek
à ontstaan midden 18e eeuw
à 19e eeuw: steeds grotere verzameling gegevens – ook analyse en presentatie van data
– Royal Statistical Society (1834)
à Adolphe Quetelet: organiseert eerste internationale conferentie over statistiek (1853)
à Florence Nightingale:
o Grondlegster moderne verpleegkunde en sociaal hervormster
o Introduceert gebruik van statistieken in gezondheidszorg, uitvindster
pooldiagram
o Eerste vrouwelijke lid RSS
Belang nieuwe cijfersymbolen
(huidig systeem: Hindu-Arabisch systeem)
– Efficiënt voor complexe bewerkingen
– Getallen in cijfersymbolen sneller te lezen
– Enige universele taal
– Cruciaal voor start wetenschappelijke revolutie in EU en opkomst moderne
natuurwetenschap vanaf 17e E
H2: Meten en meetschalen
Terminologie en kernbegrippen
Onderzoekspopulatie: alle leden van een welomschreven groep die je wil
onderzoeken
Statistische eenheid of case: element uit de bestudeerde bevolking (mensen,
woningen, landen…) – statistiek bestudeert de kenmerken van die bevolking
Let op: statistische eenheid bepaalt je analyseniveau (binnen analyseniveau blijven
wanneer besluiten nemen)
– Microniveau: individuen
– Tussenniveau: scholen
– Macroniveau: landen
– Ecological fallacy: bevindingen op hoog niveau toepassen op individuen
Variabele: kenmerken van onderzoekseenheden waarin we geïnteresseerd zijn
– bij sommige kenmerken zijn de waarden al een getal, bij andere
kenmerken dit niet het geval (bv. Geslacht)
datamatrix:
2
, – cases (waarnemingseenheden/statistische eenheid): in rijen = records
– variabelen/kernmerken (waarde varieert): in kolommen
– waarden: in cellen
parameters: kengetallen die de verdeling weergeven van een kenmerk in een
populatie (volledige populatie parameters – steekproef statistische
maten/schatters)
steekproeven: onderzoek mtb specifieke bevolkingsgroep (populatie) vaak
onmogelijk te onderzoeken steekproef: deel van de populatie (inferentiële
statistiek: conclusies trekken over volledige populatie pbv steekproefOZ)
steekproefstatistieken (statistics): statistische kengetallen van een steekproef of
schatters = een numerieke samenvatting van de steekproef uit de populatie
statistische reeks: reeks waarnemingen
tijdreeks: reeks waarnemingen in de tijd – ogenblik van waarneming is belangrijk
voor de interpretatie van de gegevens (bv. Evolutie van iets doorheen de tijd – vaak
trendsanalyses)
dimensie van een reeks: aantal variabelen dat simultaan wordt waargenomen of
bestudeerd
– unidimensionale of univeratie reeks 1 variabele bekijken
– tweedimensionale of bivariate reeks vergelijken tussen 2 groepen
– multidimensionale of multivariate reeks meerdere variabelen in
rekening brengen
Waarom meten?
à Laat ons toe om vergelijkingen te maken
à Standaarden nodig om te vergelijken (bv. Cm, km…)
à Statistiek heeft nood aan standaarden; gestandaardiseerde meetschalen en
gestandaardiseerde indicatoren = meetschaal die toelaat meetwaarden op een
consistente en vergelijkbare manier te interpreteren, ongeacht context
Wat is meten?
Operationalisatie:
– Meetbaar maken van variabelen dmv 1 of meerdere vragen
– Bepalend voor rest van OZ
– Meesatl obv voorafgaand OZ of obv een theorie
– Sommige variabelen hoeven niet onderbouwd te zijn (bv. geslacht),
andere wel (bv. armoede, seksisme…)
Variabele: een afbeelding van een bevolking P in een verzameling X van warden
gemeten eigenschap of kenmerk
Afhankelijke en onafhankelijke variabelen:
– In OZ variabele verklaren obv een andere/relaties met andere
variabelen in kaart brengen (afhankelijke = variabele die je wil
verklaren)
Meten: verdelen van de populatie P in equivalentieklassen = deelverzameling van P
die alle elementen groepeert die equivalent (gelijk) zijn voor het bestudeerde
kenmerk
3
, Schalen: toekennen van een eigen waarde (kwalitatief of kwantitatief) aan elke
equivalentieklasse van het ongeschaalde kenmerk
Meetschaal (van de variabele): de verzameling X van waarden
Meten & meetschalen
à Toekennen van getallen aan equivalentieklassen
à Hoe? 2 regels:
1) Aan elke waarde van het ongeschaalde kenmerk een unieke, specifieke
‘code’ toekennen
2) De toegekende waarden aan equivalentieklassen weerspiegelen de relaties
die in realiteit bestaan tussen de equivalentieklassen, en énkel die relaties
Kwantitatieve vs kwalitatieve waarden
à In sociale wetenschappen vaak kwantitatieve waarden
à Voordelen?
o Eenduidiger dan kwalitatieve waarden
o Verwerking van kwantitatieve waarden via computer vlotter
o Meer mogelijkheden tot analyse
Gegevens kunnen worden samengevat in simpele beschrijvende maten
Relaties tussen kenmerken kunnen als algebraïsche functies uitgedrukt
worden
Eigenschappen van variabelen en meetniveaus
Meetniveau: de manier waarop je een variabele meet, bepaalt het meetniveau of de
meetschaal van de variabelen
meetniveau bepaalt welke statistische analyses mogelijk zijn en welke niet
4 meetschalen:
1) Nominaal
2) Ordinaal
3) Interval
4) Ratio
hiërarchie van de meetschalen/meetniveaus: NOIR; bewerkingen toegelaten voor
variabelen v/e bepaald meetniveau mogelijk worden toegepast op variabelen van een
hiërarchisch hoger meetniveau, maar niet op variabelen van een lager meetniveau
Eigenschappen van variabelen
Nominale variabelen:
– Classificatie
– Numerieke waarde = slechts een naamgeving (je kunt niet rekenen met de waarden
die je aan de variabelen gegeven hebt)
Ordinale variabelen:
– Classificatie + rangorde
– De variabele of meetschaal X is ordenbaar wanneer voor elk baar elementen x1 en x2
van X, men kan bepalen of x1 > x2 dan wel x2 < x1
– Bv. opleidingsniveau
– Opmerking:
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper silkelievens2005. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €13,66. Je zit daarna nergens aan vast.