Kwantitatieve onderzoeksmethoden – samenvatting
Inleiding
Waarom statistiek?
-start: 17de E->ontwikkeling: 18de E (oiv Mercantillisme, overheden wouden hun balans
positief houden)->doorbraak in 19de E
->historici: later pas, tot 20ste E: vooral geïnteresseerd in kwalitatieve geschiedenis
-verandert ’20-’50: Franse Annales-school: Emmanuel Le Roy Ladurie
-’60-’80: bloeiperiode statistiek in geschiedenis vb: Robert Fogel: aanleg Amerikaanse
spoorwegen+ec groei Amerika: verband
-’90-nu: minder populair, maar nooit ver weg
Voordelen
-history from below: beeld van gewone mensen in het verleden
-overzichtelijk: kunnen in 1 oogopslag een grote hoeveelheid info meegeven
-modelleren en manipuleren van data
-hypotheses testen: is de stijging een echte trend? Is dit significant? Eerder toeval?
-tijdreeksanalyse: verband tss tijd en historische ontwikkeling te testen
-steekproeven: nooit in staat iedereen te testen=>kleinere steekproef gebruiken
-falsifieerbaar: kan makkelijker gecontroleerd w
Nadelen
-problematische data: vroeger: data voor andere redenen gemeten dan wij
-cijfers zijn nooit neutraal
Soorten data en concepten
Categorische -nominaal (=ongeordend), vb: familienamen, gestolen goed,…
-ordinaal (=geordend, hiërarchie aanwezig) vb: status beschuldigde
Numeriek -interval (discreet<->continue (cijfers na komma mogelijk))
-ratio (nooit onder 0, verhouding tss waarden)
Datamatrix: algemeen: componenten
-Tabel
-Waarnemingseenheid (volledige rij die alle info van 1 eenheid bevat)
-Variabele (leeftijd, voornaam,…)
-Waarde
Vuistregels tabellen
-titel: beschrijving inhoud, periode en munteenheid
-voetnoot: bron (!), mogelijk ook extra uitleg
-rij- en kolomtitel, kort en duidelijk, inclusief meeteenheden
-gegevens die we willen vergelijken zetten we zo dicht als mogelijk bij elkaar
,Tabellen
Distributie=reeks waarden per variabele
Frequentie=hoeveelheid of aantal keer dat een waarde van deze variabele voorkomt
=>Frequentietabel=combinatie, tabel v frequentie waarmee een specif. variabele voorkomt
3 soorten frequentietabellen
->3 soorten:
-simpel: nuttig wanneer er weinig verschillende waarden weergegeven moeten w
-gegroepeerd: met klassenbreedte werken
-cumulatief: weten wat het aandeel is van een aantal groepen tov het geheel
=>kunnen absolute en relatieve frequenties bevatten
Simpel gegroepeerd cumulatief
Extra tabellen:
-kruistabellen, technisch gezien ook een frequentietabel: verschillende variabelen
-specifieke tabellen met SPSS, zie later
Grafieken
->vereisten: moet zelfstandig leesbaar zijn, steeds een titel krijgen
en bron, ook: alle assen: astitel, jaartallen ook steeds op x-as
-staafdiagram: horizontale/verticale staven
-variabelen discreet? =>afstand, indien zelfde variabele:
staven mogen tegen elkaar
=>variant: geclusterde staafdiagram=>bvb per jaar een
overzicht van alle veesoorten
=>variant: stapeldiagram, dan: boven op elkaar
->ook: bevolkingspiramides zijn een bijzonder staafdiagram ‘gewoon’ staafdiagram
,-taartdiagram: slechts 1 variabele weergeven, best bij ‘aandeel van een totaal’-situatie
-lijngrafiek: zelfde soort info als staafdiagram, maar vaak voor numerieke variabelen
->ideaal voor evolutie doorheen de tijd
-puntenwolk: vooral bij correlatie-analyses, geven 2 variabelen tegenover elkaar weer
Logaritmische schaal
->indien hele geschiedenis lijken samengedrukt
->oplossing 1: verticale as manipuleren: maximum invoeren
-deel data kwijt, maar geeft een beter inzicht, fluctuaties beter zichtbaar
->maar ≠ ideaal=>oplossing 2: logaritmische schaal
=vertekening van de schaal, afstand 1-10=afstand 10-100
=>zonder verlies hoogste waarde
=>beste als we geïnteresseerd zijn in relatieve veranderingen: eerder in snelheid
veranderingen dan absolute veranderingen geïnteresseerd
=>OF veranderingen lange termijn om leesbaarheid enigszins te bewaren
-indien enkel y-as uitgedrukt w in logaritmische schaal=>semi-logaritmische grafiek
-beide assen?=>logaritmische grafiek
->vaak e (2,718, ln) of 10 (log) gekozen als grondgetal
Praktisch
SPSS
String: nominale/ordinale gegevens
, Numeric: numerieke gegevens
=>categoriseren in type en measure
In Value: code ingeven en van een label voorzien (vb: dorpen nummers geven, dan:
nummers terug namen geven, om tikfouten te voorkomen)
Tabellen
Excel
Insert->pivot table->range selecteren
->waarden waar je ze wilt verplaatsen
-absolute cijfers: meestal gegeven
-relatieve cijfers: bij values->field settings->show values as->percent of grand total
-gegroepeerde frequentietabellen->vergen wat meer moeite,
niet via pivot table
-sum(…) en herhalen, ook rij: ‘totaal’
-relatieve cijfers: cel selecteren, door totaal delen
->$ voor en na de letter als je wilt vastzetten
->in percentage via opmaak cellen, en dan % selecteren
-cumulatieve FT: optellen->voor eerste waarde: gewoon eerste waarde,
Vanaf 2de waarde enzoverder: SUM of eerste en tweede, naar beneden slepen
->ook weer $ voor eerste waarde zetten om ervoor te zorgen: blijven optellen
SPSS
->simpele frequentietabel: analyze->descriptive statistics->frequencies->variabele
selecteren+display frequency tableaanvinken->ok
-gaat zelf ook relatieve en cumulatieve frequenties berekenen
->groepeerde frequentietabel: ruwe data in categorieën omvormen
->transform->recode into different variables->naam geven aan nieuwe variabele (zal
ook kolomtitel w)
->dan: old and new values: old value: Value: ‘Duitsland’->’output variables are
strings’ aanduiden->new value: ‘Buurland’=>op ‘add’ duwen->ok
->tabel maken door stappen hierboven uit te voeren
->best gegroepeerde frequentietabel op SPSS, oefenen! Wss op examen
Grafieken
Excel
->staafdiagram: data selecteren->naast recommended charts->eerste optie
=>aanvullen op x- en y-as indien nodig
->select data=>edit=>label range kiezen, variabelen selecteren in tabel
=>axcis titles ook invoegen! Handmatig ingeven
->Ook: chart title