GESCHIEDENIS EN GETAL
INLEIDING
HANDBOEK: TE KENNEN EN NIET TE KENNEN
- Pagina 17-51
- Pagina 53 – 82
o Pagina 72 – 76 ZEKER KENNEN!!!
o Pagina 80 – 82 ZEKER KENNEN!!!
- Pagina 85 – 107
o Pagina 93 – 96 NIET KENNEN!!!
- Pagina 109 – 135
o Pagna 112 – 115 NIET KENNEN!!!
o Formules NIET KENNEN!!!
- Pagina 137 – 153
o Pagina 153 – 169: enkel weten welke technieken dit zijn en in welke context te toegepast kunnen worden
o Pagina 146 ZEKER KENNEN!!!
o Formules NIET KENNEN!!!
- Pagina 199-217
o P 203-204 NIET KENNEN
- Pagina 219-263
o Pagina 203-204 NIET KENNEN!!!
DOEL VAN DE CURSUS
- Basisbegrippen statistiek
o Maar dan voor historici
- Inleiding tot kwantitatief onderzoek
o Maar dan voor historici
▪ Toepassingen in bestaand onderzoek doorgronden
▪ Technieken zelf toepassen
▪ SPSS als competentie
- Kritische vorming als mens
WAAROM?
- Massa aan gegevens
o Beschrijven, synthetiseren, analyseren, vergelijken, presenteren
o Verklaren → historicus/historica
- Kwantitatieve gegevens
- Kwalitatieve gegevens op een kwantitatieve manier benaderen
STATISTIEK ALS BASIS VAN…
Basisbegrippen statistiek voor historici, essentieel onderdeel methode in de gedrags- en cultuurwetenschappen (Digital
humanities)
- Cursus kwantitatieve methodes in het historisch onderzoek + verlengstuk van ‘historische kritiek’
- Statistisch significant is niet noodzakelijk historisch significant
,LES 1: GEGEVENS: DEFINITIES, ORDENING , GROEPERING EN GRAFISCHE WEERGAVE
CONCEPTEN
- Waarnemingseenheden (cases, observaties) – rijen
- Variabelen (variables) – kolommen
- Waarden (values) – cellen
Al deze zaken samen vormen de DATAMATRIX
Voorbeeld datamatrix: puntenlijst
- Variabelen bv: opdracht 1, opdracht 2, opdracht 3
- Observaties: namen van studenten
- Waarde: het punt dat een student haalt voor een opdracht
Elke analyse begint met een datamatrix
SOORTEN VARIABELEN
Kunnen verschillende vormen aannemen
- Twee soorten
o Kwantitatieve
▪ Meetbare eigenschap met numerieke waarden (leeftijd, lengte, inkomen…)
o Kwalitatief (categorisch, niet makkelijk in numerieke waarden uitdrukken, bv kleur, geslacht, type)
▪ Niet meetbare eigenschap
Onderscheid tussen nominaal, ordinaal of kardinale variabelen
- Nominaal
o Attributief → bv naamgeving, omschrijving van de misdaad
o Geen rangorde
o Discreet of categorisch (waarden sluiten elkaar uit)
- Kardinaal: meetbare variabelen (kan je ook meten)
o Ratio (leeftijd, waarde,…) of interval (jaartal, namelijk verschillende kalenders)
o Discreet (aantal kinderen) of continue (waarde)
- Ordinaal: rangschikking, hiërarchie, je kan ze ordenen (bv beroep in voorbeeld), je kan ze niet meten
o Onderscheid kardinaal en ordinaal belangrijk!!
Wat is er mis met deze tabel
- Laatste variabele
- Waarheidsgehalte van de tabel
- Welke variabele? Kardinaal of toch niet
echt?
- Niet meteen van uitgaan dat het
kardinale gegevens zijn
- Auteur heeft maatschappij ingedeeld,
hiërarchisch (sociale groepen)
o Hun omgang geschat
o Soort berekening van hun
gemiddeld inkomen
o Maar basis blijft sociale ordening die hij zelf heeft toegepast
o Gegevens dus niet als kardinaal bestempelen, kritisch zijn! → schijnkardinale gegevens
,TABEL EN GRAFIEK
TABEL
- Niet te verwarren met datamatrix
- Frequentietabel (ongegroepeerd/gegroepeerd) = geeft aan hoe veel keer een bepaalde waarde voorkomt (hoe vaak is
het cijfer weergegeven?)
- Kruistabellen
o Hoe vaak komen variabelen in combinatie met elkaar voor?
- Vereisten tabel
o Duidelijke en volledige titel
o Bronvermelding
o Vermelding van waarnemingseenheid, variabelen en meeteenheid
o Overzichtelijkheid
o Zelfstandigheid (tekst en tabel kunnen idealiter onafhankelijk van elkaar gelezen worden)
GRAFIEK
- Visuele controle van gegevens (fouten!)
- Exploratie van voorafgaand aan berekeningen: bijvoorbeeld verkenning verdeling
- Aanschouwelijke manieren van voorstellen
- Vereisten grafiek:
o Zijn zelfstandig in een tekst net zoals bij tabel
o Duidelijke en volledige titel
o Bronvermelding
o Assen: eenheid
o Schaalverdeling
o X en Y-as, onafhankelijke en afhankelijke variabele
o Legende
Pagina 25-42 handboek (Trend en Toeval)
LOGARITMEN
Logaritmen zijn wiskundige bewerkingen die de exponent aangeven waartoe een bepaald getal (het grondtal) moet worden
verheven om een ander getal te verkrijgen.
In statistiek worden logaritmen vaak gebruikt om de schaal van gegevens te wijzigen, vooral wanneer de gegevens een
exponentiële groei of afname vertonen. Logaritmen kunnen helpen om grote getallen kleiner te maken en het begrijpen van
relaties tussen variabelen te vergemakkelijken
CONCEPTEN
- Onderscheid tussen
o Metrische schaal
o Semi-logaritmische schaal
o Logaritmische schaal
- Even recapituleren
o q = loga (x) of aq = x
o waarbij: x = uitkomst bij grondtal a én• q = exponent
Relatieve positie in een bepaalde tijd (tegenover een andere tijd) is vooral van belang!
Grote fout is alles in absolute cijfers/schaal willen zetten! Foutief → in logaritmische (relatieve) schaal zetten!
, SOORTEN LOGARITMEN
- meest gebruikte zijn
o logaritmen met grondtal 10
▪ doorgaans kortweg log
o natuurlijke logaritmen, grondtal e
▪ e = 2,718
▪ kortweg In
Waarom gebruiken we de logaritmische transformatie?
- Ontwikkelingen op lange termijn: leesbaarheid
- Ontwikkelingen op lange termijn: groei
- Relatieve verhoudingen en veranderingen
- (mogelijk) verband tussen variabelen
- Vergelijkbaarheid variabelen met een andere meeteenheid
- Niet alleen voor grafische representatie!
VAN METRISCHE SCHAAL…
Een metrische schaal in de statistiek is een meetschaal
waarmee je niet alleen de verschillen tussen waarden kunt
meten, maar ook de verhoudingen.
➔ Schaalverdeling y-as = gelijk
- Wat zien we?
o Type grafiek: tijdsreek (1 van de variabele
is tijd, andere as is een index in dit geval)
o Absolute schaal
o Index landtransport en haver (voeding transportmiddel: paard, dierlijke consumptie), rogge (menselijke
consumptie)
o Wat is relatie tussen deze die indexen?
▪ Patroon? → landtransportprijzen voor groot deel bepaald door prijs voedingsmiddelen
▪ Prijs van haver bepaalt de prijs van het transport (niet infrastructuur of andere variabelen
NAAR SEMI-LOGARITMISCHE SCHAAL
Een semi-logaritmische schaal is een grafische weergave waarbij 1 as een lineaire schaal heeft en de andere as een logaritmische
schaam. Meestal wordt de y-as logaritmisch weergegeven en behoudt de x-as een lineaire schaal.
Bij een logaritmische weergave zijn de afstanden tussen 1 en 10, 10 en 100, 100 en 1000 enzovoort. Bij een lineaire schaal zijn de
afstanden langs de schaal gelijk.
➔ Schaalverdeling y-as → ongelijk, maar even groot
2 belangrijke punten → groei en leesbaarheid! Kritisch naar kijken
Handboek p 17 – 51