Gevorderde analysetechnieken overzicht
Deel 1: Inleidende begrippen
1. Introductie
Begrippen:
- Steekproefgrootheid = kansvariabele = percentage of gemiddelde uit kansverdeling
- Steekproevenverdeling = hoe steekproefgrootheden variëren bij onbeperkt herhaalde
steekproeftrekkingen
- Populatieverdeling = verdeling van de variabele in de populatie
- Dichotome variabelen = een variabele met 2 mogelijke uitkomsten: 0 en 1
- Centrale limietstelling = wanneer n > 30 zal de steekproevenverdeling neigen naar
normaliteit, ookal is de populatie niet normaal verdeeld
Afkortingen:
- p = percentage in de steekproef, zuivere schatter voor π
- = gemiddelde x, zuivere schatter voor μ
- π = percentage in de populatie (p0)
- μ = gemiddelde in de populatie
Doel: via steekproefgrootheden de populatiegrootheden schatten, adhv zuivere schatters: p en
(schatters voor μ en π)
- SE = standaarderror = spreiding
!(#$!)
o Spreiding p of σ p = ! &
'
o Spreiding of σ ==
√&
'
- Foutenmarge = z*
√&
- n = steekproefgrootte
o Als n stijgt, daalt de standaarderror, daalt de onzekerheid en spreiding in de
steekproef
1
,2. Hypothesetoetsen
Doel: nagaan in welke mate resultaten aan toeval te wijten zijn, nagaan of een geformuleerde
veronderstelling statistisch gevalideerd kan worden.
2.1. Geen hypothesetoetsing zonder hypothesen
- H0: geen effect, geen verschil, geen correlatie
o Verwerpen indien < 0,05
o Aanvaarden indien > 0,05
- Ha: wel effect, wel verschil, wel correlatie
o Eenzijdig of tweezijdig
2.2. Aanvaardingsinterval
= set van waarden (95%) die parameter kan aannemen indien h0 juist is.
ßà verwerpingsinterval of kritische zone = set van waarden die zo extreem zijn en een kleine kans
op voorkomen hebben wanneer h0 juist is (alfa van 5%, 2,5% langs elke kans), waardoor we h0
mogen verwerpen.
ßà betrouwbaarheidsinterval: set waarden waarvan je zegt dat de echte waarde met 95%
zekerheid in dat interval ligt
Hoe kleiner alfa,
- Hoe minder fout in de staarten
- Hoe groter betrouwbaarheidsinterval
- Hoe grotere kans om h0 te aanvaarden, maar grotere kans op fout
- Kleiner kans op fout 1ste soort; groter kans op tweede soort
Hoe groter alfa,
- Hoe kleiner betrouwbaarheidsinterval
- Kleiner kans om h0 te aanvaarden
2
,2.3. Fouten
Waarom maken we fouten? Doordat we met steekproeven werken. Maar we hebben die vrij goed
onder controle. We kunnen ze anticiperen door vb. voor een grotere steekproef te gaan (want hoe
groter n, hoe kleiner fout, hoe kleiner spreiding)
- Eerste soort:
We verwerpen h0 terwijl die eigenlijk juist is
Je kiest zelf hoe groot kans op fout is, vb. max 5%
Is af te lezen in spss (sign.)
- Tweede soort:
We aanvaarden h0 terwijl die eigenlijk fout is
o Om die niet te maken moet je
§ Weten hoe groot overlapping is tussen steekproevenverdeling en
populatieverdeling
§ Populatieverdeling kennen (is nooit)
è fout van de tweede soort kennen we nooit exact
o Je kan nooit weten hoe groot de fout van de tweede soort is, daarvoor moet je de
exacte bruin gearceerde oppervlakte kennen, en om dar te kennen moet je het
populatiegemiddelde mu weten, maar die ken je niet.
o fout van de tweede soort kunnen we dus enkel schatten, nooit zeker weten
Als kans op fout van de eerste soort groter wordt, wordt de tweede kleiner en
omgekeerd.
3
, 3. Betrouwbaarheidsintervallen om uitspraken te doen over
populatieparameters
' '
BI = - z* <μ< + z*
√& √&
'
Met foutenmarge = z*
√&
Met z* =
- 90 % à 1,645
- 95 % à 1,96
- 99 % à 2,576
4. Kwalitatieve methode
Kwalitatief Kwantitatief
Kenmerken: Kenmerken:
- Nummers - Tekst/narratief
- Wie, wat, waar, wanneer - Waarom, hoe
- Variabelen meten - Variabelen begrijpen en uitleggen
- Gemakkelijk te reepliceren
Data: Data:
- Gestructureerde variabelen - Ongestructureerde waarden
- Statistische analyses - Samenvatting
- Abjectieve conclusies - Subjectieve conclusies
- Door survey, experiment - Door interview, focusgroep, observ.
Beperkingen kwalitatief onderzoek:
- Lack of generalizability
- Researcher bias
- Lack of replicability: zelfde resultaten bekomen met zelfde methoden maar verschillende
data sample
4