HC6 samenvatting
H8 beschrijven en analyse van gegevens
Analyse van kwalitatieve en kwantitatieve gegevens
De verzamelde gegevens moeten worden uitgewerkt tot een interpreteerbaar geheel.
- Kwantitatief onderzoek = gegevens beschrijven, samenvatten en modellen om effect van de ene variabel op de
andere te meten
- Kwalitatief onderzoek = zelfde technieken + inhoudsanalyse + etnografische onderzoeksmethode
Kwalitatieve data: Inhoudsanalyse = systematische analyse van informatie dat bestaat uit tekst of gesprek.
- Het voorkomen van bepaalde termen of thema’s.
- Tellen aan de hand van een codeerschema = schema met thematische categorieën -> kwalitatieve gegevens
worden kwantitatief (ATLAS.Ti, MaxQdata)
- Kijken naar relaties, patronen en verbanden.
Kwantitatieve data: beschrijvende analyse
- Beschrijven, verklaren, toetsen, voorspellen?
- Aantal onafhankelijke en afhankelijke variabelen?
- Meetniveaus van de variabelen?
Maten van centrale tendentie = de gegevens in 1 getal samen te vatten
1. Modus = getal dat het vaakste voorkomt
2. Mediaan = middelste getal, 50% ligt erboven en eronder. Niet gevoelig voor uitbijters -> belangrijk in de
criminologie -> beste maat om iets samen te vatten
3. Gemiddelde = gevoelig voor uitbijters
Maten van spreiding = hoeveel variatie er is om de centrale tendentie maat
1. Range = spectrum van alle getallen (soms hoogte en laagste weglaten)
2. Variantie = de gemiddelde som van de gekwadrateerde afwijkingen van de individuele scores van het
gemiddelde. Nadeel: door kwadrateren oorspronkelijke schaal weg.
3. Standaarddeviatie = oplossing ^ -> wortel uit de variantie. Weer interpreteren in originele schaal
Beschrijving van de duur tot een gebeurtenis
Niet alle variabelen zijn numeriek (interval of ratio) zoals recidiveonderzoek: of iemand recidiveert maar ook
wanneer (2 of 10 jaar met verschillende behandeling?)
Overlevingsduur onderzoek = het onderzoeken van de duur tot een bepaalde gebeurtenis
overlevingsduuranalyse, survivalanalyse, event-history-analyse, failure time-analyse.
- Afhankelijke variabel heeft alleen positieve waarden
- Gegevens zijn gecensureerd = degene die niet recidiveren tijdens de onderzoeksperiode, weet je niet of dat na
de onderzoeksperiode wel gebeurt. Dus de respondent telt mee tot het moment dat hij het onderzoek verlaat
(verhuizen, dood).
Overlevingsfunctie = voor ieder moment in de meting het percentage respondenten dat heeft overleefd
- At risk = het aantal respondenten dat de gebeurtenis (recidiveren) nog kan ondergaan -> als iemand verhuist of
overlijd dan wordt deze gecensureerd dus minder personen at risk -> maar cumalatieve overlevingskans is er nog
wel
- Sterfte kans = recidive kans -> hoeveel in die periode zijn gerecidiveerd; de kans om te recidiveren (als niemand
in die periode recidiveert dan is sterfte kans 0) -> aantal gerecidiveerd / aantal at risk
- Overlevingskans = kans om in die periode te overleven (als niemand in die periode recidiveert dan is de
overlevingskans 1) -> aantal niet gerecidiveerd / aantal at risk
,- Cumulatieve overleving = proportie respondenten die overleefd heeft op
tijdstip t
o St = St-1 X Pt (overleving)
o Je doet voor de cumulatieve overleving -> de overlevingskans X vorige cumulatieve overleving
o Door censureren wordt de cumulatieve overlevingskans lager
- Overlevingsfunctie = de cumulatieve overlevingskansen in de respectievelijke maanden vormen samen de
overlevingsfunctie -> grafisch weergegeven in een curve = Kaplan-Meier-overlevingscurve
Aannames overlevingsduuranalyse: de overlevingskansen zijn onafhankelijk over de intervallen -> daardoor kunnen
we de overlevingskansen over de opeenvolgende intervallen met elkaar vermenigvuldigen totale proportie van
overlevenden.
Goed kijken naar censuur en wat er dan gebeurt komt op TT!!
Kruisje = censuur gevallen
Kaplan-Meier overlevingscure: gebruikt alle beschikbare informatie
-> respondent telt mee tot hij uit het zicht verdwijnt
De curve eindigt lager (dan op basis % zou verwachten) omdat -> bij
cumulatieve overlevingskans rekening wordt gehouden met dat
niet iedere jongeren even lang na ontslag wordt geobserveerd ->
Exposuretijd = observatietermijn in de overlevingsduur analyse
Univariaat = kijken naar één variabel: recidiveren, IQ
,Bivariate analyse: de analyse van samenhang
Bivariate analyse = kijken naar de relatie tussen variabelen
Maten voor samenhang:
- Correlatiecoëfficiënt -> Pearson-product-moment correlatiecoëfficiënt
- Spearmans rho
Pearson-product-moment correlatiecoëfficiënt
De correlatie is de som van (per persoon) de afwijking van de score X i van die i-de
persoon van het gemiddelde Y.
De som van deze producten wordt gedeeld door de standaarddeviaties van X en Y
De correlatiecoëfficiënt is schaal en steekproefgrootte onafhankelijk -> voor 2
kwantitatieve variabelen.
- Kwantitatieve variabelen: interval of ratio
1. Sterk positieve correlatie: > 0 (+); hoge score op de ene variabel betekend
ook een hoge score op de andere variabel
2. Sterk negatieve correlatie: < 0 (-);
3. Zwakke positieve correlatie
4. Geen verband
Hoe dunner de puntenwolk hoe kleiner de range -> waarbinnen Y zal liggen
Nadelen correlatiecoëfficiënt:
- Het is een maat voor lineaire samenhang -> als er dus geen lineair verband is dan is CC geen goede maat
(logistisch) -> als boogje is; dan is CC laag; maar er is wel duidelijk een verband
- Gevoelig voor uitbijters/extreme scores
Spearman rho: als de variabelen een lager meetniveau hebben (dus niet ratio of interval) of als het meetniveau van
de twee variabelen gemengd is
Di = het verschil tussen de rangscore Xi en de rangscore Yi
Correctie voor verstorende invloeden
Er kan een spurieus verband zijn: samenhang wordt door een derde variabel veroorzaakt
Spurieus verband ontdekken via partiële correlatie = berekend de sterkte van het verband tussen X en Y, waarbij een
eventuele vertekening door een derde variabel Z is verwijderd.
, Aantal manieren om naar samenhang te kijken -> als variabel niet standaard interval meetniveau hebben
1. De ꭕ2- toets = Chi-kwadraat toets: nominale variabelen; niet perse de sterkte van het verband maar de of de
nulhypothese van geen verband wel/niet kan worden verworpen.
Voorwaarde van tabellen:
- Als 20% van de categorieën, een verwachte frequentie van 5 of hoger hebben. Chi-kwadraat niet geschikt ->
categorieën samenvoegen. o Bij 2 x 2 tabel moeten alle 4 de verwachte aantallen groter zijn dan 5
- Verwachte frequentie moet minimaal 1 zijn -> mag geen 0 zijn
2. Odds ratio = is de maat voor de verhouding va het relatief risico -> berekend de verhouding tussen de kans
verhoudingen.
Relatief risico = verhouding tussen de twee kansen. Medische methode
o Nieuwe methode 20/100 complicaties
o Oude methode 15/100 complicaties
20/100
Relatief risico = =1,33 = relatief risico.
15/100
Relatief risico van 1: dan is er geen verschil tussen beide methodes; kans is gelijk. Maar nu is bij nieuwe methode
33% meer kans op complicaties.
Odds ratio = verhouding van risico’s
o Nieuwe methode: 0,2 Kans op complicaties, 0,8 kans op geen complicaties -> 0,2/0,8 = 0,25. Dus 4x zo
kleine kans om wel complicaties te krijgen dan om geen complicaties te krijgen .
o Oude methode: 0,15 kans op complicaties, 0,85 kans op geen complicaties -> 0,15/0,85 = 0,176. Dus de
kans op complicaties is 17,6% van de kans om geen complicaties te krijgen
0,2/0,8 0,25
Odds ratio = = =1,42 Het risico is dus met 42% verhoogd.
0,15/0,85 0,176
Odds ratio van 1: dan is er geen verschil tussen de twee methodes; de kans op complicatie en geen complicatie is
dan gelijk.
Odds ratio > 1: verhoogd risico
Odds ratio < 1: risico verlagend
ODDS uitrekenen =
Bijzondere of nieuwe in de teller (bovenaan)
Rapporteren:
o Betrouwbaarheidsinterval voor gebruikt; als het interval 1 bevat -> dan geen verschil is risico tussen
beide methodes -> dan is de odds niet significant.
Breedte van betrouwbaarheidsinterval
is functie van steekproefgrootte; bij grote steekproef
minder snel het getal 1 en dus sneller significant
o Substantiële risicoverhoging = odds ratio 2 of hoger of
lager dan 0,5 -> evalueren
Reden voor gebruik van odds ratio: