Blok 6: Marktordening in de
zorg
Uitwerkingen van de tutorgroepen en verdiepingscolleges AVV
WG01-AVV: Variantieanalyse
Stel, je bent bij een zorgverzekeraar werkzaam als data-analist en wordt gevraagd om voor het
afgelopen jaar te bepalen hoeveel rughernia-operaties zijn gedeclareerd in elk van de drie
provincies die tot het kerngebied van de verzekeraar behoren. De onderzoeksvraag betreft:
‘bestaan er significante verschillen in het aantal operaties bij rughernia tussen ziekenhuizen in
Gelderland, Overijssel en Utrecht?’ Mocht uit de analyses blijken dat er inderdaad significante
verschillen zijn tussen de provincies, dan kunnen je collega’s bij zorginkoop deze informatie
gebruik als input voor gesprekken met zorgaanbieders over de mogelijke oorzaken van deze
verschillen.
Je beschikt over een dataset met gegevens van 9 random geselecteerde ziekenhuizen gelijkelijk
verdeeld over 3 provincies. Voor elk ziekenhuis weet je het relatieve aantal patiënten met een
rughernia bij wie een operatie is uitgevoerd (Y). Je bent je onderzoek gestart met beschrijvende
statistieken. ‘Boxplots’ en histogrammen laten zien dat de ziekenhuizen in de provincie Utrecht
relatief gezien vaker opereren bij een rughernia dan de ziekenhuizen in Overijssel en Gelderland.
De ziekenhuizen in Overijssel voeren relatief gezien de minste operaties uit. In een volgende stap
ga je onderzoeken of deze verschillen tussen provincies kunnen berusten op toeval. Uit ander
onderzoek is gebleken dat Y normaal is verdeeld.
a. Waarom is het aantal rughernia-operaties als fractie berekend in plaats van dat de
absolute aantallen operaties zijn weergegeven?
Absolute aantallen kunnen een vertekend beeld geven. Het ene ziekenhuis heeft meer
patiënten dan het andere ziekenhuis en met meer patiënten is de kans ook groter op meer
rughernia operaties.
b. Leg uit welke analysetechniek geschikt is om bovenstaande onderzoeksvraag te
beantwoorden.
Je gaat vergelijken tussen meer dan 2 groepen (3 verschillende groepen): Overijssel,
Gelderland en Utrecht variantieanalyse met 1 factor.
c. Bereken de totale variantie in deze steekproef. En wat is de standaardafwijking?
n=9
[1]
, (0,10+ 0,15+0,20)
over all gemiddelde = =0,15
3
2 1
S= ∗¿
(9−1)
[(0,10-0,15)2 + (0,12 – 0,15 )2 + 0,08 -0,15)2
+ (0,12-0,15)2 + (0,14-0,15)2 + (0,19-0,15)2
+ (0,20-0,15)2 + (0,15-0,15)2 + 0,25-0,15)2]
= 0,002925
Standaarddeviatie is de wortel van de variantie √ 0,02925=0,05408
d. Leg uit in hoeverre in deze casus aan de voorwaarden om variantieanalyse toe te passen is
voldaan. Onderbouw je antwoord daar waar nodig met een geschikte statistische toets
(α=0,05)
Voorwaarden voor variantieanalyse:
1. Populaties zijn normaal verdeeld Er staat gegeven dat het normaal verdeeld is
2. Steekproeven hebben een gelijk aantal waarnemingen 3 verschillende ziekenhuizen
per provincie
3. Populaties hebben gelijke variantie
Vuistregel: de grootste standaardafwijking is niet meer dan 2x de kleinste standaardafwijking
de grootste standaardafwijking is 0,0500. De kleinste 0,0200. De grootste
standaardafwijking is dus meer dan 2x de kleinste (2 * 0,0200 = 0,0400 > 0,0500)
Beter: toets voor de gelijkheid van varianties uitvoeren.
Toets van Hartley:
Stap 1: nulhypotese en alternatieve hypothese
2 2 2
H0 = σ 1=σ 2 =σ 3
2 2 2
Ha = σ 1 ≠ σ 2 ≠ σ 3
Stap 2: toetsingsgrootheid en verdeling
Hmax = (0,0500)2 / (0,0002)2 = 6,25
m-1 = 3-1 = 2
1 – α = 1 – 0,05 = 0,95
Stap 3: bepaal de kritieke grenswaarde
Zie de tabel op de volgende pagina.
Ha, m-1, α H3, 3-1, α
Kritieke grens is 87,50
Stap 4: vorm een conclusie
De gevonden waarde 6,25 < kritieke grens van 87,50 dus H0 wordt niet verworpen. Gelijke
varianties en dus mag variantieanalyse worden toegepast.
[2]
, e. Stel de ANOVA tabel op.
Bron variantie Df KS GKS F
Tussen groepen 3-1 = 2 0,015 0,0075 5,357
Binnen groepen 9-3 = 6 0,0084 0,014
Totaal 9-1 = 8 0,0234
KS(tussen) = [(0,10-0,15)2 + (0,15-0,15)2 + (0,20-0,15)2] * 3 = 0,015
KS (binnen) = (0,10-0,10)2 + (0,12-0,10)2 + (0,08-0,10)2 + (0,12-0,15)2 + (0,14-0,15)2 + (0,19-0,15)2 +
(0,20-0,20)2 + (0,15-0,20)2 + (0,25-0,20)2= 0,0084 (wetenschappelijke notatie = 8,4*10 -03)
KS(totaal) = KS(tussen) + KS(binnen) = 0,015 + 0,0084 = 0,0234 als je geen individuele waarden
hebt kun je alleen maar werken met de gemiddelde en kan je de KS niet berekenen.
KS (tussen) 0,015
GKS ( tussen )= = =0,0075
(a−1) 3−1
KS( binnen) 0,0084
GKS ( binnen )= = =0,014
(n−a) 9−3
KS(totaal ) 0,0234
GKS ( totaal )= = =0,002925
( n−1) 8
GKS (tussen) 0,0075
F= = =5,357
GKS( binnen) 0,0014
f. Toets of er significante verschillen in het aantal gedeclareerde rughernia- operaties
bestaan tussen de drie provincies (α=0,05).
Stap 1: bepaal de nulhypothese en de alternatieve hypothese
Stap 2: bepaal de toetsingsgrootheid en verdeling
De toetsingsgrootheid is de F-waarde.
GKS (tussen) 0,0075
F= =¿ =5,357
GKS( binnen) 0,0014
Stap 3: bepaal de kritieke grenswaarde
Kijk in de F-tabel bij Fa-1, n-a, α F2, 6, 0,05
Kritieke grenswaarde is 5,14
[3]
, Stap 4: vorm een conclusie
De gevonden waarde van 5,357 > kritieke grens van 5,14 H0 verwerpen. Er zijn significante
verschillen in fracties operaties bij een rughernia tussen de drie provincies
F-waarde > kritieke grens H0 verwerpen & significante verschillen
g. Bereken de standaardafwijking voor Overijssel.
De variantie kan berekend worden met de formule:
Hierbij is n de hoeveelheid ziekenhuizen in Overijssel. Dat
is 3.
2 1
S= ∗¿
( 3−1)
De standaardafwijking S is de wortel van de variantie. S= √0,004=0,02
h. Het verschil in aantal operaties tussen Overijssel en Gelderland lijkt op het eerste gezicht
niet erg groot. Is er sprake van een significant verschil tussen Overijssel en Gelderland
(α=0,05)?
Stap 1: bepaal de nulhypothese en de alternatieve hypothese
Stap 2: bepaal de toetsingsgrootheid en verdeling
Tukey’s -Honesty Significant Differences (HSD)–toets met V-
verdeling (Va, n-a, α).
Omdat het hier over het absolute
verschil gaat doe je niet 0,10-0,15 maar
kijk je naar het verschil tussen deze
twee waardes. Grootste waarde minus
kleinste waarde. Dat is 0,05
j en k staan in de formule voor elk tweetal groepen, in dit geval groep 1 (Overijssel) en groep 2
(Gelderland). staat voor gemiddelde. De rechte haken betekenen dat je het absolute verschil neemt
[4]