GRADE: Grading Recommendations Assessment, Development and Evaluation
Hiërarchie tussen verschillende studie designs bepalen de kracht van de evidentie. Bv. Er zijn 2 RCT’s van goede kwaliteit dus heeft dat veel
zeggingskracht. Daar zitten echter wel wat haken en ogen aan. Daarom is begin 2000 GRADE bedacht. GRADE; het inschatten van
samengevoegde evidentie. Dit is een andere (meer transparante manier) en wordt er op basis van meerdere factoren in kaart gebracht wat
de evidentie is en vooral hoe sterk de evidentie is. GRADE wordt in ieder geval toegepast bij iedere Systematic Review die bij Cochrane
gedaan wordt.
GRADE geeft je de mogelijkheid om de waarde van de samengevoegde evidentie in te schatten en te bepalen hoe sterk het bewijs is. In de
richtlijnen heb je hiermee te maken.
GRADE systematiek:
- Stap 1: Specificeer belangrijke uitkomsten voor de patiënt
- Stap 2: Maak een evidentie syntheses
- Stap 3: GRADE de evidentie (Hieronder eerst de waardering van evidentie). De bepaling van kwaliteit doe je door middel van onderstaande
4 niveaus van kwaliteit.
Waardering van evidentie:
- HIGH ++++: true effect lies close to the estimate of the effect
- MODERATE +++-: true effect is likely to be close to the estimate of the effect, but there is a possibility that it is substantially different
- LOW ++- -: true effect may be substantially different from the estimate of effect
- VERY LOW +- - -: true effect is likely to be substantially different from the estimate of effect
De stappen die je doorloopt om de waardering van de evidentie te bepalen
- RCT’s beginnen met ++++ (HIGH)
- Observationele studies beginnen met ++- - (LOW)
- 5 factoren verlagen de kwaliteit
- 3 factoren verhogen mogelijk de kwaliteit
- Onderbouw je beslissing
Welke factoren verlagen de kwaliteit?
1. Studie beperkingen: dit zijn risk of bias tabellen (toegevoegd bij opdracht 5)
2. Inconsistente resultaten: hele brede BI, veel spreiding
3. Indirectheid van evidentie (studie designs); als het niet de primaire uitkomst was die ze concluderen.
4. Onnauwkeurigheid (hoe groot is het betrouwbaarheidsinterval?); niet 1 kant op vallen. Er is zowel harm als geen harm.
5. Publicatie bias: negatieve resultaten worden nooit gepubliceerd.
Welke factoren verhogen mogelijk de kwaliteit?
1. Grootte van het effect
Groot: RR>2 of RR<0.5 (verhoog 1 level)
Heel groot: RR>5 of RR<0.2 (verhoog van 2 levels)
2. Dosis respons gradiënt; als je hoofdpijn hebt en je slikt PCM dan neemt pijn af, bij suikertablet zal pijn hetzelfde blijven. Je hebt een dosis
en je krijgt een respons, geef je deze dosis niet dan geen respons.
3. Residuale bias; Verschillende plausibele biasen zorgen mogelijk voor een onderschatting van een schijnbaar interventie effect.
Onderbouw je beslissing!!! Doe dit dus altijd met een groepje personen
, HU-Statistiek OMT2 2018-2019
Variabelen
Variabelen:
Een variabele is het begin van jouw beslissing om een statistische toets te kiezen. Een variabele duidt op alles dat varieert in en om een
individu. Vb. Op je tenen staan = numerieke variabelen. Als we de variabelen meten kunnen we daar op verschillende manieren m.b.v.
statistiek iets mee doen. Hieronder staan de 2 vormen.
Vorige keer hebben we het al over associaties gehad en dat is ook eigenlijk waar het allemaal om draait. Je pakt dan de variabelen en kijkt
hoe deze dan samenhangen.
Je hebt dus een associatie en dat is dus het geen waar je in geïnteresseerd bent. Je meet dus eigenlijk hoeveel mensen de aandoening in de
ene groep heeft in vergelijking met de andere groep.
Als we dan iets meten dan meet je dus een signaal. Om dat signaal zit altijd ruis heen. Meetfouten, etc. Dat is precies wat ruis is. Dat kan
een random meetfout zijn of een systematische meetfout.
Signaal/ruis:
- Signaal: RR/AR/OR (effect grootte)
- Ruis: betrouwbaarheidsinterval, gem. met standaarddeviatie of bij niet normaal verdeelde data de mediaan en interkwartiel range.
- Ratio tussen signaal en ruis: p-waarde (hypothese testen)
Signaal:
Het is belangrijk om RR (relatief risico) te berekenen i.p.v. het AR (attributieve risico) omdat het AR wordt beïnvloed door het aantal en RR
niet. Dit heeft te maken dat je bij de het AR moet aftrekken van elkaar en bij het RR bereken je het percentage door te delen. Het RRR wordt
ook wel het relatief risico reductie genoemd. Hieronder een simpel voorbeeld:
- Gegeven 1: 40 vs 30
- Gegeven 2: 10 vs 7,5
- Antwoord 1: AR = 40 – 30 = 10 RR = = 0,75 RRR = 1 – RR = 0,25
- Antwoord 2: AR = 10 – 7,5 = 2,5 RR = 7, = 0,75 RRR = 1 – RR = 0,25
Hierboven is dus een prachtig voorbeeld van een gemeten signaal weergegeven. De vraag is nu, wat is de ruis daar omheen en daar zou je
dus de betrouwbaarheid van moeten berekenen. Een variabele is het begin van jouw beslissing om een statistische toets te kiezen. Om
variabelen in te schatten is het makkelijk om je aan een aantal regels te houden.
Het kiezen van je centrummaat en spreidingsmaat op basis van het soort variabele en in het geval van een numerieke variabele of de
variabele wel of niet aan de eisen van parametrische of niet-parametrische data voldoet:
- parametrische data: bij een paramedische toets worden er eisen gesteld aan de metingen. Deze moeten op minstens interval niveau
(continue variabelen) gedaan zijn en normaal verdeeld zijn. altijd uitgedrukt in pearson.
- non-parametrische data: bij non-parametrische toetsen gelden deze eisen niet. Deze worden ook wel verdelingsvrijer toetsen genoemd.
uitgedrukt in spearman: kunnen ook andere correlaties aan gekoppeld worden. Dit is dan geen pearson maar zijn soortgelijke spearman.
Meetniveau Centrummaat (point-estimate) Spreidingsmaat (statistic-estimate)
Continu Normaal verdeeld Gemiddelde Standaarddeviatie )SD)
Continu Niet-normaal verdeeld Mediaan Interkwartielafstand of range
(IKR)
Ordinaal Weinig categorieën Aantal / %
Ordinaal Veel categorieën, Mediaan IKR / range
stappen redelijk gelijk Gemiddelde Standaarddeviatie (SD)
Nominaal 2 of meer categorieën Aantal / %
, HU-Statistiek OMT2 2018-2019
Bij Numeriek (discreet/continu) moet je altijd kijken of het normaal verdeeld is. Om te kijken of een variabele normaal verdeeld is, kun je de
volgende stappen/gegevens nalopen.
Bepaling of een variabele normaal verdeeld is of niet:
- Grafisch kijken naar de data:
- (histogram) → parabool
- (Q-Q plot/scatterplot) → liggen puntjes op de lijn normaal verdeeld.
- Kijken naar de werkelijke waarden
- Gemiddelde/mediaan: ongeveer gelijk zijn (houdt rekening met de spreiding)
- SD mag niet groter zijn dan de helft van het gemiddelde
- Skewness en de Kurtosis (hoogte en breedte van het histogram) → tussen de -1 en de 1 (relatief krachtig). Geen duidelijke afkapwaarde.
Wij houden de -1 en 1 aan.
- Kolmogorov- smirnov (grootte groep +100); Shapiro Wilk (kleine groep -100); Normaliteit test: kijkt naar de significantie van de toets.
Dus mag niet significant zijn. Als het significant is, dan verwerp je de 0-hypothese, dan kun je ervan uit gaan dat het normaal verdeeld
is. De Kolmogorov toets toetst eigenlijk of je het erna weer mag toetsen met bijv. de t-toets? Deze toetsen zijn niet echt betrouwbaar,
dus hoef je ze niet te gebruiken! Maar je moet wel weten waar het over gaat.
SPPS: Anyalyse à Descriptives à Explore
Nieuwe variabelen maken in SPSS:
Soms is het nodig om met SPSS nieuwe variabelen te maken met de variabelen die je al hebt. Bijvoorbeeld het bereken van BMI middels
lengte en gewicht. Dit doe je met Compute Variable. Als je vervolgens de BMI in drie categorieën (ondergewicht, normaal, overgewicht)
wilt indelen, dan moet je de variabelen her-coderen. Gebruik hiervoor altijd Recode into different variables. Zodat er een nieuwe variabele
gemaakt wordt.
, HU-Statistiek OMT2 2018-2019
Hypothese testing
We gaan het hebben over hypothese testing. Dit is eigenlijk de basis van al het statistisch onderzoek wat wij doen en wat je vooral ook leest.
Je begint met het opstellen van je vraagstelling en daar koppel je je hypothese aan. Je hebt dan vaak al je alternatieve hypothese verwoord.
Vb. Het aantal keren op je tenen staan verschilt dat tussen man en vrouw.
- Nul Hypothese (H0): er is geen verschil in het aantal keren op de tenen staan tussen mannen en vrouwen
- Alternatieve Hypothese (H1): er is wel een verschil in het aantal keren op de tenen staan tussen mannen en vrouwen
Degene die je dan toets is dan dus ook altijd de nulhypothese (H0) en niet je alternatieve hypothese (H1), maar door je H0 te toetsen kan je
een uitspraak doen over je nulhypothese (H0). Je kunt nooit de alternatieve hypothese (H1) verwerpen. Je gaat dus altijd van de H0 en gaat
die proberen te falsificeren.
Een of tweezijdig toetsen:
Bij eenzijdig toetsen van de normaal-verdeelde data kan je dus i.p.v. 2,5 % beiderzijds ook 5% aan 1 kant berekenen. Dit betekent wel dat
je echt maar 1 kant op kan gaan. Binnen de fysiotherapie kom je dat niet echt tegen. Ook als er schommeling plaatsvindt bij een chronisch
zieke is dit geen eenrichtingsverkeer aangezien er altijd momenten zijn dat het beter gaat.
Zodra je een artikel leest waarbij ze eenzijdig hebben getoetst en wij dat onzin vinden moet je de p waarde verdubbelen, dan kom je namelijk
op de werkelijke waarde van tweezijdig toetsen uit. Dit is alleen als er onterecht eenzijdig getoetst wordt.
Hypothesetoetsing:
Hypothesetoetsing leidt ook tot fouten. Belangrijk is dat je vooraf heel goed nadenkt over de fouten die je maakt.
- Een type I fout is de verkeerde beslissing die genomen wordt als een toets een ware nulhypothese verwerpt. Een fout van de eerste soort
kan vergeleken worden met een fout-positief (FP) in andere testsituaties. De onbetrouwbaarheid wordt aangegeven met de Griekse letter
α (Alpha). Alpha is de waarschijnlijkheid(probability) van een significant resultaat wanneer de H0 waar is.
- Een type II fout is de verkeerde beslissing die genomen wordt als een toets een onware nulhypothese niet verwerpt. Een fout van de
tweede soort kan vergeleken worden met een fout-negatief (FN) in andere testsituaties. De kans op een fout van de tweede soort wordt
meestal aangegeven met de Griekse letter β (Beta). Beta is de waarschijnlijkheid (probability) van een niet-significant resultaat wanneer de
H1 waar is.
Als je gaat nadenken over hoe je je experiment laat plaatsvinden, denk je na over deze fouten. Het is iedere keer als je hierover nadenkt
makkelijk om een 2x2 tabel te tekenen anders raak je vrij makkelijk de draad kwijt.
Voorbeeld 2 x 2 tabel:
Bereken middels onderstaande tabel de TP, FP, FN en TN uit met de volgende gegevens: (de waarde hieronder worden normaalgesproken
gebruikt).
- Alpha 5% (0,05)
- Beta 20% (0,20)
- Power (1-beta) = 80% (0,8)
- Voorafkans H0 = 50%
- Voorafkans H1 = 50%
H0 Niet Waar H0 Waar Uitkomst:
- TP: 0,80*0,5 = 0,400 = 40%
- FP: 0,05*0,5 = 0,025 = 2,5%
- FN: 0,20*0,5 = 0,100 = 10%
Significante Terecht positief (TP) Fout Positief (FP) - TN: 0,95*0,5 = 0,475 = 47,5%
bevinding Type I fout: alpha
Power*voorafkans op H1 Alpha*voorafkans op H0
Niet-Significante Fout Negatief (FN) Terecht Negatief (TN)
bevinding Type II fout: beta
Beta*voorafkans op H1 1-Alpha*voorafkans op H0
Conclusie: Je hebt de grootste kans op een Terecht Negatief (TN) resultaat met bovengenoemde gegevens. Wat je moet onthouden is dat
je vooraf kans (=50% in dit geval) altijd bepalend is voor het resultaat wat je gaat vinden! Maar waar haal je deze vandaan? Vaak kun je niet
meer dan een schatting doen; of van tevoren je hypothese al iets te bevestigen (in literatuur kijken; exploratief onderzoek of pilotstudie).
Daarna ga je pas werkelijk een experiment opbouwen. Je moet gaan nadenken over hoe je vooraf er al voor kan zorgen dat je hypothese
waarschijnlijker wordt. Je moet ook onthouden waarom je kiest voor een alpha of beta waarde of vals negatieve of vals positieve waarde.
Als je vooraf hebt bepaald wat je alpha en je beta is dan ga je kijken of er een werkelijk verschil bestaat. Als er een verschil bestaat kom je
uit bij de p waarde. De p-waarde is dus wezenlijk iets anders dan de alpha. De ene is de uitkomst en de andere is een afkappunt.
Met p-waarde geef je uitspraak over het ontelbaar keer herhalen van je experiment (Forrest Gump → long run). Als je dit experiment
ontelbaar keer herhaald wat is dan de kans dat dit resultaat/extreme/uitkomst er is?
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller rensschilders. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $27.56. You're not tied to anything after your purchase.