KTO Lesdag 1 Basis van wetenschap
Het belang van onzeker zijn
Niet al het gepubliceerde onderzoek is van dezelfde kwaliteit. In de afgelopen jaren is er veel
aandacht voor de replication crisis. Dit gaat over dat een groot deel van gevonden resultaten van
wetenschappelijk onderzoek niet terug gevonden worden bij herhaling van dit onderzoek.
Wanneer je een meting herhaalt, reproduceer je bijna nooit exact hetzelfde resultaat. Herhaalde
metingen hebben een range van waardes door biologische variatie en de beperkte precisie van
het meetinstrument. Maar hoe kunnen we dan bepalen of we echt een verschil hebben
waargenomen dat past bij onze hypothese.
Statistiek helpt ons bij het beantwoorden van deze vraag. Door middel van een kwantitatief
model wordt de rol van kans gekwantificeerd. Het is een schatting met error, geen precieze
meting. De praktische applicatie hiervan is om de onzekerheid bij de uitkomsten van onze
experimenten weer te geven en om een betrouwbaarheid niveau te geven aan claims die verder
gaan dan enkele observaties.
Twee vormen van statistiek onderscheiden, namelijk descriptief en inferentiële statistiek. Bij
descriptieve statistiek wordt een data set samengevat met een puntschatter en de spreiding hier
omheen. Inferentiële statistiek doet een uitspraak (generaliseert) van geobserveerde data naar
de wereld als geheel. De concepten 'het trekken van een steekproef' en 'schatten' onderbouwen
deze beide vormen van statistiek, welke het proces van verzamelen van data en het
kwantificeren van de onzekerheid in het generaliseren aangeven.
Om het trekken van een steekproef te begrijpen moet het concept populatie helder zijn.
Populatie bevat de doelpopulatie waaruit een steekproef genomen
is. Binnen deze steekproef kunnen variabelen gemeten worden. De
frequentie histogram van alle mogelijk waardes van een gemeten
variabele wordt de populatie distributie genoemd. Binnen de
populatie distributie gaat de interesse uit naar de puntschatter en de
spreiding, voorbeeld is het gemiddelde en de s.d.(zie figuur 1).
Statistische inferentie
Statistische inferentie is het proces waarbij conclusies worden getrokken over een populatie
door middel van statistische analyses van een steekproef uit die populatie.
Statistische analyses
- Beschrijvende statistiek: onderzoeksgegevens op een overzichtelijke manier
samenvatten zonder te kijken naar mogelijke relaties of verbanden tussen variabelen
- Inferentiële statistiek: data om conclusies te trekken over de populatie, schatten effecten
en relaties, de betrouwbaarheid van die relatie en p-waarde.
Statistische inferentie = het proces waarbij conclusies worden getrokken over populatie door
middel van statistische analyse van een steekproef uit die populatie.
Populaties
- Doelpopulatie: is de totale groep mensen naar wie je je onderzoeksbevindingen wilt
generaliseren. Uitgebreide groep.
- Bronpopulatie: de groep waar je toegang toe hebt en waarmee je uiteindelijk je
onderzoek gaat uitvoeren dus in deze tijd in een bepaalde streek of een bepaalde stad
- Steekproef: dit zijn de daadwerkelijk geselecteerde patiënten voor jouw onderzoek
Onderliggende principes statistische inferentie
1. De steekproef is waarschijnlijk een goede weerspiegeling van de populatie
2. We kunnen nooit zeker weten hoe goed de steekproef de populatie weerspiegelt
a. Sampling error ontstaat doordat niet alle eenheden van de doelpopulatie, maar
slechts een steekproef daarvan wordt onderzoekt
b. Sampling distribution/steekproefverdeling: richting normale verdeling, de
variatie in steekproefgemiddelde, vertelt ons iets over onzekerheid schatting.
c. De sampling distribution en standaard error liggen ten grondslag aan het
betrouwbaarheidsinterval
, 3. De manier waarop de steekproef getrokken wordt speelt een rol
Factoren die invloed hebben op onzekerheid
- Steekproef omvang
- Spreiding binnen de onderzoekspopulatie
Betrouwbaarheidsinterval
- Bij herhaling van het onderzoek met nieuwe steekproeven uit dezelfde populatie mag
verwacht worden dat bij 95% van die steekproeven de populatieparameter binnen dit
betrouwbaarheidsinterval ligt.
Doelpopulatie
Bronpopulatie
Steekproef
Major surgery is associated with negative postoperative outcomes such as complications and
delayed or poor recovery. Prehabilitation can help to reduce the negative effects of major surgery.
Offering prehabilitation by means of mobile health (mHealth) could be an effective new approach.
The aim of this study is to evaluate the effectiveness of the Be Prepared mHealth application, a
smartphone app using behavior change techniques to address risk behavior prior to surgery in
patients undergoing major elective surgery. Adult patients scheduled for major elective surgery
were recruited from the preoperative assessment outpatient clinic of two academic hospitals in the
Netherlands. Patients were informed about the study by the anesthetist, anesthesiology nurse, or
anesthesiology assistant during their preoperative assessment. In total, 86 patients undergoing
major surgery participated.
Wat is het verschil tussen een sample distribution / steekproefverdeling en een sampling
distribution / steekproevenverdeling?
- Steekproefverdeling is de verdeling binnen de steekproef
- Steekproeven verdeling is de verdeling van de mogelijk verschillende steekproeven die
getrokken kunnen worden
- Een sample distribution is een verdeling van de data in 1 sample, de sampling
distribution is de verdeling van een puntschatter van meerdere samples. De spreiding
van de sampling distribution zegt iets over de sampling error.
Welke factoren hebben invloed op de onzekerheid van een schatting van een
populatieparameter en leg dit uit.
- Steekproefomvang: hoe groter de steekproef, hoe meer het op de bronpopulatie gaat
lijken
- Variatie
- Spreiding binnen onderzoekspopulatie: is de spreiding van variabelen hoog, dan zal de
uitkomst ook veel onzekerder zijn
Wat is een betrouwbaarheidsinterval
- Maat voor de precisie van het gemiddelde dat we hebben geschat in onze steekproef
- Breed interval is niet veel zekerheid, smal interval is behoorlijk nauwkeurige schatting
Counterfactual
Counterfactual is een gegeven wat in je hoofd zich doet afspelen maar niet in de werkelijkheid
uit te voeren is. Het zijn voorwaardelijke zinnen die bespreken wat waar zou zijn geweest onder
verschillende omstandigheden.
- Op individueel niveau is dat: een behandeling geven aan een patiënt, hierbij de
uitkomsten van die behandeling meten. Daarna terug in de tijd, geen behandeling geven
aan die patiënt en de uitkomsten meten. Deze uitkomsten vergelijken met elkaar
- Op populatieniveau is dat: populatie opdelen in twee, ene groep krijg behandeling en de
andere groep krijg geen behandeling. De groep die geen behandeling krijg is de
counterfactual groep. Deze geeft een soort benchmark of een vergelijkingsmogelijkheid
met wel een interventie doen. Uitkomsten vergelijken en dan de distributie/verdeling
van de uitkomsten.
, - Randomisatie: om de vergelijkbaarheid van de groepen zo goed mogelijk te hebben
o Van een populatie hebben alle deelnemers een distributie van toekomstige
uitkomsten, deze wil je randomiseren door alles zo gelijk mogelijk te verdelen
over beide populaties
o Het gaat niet zozeer om gelijk verdelen van bepaalde factoren maar om de
uitspraak over de kans dat er een substantieel verschil bestaat tussen de twee
groepen.
- Het creëren van mogelijke alternatieven voor plaats gevonden situaties.
The science of bad science
Wat wordt gezien als oorzaken voor mindere kwaliteit van gepubliceerd wetenschappelijk
onderzoek?
- Ongepaste onderwerpen, niet representatieve steekproeven, kleine steekproeven,
onjuiste analysemethoden en verkeerde interpretatie
- We hebben minder onderzoek nodig, beter onderzoek en onderzoek dat om de juiste
redenen wordt gedaan
Wat is het verschil tussen exploratief en conformatief onderzoek?
- Exploratief: vooraf geen hypothese stellen, je weet niet wat voor effect je verwacht, je
toetst meerdere hypotheses (hypothese genererend)
- Confirmatief: vooraf wel een hypothese stellen, je toetst slechts een hypothese
(hypothese bevestigend)
Kleine veranderingen kunnen zijn dat ethische commissies nu beter zijn toegerust om
wetenschappelijke zwakheden op te sporen en dat meer tijdschriften statistici in dienst hebben.
1. Veel onderzoek faalt om vragen te beantwoorden die ertoe doen.
2. Onderzoeksmethoden kunnen ontoereikend zijn. Veel onderzoeken zijn te klein en meer
dan de helft gaat niet adequaat om met vooringenomenheid.
3. Onderzoek wordt niet efficiënt gereguleerd en beheerd.
4. Het afgeronde onderzoek wordt niet volledig toegankelijk gemaakt. De helft van de
onderzoeken wordt helemaal nooit gepubliceerd en er is een vooroordeel in wat wordt
gepubliceerd, wat betekent dat behandelingen effectiever en veiliger lijken dan ze in
werkelijkheid zijn.
5. Gepubliceerde rapporten van onderzoek zijn vaak bevooroordeeld en onbruikbaar.
Beschrijf in eigen woorden wat er bedoeld wordt met Phacking, cherrypicking, HARKing.
- P-hacking = p-waarde beïnvloeden door verschillende vormen
o 2 verschillende uitkomstmaten en allerlei variabelen gaat linken aan die twee
uitkomstmaten
o Toevoegen van meer observaties
o Corrigeren voor geslacht
o Ex/includeren van 1 of meerdere aandoeningen
o Combinaties
o Kleine steekproeven
- Cherrypicking: je kiest de uitkomstmaat die het beste uitkomt, je publiceert dat gedeelte
- selectieve uitkomsten rapporteren of switchen van uitkomst
o Van conformatief naar exploratief onderzoek
- HARKing: Hypothesizing After the Results are Known ing, je analyseert de data en gaat
dan bedenken terwijl je analyseert, ik zie van alles uit data komen, kan ik daar
hypotheses bij bedenken.
Wat wordt bedoeld met 'Publication bias'?
- Publicatiebias is een vorm van vertekening die een belangrijke rol speelt bij meta-
analyses. Publicatiebias heeft te maken met de selectieve publicatie van studies, namelijk
wanneer de publicatie afhankelijk is van de grootte, de richting of de statistische
significantie van de studieresultaten. Publicatiebias is de vertekening die ontstaat als bij
wetenschappelijk onderzoek de positieve resultaten wel, maar negatieve of onduidelijke
resultaten niet gepubliceerd worden.
, Beschrijvende statistiek
Beschrijvende statistiek heeft als doel om de verzamelde data op een overzichtelijke manier
samen te vatten, zonder te kijken naar mogelijke relaties of verbanden tussen variabelen. Dit
kun je zowel grafisch als numeriek doen.
1. Datacontrole: controleren of geen fouten bevallen of onmogelijk waarden
a. Analyse → descriptive statistics → frequencies
b. Graphs → legacy dialogs → boxplot
Missing proberen te voorkomen doordat verplicht is om iets in te vullen
Data verkeerd ingevuld: datacontrole op uitschieters, invloed van uitschieters bekijken
Meetniveau van variabele bepaald hoe je ruwe data samenvat
Meetniveau Centrummaat Spreidingsmaat
Continu Normaal verdeeld Gemiddelde Standaarddeviatie
Continu Niet normaal verdeeld Mediaan Interkwartielafstand/ range
Ordinaal Weinig categorieen Aantal/ %
Ordinaal Veel categorieen, stappen Mediaan IKR/range
redelijk gelijk Gemiddelde Standaarddeviatie
Nominaal 2 of meer categorieen Aantal/ %
Analyse → descriptive statistics → explore
Wel of niet normaal verdeeld
- Geen absolute uitspraak mogelijk
- Meerdere aspecten bekijken → beslissen op basis van volgende stappen
o Grafiek maken
o Gemiddelde is niet mediaan
o Grootte van skewness en kurtosis
o Statistische toetsen: p < 0,05 betekend niet normaal verdeelde data
▪ Kolmogorov-Smirnov test
▪ Shapiro-Wilk test
Nieuwe variabelen maken in SPSS
- Transform
o Recode into different variables
o Compute variable
▪ Bijv BMI = gewicht / lengte2
o Recode into different variables
▪ Bijv normaal gewicht BMI <25
▪ Overgewicht 25-30
▪ Obesitas BMI > 30
Opdracht 1
Variabele Meetniveau
Leeftijd Ratio
Geslacht Nominaal
Lengte Ratio
Gewicht Ratio
BMI Interval
GOLD-klasse Ordinaal
Handknijpkracht Interval
30sec- Interval
ChairStandTest
Opdracht 2
Beoordeel of de variabelen leeftijd en handknijpkracht normaal verdeeld zijn. Volg daarvoor
onderstaande stappen:
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller kikidenblanken. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.15. You're not tied to anything after your purchase.