Zelfgemaakte cursus/samenvatting - statistiek theorie - Els Claeys
Samenvatting - Statistiek voor de gezondheidswetenschappen: data-analyse
Statistiek voor de gezondheidswetenschappen: Theorie
Alles voor dit studieboek
(16)
Geschreven voor
Universiteit Gent (UGent)
Gezondheidsbevordering
Statistiek theorie
Alle documenten voor dit vak (1)
Verkoper
Volgen
ryanagyemang9
Voorbeeld van de inhoud
Deel 1: Inleiding, beschrijvende en verklarende statistiek
Inleiding
Inleiding
1.1 Onderzoeksvormen binnen wetenschappelijk onderzoek
Onderzoeken onderverdeeld in 2 groepen (medische of epidemiologische onderzoeken)
Observationele onderzoek
• Geobserveerd
• Metingen aan proefpersoon zonder dat dit de persoon beïnvloedt
• Resultaten metingen met elkaar in verband brengen
2 groepen:
Cohorto nderzoeken
• Waarbijgroepptn/proefpersonenwordtgeobserveerd
• Retrospectief: info verzamelen terugkijkend in de tijd
• Transversaal of cross-sectioneel: info verzamelen op moment dat onderzoek uitgevoerd wordt
Prospectief:groep gevolgd overdetijd
Case-controlonderzoeken
• Groep ptn met bepaalde ziekte of aandoening(cases) vergeleken met groep controlepersonen (controles)
• Groepenwvergelekenobvmogelijkeoorzakenvan betreffende ziekte/aandoening
• retroperspectiefonderzoek:terugkijkendintijd,oorzaken hebben vnl in verleden plaatsgevonden
Experimentele onderzoeken
• Proefpersoon wordt beïnvloed
• Doel: effect interventie evalueren
Experimenteel: je komt tussen als onderzoeker. Je gaat interventie implementeren bij je onderzoekseenheden.
Soorten variabelen
Uitkomstvariabele van onderzoek: meestal continu of dichotoom
• Continue variabelen
— Kunnen een oneindig aantal waarden aannemen
— Bv. Lichaamsgewicht, lichaamslengte
• Dichotome variabelen
— Kunnen 2 waarden aannemen: wel of niet
— Bv. Patiënt is OF ziek OF niet ziek
• Categoriale variabele
— Bestaat uit meer dan 2 groepen
— Bv. Lichaamsgewicht als men onderscheid maakt tussen normaal gewicht, overgewicht en obesitas
— = ordinale categoriale variabelen: er zit bepaalde volgorde in VS nominale (bv. ‘beroep’): geen ordering
Beschrijvende VS verklarende statistiek
• Beschrijvende: overzichtelijk samenvatten van onderzoeksgegevens, zonder te kijken naar mogelijke
verbanden of relaties tussen verschillende variabelen
• Verklarende: schatten van effecten en relaties, schatten betrouwbaarheid van deze effecten en relaties en het
berekenen van p-waarden
• Voor beide belangrijk de eigenschappen van verschil variabelen onderzoeken
→ Bepalen statistische mogelijkheden
Terminologie
Uitkomstvariabele: variabele waarover de onderzoeker uitspraken wil doen
→ Uitkomstvariabel: variabel dat je wil gaan hebben. Afhankelijk: dat je wil gaan meten
• Van wetenschappelijk onderzoek: afhankelijke variabele
• Overige: onafhankelijke variabelen (bv. Rookgedrag) = determinanten = verklarende variabelen = voorspellers
= predictoren = covarianten
Toegepaste statistiek = analyseren van data om wetenschappelijke vraag te beantwoorden. Komen tot evidence based
practice: gestaafd/ondersteund door evidentie.
• Hoe? Data: waarnemingen op variabelen =
• Kenmerken van onderzoekseenheden (individuen in ons vakgebieden) die kunnen variëren BV: leeftijd meten
(30 VS 70)
• Door steekproef (=onderzoekspopulatie) nemen van doelpopulatie (hier willen we uitspraken over doen) Nooit
, volledige doelpopulatie opnemen: bv gezondheid van inwoners België
→ kijken naar gezondheidsenquête: niet ALLE inwoners
→ door steekproef nemen kunnen we zeggen alle inwoners
Onderzoeksvormen
• Observationeel onderzoek: als onderzoekers puur observeren, je komt zelf niet tussen (BV:
gezondheidsenquete)
• Experimenteel onderzoek: interventie studies, je komt als onderzoeker wel tussen (BV: klinische testen
medicijn)
• Onderscheid tijdsaspect
• Prospectief: studie loopt in tijd en loopt door (vooruit in tijd)
• Retrospectief: keert terug in tijd B.v door vroegere dossier gegevens te gaan meten
• Transversaal: crossectioneel, geen longitudinaal, gegevens worden op 1 moment verzameld, niet over
langere periode
• Case controle onderzoek: spec vorm retrospectief, groep met ziekte vergelijken met groep die ziekte niet
heeft
Variabelen
Variabelen: kenmerken onderzoekseenheden die we kunnen meten
• Uitkomstvariabelen: afhankelijke (dependent) variabele
→ willen we voorspellen, verklaren
• Onafhankelijke (independent) = determinanten, verklarende, voorspellende, waarvan we denken een invloed te
hebben op de afhankelijke
Soorten variabelen
Nominaal; geen natuurlijke ordening
Ordinaal; bv onderwijsniveaus, sociale klasse.
Continu= bv, kg cijfers in de praktijk is dat afhankelijk
van
Interval: afstand is gelijk aan andere waarde.
Onderscheid goed maken, bepaald welke statische testen nodig
Categorische/categoriale/kwalitatieve variabelen:
Categorische/categoriale/kwalitatieve variabelen: die als mogelijke uitkomst een beperkt aantal mogelijke variabelen
hebben (VB: geslacht)
• Nominaal (niet geordend): niet op natuurlijke manier ordenen, aantal mogelijke uitkomsten
• Ordinaal (geordend): wel mogelijk om te ordenen
• Dichotoom (2 categorieën): dummy codering 1 VS 0 (2 mogelijke uitkomsten)
Numerieke / kwantitatieve:
Numerieke / kwantitatieve: hele reeks mogelijke uitkomsten die op een continuüm bevinden
• Discreet (gehele getallen / aantallen): niet gewicht bv, wel meting het aantal keer dat mensen naar huisarts zijn
geweest)
• Continu (in theorie oneindig aantal mogelijke waarden) VB: BMI
• In theorie: hangt af van precisie meetinstrument
• Interval-schaal: elk interval heeft dezelfde betekenis of grootte (VB: gewicht uitgedrukt in kg)
• Ratio-schaal: er is sprake van natuurlijk nulpunt, als 0 uitkomst is, betekent dat afwezig is van kenmerk (VB:
bij gewicht 0 = er is geen gewicht, bij T 0 = geen ratio schaal)
• Mutuallyexclusive:1antwoordmogelijkperproefpersoon
• Pijl van nummerieke naar categorische: VB BMI hangt af van hoe kenmerk is gemeten en wordt behandeld
, voor welk soort
• Likertschaal:helemaalnietakkoord–nietakkoord–akkoord....
Cohort = groep onderzoekseenheden
Soorten statistiek (onderscheid steekproef en doelpopulatie)
• Beschrijvende:overzichtelijksamenvattenvandata:grafische/numeriekeweergave-
→ eerste stap altijd beschrijvende analyse, puur beschrijven, gegevens verzameld weergeven
• Verklarende/inferentieëlestatistiek:schattenvaneffecten/relaties betroubaarheud vd onderzoeksresultaten en
hypothesen testen
Beschrijvende statistiek
Inleiding
• Doel: onderzoeksgegevens op overzichtelijke manier samenvatten
• Grafisch of numeriek
→ keuze: doel samenvatting
— Gegevens samengevat in mondelinge presentatie op congres: grafisch
— Wetenschappelijkartikel:numeriek
▪ Voordeel: info compacter en preciezer
Grafische weergave onderzoeksgegevens
Continue variabele in:
• Histogram
— X-as: continue variabele waarden (bv. Cholesterol)
— Y-as: aantallen proefpersonen
• Tak-en-blad/stemandleafdiagram
— Heel informatief
— Stengel = stem: tientallen
— Blad = leaf: eenheden
1. 2 proefpersonen zijn 19j
2.2 pf van 21, 3 pf van 22, 1 pf 23
• 2 continue variabelen: puntenwolk (scatterplot) visueel idee hoe 2 variabelen aan elkaar hangen
→ 1 continue variabel op de x en y as en dan gaan kijken
• Categorische variabelen in:
— Staafdiagram(barchart)
• 2v ariabelen:geclusterd/gesegmenteerd staafdiagram
— Taartdiagram(piechart) = Op een cirkcel manier de proproties wordt gegeven.
Numerieke weergave van onderzoeksgegevens
Dichotome of categoriale variabelen weergeven in frequentietabel
• Aantallen (freq) + percentages in verschillende groepen
• Valid percent: valide percentage waarbij missende waarden niet worden meegeteld
• Te veel mogelijke waarden die allemaal een paar keer voorkomen
• Samenvatting smaten worden gebruikt
• Combinatie centrummaten en spreidingsmaten om continue variabele te beschrijven
• Centrummaten:centrale waarde die distributie variabele beschrijft
Modus
• Meest voorkomende waarde
• Ook voor categorische variabelen
• Weinig informatief (weinig gebruikt: zegt weinig over distributie)
• Rekenkundig gemiddelde
• Alle waarden optellen en delen door aantal observaties/waarnemingen
• Alleen goede indicator bij normaal verdeelde variabelen
X=gemiddelde
Mediaan N = aantal personen in onderzoekspopulatie
Xi=waarde van variabele x voor persoon i
• Alle observaties ordenen
→ percentielpunten
• Geen berekeningen (minder krachtig)
• Ordening in alle observaties = middelste waarde (p50)
= waarde van observaties waarvoor geldt dat 50% van de observaties onder deze waarde en 50% boven deze
waarde ligt
Bij variabele die niet mooi normaal verdeeld is: niet rekenkundig gemiddelde, maar medoaan
Geometrisch gemiddelde
Spreidingsmaten
Spreidingsmaten: hoeveel spreiding er is in de variabele
• Variantie
• Standaarddeviatie
• Range
• Interkwartiel-range
De normale verdeling
Kenmerken
• Observaties symmetrisch verdeeld rond gemiddelde (geen uitschieters)
• Gemiddelde=mediaan
• Klokvorm (niet te hoog/niet te plat): 95% vd waarnemingen tss interval: gem +- 2*sd
Altijd goed kijken of het normaal verdeeld is of niet en dan
weet je welke centrummaat je moet gebruiken. Bv. De
deskundige gemiddelde of de mediaan.
Niet normaal verddeld
Werken met continue variabele: eerst histogram bekijken!
Scheef naar rechtse verdeling (skewed tot he right = pos skew)
• Uitschietersaanrechterkant
• Bv.Bloedwaarden
• Gemiddelde>mediaan
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper ryanagyemang9. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €14,16. Je zit daarna nergens aan vast.