Deel 1: Inleiding, beschrijvende en verklarende statistiek
Inleiding
Inleiding
1.1 Onderzoeksvormen binnen wetenschappelijk onderzoek
Onderzoeken onderverdeeld in 2 groepen (medische of epidemiologische onderzoeken)
Observationele onderzoek
• Geobserveerd
• Metingen aan proefpersoon zonder dat dit de persoon beïnvloedt
• Resultaten metingen met elkaar in verband brengen
2 groepen:
Cohorto nderzoeken
• Waarbijgroepptn/proefpersonenwordtgeobserveerd
• Retrospectief: info verzamelen terugkijkend in de tijd
• Transversaal of cross-sectioneel: info verzamelen op moment dat onderzoek uitgevoerd wordt
Prospectief:groep gevolgd overdetijd
Case-controlonderzoeken
• Groep ptn met bepaalde ziekte of aandoening(cases) vergeleken met groep controlepersonen (controles)
• Groepenwvergelekenobvmogelijkeoorzakenvan betreffende ziekte/aandoening
• retroperspectiefonderzoek:terugkijkendintijd,oorzaken hebben vnl in verleden plaatsgevonden
Experimentele onderzoeken
• Proefpersoon wordt beïnvloed
• Doel: effect interventie evalueren
Experimenteel: je komt tussen als onderzoeker. Je gaat interventie implementeren bij je onderzoekseenheden.
Soorten variabelen
Uitkomstvariabele van onderzoek: meestal continu of dichotoom
• Continue variabelen
— Kunnen een oneindig aantal waarden aannemen
— Bv. Lichaamsgewicht, lichaamslengte
• Dichotome variabelen
— Kunnen 2 waarden aannemen: wel of niet
— Bv. Patiënt is OF ziek OF niet ziek
• Categoriale variabele
— Bestaat uit meer dan 2 groepen
— Bv. Lichaamsgewicht als men onderscheid maakt tussen normaal gewicht, overgewicht en obesitas
— = ordinale categoriale variabelen: er zit bepaalde volgorde in VS nominale (bv. ‘beroep’): geen ordering
Beschrijvende VS verklarende statistiek
• Beschrijvende: overzichtelijk samenvatten van onderzoeksgegevens, zonder te kijken naar mogelijke
verbanden of relaties tussen verschillende variabelen
• Verklarende: schatten van effecten en relaties, schatten betrouwbaarheid van deze effecten en relaties en het
berekenen van p-waarden
• Voor beide belangrijk de eigenschappen van verschil variabelen onderzoeken
→ Bepalen statistische mogelijkheden
Terminologie
Uitkomstvariabele: variabele waarover de onderzoeker uitspraken wil doen
→ Uitkomstvariabel: variabel dat je wil gaan hebben. Afhankelijk: dat je wil gaan meten
• Van wetenschappelijk onderzoek: afhankelijke variabele
• Overige: onafhankelijke variabelen (bv. Rookgedrag) = determinanten = verklarende variabelen = voorspellers
= predictoren = covarianten
Toegepaste statistiek = analyseren van data om wetenschappelijke vraag te beantwoorden. Komen tot evidence based
practice: gestaafd/ondersteund door evidentie.
• Hoe? Data: waarnemingen op variabelen =
• Kenmerken van onderzoekseenheden (individuen in ons vakgebieden) die kunnen variëren BV: leeftijd meten
(30 VS 70)
• Door steekproef (=onderzoekspopulatie) nemen van doelpopulatie (hier willen we uitspraken over doen) Nooit
, volledige doelpopulatie opnemen: bv gezondheid van inwoners België
→ kijken naar gezondheidsenquête: niet ALLE inwoners
→ door steekproef nemen kunnen we zeggen alle inwoners
Onderzoeksvormen
• Observationeel onderzoek: als onderzoekers puur observeren, je komt zelf niet tussen (BV:
gezondheidsenquete)
• Experimenteel onderzoek: interventie studies, je komt als onderzoeker wel tussen (BV: klinische testen
medicijn)
• Onderscheid tijdsaspect
• Prospectief: studie loopt in tijd en loopt door (vooruit in tijd)
• Retrospectief: keert terug in tijd B.v door vroegere dossier gegevens te gaan meten
• Transversaal: crossectioneel, geen longitudinaal, gegevens worden op 1 moment verzameld, niet over
langere periode
• Case controle onderzoek: spec vorm retrospectief, groep met ziekte vergelijken met groep die ziekte niet
heeft
Variabelen
Variabelen: kenmerken onderzoekseenheden die we kunnen meten
• Uitkomstvariabelen: afhankelijke (dependent) variabele
→ willen we voorspellen, verklaren
• Onafhankelijke (independent) = determinanten, verklarende, voorspellende, waarvan we denken een invloed te
hebben op de afhankelijke
Soorten variabelen
Nominaal; geen natuurlijke ordening
Ordinaal; bv onderwijsniveaus, sociale klasse.
Continu= bv, kg cijfers in de praktijk is dat afhankelijk
van
Interval: afstand is gelijk aan andere waarde.
Onderscheid goed maken, bepaald welke statische testen nodig
Categorische/categoriale/kwalitatieve variabelen:
Categorische/categoriale/kwalitatieve variabelen: die als mogelijke uitkomst een beperkt aantal mogelijke variabelen
hebben (VB: geslacht)
• Nominaal (niet geordend): niet op natuurlijke manier ordenen, aantal mogelijke uitkomsten
• Ordinaal (geordend): wel mogelijk om te ordenen
• Dichotoom (2 categorieën): dummy codering 1 VS 0 (2 mogelijke uitkomsten)
Numerieke / kwantitatieve:
Numerieke / kwantitatieve: hele reeks mogelijke uitkomsten die op een continuüm bevinden
• Discreet (gehele getallen / aantallen): niet gewicht bv, wel meting het aantal keer dat mensen naar huisarts zijn
geweest)
• Continu (in theorie oneindig aantal mogelijke waarden) VB: BMI
• In theorie: hangt af van precisie meetinstrument
• Interval-schaal: elk interval heeft dezelfde betekenis of grootte (VB: gewicht uitgedrukt in kg)
• Ratio-schaal: er is sprake van natuurlijk nulpunt, als 0 uitkomst is, betekent dat afwezig is van kenmerk (VB:
bij gewicht 0 = er is geen gewicht, bij T 0 = geen ratio schaal)
• Mutuallyexclusive:1antwoordmogelijkperproefpersoon
• Pijl van nummerieke naar categorische: VB BMI hangt af van hoe kenmerk is gemeten en wordt behandeld
, voor welk soort
• Likertschaal:helemaalnietakkoord–nietakkoord–akkoord....
Cohort = groep onderzoekseenheden
Soorten statistiek (onderscheid steekproef en doelpopulatie)
• Beschrijvende:overzichtelijksamenvattenvandata:grafische/numeriekeweergave-
→ eerste stap altijd beschrijvende analyse, puur beschrijven, gegevens verzameld weergeven
• Verklarende/inferentieëlestatistiek:schattenvaneffecten/relaties betroubaarheud vd onderzoeksresultaten en
hypothesen testen
Beschrijvende statistiek
Inleiding
• Doel: onderzoeksgegevens op overzichtelijke manier samenvatten
• Grafisch of numeriek
→ keuze: doel samenvatting
— Gegevens samengevat in mondelinge presentatie op congres: grafisch
— Wetenschappelijkartikel:numeriek
▪ Voordeel: info compacter en preciezer
Grafische weergave onderzoeksgegevens
Continue variabele in:
• Histogram
— X-as: continue variabele waarden (bv. Cholesterol)
— Y-as: aantallen proefpersonen
• Tak-en-blad/stemandleafdiagram
— Heel informatief
— Stengel = stem: tientallen
— Blad = leaf: eenheden
1. 2 proefpersonen zijn 19j
2.2 pf van 21, 3 pf van 22, 1 pf 23
• 2 continue variabelen: puntenwolk (scatterplot) visueel idee hoe 2 variabelen aan elkaar hangen
→ 1 continue variabel op de x en y as en dan gaan kijken
• Categorische variabelen in:
— Staafdiagram(barchart)
• 2v ariabelen:geclusterd/gesegmenteerd staafdiagram
— Taartdiagram(piechart) = Op een cirkcel manier de proproties wordt gegeven.
Numerieke weergave van onderzoeksgegevens
Dichotome of categoriale variabelen weergeven in frequentietabel
• Aantallen (freq) + percentages in verschillende groepen
• Valid percent: valide percentage waarbij missende waarden niet worden meegeteld
• Te veel mogelijke waarden die allemaal een paar keer voorkomen
• Samenvatting smaten worden gebruikt
• Combinatie centrummaten en spreidingsmaten om continue variabele te beschrijven
• Centrummaten:centrale waarde die distributie variabele beschrijft
Modus
• Meest voorkomende waarde
• Ook voor categorische variabelen
• Weinig informatief (weinig gebruikt: zegt weinig over distributie)
• Rekenkundig gemiddelde
• Alle waarden optellen en delen door aantal observaties/waarnemingen
• Alleen goede indicator bij normaal verdeelde variabelen
X=gemiddelde
Mediaan N = aantal personen in onderzoekspopulatie
Xi=waarde van variabele x voor persoon i
• Alle observaties ordenen
→ percentielpunten
• Geen berekeningen (minder krachtig)
• Ordening in alle observaties = middelste waarde (p50)
= waarde van observaties waarvoor geldt dat 50% van de observaties onder deze waarde en 50% boven deze
waarde ligt
Bij variabele die niet mooi normaal verdeeld is: niet rekenkundig gemiddelde, maar medoaan
Geometrisch gemiddelde
Spreidingsmaten
Spreidingsmaten: hoeveel spreiding er is in de variabele
• Variantie
• Standaarddeviatie
• Range
• Interkwartiel-range
De normale verdeling
Kenmerken
• Observaties symmetrisch verdeeld rond gemiddelde (geen uitschieters)
• Gemiddelde=mediaan
• Klokvorm (niet te hoog/niet te plat): 95% vd waarnemingen tss interval: gem +- 2*sd
Altijd goed kijken of het normaal verdeeld is of niet en dan
weet je welke centrummaat je moet gebruiken. Bv. De
deskundige gemiddelde of de mediaan.
Niet normaal verddeld
Werken met continue variabele: eerst histogram bekijken!
Scheef naar rechtse verdeling (skewed tot he right = pos skew)
• Uitschietersaanrechterkant
• Bv.Bloedwaarden
• Gemiddelde>mediaan
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ryanagyemang9. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $15.28. You're not tied to anything after your purchase.