Statistiek voor gezondheidswetenschappen: theorie (D013201A)
Summary
Volledige samenvatting van het vak Statistiek voor de gezondheidswetenschappen met uitgewerkte voorbeelden
0 view 0 purchase
Course
Statistiek voor gezondheidswetenschappen: theorie (D013201A)
Institution
Universiteit Gent (UGent)
Book
Inleiding in de toegepaste biostatistiek
Deze samenvatting omvat het volledige vak gedoceerd door prof. Els Clays. Alles staat schematisch uitgeschreven in puntjes en voorbeelden worden verduidelijkt met foto's en grafieken
- Observationeel: puur
meten en observeren
- Experimenteel: interventie onderzoek -> altijd prospectief
o Doel: effect van de interventie evalueren
o Vb effectiviteit van medicatie -> werken met controle groep om nieuw medicijn te staven
- Case control: cases selecteren waar je onderzoek naar wilt doen + controlegroep voorzien
o Bepaalde groep vergelijken met controlegroep
Heeft dezelfde eigenschappen maar heeft interventie niet ondergaan
o Vb wat is de invloed van roken op longkanker waarbij de ene groep heeft gerookt en de
andere niet
- Cohort
o Retrospectief
o Prospectief
Vb ziekteontwikkeling binnen x aantal jaar
o Transversaal
Op 1 punt in het heden bekijken
2. Variabelen
= kenmerken onderzoek
In kaart brengen om te bekijken welke testen je kan doen
- Afhankelijke variabele
o = outcome variabele = dependent variabele
o Hier doe je onderzoek naar, dit wil je verklaren/
voorspellen
o Vb mentale gezondheid
- Onafhankelijke variabele
o = independent variabele = determinanten =
predictoren =covariaten
o Analyseren in welke mate deze in relatie staat met
afhankelijke
o Vb leeftijd, geslacht
2.1. Soorten variabelen
- Categorische/ categoriale/ kwalitatieve variabele
o Nominaal
Geen natuurlijke ordening/ rangorde
Vb bloedgroep, provincie, oogkleur,
ethnische groep
o Ordinaal
Data zijn niet continu, wel geordend
Vb ziektegraad: mild – matig – ernstig
Vb alcohol: niets – 1 tot 2 glazen/ d - > 2
glazen
Vb % dat RR zakt
Vb opleidingniveau & sociale klasse
1
, o Dichotoom
2 mogelijke uitkomsten
Vb wel/ niet roken -> 1 – 0 gecodeerd
Vorm van een categorische variabele maar beperkt tot 2 groepen
- Numerieke/ kwantitatieve variabele
o Discreet
Gehele getallen
Telling
Vb aantal keer de bus genomen dit jaar, aantal keer naar de HA gegaan
Je kan niet anderhalve keer gegaan zijn
o Continu
Opmeten op schaal
Oneindig, in praktijk afronden -> meetinstrument bepaald precisie
Vb lengte, gewicht, BMI, vermindering RR in mmHg
Intervalschaal
Zelfde waarde tussen 12kg en 13kg als tussen 41kg en 42kg
0°C, want is een eigen waarde
Ratio schaal
Natuurlijk nulpunt waarbij waarde 0 ontbrekend is van kenmerk
Vb 0kg = ontbreken van gewicht
- Numeriek -> categorisch
o Hercoderen naar categorische variabele
o Vb leeftijd: 18j 19j 20j 21j 22j 23j -> 18-20j & 21-23j
o Omgekeerd niet mogelijk
Start onderzoek = in kaart brengen van alle variabelen -> bepaald statistische mogelijkheden
2
, H2: Beschrijvende statistiek
Onderzoeksvraag nog niet bekijken
= overzichtelijk samenvatten van data op een numerieke of grafische wijze
= variabelen beschrijven nog voor je er testen mee doet
Hoe is de verdeling in mijn populatie via de gemeten steekproef
Nog geen relaties of verbanden testen
Voorbeeld
N = 100
Observationeel cross-sectioneel OZ = geen
verdere metingen doorheen de tijd
Chol = afhankelijke variabele, hier willen we
uitspraak over doen
- Staafdiagram (bar chart)
X-as: categoriën
y-as: aantal personen
mannen en vrouwen vergelijken
- Geclusterd staafdiagram
2 categorische variabelen met elkaar combineren en verhouding bekijken
Nog niet verklaren waarom er meer mannen bijwerkingen hebben
- Taartdiagram
Weergeven categoriale variabelen
- Histogram
Heel krachtig!
Eerste wat je doet bij verwerking van gegevens
Continue variabelen!
- Stem and leaf plot
Voor kleinere steekproeven
Vb distributie van alle kinderen in cm (continue variabele)
- Puntenwolk
Ieder punt is een proefpersoon
Enkel visuele weergave hoe 2 variabelen zich tov elkaar verhouden
= samenhang 2 numerieke continue variabelen
- Box-and-whisker plot
Enkel voor continue variabelen
Bovenste en onderste streepje: min & max leeftijd
Doosje: interkwartiel range
Zwarte streep = mediaan = p50
Voordeel: duidelijk te zien of er symmertrie is
2. Numerieke weergave
Voordeel: compactere en preciezere gegevens
- Frequentietabel
Eerste waat je doet
= volledige beschrijving van numerieke variabelen
Zowel % als aantallen worden weergegeven
Voorbeeld: 40 niet drinkers + 38 met <2g/d = 78% drinkt
minder dan 2 glazen per dag
Niet informatief voor continue variabelen
- Frequentietabel met missende waarden
Vb technische problemen, pp heeft niet alles ingevuld -> verschil
tussen % en valid %
In dit voorbeeld is rookt 26,1% van alle antwoorden
Transparantie over de verkregen waarden!
Cummulicatief percentage = groepen die werden samengenomen
3
, 3. Centrummaten
= meest typische/ centrale waarde van een bepaalde variabele
3.1. Modus
Weinig informatief, weinig gebruikt, geen berekening
Meest voorkomende waarde in de dataset
Vb leeftijd 29j komt meest voor, geen info over spreiding of gemiddelde
3.2. Rekenkundig gemiddelde
Alleen bij normaal verdeelde variabelen
Anders te veel beïnvloeding door uitschieters -> geen goede weergave over meest centrale
waarde
Alles optellen en delen door aantal
Wiskundige berekening, alle info wordt gebruikt
3.3. Mediaan
Rang gerelateerd, percentielpunt nemen (P50 = middelste waarde)
Alternatief voor rekenkundig gemiddelde
Geen wiskundige berekening
Centrummaat voor scheef verdeelde variabelen
3.4. Geometrisch gemiddelde
= nieuwe variabele maken door scheve verdeling (door SPSS laten hercoderen)
Natuurlijk logaritme nemen van iedere waarde -> histogram opmaken -> betere verdeling? ->
gemiddelde berekenen -> inversie nemen om oorspronkelijke eenheid te verkrijgen
Enkel bij rechts scheef
Veel 0 waarden -> geen berekening mogelijk
Nieuw gemiddelde zou beter bij mediaan moeten liggen dan
rekenkundig gemiddelde
Dataclearing bij verwerken van gegevens!
Fouten ingegeven?
Voldoet niet aan eisen van steekproef
Missende waarde?
4. Spreidingsmaten
Je wilt een uitspraak doen over de meest typische waarde en spreiding
Eerst zicht krijgen via histogram ivm distributie en normaliteit
4.1. Variantie
Stap 1 bij normaal verdeelde
= gemiddelde van de gekwadrateerde getallen tov het gemiddelde
Anders kan je 0 uitkomen voor standaarddeviatie en erna delen door N-1
Vb: 5p met leeftijd 41, 42, 43, 44, 45 j -> gemiddelde leeftijd = 43j
S² = [(43-41)²+(43-42)²+(43-43)²+(44-43)²+(45-43)²] = 10
10/(5-1) = 2,5
4.2. Standaarddeviatie
= gemiddeld verschil tussen observaties en het gemiddelde
Zegt iets over spreiding
Maakt gebruik van alle waarden (ook uitschieters)
wortel trekken van variantie dus: wortel van S2 = 1,58
dataset kan + en – zijn
enkel geschikt bij normale verdeling
4.3. Range
= minimum – maximum
Vb leeftijd: 19j-82j
Geen duidelijke info binnenin de distributie
4.4. Interkwartiel-Range
= percentiles
Rond P50 (= mediaan) IR bepalen = middelste 50% van de observaties
Kan bij iedere curve
Niet voor kleine steekproeven
Vb een kwart is jonger dan 29j en een kwart is ouder dan 54j
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller jokecools. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.80. You're not tied to anything after your purchase.