Deze samenvatting omvat het volledige vak gedoceerd door prof. Els Clays. Alles staat schematisch uitgeschreven in puntjes en voorbeelden worden verduidelijkt met foto's en grafieken
- Observationeel: puur
meten en observeren
- Experimenteel: interventie onderzoek -> altijd prospectief
o Doel: effect van de interventie evalueren
o Vb effectiviteit van medicatie -> werken met controle groep om nieuw medicijn te staven
- Case control: cases selecteren waar je onderzoek naar wilt doen + controlegroep voorzien
o Bepaalde groep vergelijken met controlegroep
Heeft dezelfde eigenschappen maar heeft interventie niet ondergaan
o Vb wat is de invloed van roken op longkanker waarbij de ene groep heeft gerookt en de
andere niet
- Cohort
o Retrospectief
o Prospectief
Vb ziekteontwikkeling binnen x aantal jaar
o Transversaal
Op 1 punt in het heden bekijken
2. Variabelen
= kenmerken onderzoek
In kaart brengen om te bekijken welke testen je kan doen
- Afhankelijke variabele
o = outcome variabele = dependent variabele
o Hier doe je onderzoek naar, dit wil je verklaren/
voorspellen
o Vb mentale gezondheid
- Onafhankelijke variabele
o = independent variabele = determinanten =
predictoren =covariaten
o Analyseren in welke mate deze in relatie staat met
afhankelijke
o Vb leeftijd, geslacht
2.1. Soorten variabelen
- Categorische/ categoriale/ kwalitatieve variabele
o Nominaal
Geen natuurlijke ordening/ rangorde
Vb bloedgroep, provincie, oogkleur,
ethnische groep
o Ordinaal
Data zijn niet continu, wel geordend
Vb ziektegraad: mild – matig – ernstig
Vb alcohol: niets – 1 tot 2 glazen/ d - > 2
glazen
Vb % dat RR zakt
Vb opleidingniveau & sociale klasse
1
, o Dichotoom
2 mogelijke uitkomsten
Vb wel/ niet roken -> 1 – 0 gecodeerd
Vorm van een categorische variabele maar beperkt tot 2 groepen
- Numerieke/ kwantitatieve variabele
o Discreet
Gehele getallen
Telling
Vb aantal keer de bus genomen dit jaar, aantal keer naar de HA gegaan
Je kan niet anderhalve keer gegaan zijn
o Continu
Opmeten op schaal
Oneindig, in praktijk afronden -> meetinstrument bepaald precisie
Vb lengte, gewicht, BMI, vermindering RR in mmHg
Intervalschaal
Zelfde waarde tussen 12kg en 13kg als tussen 41kg en 42kg
0°C, want is een eigen waarde
Ratio schaal
Natuurlijk nulpunt waarbij waarde 0 ontbrekend is van kenmerk
Vb 0kg = ontbreken van gewicht
- Numeriek -> categorisch
o Hercoderen naar categorische variabele
o Vb leeftijd: 18j 19j 20j 21j 22j 23j -> 18-20j & 21-23j
o Omgekeerd niet mogelijk
Start onderzoek = in kaart brengen van alle variabelen -> bepaald statistische mogelijkheden
2
, H2: Beschrijvende statistiek
Onderzoeksvraag nog niet bekijken
= overzichtelijk samenvatten van data op een numerieke of grafische wijze
= variabelen beschrijven nog voor je er testen mee doet
Hoe is de verdeling in mijn populatie via de gemeten steekproef
Nog geen relaties of verbanden testen
Voorbeeld
N = 100
Observationeel cross-sectioneel OZ = geen
verdere metingen doorheen de tijd
Chol = afhankelijke variabele, hier willen we
uitspraak over doen
- Staafdiagram (bar chart)
X-as: categoriën
y-as: aantal personen
mannen en vrouwen vergelijken
- Geclusterd staafdiagram
2 categorische variabelen met elkaar combineren en verhouding bekijken
Nog niet verklaren waarom er meer mannen bijwerkingen hebben
- Taartdiagram
Weergeven categoriale variabelen
- Histogram
Heel krachtig!
Eerste wat je doet bij verwerking van gegevens
Continue variabelen!
- Stem and leaf plot
Voor kleinere steekproeven
Vb distributie van alle kinderen in cm (continue variabele)
- Puntenwolk
Ieder punt is een proefpersoon
Enkel visuele weergave hoe 2 variabelen zich tov elkaar verhouden
= samenhang 2 numerieke continue variabelen
- Box-and-whisker plot
Enkel voor continue variabelen
Bovenste en onderste streepje: min & max leeftijd
Doosje: interkwartiel range
Zwarte streep = mediaan = p50
Voordeel: duidelijk te zien of er symmertrie is
2. Numerieke weergave
Voordeel: compactere en preciezere gegevens
- Frequentietabel
Eerste waat je doet
= volledige beschrijving van numerieke variabelen
Zowel % als aantallen worden weergegeven
Voorbeeld: 40 niet drinkers + 38 met <2g/d = 78% drinkt
minder dan 2 glazen per dag
Niet informatief voor continue variabelen
- Frequentietabel met missende waarden
Vb technische problemen, pp heeft niet alles ingevuld -> verschil
tussen % en valid %
In dit voorbeeld is rookt 26,1% van alle antwoorden
Transparantie over de verkregen waarden!
Cummulicatief percentage = groepen die werden samengenomen
3
, 3. Centrummaten
= meest typische/ centrale waarde van een bepaalde variabele
3.1. Modus
Weinig informatief, weinig gebruikt, geen berekening
Meest voorkomende waarde in de dataset
Vb leeftijd 29j komt meest voor, geen info over spreiding of gemiddelde
3.2. Rekenkundig gemiddelde
Alleen bij normaal verdeelde variabelen
Anders te veel beïnvloeding door uitschieters -> geen goede weergave over meest centrale
waarde
Alles optellen en delen door aantal
Wiskundige berekening, alle info wordt gebruikt
3.3. Mediaan
Rang gerelateerd, percentielpunt nemen (P50 = middelste waarde)
Alternatief voor rekenkundig gemiddelde
Geen wiskundige berekening
Centrummaat voor scheef verdeelde variabelen
3.4. Geometrisch gemiddelde
= nieuwe variabele maken door scheve verdeling (door SPSS laten hercoderen)
Natuurlijk logaritme nemen van iedere waarde -> histogram opmaken -> betere verdeling? ->
gemiddelde berekenen -> inversie nemen om oorspronkelijke eenheid te verkrijgen
Enkel bij rechts scheef
Veel 0 waarden -> geen berekening mogelijk
Nieuw gemiddelde zou beter bij mediaan moeten liggen dan
rekenkundig gemiddelde
Dataclearing bij verwerken van gegevens!
Fouten ingegeven?
Voldoet niet aan eisen van steekproef
Missende waarde?
4. Spreidingsmaten
Je wilt een uitspraak doen over de meest typische waarde en spreiding
Eerst zicht krijgen via histogram ivm distributie en normaliteit
4.1. Variantie
Stap 1 bij normaal verdeelde
= gemiddelde van de gekwadrateerde getallen tov het gemiddelde
Anders kan je 0 uitkomen voor standaarddeviatie en erna delen door N-1
Vb: 5p met leeftijd 41, 42, 43, 44, 45 j -> gemiddelde leeftijd = 43j
S² = [(43-41)²+(43-42)²+(43-43)²+(44-43)²+(45-43)²] = 10
10/(5-1) = 2,5
4.2. Standaarddeviatie
= gemiddeld verschil tussen observaties en het gemiddelde
Zegt iets over spreiding
Maakt gebruik van alle waarden (ook uitschieters)
wortel trekken van variantie dus: wortel van S2 = 1,58
dataset kan + en – zijn
enkel geschikt bij normale verdeling
4.3. Range
= minimum – maximum
Vb leeftijd: 19j-82j
Geen duidelijke info binnenin de distributie
4.4. Interkwartiel-Range
= percentiles
Rond P50 (= mediaan) IR bepalen = middelste 50% van de observaties
Kan bij iedere curve
Niet voor kleine steekproeven
Vb een kwart is jonger dan 29j en een kwart is ouder dan 54j
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper jokecools. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €9,06. Je zit daarna nergens aan vast.