Biomedische statistiek
Hoofdstuk 1
Toeval variatie is in de meeste wetenschappelijke experimenten aanwezig.
Een experiment is eigenlijk een willekeurige steekproef.
Random veranderlijke: variabelen waarvan waarde afhangt van toevalsvariatie.
Soorten variabelen
Categorisch: data wordt onderverdeeld in categoriën (kwalitatief)
Zonder orde: nominaal (bloedgroep, nationaliteit)
Met orde: ordinaal (bijv pijn, ernstig, mild, geen)
Binair: er zijn maar twee mogelijke categoriën (ja/nee, dood/levend)
Numeriek: data heeft numerieke waarde (kwantitatief)
Discreet: geteld aantal, geheel getal (punten op examen, datum)
Continu: met komma (meetwaarde, percentage, bloeddruk, leeftijd, lichaamslengte.)
Hoofdstuk 3 Errors checking and outlier
Outliers: observaties die afwijken van de rest van de data. Bij outliers moet worden nagekeken of dit
een fout in de data is of dat het gewoon een afwijkende waarde is. Blijkt de waarde correct te zijn
mag deze niet worden verwijderd.
Hoofdstuk 4 displaying data diagrammatically
1 variabelen
Staafdiagram
Taartdiagram
Histogram
Puntendiagram
Steelbladdiagrammen
Box-plot
2 variabelen
1 categorische waarde: twee aparte diagrammen kiezen.
Waardes allebei numeriek of allebei ordinaal: spreidingsdiagram.
De vorm van de verdeling bepaald vaak de keuze van diagram.
Unimodaal: 1 piek
o Symmetrisch, scheef naar rechts of scheef naar links.
, Bimodaal: 2 pieken
Uniform: geen pieken, alles is ongeveer gelijk.
, Hoofdstuk 5 describing data: the average
Rekenkundig gemiddelde (ook wel gemiddelde) µ
Gebruiken bij symmetrische data
Berekend door alles op te tellen en te delen door de som van de aantal nummers.
Wiskundig gezegd: x = x1 + x2 + x3 ….. / n ofwel x = Σx / n
o Σ betekent de som van ......
Gevoelig voor outliers.
De mediaan
Data sorteren op orde van grote, begin met de kleinste eindig met de grootste.
De mediaan is de middelste data.
Bij een even aantal observaties wordt het gemiddelde genomen van de middelste twee.
Ongevoelig voor outliers.
De modus
Het getal wat het meest voorkomt, negeert wel een groot gedeelte van de data.
Gewogen gemiddelde
Wanneer bepaalde waarde belangrijker zijn dan andere.
Σ wx / w (w=weight)
Hoofdstuk 6 describing data: the spread
Asymmetrische spreiding
De range: de grootste en kleinste waarde.
Percentielen: waarden rangschikken van klein naar groot, het percentiel geeft aan hoeveel
procent van de waardes boven en onder de gekozen waarde liggen.
Speciale percentielen: P50 (mediaan), P25-P75 (kwartielen), P10-20-30... (decielen), P75-P25
(interkwartiel afstand).
Referentie interval: 95% van de observaties worden vaak gebruikt, bovenste en onderste
2,5% niet.
Symmetrische spreiding
Bij de variantie wordt de gemiddelde afwijking in het kwadraat te gaan zodat negatieve
verschillen ook worden meegenomen in de berekening.
De standaard afwijking:
Spreidingsmaten
De standaard afwijking: symmetrische verdeling, gevoelig voor outliers, gebruikt alle info,
relatie met onderliggende verdeling.
Interkwartiel afstand: verdeling hoeft niet symmetrisch, ongevoelig voor outliers, gebruikt
niet alle informatie.