Samenvatting Biostatistiek
Als 0 niet in het betrouwbaarheidsinterval ligt, dan is p<0,05 en wordt H 0 verworpen. Er is dus een
significant verschil waargenomen.
Als P ≤ 0,05, dan H0 verwerpen en HA accepteren.
Als P > dan 0.05, dan H0 niet verwerpen.
Afronden
NEN; bepaal en rond het getal af door te kijken naar de uitkomst van /2. (tel het aantal nullen tel het aantal nullen
voor het eerste getal, dit is het aantal decimalen). Notabene als n<10 gebruik dan 1 decimaal extra.
Een 5 moeten worden afgerond naar een even nummer. 0 is even. Bij het afronden van het
gemiddelde wordt er gekeken naar se(tel het aantal nullen X́ ¿ /2. Bij het afronden van b wordt er gekeken naar se(tel het aantal nullen b)/2.
Statistiek is nodig om medische/farmacologische/biologische problemen op te lossen aan de hand
van een statistische vraag. Het kan worden gebruikt om de wetenschappelijke literatuur beter te
begrijpen, voor een kritische verklaring en analyse van data uit het onderzoek, onderzoek en
experiment design en voor het beter begrijpen en evalueren van klinische data.
Variatie is onvoorspelbaar. Het voorspelbare gebeurt gewoonlijk en het onwaarschijnlijke komt soms
voor.
- Beschrijvende statistiek; het weergeven van data en variatie in data op een eenvoudige
manier.
- Stochastic/goodness of fit analyse; het vergelijken van gemeten variatie met de theoretisch
verwachte variatie.
- Schattings theorie; het trekken van conclusies gebaseerd op samples.
- Test-theorie; bepaal de verschillen tussen twee groepen behandelingen.
- Correlatieanalyse en regressieanalyse; de relatie tussen variabelen.
- Experimenteel ontwerp; het optimaliseren van de experimentele opstelling.
Variabelen die de eigenschappen van een populatie karakteriseren worden parameters genoemd, ze
worden met Griekse letters beschreven.
- is het gemiddelde van een eigenschap binnen een populatie.
- is de standaarddeviatie van een eigenschap binnen een populatie.
Deze parameters zijn constant voor een bepaalde populatie.
Een sample is een deel van de populatie die wordt gebruikt om conclusies te trekken over de hele
populatie. Het gaat hierbij om een steekproef. Parameters die de eigenschappen van een sample
karakteriseren worden statistische hoeveelheden of statistieken genoemd.
- X́ is het gemiddelde van een eigenschap binnen een steekproef
- s is de standaarddeviatie van een eigenschap binnen een steekproef.
De statistische hoeveelheden van een sample zijn variabel. Het eerste sample zal resulteren in
andere statistische hoeveelheden dan het tweede sample. Het trekken van conclusies gebaseerd op
een steekproef introduceert een kans factor.
De populatie is het complete geheel van elementen waarover een experiment wordt uitgevoerd.
Een sample is een gelimiteerd aantal van elementen van een populatie. Een sample moet
representatief zijn voor de gehele populatie om betrouwbare conclusies over de populatie te kunnen
trekken. Daarnaast moet een sample random en onafhankelijk worden geselecteerd. Random wil
zeggen dat alle elementen binnen een populatie dezelfde kans hebben om geselecteerd te worden.
1
,Om een sample random te selecteren kan er gebruik worden gemaakt van lotingsgetallen (tel het aantal nullen tabel 1).
Let op er moeten wel relevante getallen worden gekozen.
Gelaagde samples kunnen worden verkregen door uit de eerste laag eerst bijvoorbeeld random 2
van de 20 boxen te kiezen. En vervolgens kan er uit de tweede laag random 20 tabletten van de ene
box en 20 tabletten van de andere box worden gekozen.
De relatie tussen een sample en de populatie is afhankelijk van onzekerheid. De
waarschijnlijkheidsverdeling is theoretisch gelijk aan de relatieve frequentieverdeling.
2 soorten data:
- Categorische data (tel het aantal nullen kwalitatief)
2 categorieën/dichotomie; binaire data, yes/no, 0-1
> 2 categorieën
Het zijn geen getallen/waarden, maar bijvoorbeeld het geslacht of beroep.
- Numerieke data (tel het aantal nullen kwantitatief)
Discrete data
Continue data; variabelen als lengte, gewicht, buitentemperatuur, tijd, e.d. kunnen
allerlei tussenwaarden aannemen.
Classificatie categorische data;
- Nominale schaal; alleen classificatie. Bijvoorbeeld bloedgroep. Dichotomie is een
uitzondering, er is sprake van een binaire schaal met twee types. Hier heeft de waarde die
een variabele kan aannemen alleen de betekenis van een naam. Er is geen sprake van een
volgorde. Denk bijvoorbeeld aan rugnummers van een voetbalelftal. Je kunt niet zeggen dat
de speler met rugnummer 14 beter is dan de speler met rugnummer 7
- Ordinale schaal; classificatie en rangorde. Bijvoorbeeld scores. De rangorde vindt plaats van
laag naar hoog. Er is wel sprake van volgorde, een hoger nummer duidt op een hogere score,
maar het verschil tussen bijvoorbeeld 3 en 4 is niet hetzelfde als het verschil tussen 1 en 2
Waarneming/meetwaarde; het aantal incidenten van de uitkomst of de frequentie (tel het aantal nullen discrete
aantallen). De data wordt in een tabel of bar diagram gepresenteerd.
Classificatie numerieke data;
- Interval schaal; meting met een gefixeerde eenheid. Het nulpunt is niet arbitrair gekozen.
Bijvoorbeeld temperatuur.
- Ratio schaal; meting met een gefixeerde eenheid en een gefixeerd nulpunt. Voorbeelden
zijn; relatieve frequentie, snelheid en concentratie.
- Gecensureerde data; eenzijdig gelimiteerd. Bijvoorbeeld overlevingstijd.
De data wordt in een frequentietabel of een histogram gepresenteerd.
2
, Type variabele Numeriek Grafisch
Categorisch & nominaal Frequentie tabel (tel het aantal nullen aantallen, Staafdiagram
percentages)
Ligging: modus
Categorisch & ordinaal Frequentie tabel (tel het aantal nullen aantallen, Staafdiagram
percentages)
Ligging: mediaan
Spreiding: IQR, range
Continue & niet normaal Ligging: mediaan Histogram, boxplot
Spreiding: IQR, range
Meetwaarden hebben een gelimiteerde precisie. De presentatie van de metingen zegt iets over de
mate van precisie.
De standaarddeviatie of standaardafwijking is een maat voor de spreiding van een variabele of van
een verdeling of populatie. Het is een rekenkundige maat voor de spreiding van de getallen rondom
het gemiddelde. Het nadeel van een variabele met weinig spreiding is dat het niet veel varieert en
dat je ook weinig statistisch significante verschillen of verbanden zult vinden. De range is het gebied
wat ligt tussen de laagste en hoogste waarde. Als de range groot is dan is de standaarddeviatie ook
heel groot. De mediaan is het gemiddelde van de verdeling. Als n een even aantal is dan is het
gemiddelde van de twee metingen in het midden de mediaan. Als n een oneven aantal is dan is de
middelste gemeten waarde de mediaan. De modus is de het getal of de klasse die het meest
voorkomt.
Spreiding
SS=∑ ¿ ¿ De som van de kwadraten voor een populatie. SS is altijd positief!
MS=σ 2=∑ ¿ ¿ ¿ De gemiddelde som van de kwadraten voor een populatie, het is gelijk aan de
variantie.
s2=
∑ X 2−n∗ X́ 2 De variantie, het is de gemiddelde som van de kwadraten voor een sample
n−1
(tel het aantal nullen steekproef). Het is handig om ∑ X 2 en X́ 2 eerst apart te berekenen. n is het aantal
uitkomsten/steekproeven.
μ=
∑ X Het gemiddelde van de eigenschappen binnen een populatie.
N
X́ =
∑ X Het gemiddelde van de eigenschappen binnen een steekproef.
n
2
√ s =s De standaarddeviatie (tel het aantal nullen altijd positief!).
De variantie van een sample (tel het aantal nullen s2) is een goede taxateur voor 2 met df = n-1. De standaarddeviatie van
een sample (tel het aantal nullen s) is geen goede taxateur voor .
De relatieve standaarddeviatie (tel het aantal nullen RSD) = variatiecoëfficiënt= standaarddeviatie/gemiddelde (tel het aantal nullen %)
3
, Een centiel is 1%, een percentiel is 10% en een kwartiel is 25%.
De inter-quartile range (tel het aantal nullen IQR) is gebaseerd op het eerste kwartiel (tel het aantal nullen 25% onder en 75% boven) en
derde kwartiel (tel het aantal nullen 25% boven en 75% onder). De afstand hiertussen is de IQR. Hierbinnen bevindt zich
dus 50% van de data.
Grove error; serieuze fout. Het experiment moet opnieuw worden uitgevoerd. Precisie; het is de
mate van reproduceerbaarheid. Het geeft aan hoe dicht de metingen bij elkaar zitten.
Accuraatheid/juistheid geeft aan hoe ver de metingen liggen van de juiste waarde. Bias/
systemische afwijking; het is de afwijking van de werkelijke waarde. De precisie van de meting is
gelimiteerd en afhankelijk van het instrument.
Als er sprake is van continue data dan wordt dit in het histogram aangegeven door geen ruimte te
laten tussen de verschillende staven.
Data transformatie
- Lineaire transformatie; y= a + b * X
- Logaritmische transformatie; y= ln(tel het aantal nullen X)
Voor symmetrische verdelingen (normale verdelingen) geeft het gemiddelde en de
standaarddeviatie een goed beeld van de centrale tendency en de spreiding. Bij centrale tendency
gaat het om het gemiddelde, de mediaan, de modus en het geometrische gemiddelde. Bij de
spreiding gaat het om centielen, percentielen, de IQR, de variantie en de standaarddeviatie. Voor
asymmetrische verdelingen zijn er andere mogelijkheden om de verdeling te beschrijven, namelijk
een histogram of een bar diagram. Voor een verdeling die sterk naar links is verschoven kan het
helpen om een logaritmische transformatie uit te voeren om een meer symmetrische verdeling te
krijgen.
Kansen
De kans op een specifieke uitkomst (tel het aantal nullen A) is de fractie van het aantal keren dat uitkomst A voorkomt als
het experiment een groot aantal keren wordt uitgevoerd. Pr(tel het aantal nullen A); de kans dat uitkomst A voorkomt. De
kans op Pr(tel het aantal nullen A⋂B) =0 als één van de twee uitkomsten de ander uitsluit. Een Pr van ∞ = 1.
Kansen en waarschijnlijkheden
Pr(tel het aantal nullen A⋂B) = Pr(tel het aantal nullen A) · Pr(tel het aantal nullen B) Het is de kans dat A en B tegelijkertijd voorkomen. (tel het aantal nullen productregel)
Pr(tel het aantal nullen A∪B) = Pr(tel het aantal nullen A) + Pr(tel het aantal nullen B) – Pr(tel het aantal nullen A⋂B) Het is de kans dat of A of B voorkomt. (tel het aantal nullen Additieregel)
Pr(tel het aantal nullen Ā)= 1- Pr(tel het aantal nullen A) Het is de kans dat A niet voorkomt.
Als A en B afhankelijk zijn dan geldt:
Pr(tel het aantal nullen A|B) = Pr (tel het aantal nullen A⋂B)/Pr(tel het aantal nullen B) Het is de kans dat A voorkomt als B vaststaat.
Pr(tel het aantal nullen B|A) =Pr (tel het aantal nullen A⋂B)/Pr(tel het aantal nullen A) Het is de kans dat B voorkomt als A vaststaat.
Pr(tel het aantal nullen A⋂B) = Pr(tel het aantal nullen A) · Pr(tel het aantal nullen B|A) = Pr(tel het aantal nullen B) · Pr(tel het aantal nullen A|B)
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper ikoekman. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.