WDH2
KENNISKLIP 1: HOW TO IN R
In script editor intypen en opslaan
Bestanden zoeken: Session set working directory choose directory
Bestand openen: file open file voorbeeld.R klikken en openen
In script:
- # is extra commentaar die niet uitgevoerd wordt
- Niet numerieke waardes tussen “ “ zetten
- Tabel ( waarden) om te kijken hoeveel ziek zijn en hoeveel niet ziek zijn
- Mean (leeftijd) = gemiddelde
Dingen weghalen? rm (serie variabelen namen)
WERKCOLLEGE 1: KANSREKENINGEN EN BESCHRIJVENDE STATISTIEK
KENNISKLIP KANSREKENING EN BESCHRIJVENDE STATISTIEK
Populatie en steekproef:
- Beschrijvende en concluderende statistiek: vanuit
steekproef/waarneming naar populatie van onbekende
parameter
- Kansrekening: kans op een bepaalde steekproef als er
uitgegaan wordt op een bepaalde samenstelling van de
populatie
o Onafhankelijke waarnemingen: gewicht van ene dier is
onafhankelijk van ander individu
o Random (aselecte) trekking uit de populatie en daar
ga je vanuit dat deze steekproef een afspiegeling is van de populatie
o Berekenen van de kans op een bepaalde samenstelling van de steekproef
Karakter van de variabele: ook wel het type of de
aard van de variabele/welke waarden de variabele
kan aannemen
- Klassevariabelen:
o Vb: binaire variabele: ziek/niet ziek
(2 variabelen)
Binomiale kansverdeling
gebruiken
Als individuen onafhankelijk
zijn mogen kansen
vermenigvuldigen, want kans op ziek dier blijft gelijk
Kans op 1 ziek dier in 3
o Ras: boxer, poedel etc
, - Continue variabelen: gewicht, haemoglobinegehalte etc (kan heel veel waarden
aannemen)
o Weergeven met normale verdeling met μ (gemiddelde) en variantie (σ^2).
σ staat voor standaard deviatie
Standaard deviatie: geeft mate van spreiding van getallen rondom
het gemiddelde van deze getallen
o Z = (x-μ)/σ is standarisatie dmv transformatie
Standaard normale
verdeling is wanneer de
normale vorm omgezet
wordt in een z vorm
(N(0,1)) met 0 is het
midden met een standaard
deviatie van 1 naar links
en rechts
o Als er symmetrie is, dan geldt
P(Z<-1,5) = 1 – P(Z< + 1,5)
Beschrijvende statistiek: categorische variabele
- Proportie = x/n = aantal ziek/totaal (relatieve frequentie)
- Kan ook in (kruis)tabel, staafdiagram of taartdiagram
Beschrijvende statistiek met continue variabelen:
- Standaard deviatie: maat van afstand van het
gewicht van een individu van het gewicht van het
gemiddelde van de groep
- Percentiel: P10 = 5 betekent dat 10 % van de
waarden kleiner is dan 5
- Kan weergegeven worden in: histogram of
boxplot, cumulatieve frequentieverdeling/polygoon
HOW TO IN R
Bij log berekenen met resultaat NA onbekende waarden. Log van 0 kan niet.
Als er een gemiddelde van log.coat.ug.g berekend wordt, dan kan dat niet door NA, dus
na.rm=TRUE en dat verwijdert de NA waardes waar je niets mee kunt
WERKCOLLEGE 2: BETROUWBAARHEIDSINTERVAL EN TOETSINGSPROTOCOL
KENNISKLIP BETROUWBAARHEIDSINTERVAL EN TOETSINGSPROTOCOL
Types onderzoek:
- Experimenteel (ingegrepen wordt in systeem)
o Oorzakelijk verband, standaardisatie, gecontroleerde omstandigheden
o Via randomisatie gelijkwaardig samenstelling van subgroepen
- Observationeel (observeren van systeem)
o Cross sectional, cohort, case-control studie
o Definiëren van de (sub)populatie(s)
o Random trekking uit de (sub)populatie: ieder dier heeft een gelijke kans
om getrokken worden
o Randomisatie/random trekkingen: grootste kans op resultaten
representatief voor de populatie
Types hypothesen:
- Nulhypothese (H0) zijn hele concrete stellingen over een parameter in de
populatie die statisch te toetsen is
, - Alternatieve hypothese (H1): als nulhypothese verworpen wordt, dan gaat
alternatieve hypothese in. Bijv gemiddelde van populatie is ongelijk aan 600
Nulhypothese kan waar of niet waar zijn, want
we weten niet omdat we de populatie niet
kennen, dus data zeggen of nulhypothese
verworpen wordt of niet verworpen wordt
- Wat we kunnen proberen is een zo goed
mogelijke steekproef te nemen
(observationeel) of de groepen zo
gelijkwaardig mogelijk te maken
(experimenteel) mbv aantal
waarnemingen
o Groter aantal waarnemingen grotere kans op representativiteit (minder
onzekerheid, vaak uitgedrukt als standard error (se) van de schatting))
o Maar teveel waarnemingen is verspilling van arbeid en geld
3 simulaties:
- Steekproef met n=10 en elke keer gemiddelde berekeningen en alle gemiddeldes
in grafiek zitten zelden heel hoog of laag gemiddelde maar wel breed
- Steekproef met n=25 gemiddelde per steekproef berekenen en in grafiek
zetten grafiek wordt smaller en hele extreme gemiddelden komen bijna niet
meer voor
- Steekproef met n=100 wordt de grafiek nog smaller en extreme waardes kunnen
niet voorkomen en deze geeft beter het werkelijke gemiddelde weer
Deze pricisie uitdrukken in betrouwbaarheidsinterval
Betrouwbaarheidsinterval: maat voor de precisie
- Continue variabele
o N=aantal dieren dat gemeten is
o S= standaard deviatie
- Binaire variabele
o P=fractie zieke dieren
Toetsingsprocedure:
- Stap 1: hypothese formuleren in nulhypothese en alternatieve hypothese
N= wat er in steekproef gevonden is
X=gemiddelde in steekproef
Nulhypothese
S=standard error
Dus: resultaat is gestandariseerd tov de nulhypothese
Test1 heeft een kansverdeling.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper ninadarda. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,49. Je zit daarna nergens aan vast.