WDH2
KENNISKLIP 1: HOW TO IN R
In script editor intypen en opslaan
Bestanden zoeken: Session set working directory choose directory
Bestand openen: file open file voorbeeld.R klikken en openen
In script:
- # is extra commentaar die niet uitgevoerd wordt
- Niet numerieke waardes tussen “ “ zetten
- Tabel ( waarden) om te kijken hoeveel ziek zijn en hoeveel niet ziek zijn
- Mean (leeftijd) = gemiddelde
Dingen weghalen? rm (serie variabelen namen)
WERKCOLLEGE 1: KANSREKENINGEN EN BESCHRIJVENDE STATISTIEK
KENNISKLIP KANSREKENING EN BESCHRIJVENDE STATISTIEK
Populatie en steekproef:
- Beschrijvende en concluderende statistiek: vanuit
steekproef/waarneming naar populatie van onbekende
parameter
- Kansrekening: kans op een bepaalde steekproef als er
uitgegaan wordt op een bepaalde samenstelling van de
populatie
o Onafhankelijke waarnemingen: gewicht van ene dier is
onafhankelijk van ander individu
o Random (aselecte) trekking uit de populatie en daar
ga je vanuit dat deze steekproef een afspiegeling is van de populatie
o Berekenen van de kans op een bepaalde samenstelling van de steekproef
Karakter van de variabele: ook wel het type of de
aard van de variabele/welke waarden de variabele
kan aannemen
- Klassevariabelen:
o Vb: binaire variabele: ziek/niet ziek
(2 variabelen)
Binomiale kansverdeling
gebruiken
Als individuen onafhankelijk
zijn mogen kansen
vermenigvuldigen, want kans op ziek dier blijft gelijk
Kans op 1 ziek dier in 3
o Ras: boxer, poedel etc
, - Continue variabelen: gewicht, haemoglobinegehalte etc (kan heel veel waarden
aannemen)
o Weergeven met normale verdeling met μ (gemiddelde) en variantie (σ^2).
σ staat voor standaard deviatie
Standaard deviatie: geeft mate van spreiding van getallen rondom
het gemiddelde van deze getallen
o Z = (x-μ)/σ is standarisatie dmv transformatie
Standaard normale
verdeling is wanneer de
normale vorm omgezet
wordt in een z vorm
(N(0,1)) met 0 is het
midden met een standaard
deviatie van 1 naar links
en rechts
o Als er symmetrie is, dan geldt
P(Z<-1,5) = 1 – P(Z< + 1,5)
Beschrijvende statistiek: categorische variabele
- Proportie = x/n = aantal ziek/totaal (relatieve frequentie)
- Kan ook in (kruis)tabel, staafdiagram of taartdiagram
Beschrijvende statistiek met continue variabelen:
- Standaard deviatie: maat van afstand van het
gewicht van een individu van het gewicht van het
gemiddelde van de groep
- Percentiel: P10 = 5 betekent dat 10 % van de
waarden kleiner is dan 5
- Kan weergegeven worden in: histogram of
boxplot, cumulatieve frequentieverdeling/polygoon
HOW TO IN R
Bij log berekenen met resultaat NA onbekende waarden. Log van 0 kan niet.
Als er een gemiddelde van log.coat.ug.g berekend wordt, dan kan dat niet door NA, dus
na.rm=TRUE en dat verwijdert de NA waardes waar je niets mee kunt
WERKCOLLEGE 2: BETROUWBAARHEIDSINTERVAL EN TOETSINGSPROTOCOL
KENNISKLIP BETROUWBAARHEIDSINTERVAL EN TOETSINGSPROTOCOL
Types onderzoek:
- Experimenteel (ingegrepen wordt in systeem)
o Oorzakelijk verband, standaardisatie, gecontroleerde omstandigheden
o Via randomisatie gelijkwaardig samenstelling van subgroepen
- Observationeel (observeren van systeem)
o Cross sectional, cohort, case-control studie
o Definiëren van de (sub)populatie(s)
o Random trekking uit de (sub)populatie: ieder dier heeft een gelijke kans
om getrokken worden
o Randomisatie/random trekkingen: grootste kans op resultaten
representatief voor de populatie
Types hypothesen:
- Nulhypothese (H0) zijn hele concrete stellingen over een parameter in de
populatie die statisch te toetsen is
, - Alternatieve hypothese (H1): als nulhypothese verworpen wordt, dan gaat
alternatieve hypothese in. Bijv gemiddelde van populatie is ongelijk aan 600
Nulhypothese kan waar of niet waar zijn, want
we weten niet omdat we de populatie niet
kennen, dus data zeggen of nulhypothese
verworpen wordt of niet verworpen wordt
- Wat we kunnen proberen is een zo goed
mogelijke steekproef te nemen
(observationeel) of de groepen zo
gelijkwaardig mogelijk te maken
(experimenteel) mbv aantal
waarnemingen
o Groter aantal waarnemingen grotere kans op representativiteit (minder
onzekerheid, vaak uitgedrukt als standard error (se) van de schatting))
o Maar teveel waarnemingen is verspilling van arbeid en geld
3 simulaties:
- Steekproef met n=10 en elke keer gemiddelde berekeningen en alle gemiddeldes
in grafiek zitten zelden heel hoog of laag gemiddelde maar wel breed
- Steekproef met n=25 gemiddelde per steekproef berekenen en in grafiek
zetten grafiek wordt smaller en hele extreme gemiddelden komen bijna niet
meer voor
- Steekproef met n=100 wordt de grafiek nog smaller en extreme waardes kunnen
niet voorkomen en deze geeft beter het werkelijke gemiddelde weer
Deze pricisie uitdrukken in betrouwbaarheidsinterval
Betrouwbaarheidsinterval: maat voor de precisie
- Continue variabele
o N=aantal dieren dat gemeten is
o S= standaard deviatie
- Binaire variabele
o P=fractie zieke dieren
Toetsingsprocedure:
- Stap 1: hypothese formuleren in nulhypothese en alternatieve hypothese
N= wat er in steekproef gevonden is
X=gemiddelde in steekproef
Nulhypothese
S=standard error
Dus: resultaat is gestandariseerd tov de nulhypothese
Test1 heeft een kansverdeling.
Los beneficios de comprar resúmenes en Stuvia estan en línea:
Garantiza la calidad de los comentarios
Compradores de Stuvia evaluaron más de 700.000 resúmenes. Así estas seguro que compras los mejores documentos!
Compra fácil y rápido
Puedes pagar rápidamente y en una vez con iDeal, tarjeta de crédito o con tu crédito de Stuvia. Sin tener que hacerte miembro.
Enfócate en lo más importante
Tus compañeros escriben los resúmenes. Por eso tienes la seguridad que tienes un resumen actual y confiable.
Así llegas a la conclusión rapidamente!
Preguntas frecuentes
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
100% de satisfacción garantizada: ¿Cómo funciona?
Nuestra garantía de satisfacción le asegura que siempre encontrará un documento de estudio a tu medida. Tu rellenas un formulario y nuestro equipo de atención al cliente se encarga del resto.
Who am I buying this summary from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ninadarda. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy this summary for 3,49 €. You're not tied to anything after your purchase.