Werkcollege en Zelfstudie aantekeningen Epidemiologie en Economie (DB3-B-EE)
5 views 0 purchase
Course
Epidemiologie en Economie (DB3BEE)
Institution
Universiteit Utrecht (UU)
De aantekeningen van werkcolleges en zelfstudies van het vak Epidemiologie en Economie dat in het 3e jaar van de Bachelor Diergeneeskunde aan de Universiteit van Utrecht wordt gegeven.
- Correlatie coëfficiënt bevindt zich tussen -1 en 1
- r = hoever de punten van de lijn af liggen en de richting van de lijn
- r = 0 -> geen associatie
- r < 0 -> negatieve associatie
- r > 0 -> positieve associatie
Niet gelijkwaardig = regressie -> H0: β =0 en H1: β ≠ 0
y = a +bx
a = snijpunt met de y-as
b= richtingscoëfficiënt/regressiecoëfficiënt
Als er geen relatie is dan is b = 0 -> x heeft geen invloed op y
Griekse letters is populatie (ϱ en β)
Normale letters is steekproef (r, a en b)
- Regressie = gemiddeld effect van x op y
- Correlatie = associatie tussen x en y
Standaarddeviatie = gemiddelde gekwadrateerde afstand tot het gemiddelde
= een maat voor de spreiding rondom het gemiddelde = tot de lijn
Als je de kwadraatsom deelt door de vrijheidsgraden krijg je de variantie = gemiddelde
kwadraatsom.
De totale afstand is de afstand van een punt tot het gemiddelde gewicht. De totale afstand
bestaat uit een residue en een regressie. Residue is de afstand van de punten tot aan de lijn.
Omdat het niet uitmaakt of de residu boven of onder de lijn ligt – de afstand blijft tocht
hetzelfde- kunnen we ook naar de residuen in het kwadraat kijken.
Als alle residuen in het kwadraat op zijn kleinst moeten zijn, dan moet dus de som van de
reisduen in het kwadraat op zijn kleinst zijn; oftewel de residu kwadraatsom moet zo klein mogelijk zijn.
Vrijheidsgraden = aantal waarnemingen -2.
Een residu is de afstand van een punt tot de lijn dus y i-(a+bxi).
Het blauwe stuk is het maximale wat je ernaast kan zitten: dit is als je bijvoorbeeld maar naar één variabele
kijkt, bijv. Gewicht. Het groene stuk is het door de regressie verklaarde stuk -> deze heeft 1 vrijheidsgraad
1
,Als je de kwadraatsommen deelt door de vrijheidsgraden krijg je de varianties = MS = mean squares =
gemiddelde kwadraatsom.
= alternatieve hypothese ≠ 0 -> grote F waarde = MS reg/MSres.
<- anova tabel
Als er sprake is van regressie dan kijk je naar de
richtingscoëfficient, als deze 0 is dan is er geen sprake van regressie en kan je de waarnemingen beter
samenvatten met een constant getal = gemiddelde.
Als de puntenwolk goed bij de lijn past, zullen de residuen klein zijn vergeleken met de regressie stukjes. De
residu variantie zal dan klein zijn in vergelijking met de door de regressie verklaarde variantie. = Alternatieve
hypothese is waar.
Uitkomst F-waarde = de door de regressie verklaarde variantie is …. maal zo groot als de residu variantie.
Om de p-waarde de uitkomst van de toetsingsgrootheid te bepalen gebruikt men dat F een fischer verdeling
heeft met 1 en n-2 vrijheidsgraden.
Je kan het ook toetsen met de t-toets:
Toetsingsgrootheid van de t-toets bepaald de afstand tussen datgenen wat je vond in je onderzoek (b) en de
nulhypothese uitgedrukt in standard errors -> t = (b-0)/se(b)
T= √F
Als de nulhypothese wordt verworpen dan is een lineair verband aangetoond, dat wil zeggen er is aangetoond
dat de regressiecoëfficiënt geen nul is.
Een maat voor hoe strak de punten om de lijn liggen is SS reg/SStotaal = r2.
WERKCOLLEGE 2: VARIANTIE ANALYSE
Voorbeeld van 3 groepen honden: controle groep, P 2O7 groep en HMP groep. De groepen honden krijgen ieders
een ander soort voer en er wordt gekeken naar de tandsteenindex.
De nulhypothese luidt: H0 = µ1=µ2=µ3. De gemiddelde tandsteenindex is dus volgens de nulhypothese bij alle
groepen honden gelijk.
De waarneming wordt beschreven als het groepsgemiddelde plus residu.
Modellen voor de populatie:
Model voor alternatieve hypothese:
yij=µ1 + residu
Model voor nulhypothese:
yij=µ + residu
-> er hoeft dan geen rekening te worden gehouden met verschillende gemiddelden -> deze zijn dan namelijk
gelijk.
2
,Meestal schrijft men deze twee modellen in een keer als:
yij=µ + (µ1-µ) + residu
(µ1-µ) = groepseffecten
Modellen voor de steekproef:
yij= y + ( y 1 - y ) + eij
Waarbij het residu in de steekproef eij = yij- y i
Totale afwijking = afwijking tussen een waarneming en het algemeen
gemiddelde
Groepsafwijking = afwijking tussen het groepsgemiddelde en het
algemeen gemiddelde = groepseffecten
Residuele afwijkingen = afwijkingen tussen een waarneming en z’n groepsgemiddelde
Totale afwijking = afwijking tussen groepen + residu afwijking
De afwijkingen gekwadrateerd en gesommeerd heten kwadraatsommen
Totale afwijking gekwadrateerd en gesommeerd = totale kwadraatsom = SS total
Tussen groepen afwijking gekwadrateerd en gesommeerd = tussen groepen kwadraatsom = SS Groep
Residuele afwijking gekwadrateerd en gesommeerd = residu kwadraatsom = SS Res
SSTotal = SSGroup + SSRes
Vrijheidsgraden
Dftotaal = n-1 vrijheidsgraden -> aantal waarnemingen -1
DfGroep = aantal groepen -1
Dfresidu = dftotaal - dfgroep
Deel de kwadraatsommen door de vrijheidsgraden en je krijgt variantie ook wel gemiddelde kwadraat sommen
genoemd (MS).
F-test
Als de nulhypothese klopt dan is de groepsvariantie gelijk aan de residu variantie. Als je dan de F-test doet
moet hier 1 uit komen:
F = MSgroep/MSresidu ≈ 1
Als de nulhypothese niet klopt dan vind je een F-waarde die veel groter is dan 1.
Maar wat is dan veel groter dan 1? Hiervoor moet je p-waardes berekenen. De toetsingsgrootheid F heeft een
zogenaamde Fischer verdeling met een vrijheidsgraad voor de groep en de residu.
3
, WERKCOLLEGE 3: UITBREIDINGEN
Regressie model met meer dan één onafhankelijke variabele
Voorbeeld: Marokkaanse werkezels
Omdat weegschalen zeldzaam zijn zochten ze andere methoden om het lichaamsgewicht te bepalen, ze
hebben 6 dingen gemeten.
Het lineaire model voor de populatie waaruit de steekproef uitkomstig is, is een uitbreiding van het geval met 1
onafhankelijke variabel:
Waarbij de lichaamsgewichten yi normaal verdeeld zijn met variantie σ2. De x-en zijn de 6 onafhankelijke
variabelen. Omdat we het bij elkaar optellen is het een lineair model.
Β1 stelt nu de verandering voor in de y-variabele als x1 met 1 verandert terwijl de andere variabelen constant
gehouden worden.
De steekproef
In de steekproef noemen we het intercept a en de richtingscoëfficiënten noemen we b 1, b2 etc. Men wil de
residuen zo klein mogelijk hebben. Een residu is nu de afstand van een punt tot het (hyper)vlak dus:
-> Afstand tussen de waarneming (y1) en het lineaire model (a+b1x1 + b2x2 …)
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller gemmajonker. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.23. You're not tied to anything after your purchase.