100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Zeer volledige samenvatting van hoorcolleges Statistiek 2 $7.44   Add to cart

Class notes

Zeer volledige samenvatting van hoorcolleges Statistiek 2

1 review
 51 views  7 purchases
  • Course
  • Institution

Zeer volledige samenvatting, bijna een transcript, van alle hoorcolleges van statistiek 2. Met deze samenvatting heb ik een 9,3 gehaald voor het tentamen.

Preview 3 out of 27  pages

  • December 20, 2022
  • 27
  • 2020/2021
  • Class notes
  • Demarest
  • All classes

1  review

review-writer-avatar

By: pepijnhoppenbrouwer • 1 year ago

avatar-seller
STATISTIEK 2

W1: hoorcollege
Variabelen bij statistiek 2
Interval-ratio afhankelijke variabele  lineaire regressie
Dichotoom (0/1, dus twee keuzes) afhankelijke variabele  logistische regressie
De onafhankelijke variabele kan zowel nominaal, ordinaal en interval-ratio zijn. Dus categorisch en
numeriek.


Pijlers er van de cursus
- Regressie modellen: zowel lineair als logistisch.
- Multivariaat, er worden in de cursus meerdere onafhankelijke variabelen bekeken.
- Begrijpen welk effect onafhankelijke variabelen hebben op de afhankelijke variabele.
- Hoe goed het model bij de daadwerkelijke waarde past.
- Interacties: wordt het effect van de onafhankelijke variabele op de afhankelijke variabele
beinvloed door een derde variabele.
- Is onze data wel geschikt om deze statistische methode te gebruiken.
- PRIORITEIT ZIJN DE COEFFICIENTEN: EFFECT VAN ONAFHANKELIJK OP AFHANKELIJKE
VARIABELEN.


DE BIVARIATE LINEAIRE REGERESSIE
Pearson’s correlatie: samenhang tussen twee bivariate correlatie.
Vuistregel: +1 perfect positief verband, -1 perfect negatief verband, 0 geen verband. 0,1 = zwak, 0,3 =
matig, 0,5 = sterk.

Correlaties kunnen worden weergegeven in een scatter plot. Op de X-as staat de onafhankelijke
variabele en de Y-as de afhankelijke variabele. Uit de scatter plot is het verband weer te geven. Dit is
te zien aan het richtingscoëfficiënt. Is het richtingscoëfficiënt positief, zelfs +1, dan heb je een positief
verband.

Vaak een scatter wolk, de puntjes staan niet in een rechte lijn.

Correlaties hangt samen met hoe goed de punten op een lijn kunnen worden gebracht in een scatter
plot.



Bivariate regressie:

2 continue variabelen. Een onafhankelijke (X) en een afhankelijke (Y).

Kijkt niet naar de sterkte van het verband. Maar naar de verandering van Y als gevolg van een
verandering van X. hierdoor proberen we te kunnen voorspellen wat er gebeurt als X verandert met
Y.

Regressielijn met perfecte samenhang: X =6 en Y =6, dan is er perfecte correlatie/samenhang. Er is
gebruik gemaakt van dezelfde schaal. Dit is de +1, maar hier zijn we niet in geïnteresseerd. We zijn

,geïnteresseerd in het richtingscoëfficiënt/helling van de lineaire functie. Als X omhoog gaat, hoeveel
gaat Y omhoog.

De regressielijn geeft geen causaliteit aan. Dit moet jezelf bedenken. Je moet zelf bedenken welke
variabele eerst komt en dus een gevolg veroorzaakt.

Geen regressielijn: als er een scatter wolk is, moet er mbv SPSS een regressielijn worden getekend.
Bij het tekenen van een regressielijn moet er worden opgelet op de schaal van de assen. SPSS: fit line
at total voor de regressie lijn. Als SPSS dit heeft gedaan, hebben we een model. Dit model geeft weer
wat het effect is van X op Y. Deze functie interesseert ons, vooral het effect van X op Y. de helling van
de lijn interesseert ons het meest bij lineaire regressie.

Regressielijn gebruiken: SPSS heeft een lineaire regressielijn opgetekend. Aan de lijn is de
samenhang positief of negatief te bepalen. De regressielijn is het statisch model. Stel je wil weten
hoeveel de waarde van Y is voor een bepaalde X, moet je gewoon lijnen trekken. Dus vanaf X naar de
lijn en van de lijn naar Y, en kun je de waarde gewoon aflezen.

Formule regressielijn = y = a + bx  a= constante : waar de lijn de Y-as snijdt, b =
richtingscoefficient : hoeveel Y omhoog gaat als X 1 toeneemt.

Notatie regressie formule = yi = b0 + b1xi

Het model is een vereenvoudiging van de werkelijkheid. De lijn is namelijk een model. Er is sprake
van een error. De observaties zoals ze zijn in de werkelijkheid wijken namelijk af van de lijn. De
observaties liggen niet op de lijn. We kijken nu naar het verschil tussen de geobserveerde waarde en
de waarde die de lijn aangeeft. Alleen als er perfecte samenhang is, correlatie = 1, voorspelt de
regressielijn niet de perfecte Y-waarde. De regressielijn geeft een voorspelde waarde en daarnaast is
er de echte waarde:

yi-hat = b0 + b1xi  hat geeft aan dat het een geschatte waarde betreft.

yi = b0 + b1xi + ei  epsilon staat voor error



Hoe regressielijn bepalen: Ordinary Least Squares (kleinste kwadraten-methode). SPSS berekent de
waarde van de constante en de helling. Het verschil tussen de geobserveerde waardes en die van de
lijn moet zo klein mogelijk zijn. RS, de afstand tussen de lijn en observaties, wordt gekwadrateerd.
Kwadratensom. Dit doet SPSS, en hoef je niet handmatig te doen.

Squared residuals = SSR = gekwadrateerde som van de verschillen.



Lineaire functie, verandering constante: constante is in de formule a of b0, het snijpunt met de Y-as.
Als de constante verandert komt de lijn hoger of lager op de grafiek te liggen, maar het
richtingscoefficient/de helling verandert niet.

Lineaire functie, verandering richtingscoefficient: als de helling 1 is, dan is er een sterk positief
verband. Is de helling minder dan 1, bijvoorbeeld 0,5 (een plattere lijn), dan is er minder een effect
tussen X en Y. of de correlatie: er is een minder sterke samenhang tussen X en Y. een platte lijn,
betekent dat de helling gelijk is aan 0, er is dan geen verband. Een negatief effect is een lijn die naar
beneden helt, dus een negatieve helling.

, Van steekproef tot populatie, significantietoetsen: de observaties van de dataset komen uit een
steekproef. Het model is dus gemaakt op basis van een steekproef. Op het gemaakte model moet
weer een betrouwbaarheidsinterval en significantietoets worden berekend. We bestuderen dus een
steekproef, maar willen weten hoe het werkt in de gehele populatie.

Steekproef en regressielijnen: van verschillende steekproeven doen, kun je steeds regressielijnen
maken. Dit kan worden gebruikt voor een betrouwbaarheidsinterval. Hierbij hoort ook weer een
standaardfout. De standaardfout van een regressie coëfficiënt is de standaardafwijking van de
steekproefverdeling van die coëfficiënt.



T-TOETS

t-toets: WIJKT b1 significant af van 0. De vraag die we vaak stellen is of onze regressiecoefficient
significant afwijkt van 0. De nulhypothese wordt dus weer gesteld. Er wordt weer de t-statistiek
gebruikt.

bobserved −b
t= expected


SEb

Standaardfout krijg je in de output.

Om te zeggen of de t significant is wordt naar de p-waarde gekeken in de output. Als dit met de hand
zou worden berekend kijk je weer naar de t-tabel en de kritische waarden, maar dat is niet van
toepassing hier.

Vrijheidsgraden = N – p – 1  p = aantal onafhankelijke waarden, N = aantal observaties.

p-waarde: onder de nulhypothese wat is de kans om deze t-waarde te vinden of extremer? De p-
waarde geeft een percentage aan.

De t-waarde en p-waarde kunnen ook berekend worden voor de constante.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller FemkeVerhelst. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $7.44. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

67096 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$7.44  7x  sold
  • (1)
  Add to cart