100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Verhelderende samenvatting van Blok 2.2C Statistics II: Explaining and predicting $11.94   Add to cart

Summary

Verhelderende samenvatting van Blok 2.2C Statistics II: Explaining and predicting

2 reviews
 109 views  9 purchases
  • Course
  • Institution

Hoofdstuk 2, 8, 9, 10, 11, 12, 13 en 14 zijn uitgewerkt zoals ook geleerd moest worden voor de toets. De hoofdstukken zijn praktisch uitgewerkt in deze samenvatting met daarin: - stappenplannen uitgeschreven hoe een berekening plaatsvindt - belangrijke verbanden en inzichten in een geel LET OP-kade...

[Show more]

Preview 4 out of 34  pages

  • June 30, 2020
  • 34
  • 2019/2020
  • Summary

2  reviews

review-writer-avatar

By: Pleun2021 • 3 year ago

review-writer-avatar

By: daniel_van_dijck • 4 year ago

avatar-seller
Blok 2.2C Statistics II
EXPLAINING AND PREDICTING




Hoofdstuk 2, 8, 9, 10, 11, 12, 13 en 14 uit Moore, McCabe &
Craig. Deze moesten bestudeerd worden voor dit blok (de
andere hoofdstukken zijn al bij de toelating aan bod gekomen).

,Relaties tussen variabelen
(H2)
2.1 Relaties tussen variabelen
Twee variabelen die bij dezelfde individuen zijn gemeten zijn aan elkaar gerelateerd
als de waarde van de ene variabele je informatie geeft over de waarde van de
andere die je anders niet zou hebben.
Het is belangrijk om voor jezelf na te gaan of je de relatie tussen de twee variabelen
gewoon wil verkennen, of dat je wil aantonen dat de ene variabele variantie in de
ander kan verklaren en mogelijk voorspellen.
Er zijn namelijk twee maten die gebruikt kunnen worden bij het onderzoeken van
relaties tussen twee continue (kwantitatieve) variabelen:
- Correlatie  Is er een relatie tussen var. 1 en var. 2 en hoe sterk is deze?
- Regressie  Is er een relatie tussen var. 1 en var. 2 en wat kunnen we op basis
van deze relatie voorspellen?
In termen van correlatie en regressie wordt er gesproken van een verklarende
variabele (onafhankelijk) en een uitkomstvariabele (afhankelijk).



2.2 Scatterplots
De beste manier om relaties tussen twee kwantitatieve variabelen weer te geven is
met een scatterplot. Hierbij worden twee verschillende variabelen gemeten bij
dezelfde personen. De ene verklarende variabele wordt op de x-as gezet, de
uitkomstvariabele op de y-as. Ieder individu hoort bij een punt (gebaseerd op een
combinatie van x en y) in de scatterplot.

Hoe bekijk je een scatterplot?
Stap 1: Je bekijkt het algehele patroon en bepaalt of er opvallende zaken te zien zijn.
Stap 2: Beoordeel de scatterplot op de relatie:
- richting  positieve of negatieve correlatie?
- vorm  lineair of niet?
- sterkte  hoe dicht liggen de punten bij elkaar?
Stap 3: Je bekijkt of er outliers zijn. Hierbij kijk je niet naar losse waarden binnen één
variabele, maar naar een vreemde combinatie van waarden. Vaak is dit een
individuele punt in de scatterplot die ver van de puntenwolk vandaan ligt.



2.3 Correlatie
Om de scatterplot te interpreteren gebruiken we een numerieke maat, de
correlatiecoëfficiënt R (Pearsons rho). Deze maat meet de sterkte van de lineaire

,relatie en wordt uitgedrukt in de volgende formule:
1 xi−𝑥̅ yi−𝑦̅
r= ∑( )( )
n−1 sx sy
Een aantal eigenschappen van de Pearsons correlatiecoëfficiënt R zijn:
- r is altijd een getal tussen -1 (heel negatief) en +1 (heel positief).
- r > 0 = positieve relatie, r < 0 = negatieve relatie.
- r = ongeveer 0  een zwak/geen verband.
- r is het sterkst wanneer hij zo dicht mogelijk bij de uiterste waarden -1 of +1 ligt.



A: sterk, negatief, lineair
verband (r = -1).
B: zwak, positief?,
lineair verband (r = 0).
C: matig/sterk, positief,
lineair verband (r = 0.7).
D: zwak/matig, negatief,
lineair verband (r = -0.3)




LET OP!
- Correlatie r maakt geen onderscheid tussen de verklarende en de
uitkomstvariabele. Je kan aan r dus niet zien wat nou wat beïnvloedt.
- Correlatie r kan enkel berekend worden bij kwantitatieve variabelen.
- Correlatie r kan enkel berekend worden bij lineaire verbanden. Kromlijnige
verbanden kunnen niet beschreven worden a.d.h.v. r.
- Correlatie r is sterk beïnvloedbaar door outliers.



2.4 Kleinste-kwadraten regressie
Bij correlatie werden beide variabelen gelijk behandeld. Met regressie wordt er
onderscheid gemaakt in een onafhankelijke (predictor)variabele (X) en een
afhankelijke (uitkomst)variabele (Y).
Wederom wordt er bij regressie uitgegaan van een scatterplot. Echter wordt de
relatie nu niet uitgedrukt in één waarde (zoals bij de Pearsons R correlatie-
coëfficiënt), maar in een formule die een lijn weergeeft. Deze regressielijn beschrijft
hoe een uitkomstvariabele verandert als een verklarende variabele verandert. Aan de
hand hiervan kunnen we waarden van y voorspellen voor gegeven waarde van x.

, De kleinste-kwadraten regressielijn
De kleinste-kwadraten regressielijn is de lijn die de som van kwadraten van de
verticale afstandjes van de datapunten tot aan de lijn minimaliseert. Als we date
hebben op een verklarende variabele x en een uitkomstvariabele y, dan is de
vergelijking van de kleinste-kwadraten regressielijn:
ŷ = 𝑏0 + 𝑏1 𝑥

- x is de waarde van de verklarende variabele.
- y-hat is de waarde van de uitkomstvariabele voor een gegeven waarde voor .
- b1 is de helling (slope), de hoeveelheid waarmee y verandert per één stap
verandering in x.
- b0 is het intercept (constant), de waarde van y als x = 0.




Het berekenen van b1 en b0
Stap 1: Wat is het gemiddelde van x en het gemiddelde van y?
 gemiddelde x =…, gemiddelde y =…
Stap 2: Wat is de standaardafwijking van x en van y?
 standaardafwijking x =…, standaardafwijking y = …
Stap 3: Wat is de correlatiecoëfficiënt r?
 correlatiecoëfficiënt r = …
Stap 4: Bereken b1
𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑎𝑓𝑤𝑖𝑗𝑘𝑖𝑛𝑔 𝑦
 b1 = r × 𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑎𝑓𝑤𝑖𝑗𝑘𝑖𝑛𝑔 𝑥
Stap 5: Bereken b0
 b0 = gemiddelde y – (b1 × gemiddelde x)
Stap 6: Formule invullen
 uitkomstvariabele y = b0 + (b1 × verklarende variabele x)

Eigenschappen van de kleinste-kwadraten regressie
- Een verandering van één standaarddeviatie in x, komt overeen met een
verandering van r standaard deviaties in y.
- De kleinste-kwadraten regressielijn gaat altijd door het gemiddelde van x en het
gemiddelde van y.
- Het onderscheid tussen verklarende variabelen en de uitkomstvariabele is
essentieel.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller orthopedagooginopleiding. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $11.94. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

77254 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$11.94  9x  sold
  • (2)
  Add to cart