100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Colleges statistiek B (Cijfer 9,3) €12,99
In winkelwagen

College aantekeningen

Colleges statistiek B (Cijfer 9,3)

 3 keer bekeken  0 keer verkocht

Colleges statistiek B

Voorbeeld 4 van de 44  pagina's

  • 29 januari 2022
  • 44
  • 2021/2022
  • College aantekeningen
  • -
  • Alle colleges
Alle documenten voor dit vak (10)
avatar-seller
lunavandenbergh
STATISTIEK B BLOK 4
COLLEGE 1.1 | 08.01.2021. CORRELATIE EN LINEAIRE REGRESSIE HOOFDSTUK 10, 11 EN 12

Organisatie

- Vier hoorcolleges, vijf werkgroepen, waarvan twee SPSS-practica
- Bereid de werkgroepen goed voor (maak de opgaven)
- Werkgroepdocenten: Wouter van der Schors en Michel Oskam

Leerdoelen: een correlatiecoëfficiënt interpreteren

Wat en waarom?
Samenhang*

- Spreidingsdiagram (of: scatterplot)
o Grafische weergave samenhang
- Correlatiecoëfficiënt en -analyse
o Maat voor sterkte van de samenhang
- Regressie analyse
Lijn door puntenwolk tekenen, die zo goed mogelijk past
o Methode om de samenhang tussen twee (of meer) variabelen te beschrijven / bepalen met
behulp van een functionele relatie
o Schat/tekent lijn die de gegevens in het spreidingsdiagram zo goed mogelijk beschrijft

* Ook: Chi-kwadraat toets. (is behandeld in Statistiek A)

Veel meer kijken naar 2 variabelen die samenhang hebben, veel vollediger de vraag beantwoorden
A alleen kijken of er statistisch verschil is. B wat zijn de factoren die invloed hebben
Naar verklaringen zoeken voor een bepaald gegeven. Kijken samenhang tussen variabelen

Wat en waarom?
Wat is het verband tussen de temperatuur en het aantal uren per dag dat iemand het strand
bezoekt?
Aantal uren is continu. Bij x kwadraat was alleen categorisch. Kunnen meerdere variabelen meten

Wat is het verband tussen aantal facebook vrienden, reistijd naar de universiteit, sporten, het hebben van een
smartphone?


Spreidingsdiagram: scatterplot
Wat is het verband tussen ‘Aantal Facebook-vrienden’ en ‘Reistijd’?

Allemaal individuele waarden.
Regres analyse gaat proberen zo’n goed mogelijke lijn te tekenen

,Correlatiecoëfficiënt – algemeen
Maat voor lineaire samenhang tussen 2 variabelen (zie K&S pg 93)


r=
 ( x − x )( y − y )
i i
=
cov( x, y )

 (x − x)  ( y − y)
2 2 sx s y
i i

Als vermenigvuldigen van de twee termen pos is dan is pos correlatie, meer reizen is meer vrienden
Meer reizen, minder facebook vrienden als neg is.
Onafhankelijk van schaal waarop variabelen gemeten worden
Coëfficiënt altijd tussen -1 en 1

Kenmerken:

- Onderzoekt geen oorzakelijk (= causaal) verband
- Variabelen tenminste op intervalniveau gemeten
- Dimensieloze index
- Tussen -1 en +1
- Ordinaal

Correlatiecoëfficiënt – interpretative
r = 1 of -1 → resp. perfect positieve of negatieve lineaire samenhang
r = 0 → geen lineaire samenhang
0 < r < 1 of -1 < r < 0 → resp. positief / negatief lineaire samenhang




Aantal standaardafwijkingen verandering in y voor een standaardafwijking verandering in x
Hoe dichter bij 1 pos verband en -1 neg verband. Vinden waar sterkste verband en grootste correlatie
Standaardafwijking veranderen hetzelfde
Coëfficiënten vergelijken tussen verschillende situaties en kijken waar grootste is

College 1.2 | 08.01.2020
Leerdoel: een lineaire regressievergelijking opstellen en interpreteren

Regressie analyse – algemeen

- Methode om de samenhang tussen 2 (of meer) variabelen te beschrijven met behulp van een
functionele relatie (= de regressievergelijking)
- Techniek levert de ‘best passende’ lijn die de puntenwolk (zie spreidingsdiagram) zo goed mogelijk
beschrijft om (o.a.):
o Voorspellingen te doen
o Theorie te vormen / te toetsen, Stel voorop dat je verwacht… toetsen op data

, Regressie analyse – spreidingsdiagram

Wat is het verband tussen ‘Aantal Facebook-vrienden’ en
‘Reistijd’?

Welke lijn past het beste?

Lastig om op het oog te zien




Regressie analyse – onderdelen

- Enkelvoudige lineaire regressie continu afhankelijke variabele
- Meervoudige lineaire regressie, binaire dummy
- Logistische regressie (college 2), geordende categorische variabele
- Ordinale regressie (wordt niet behandeld)
- Multinomiale regressie (wordt niet behandeld)
- Keuze (regressie-model) hangt af van meetniveau afhankelijke variabele!

(enkelvoudige) Lineaire regressive
Notatie (enkelvoudig): y = β0 + β1 * x + e waarbij

- y (op y-as): afhankelijke variabele (of: outcome)
o Meetniveau: altijd interval of ratio
- x (op x-as): onafhankelijke variabele (of: exposure)
o Meetniveau: interval of ratio, indien anders: herdefinieren als 0 - 1 variabele
- β0 & β1: regressiecoefficienten (of: parameters) waarbij
o β0: snijpunt met y-as (of: intercept)
o β1: richtingscoefficient (of: slope)
- e: residu (error / voorspellingsfout).
o Verdeling is N(0,σ)

(enkelvoudige) Lineaire regressie (2)
Wat is de ‘best passende’ lijn?
Waarbij geen residu is, is niet echt mogelijk.
y’ is de voorspelde waarde

- Ideaal: y = β0 + β1 * x
- Beschikbaar: meetpunten (xi, yi) waarbij i = 1, 2, …, n
- Dus: voorspelde waarde yi’ bij gegeven xi: yi’ = β0 + β1 * xi
- En: regressievergelijking: y’ = β0 + β1 * x

, (enkelvoudige) Lineaire regressie (3)
‘Best passende’ lijn




Overal aantal afwijkingen, fout in de voorspelling, residuen zijn er nog

(enkelvoudige) Lineaire regressie (4)

- Fout in voorspelling: residuen (afstand van de meetpunten tot voorspelde regressielijn)
o Wiskundig: ei = yi – yi’= yi - (β0 + β1 * xi)
- Gezocht: de lijn waarbij het kwadraat van de afstanden van alle punten tot die lijn zo klein mogelijk is
n

e 2
i
- Wiskundig: minimalisering i =1 (kleinste kwadratencriterium)
Kwadraten: neg waardes pos, zo’n klein mogelijke som.

(enkelvoudige) Lineaire regressie (5)

- Uitgaande van het kleinste kwadratencriterium kan wiskundig de vergelijking voor de beste lijn
worden afgeleid
- We gebruiken daarvoor x en y




Variantie tov elkaar

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lunavandenbergh. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €12,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 53920 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€12,99
  • (0)
In winkelwagen
Toegevoegd