100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting ALLE tentamenstof Statistiek 2 (SOBA108A) €9,32   In winkelwagen

Samenvatting

Samenvatting ALLE tentamenstof Statistiek 2 (SOBA108A)

 71 keer bekeken  8 keer verkocht
  • Vak
  • Instelling
  • Boek

Samenvatting van ALLE tentamenstof voor het tentamen van Statistiek 2. In dit document zijn alle belangrijke concepten, zowel van het boek als de colleges, uitgewerkt en uitgelegd. Dit document geeft de kern van het vak Statistiek 2 weer. Ik heb zelf een 9.5 gehaald op het tentamen van Statist...

[Meer zien]

Voorbeeld 2 van de 10  pagina's

  • Ja
  • 12 november 2022
  • 10
  • 2020/2021
  • Samenvatting
avatar-seller
Statistiek 2

H0: gemiddelden zijn gelijk (de curves van de normale verdeling
vallen op elkaar).
Ha: gemiddelden zijn ongelijk (de curves zijn ten opzichte van
elkaar verschoven (en de mate van overlap bepaalt de hoogte van
de p-waarde)).
Significante p-waarde: je kan de resultaten van de steekproef generaliseren naar de populatie.

Steekproefverdeling: univariate verdeling voor een variabele.
Steekproevenverdeling: verdeling van de statistics die uitgerekend zijn bij de steekproef. SD =
standaardfout.

Marginale verdeling = univariate verdeling → veel onzekerheid bij voorspelling y.
→ Geschatte SD: √Σ(y-ȳ)²/ n-1 (Sy)
Conditionele verdeling: verdeling van y gegeven de waarde van x → minder onzekerheid.
Beschrijft de variabiliteit in de y waarden voor een gegeven/vaste x.


Skewness (scheefheid) Kurtosis (gepiektheid)
- Symmetrische verdeling: = 0 - Normale verdeling: = 0
- Rechtsscheve verdeling: > 0 - Gepiekte verdeling: > 0
- Linksscheve verdeling: < 0 - Platte verdeling: < 0


Causaal verband tussen 2 variabelen
- Er moet een verband zijn die asymmetrisch is (dus van x naar y).
- Er moet een volgorde in de tijd zijn. De oorzaak x moet eerder gebeuren dan het
gevolg y.
- Er mogen geen alternatieve verklaringen z bestaan.
➔ In observationeel onderzoek komt de alternatieve verklaring vaak door de 3e
variabele. Causaliteit in observationeel onderzoek is niet te bewijzen omdat de
3e variabele nooit helemaal uitgesloten kan worden. Controleren voor een
variabele gebeurt door het maken van groepen en het bij benadering constant
houden van de variabele binnen de groepen.
→ In experimenteel onderzoek kan causaliteit wel bewezen worden.
Invloed van de 3e variabele z op de relatie tussen x en y verwijderen (controleren voor de 3e
variabele) door ze voor iedereen constant te houden.

- Deterministisch model: y = α + βx --> voor elke waarde van x is er 1 enkele waarde
voor y.
- Probabilistisch model: E(y)= α + βx → De gemiddelde waarde van y bij een bepaalde
waarde van x. De lijn ŷ = a +bx schat dus het gemiddelde voor y voor alle observaties in
de populatie die dezelfde x waarde kennen.
➔ Aanname dat conditionele verdeling van y normaal verdeeld is.


1

, ➔ Conditioneel gemiddelde/ verwachte waarde: E(y)= α + βx
➔ Conditionele SD: spreiding van de y-waarden rond hun conditionele gemiddelde
(de regressielijn). Aanname dat de SD constant is voor elke waarde van x. →
geschatte SD: √Σ(y-ŷ)²/ n-2 (in SPSS: std. Error of the estimate). De vergelijking
E(y)= α + βx kent 2 onbekende parameters dus vandaar is df= n-2.
➔ SSE: Σ(y-ŷ)² = Σe²
➔ Variantie: S² = SSE/ n-2 =MSE (mean squared error)
- Statistisch model voor lineaire regressie: y = α + βx + ε.
➔ ε = error term → geeft de fout weer die ontstaat voor het gebruiken van ȳ in
plaats van een bepaalde waarde voor y die geldt voor een bepaalde waarde van
x.
➔ Elke observatie heeft zijn eigen ε waarde.
➔ Het gemiddelde van de ε waarden is 0 (= op regressielijn).
➔ Als ε positief is dan is y = α + βx + ε groter dan y = α + βx en valt de observatie
boven ȳ (boven regressielijn)
➔ Als ε negatief is dan valt de observatie onder ȳ (onder regressielijn).

Betere voorspellingen van y als we x gebruiken? Ja → x en y sterke samenhang
1. Voorspel y zonder gebruik te maken van x. Gebruik het steekproefgemiddelde ӯ.
→ met totaal fouten e1 = Σ(y-ȳ)² = TSS
2. Voorspel y door gebruik te maken van x. als de relatie lineair is dan is de
voorspellingslijn ŷ=a +bx, dit is dan de beste voorspeller voor y.
→ met totaal fouten e2 = Σ(y-ŷ)² = SSE
3. Proportionele afname van fouten berekenen: r²= e1-e2 /e1 = TSS-SSE/TSS
➔ de proportionele reductie in fouten van het gebruikmaken van de voorspellingslijn
ten opzichte van slechts ӯ.

Regressie: modelleren van het verband
→ Enkelvoudige regressie geeft het verband tussen x
en het gemiddelde van y.
- Regressiemodel: rechte lijn door een
puntenwolk/spreidingsdiagram trekken en de
waarden van y voorspellen uit de gegeven
waarden van x.
➔ Model: ŷ = α + βx (ŷ=
geschatte/voorspelde waarde)
➔ Constante (α): waarde van y als x gelijk is aan nul
➔ Helling (β): stijging in y als x met 1 stijgt
- Model kan geschat worden least square principe (fouten minimaliseren). Geschatte
model: ŷ = a + bx
1. Spreidingsdiagram: voor elke set van waarden (x en y) een punt.
➔ a: ȳ - bx̄
➔ b: Σ(x-x̄)(y-ȳ) / Σ(x-x̄)² = covariantie/ variantie




2

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper RUGsocio. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €9,32. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 81849 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€9,32  8x  verkocht
  • (0)
  Kopen