100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Summary Data Mining classification (1+2) + solutions exercises €2,99
In winkelwagen

Samenvatting

Summary Data Mining classification (1+2) + solutions exercises

 7 keer bekeken  0 keer verkocht

Dit document bevat een samenvatting van de theorie die doorlopen werd tijdens deze labsessie. Daarnaast staan er op het einde van het document oplossingen van de labsessies.

Voorbeeld 2 van de 10  pagina's

  • 4 augustus 2023
  • 10
  • 2022/2023
  • Samenvatting
  • data mining
Alle documenten voor dit vak (7)
avatar-seller
Worstje2021
Classification 1
lag1, lag2,…,lag5: percentage return for each of the five previous trading days

volume: number of shares traded on previous day

today: percentage return on data in question

direction: whether the market was Up or Down on this data

cor(): produces matrix containing all of correlations among the predictors




Here error because “direction” variable is qualitative

Correlations between the lags and today’s returns close to zero => little correlation

Year and volume: substantial correlation

glm(): fits linear models that includes logistic regression (similar to lm() except: family = binomial)

Lag1

 smallest p-value
 negative coefficient: if
market had positive return
yesterday, then less likely to
go up today
 0.15: no clear evidence of
association between Lag1
and direction

, coef(): access coefficients

summary(): access specific aspects of fitted model




predict(): can be used for the probability that the market will go up, given values of predictors

type = “response”: tells R to output probabilities of the form P(Y=1|X)

contrasts(): indicates that R has created a dummy variable




Vector of class predictions based on whether predicted probability of a market increase is greater
than or less than 0.5:




First command: creates vector of 1,250 Down elements

Second command: transforms to Up all of elements for which predicted probability of

market increase exceeds 0.5

table(): produces a confusion matrix



Diagonal elements: correct predictions

Off-diagonal elements: incorrect

Training error rate: 100 – 52.2 = 47.8%

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Worstje2021. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 53340 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€2,99
  • (0)
In winkelwagen
Toegevoegd