Interaction (definition) - answer-Effect of one variable on target variable depends on the value/level of another variable.
GLM Description (idea) - answer-GLMs relate a function of target mean linearly to a set of predictors. Target itself is not transformed.
Recursive binary splitting (idea...
Predictive Analytics Exam
Interaction (definition) - answer-Effect of one variable on target variable depends on the
value/level of another variable.
GLM Description (idea) - answer-GLMs relate a function of target mean linearly to a set
of predictors. Target itself is not transformed.
Recursive binary splitting (idea) - answer-divide feature space recursively into a set of
non-overlapping regions of relatively homogeneous observations until a stopping
criterion is reached.
Random Forests (idea) - answer-Reduce overfitting and variance of base trees by
combining the results of multiple trees fitted to different bootstrapped samples of
training data in parallel.
Reduce correlation between different trees by taking a random sample of predictors as
candidates for each split.
Boosting (idea) - answer-In each iteration, fit a tree to the residuals of the preceding tree
and a scale-down version of current tree's predictions is added to the previous
predictions.
Each tree focuses on observations that the previous tree predicted poorly.
Backward step-wise selection - answer-start with the full model with all features and
sequentially remove features until no improvement in selected measure.
Forward Stepwise Selection - answer-start with the null model with no features and
sequentially add features until no improvement in selected measure.
BIC vs. AIC - answer-BIC is more conservative and results in simpler models.
Binarization - answer-Replacing a value with 0 or 1 based on threshold.
pros: drop individual factor levels statistically insignificant with respect to the base level.
cons: more steps in the stepAIC procedure and model may become harder to interpret.
Regularization (idea) - answer-reduce overfitting by shrinking the size of the coefficient
estimates, especially those of non-predictive features.
Reduction occurs by optimizing the log-likelihood function adjusted by a penalty term
that reflects the size of the coefficients.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper TOPDOCTOR. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €9,82. Je zit daarna nergens aan vast.