100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Data Preprocessing and Regressions(Machine Learning) test questions and answers 2024 €13,34   In winkelwagen

Tentamen (uitwerkingen)

Data Preprocessing and Regressions(Machine Learning) test questions and answers 2024

 1 keer bekeken  0 keer verkocht
  • Vak
  • Data Mining
  • Instelling
  • Data Mining

Data Preprocessing and Regressions(Machine Learning) test questions and answers 2024

Voorbeeld 2 van de 14  pagina's

  • 15 november 2024
  • 14
  • 2024/2025
  • Tentamen (uitwerkingen)
  • Vragen en antwoorden
  • Data Mining
  • Data Mining
avatar-seller
Data Preprocessing and
Regressions(Machine Learning)
test questions and answers
2024
Numpy package
Allows us to work with arrays
matplotlib package
Allows to make charts and graphs
pandas package
imports and manipulates data
How do you import a csv dataset file
pd.read_csv(~~~~~~~~~~~.csv)
How do you split a dataset up into different variables, with specific rows
and columns
x=dataset.iloc[rows,columns].values
y=dataset.iloc[rows,columns].values
What does iloc do?
locates the columns/rows by its index
What does SimpleInputer from sklearn do?
Find missing values of a variable, and assign it to the mean of the other
values of that variable
What is the code to replace missing values of a dataset from columns 1
and 2 using imputer?
from sklearn.impute import SimpleInputer
imputer=SimpleInputer(missing_values=np.nan,strategy='mean')
imputer.fit(x.iloc[:,1:3]
x.iloc[:,1:3]=imputer.transform(x.iloc[:,1:3])
Why should you never assign 1,2,3,.... to a categorical variable whose
values range is not a boolean?

, The machine might think that there is a pattern. The alternative way is to
use onehotencoding
When encoding categorical data, when should you use np.array and
ColumnTransformer package from sklearn?
When your variable has more than one category ***You never use this for
LabelEncoder
What are all of the sklearn packages to use when doing categorical data
encoding?
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import LabelEncoder
How would you use ColumnTransformer to encode the 1st index of variable
x using OneHotEncoder?
ct=ColumnTransformer(transformers=[('encoding', OneHotEncoding,[0])],
remainder='passthrough')

x=np.array(ct.fit_transform(x))
How would you use ColumnTransformer to encode the 1st index of variable
y using LabelEncoder?
ct=ColumnTransformer(transformers=[('encoding', LabelEncoder(), [0])],
remainder='passthrough')

y=np.array(ct.fit_transform(y))
Why is the idea of training and testing data and why do we do it?
It is a method to measure the accuracy of your model. The dataset is split
randomely from a 80:20 ratio. The trained data is the 80 and that is what
the machine learns. The test is what the machine tests based on what is
learned with the trained data. If the test and trained are similar, that
means the fit of the model is good, otherwise it is not
How do you use sklearn to declare trained and test for 2 variables using
train_test_split?
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test= train_test_split(x,y,test_size=0.2,
random_state=#)
Should you do feature scaling before or after train/test?
After doing train/test

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper BRAINBOOSTERS. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €13,34. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 67474 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€13,34
  • (0)
  Kopen