Samenvatting

Summary Quantitative Innovation Analytics - R Formulas & knowledge clips

4 keer bekeken 0 keer verkocht

Vak
GEO4-2270

Instelling
Universiteit Utrecht (UU)

In this document, all different formulas used for the program R during this course are provided. Furthermore, I added the important parts of the knowledge clips with supporting images to make it easier to understand.

[Meer zien]

Voorbeeld 4 van de 73 pagina's

Bekijk voorbeeld

Geupload op 21 december 2024
Aantal pagina's 73
Geschreven in 2023/2024
Type Samenvatting

formulas
program r
residual distance
knowledge clips
ordinary least square models

Volgen

Kim2001 Lid sinds 3 jaar 4 documenten verkocht

€7,16

In winkelwagen

Op verlanglijstje

100% tevredenheidsgarantie
Direct beschikbaar na betaling
Zowel online als in PDF
Je zit nergens aan vast

General
● install packages
install.packages(“ …”)
library(...)

● Checking class of variable
class()

● Changing class of variables
character_var <- as.character(numeric_var)
→ a character type variable is one that stores textual data, such as letters, words, or
any other character strings
numeric_var <- as.numeric(character_var)
Numeric variables are used to represent quantitative, continuous, or discrete
numeric values, such as integers or real numbers.
date_var <- as.Date("2022-01-01")
→ pick a date
factor_variable <- as.factor(char_vector)
→ represent categorical data in R

● checking NAs
is.na(df)
any(is.na(x)))

● removing NAs
unique()
na.omit()
cleaned_vec <- vec[complete.cases(vec)]

● providing output
summary()

● merging datasets
package = dplyr
inner_join()
result <- inner_join(df1, df2, by = "ID")
left_join() or right_join()
merge()

● interpretation R-squared (R2)

,If R-squared is close to 1, it suggests that the model is a good fit, and a large
proportion of the variability in the dependent variable is explained by the independent
variables.
If R-squared is close to 0, it indicates that the model does not provide a good fit to
the data, and the independent variables do not explain much of the variability in the
dependent variable.

● interpretation intercepts/coefficients
The sign of the coefficient (positive or negative) indicates the direction of the effect.
If the coefficient is positive (e.g., +29.4), it suggests that an increase in the
independent variable is associated with an increase in the dependent variable. If it is
negative, the interpretation is the opposite.

● select and filter data
package = dplyr
selected_data <- select(data, ID, Name)
filtered_data <- filter(data, Age > 25, Score >= 90)
== → selecting on date for example

!= → not want to include this particular thing

● Family

,Model 1: Ordinary Least Squares Models
● Load dataset
airports <- read.delim(file.choose(), sep=",", header=F)
routes <- read.delim(file.choose(), sep=",", header=F)
airunuts <- read.delim(file.choose(), sep=",", header=T)

● Changing names of columns
names(airports) <- c("id", "name", "city", "country", "iata", "guko", "lat", "lon",
"altitude", "timezone", "dst", "timezonename", "type", "source")
names(airports)
names(routes) <- c("Airline", "AirlineID", "SourceAirport", "SourceairportID",
"Destairport", "DestairportID", "Codeshare", "Stops", "Equipment")
names(routes) <-tolower(names(routes))

● Package edges&nodes
library(igraph)

● Making graph from edgelist
edgelist <- routes[c("sourceairport", "destairport")]
package = igraph
route1 <- graph_from_data_frame(edgelist,directed = T,vertices = NULL)

● Calculating mean & median
mean(degree(route1,mode = "in"))
median(degree(route1,mode = "in"))

● Calculating standard deviation of indegree
sd(degree(route1,mode = "in"))

● Calculating indegree and sorting it
sort(degree(route1, mode = "in"), decreasing= T)[1:12]

● Making histogram
hist(degree(route1), col="navyblue", breaks = 50 )

● Create edgelist with large airports only >411 degrees (top 12)
sa <- data.frame(table(edgelist$sourceairport))

, ds <- data.frame(table(edgelist$destairport))
edgelist2 <- merge(edgelist, sa, by.x = "sourceairport", by.y = "Var1", all = T )
edgelist2 <- merge(edgelist2, ds, by.x = "destairport", by.y = "Var1", all = T )
edgelist3 <- edgelist2[edgelist2$Freq.x >411 & edgelist2$Freq.y >411,]
route2 <- graph_from_data_frame(edgelist3[1:2])
plot(route2)

● Differences transitivity, betweenness & closeness
Transitivity: If two neighboring airports are unconnected, people have a larger
likelihood to pass your airport. They might also take an alternative equally long
route however.
Betweenness: Expresses how many people are forced to go through your airport
if they want to take the shortest route.
Closeness: Says something about how many steps you are from other airports.
This makes you are more attractive airport.

● Making histograms of centrality measures
hist(transitivity(route1, type ="local", isolates = "zero"), col="coral", breaks = 50)
hist(betweenness(route1, directed = T), col = "darkorchid2", breaks = 50)
hist(closeness(route1, normalized=F,mode = "in" ), col = "deepskyblue", breaks =
50)
round(sort(betweenness(route1, directed = T), decreasing =T)[1:12],0)
round(sort((closeness(route1, mode="in" )), decreasing =T)[1:12],2)

● run a linear model
model0 <- lm(y ~x, data= namedataset, na.action = na.exclude)

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Kim2001. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €7,16. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 50155 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen

Populaire Universiteiten

Populaire Hogescholen

Populaire Scholen

Populaire samengevatte studieboeken voor Communicatie en Taal

Populaire samengevatte studieboeken voor Economie en Bedrijf

Populaire samengevatte studieboeken voor Exact en Informatica

Populaire samengevatte studieboeken voor Gedrag en Maatschappij

Populaire samengevatte studieboeken voor Gezondheid en Geneeskunde

Populaire samengevatte studieboeken voor Onderwijs en Opvoeding

Populaire samengevatte studieboeken voor Recht en Bestuur

De beste samenvattingen om je Wft-diploma te behalen

De beste samenvattingen om je theorie examens te behalen

De beste samenvattingen voor je cursus in de Veiligheidsbranche

De beste samenvattingen voor Gezondheid & Hygiëne cursussen

De beste samenvattingen voor zakelijke cursussen

De beste samenvattingen voor je PABO WisCAT cursus

Populaire vakken

Populaire vakken

Populaire vakken

Boekverslagen en samenvattingen

Verkoper

Samenvatting

Summary Quantitative Innovation Analytics - R Formulas & knowledge clips

Document informatie

Onderwerpen

Geschreven voor

Verkoper

Ontvangen beoordelingen

Voorbeeld van de inhoud

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Snel en makkelijk kopen

Focus op de essentie

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?