100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Statistiek voor de humane wetenschappen, een Nederlandse samenvatting €5,49   In winkelwagen

Samenvatting

Statistiek voor de humane wetenschappen, een Nederlandse samenvatting

1 beoordeling
 251 keer bekeken  7 keer verkocht

Examen gehaald met 18/20. Een volledige samenvatting van de cursus statistiek voor de humane wetenschappen in het Nederlands. de samenvatting is gebaseerd op de lessen en het cursusmateriaal van professor Dirk Speelman. In de samenvatting zitten extra verduidelijkingen, notities die stap voor sta...

[Meer zien]

Voorbeeld 4 van de 169  pagina's

  • 31 mei 2021
  • 169
  • 2020/2021
  • Samenvatting
  • statistiek
Alle documenten voor dit vak (2)

1  beoordeling

review-writer-avatar

Door: katoschonk • 1 jaar geleden

avatar-seller
laurebudts
Statistiek voor de humane wetenschappen
Hoofdstuk 1: Basis van datasets


1. Verschillende soorten variabelen


ONDERSCHEID 1: STATISTISCHE vs. NON-STATISTISCHE VARIABELEN
Statische variabelen representeren eigenschappen die worden gemeten met het doel om er verdere statistieken
mee te berekenen. De software RStudio zal alle variabelen in een dataset bekijken als een bewerkbare variabele,
maar kolommen zoals ID representeren geen echte variabele. Kolommen zoals ID, die bestaan uit unieke non-
numerische waarden, zijn onbruikbaar voor statistieken. Ook als ID zou bestaan uit numerische waarden, is er geen
nut in het berekenen van gemiddelden, frequentie, …


ONDERSCHEID 2: CATEGORISCHE vs. NUMERISCHE VARIABELEN
Categorische variabelen zijn variabelen die een label zijn, geen cijfers. Binnen de categorische variabelen maken
we nog een onderscheid tussen nominale en ordinale variabelen.


Ordinale variabelen: Hebben een intrinsieke volgorde, er is een duidelijk hiërarchie/volgorde
Bv. Laag inkomen – gemiddeld inkomen – hoog inkomen
Nominale variabelen: Hebben geen intrinsieke volgorde, er is geen eenduidig antwoord welke waarde hoger is
Bv. Noord – West – Zuid – Oost




Numerische variabelen hebben wel cijfers als waarden en zijn erg relevant voor allerlei statische bewerkingen.
Numerische variabelen kunnen we op 2 verschillende manieren verder onderscheiden.
De eerste manier is die van interval variabelen en ratio variabelen:


Interval variabele: Hebben een arbitrair nulpunt en de verhouding tussen 2 intervallen heeft geen duidelijke
betekenis
Bv. Temperaturen
Ratio variabele: Hebben een natuurlijk nulpunt en de verhoudingen zijn duidelijk
Bv. Jaarlijkse hoeveelheid regen in inches


De tweede manier is die van discrete variabelen en continue variabelen:


Discrete variabele: De volgende waarde is logisch en gekend
Bv. Aantal kinderen
Continue variabele: Tussen 2 waarden kan er altijd nog een derde waarde zitten, de volgorde is daardoor niet
gekend.
Bv. Graden Celsius

,Hoofdstuk 2: Basisinstructies in RStudio


1. De start van een sessie in RStudio


Setting working directory
= de folder waarin gewerkt wordt aanduiden als ‘working directory’
! geldig gedurende de sessie, telkens opnieuw herhalen bij openen van nieuwe RSessie, Rscript, folder, …
? Bij niet gespecifieerde locatie gaat de informatie naar de working directory


In RStudio

Files – document – stathum – folder – more – set as working directory



Laden en installeren van pakketten
= We hebben extra pakketten nodig voor sommige bewerkingen
! Je moet deze pakketten slechts 1x installeren, daarna gewoon altijd laden
! Best practice om alle nodige pakketten bovenaan je Rscript te zetten


In Rstudio

Installeren: install.packages(“naam”)
Laden: library(naam)



Het pakket ‘Tidyverse’ installeert heel wat functies onder een makkleijkere naam dan de BaseR namen. In 2
gevallen hebben functies dezelfde namen, RStudio gebruikt vanaf het laden van Tidyverse alle fucntienamen van
dat pakket.




Comments
= Voor jezelf en anderen omschrijven wat de eerstvolgende instructie zal doen met de dataset
? dmv een # te plaatsen voor de instructie weet RStudio dat dit een comment is en geen instructie

, 2. Bestanden importeren in RStudio
Bestanden inspecteren
= Voordat we een dataset opnemen in RStudio is het belangrijk om eerst de data te inspecteren om te zien of
er bepaalde eigenschappen zijn waarmee we rekening zullen moeten houden
? Afhankelijk van het bestandstype zijn er 2 manieren om data te inspecteren


Bij een .txt-bestand à klikken op de bastandsnaam in het veld rechts onderaan. Je krijgt de inhoud
linksboven te zien in een nieuw tabblad.
Bij een .csv-bestand à klikken op de bestandsnaam – in het pop-up-menu klik je op ‘view file’


CASUS:
We hebben een dataset ‘Students’ met daarin heel wat gegevens over de schoolprestaties van 10 studenten.
Voordat we deze dataset gaan beginnen bewerken in RStudio, is het belangrijk om deze eerst te inspecteren.
Stel:
- De data in de set werden genoteerd onder het format DD/MM/YYYY
- Het decimaalteken dat gebruikt werd is een komma “,”
- Bij missende data werd NA aangegeven


Het aangeven van missende data dmv NA is een goed ding, dat begrijpt het programma. De default voor data en
decimaaltekens in RStudio is echter anders. RStudio verwacht een punt “.” als decimaalteken en verwacht dat data
genoteerd worden als YYYY/MM/DD. We kunnen dit oplossen door gebruik te maken van de functie locale


Read_tsv en Locale
Read_tsv
= functie voor het importeren van bestanden in RStudio
A1 “naam_bestand”
? door het toevoegen van extra argumenten kan je non-default settings aanpassen


Locale
= toe te voegen argument bij read_tsv om te verduidelijken dat we locale settings willen aanpassen


In RStudio

# read the students dataset
d <- read_tsv (“students.csv”,
locale = locale (decimal_mark = “,” , date_format = “%d/%m/%Y”))



Verduidelijking
d <- is een toewijzing, staat voor ‘krijgt de waarde’. Het resultaat van de instructie wordt opgeslagen in ‘d’.
we noemen het resultaat van read_tsv een dataframe


%d en %m staan voor DD en MM, %Y staat voor YYYY

, Een functie verkennen
= de documentatie van een functie bekijken. Deze documentatie verschijnt in het HELP-panel


In RStudio

# request documentation for the function read_tsv()
?read_tsv



Als resultaat krijg je de functie met alle mogelijke argumenten. Het enige verplichte argument is de bestandsnaam
van het bestand dat je wil importeren. De overige argumenten zijn allemaal optioneel die indien niet vernoemd
gewoon hun default-instelling volgen


Andere opties:
Read_tsv voor bestanden met tab als kolomscheidingsteken
Read_csv voor bestanden met komma als kolomscheidingsteken
Read_csv2 voor bestanden met puntkomma als kolomscheidingsteken
Read_delim voor bestanden waarbij je zelf aangeeft wat het kolomscheidingsteken is


Ingelezen data bekijken en exploreren
= dmv de functie View(d) kunnen we een visuele representatie krijgen van object ‘d’.
! RStudio is hoofdlettergevoelig – deze functie moet met een hoofdletter genoteerd worden


In RStudio

# inspect the dataset
View (d)



= dmv de functie skim(d) kunnen we de verschillende eigenschappen van het object snel bekijken
! zie geen hoofdletter


In RStudio

# inspect proeperties of the dataset
skim(d)

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper laurebudts. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 83637 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,49  7x  verkocht
  • (1)
  Kopen