100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Statistiek voor de humane wetenschappen, een Nederlandse samenvatting $6.21   Add to cart

Summary

Statistiek voor de humane wetenschappen, een Nederlandse samenvatting

1 review
 251 views  7 purchases
  • Course
  • Institution

Examen gehaald met 18/20. Een volledige samenvatting van de cursus statistiek voor de humane wetenschappen in het Nederlands. de samenvatting is gebaseerd op de lessen en het cursusmateriaal van professor Dirk Speelman. In de samenvatting zitten extra verduidelijkingen, notities die stap voor sta...

[Show more]

Preview 4 out of 169  pages

  • May 31, 2021
  • 169
  • 2020/2021
  • Summary

1  review

review-writer-avatar

By: katoschonk • 1 year ago

avatar-seller
Statistiek voor de humane wetenschappen
Hoofdstuk 1: Basis van datasets


1. Verschillende soorten variabelen


ONDERSCHEID 1: STATISTISCHE vs. NON-STATISTISCHE VARIABELEN
Statische variabelen representeren eigenschappen die worden gemeten met het doel om er verdere statistieken
mee te berekenen. De software RStudio zal alle variabelen in een dataset bekijken als een bewerkbare variabele,
maar kolommen zoals ID representeren geen echte variabele. Kolommen zoals ID, die bestaan uit unieke non-
numerische waarden, zijn onbruikbaar voor statistieken. Ook als ID zou bestaan uit numerische waarden, is er geen
nut in het berekenen van gemiddelden, frequentie, …


ONDERSCHEID 2: CATEGORISCHE vs. NUMERISCHE VARIABELEN
Categorische variabelen zijn variabelen die een label zijn, geen cijfers. Binnen de categorische variabelen maken
we nog een onderscheid tussen nominale en ordinale variabelen.


Ordinale variabelen: Hebben een intrinsieke volgorde, er is een duidelijk hiërarchie/volgorde
Bv. Laag inkomen – gemiddeld inkomen – hoog inkomen
Nominale variabelen: Hebben geen intrinsieke volgorde, er is geen eenduidig antwoord welke waarde hoger is
Bv. Noord – West – Zuid – Oost




Numerische variabelen hebben wel cijfers als waarden en zijn erg relevant voor allerlei statische bewerkingen.
Numerische variabelen kunnen we op 2 verschillende manieren verder onderscheiden.
De eerste manier is die van interval variabelen en ratio variabelen:


Interval variabele: Hebben een arbitrair nulpunt en de verhouding tussen 2 intervallen heeft geen duidelijke
betekenis
Bv. Temperaturen
Ratio variabele: Hebben een natuurlijk nulpunt en de verhoudingen zijn duidelijk
Bv. Jaarlijkse hoeveelheid regen in inches


De tweede manier is die van discrete variabelen en continue variabelen:


Discrete variabele: De volgende waarde is logisch en gekend
Bv. Aantal kinderen
Continue variabele: Tussen 2 waarden kan er altijd nog een derde waarde zitten, de volgorde is daardoor niet
gekend.
Bv. Graden Celsius

,Hoofdstuk 2: Basisinstructies in RStudio


1. De start van een sessie in RStudio


Setting working directory
= de folder waarin gewerkt wordt aanduiden als ‘working directory’
! geldig gedurende de sessie, telkens opnieuw herhalen bij openen van nieuwe RSessie, Rscript, folder, …
? Bij niet gespecifieerde locatie gaat de informatie naar de working directory


In RStudio

Files – document – stathum – folder – more – set as working directory



Laden en installeren van pakketten
= We hebben extra pakketten nodig voor sommige bewerkingen
! Je moet deze pakketten slechts 1x installeren, daarna gewoon altijd laden
! Best practice om alle nodige pakketten bovenaan je Rscript te zetten


In Rstudio

Installeren: install.packages(“naam”)
Laden: library(naam)



Het pakket ‘Tidyverse’ installeert heel wat functies onder een makkleijkere naam dan de BaseR namen. In 2
gevallen hebben functies dezelfde namen, RStudio gebruikt vanaf het laden van Tidyverse alle fucntienamen van
dat pakket.




Comments
= Voor jezelf en anderen omschrijven wat de eerstvolgende instructie zal doen met de dataset
? dmv een # te plaatsen voor de instructie weet RStudio dat dit een comment is en geen instructie

, 2. Bestanden importeren in RStudio
Bestanden inspecteren
= Voordat we een dataset opnemen in RStudio is het belangrijk om eerst de data te inspecteren om te zien of
er bepaalde eigenschappen zijn waarmee we rekening zullen moeten houden
? Afhankelijk van het bestandstype zijn er 2 manieren om data te inspecteren


Bij een .txt-bestand à klikken op de bastandsnaam in het veld rechts onderaan. Je krijgt de inhoud
linksboven te zien in een nieuw tabblad.
Bij een .csv-bestand à klikken op de bestandsnaam – in het pop-up-menu klik je op ‘view file’


CASUS:
We hebben een dataset ‘Students’ met daarin heel wat gegevens over de schoolprestaties van 10 studenten.
Voordat we deze dataset gaan beginnen bewerken in RStudio, is het belangrijk om deze eerst te inspecteren.
Stel:
- De data in de set werden genoteerd onder het format DD/MM/YYYY
- Het decimaalteken dat gebruikt werd is een komma “,”
- Bij missende data werd NA aangegeven


Het aangeven van missende data dmv NA is een goed ding, dat begrijpt het programma. De default voor data en
decimaaltekens in RStudio is echter anders. RStudio verwacht een punt “.” als decimaalteken en verwacht dat data
genoteerd worden als YYYY/MM/DD. We kunnen dit oplossen door gebruik te maken van de functie locale


Read_tsv en Locale
Read_tsv
= functie voor het importeren van bestanden in RStudio
A1 “naam_bestand”
? door het toevoegen van extra argumenten kan je non-default settings aanpassen


Locale
= toe te voegen argument bij read_tsv om te verduidelijken dat we locale settings willen aanpassen


In RStudio

# read the students dataset
d <- read_tsv (“students.csv”,
locale = locale (decimal_mark = “,” , date_format = “%d/%m/%Y”))



Verduidelijking
d <- is een toewijzing, staat voor ‘krijgt de waarde’. Het resultaat van de instructie wordt opgeslagen in ‘d’.
we noemen het resultaat van read_tsv een dataframe


%d en %m staan voor DD en MM, %Y staat voor YYYY

, Een functie verkennen
= de documentatie van een functie bekijken. Deze documentatie verschijnt in het HELP-panel


In RStudio

# request documentation for the function read_tsv()
?read_tsv



Als resultaat krijg je de functie met alle mogelijke argumenten. Het enige verplichte argument is de bestandsnaam
van het bestand dat je wil importeren. De overige argumenten zijn allemaal optioneel die indien niet vernoemd
gewoon hun default-instelling volgen


Andere opties:
Read_tsv voor bestanden met tab als kolomscheidingsteken
Read_csv voor bestanden met komma als kolomscheidingsteken
Read_csv2 voor bestanden met puntkomma als kolomscheidingsteken
Read_delim voor bestanden waarbij je zelf aangeeft wat het kolomscheidingsteken is


Ingelezen data bekijken en exploreren
= dmv de functie View(d) kunnen we een visuele representatie krijgen van object ‘d’.
! RStudio is hoofdlettergevoelig – deze functie moet met een hoofdletter genoteerd worden


In RStudio

# inspect the dataset
View (d)



= dmv de functie skim(d) kunnen we de verschillende eigenschappen van het object snel bekijken
! zie geen hoofdletter


In RStudio

# inspect proeperties of the dataset
skim(d)

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller laurebudts. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.21. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

77764 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$6.21  7x  sold
  • (1)
  Add to cart