Summary

Statistiek voor de humane wetenschappen, een Nederlandse samenvatting

Name: Statistiek voor de humane wetenschappen, een Nederlandse samenvatting
SKU: doc_1139599
Rating: 5.00 (1 reviews)
Author: laurebudts

1 review

7 purchases

Course
Statistiek voor de humane wetenschappen (BKULF0FG1A)

Institution
Katholieke Universiteit Leuven (KU Leuven)

Examen gehaald met 18/20. Een volledige samenvatting van de cursus statistiek voor de humane wetenschappen in het Nederlands. de samenvatting is gebaseerd op de lessen en het cursusmateriaal van professor Dirk Speelman. In de samenvatting zitten extra verduidelijkingen, notities die stap voor sta...

[Show more]

Preview 4 out of 169 pages

View example

Uploaded on May 31, 2021
Number of pages 169
Written in 2020/2021
Type Summary

statistiek
statistiek voor de humane wetenschappen

Institution
Katholieke Universiteit Leuven (KU Leuven)
Education
Schakelprogramma Bedrijfscommunicatie
Course
Statistiek voor de humane wetenschappen (BKULF0FG1A)

1 review

By: katoschonk • 1 year ago

laurebudts

Member since 3 year 28 documents sold

$5.91

Also available in package deal from $16.67

Add to cart

Add to wishlist

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Also available in package deal (1)

Bundel 2e semester schakeljaar bedrijfscommunicatie: Statistiek - Argumentatieleer - Sociologie van Media en ICT

$ 17.73 $ 16.67

3x sold

3 items

1. Summary - Samenvatting argumentatieleer 2021
2. Summary - Samenvatting sociologie van media en ict 2020-2021 kuleuven
3. Summary - Statistiek voor de humane wetenschappen, een nederlandse samenvatting
Show more

Statistiek voor de humane wetenschappen
Hoofdstuk 1: Basis van datasets

1. Verschillende soorten variabelen

ONDERSCHEID 1: STATISTISCHE vs. NON-STATISTISCHE VARIABELEN
Statische variabelen representeren eigenschappen die worden gemeten met het doel om er verdere statistieken
mee te berekenen. De software RStudio zal alle variabelen in een dataset bekijken als een bewerkbare variabele,
maar kolommen zoals ID representeren geen echte variabele. Kolommen zoals ID, die bestaan uit unieke non-
numerische waarden, zijn onbruikbaar voor statistieken. Ook als ID zou bestaan uit numerische waarden, is er geen
nut in het berekenen van gemiddelden, frequentie, …

ONDERSCHEID 2: CATEGORISCHE vs. NUMERISCHE VARIABELEN
Categorische variabelen zijn variabelen die een label zijn, geen cijfers. Binnen de categorische variabelen maken
we nog een onderscheid tussen nominale en ordinale variabelen.

Ordinale variabelen: Hebben een intrinsieke volgorde, er is een duidelijk hiërarchie/volgorde
Bv. Laag inkomen – gemiddeld inkomen – hoog inkomen
Nominale variabelen: Hebben geen intrinsieke volgorde, er is geen eenduidig antwoord welke waarde hoger is
Bv. Noord – West – Zuid – Oost

Numerische variabelen hebben wel cijfers als waarden en zijn erg relevant voor allerlei statische bewerkingen.
Numerische variabelen kunnen we op 2 verschillende manieren verder onderscheiden.
De eerste manier is die van interval variabelen en ratio variabelen:

Interval variabele: Hebben een arbitrair nulpunt en de verhouding tussen 2 intervallen heeft geen duidelijke
betekenis
Bv. Temperaturen
Ratio variabele: Hebben een natuurlijk nulpunt en de verhoudingen zijn duidelijk
Bv. Jaarlijkse hoeveelheid regen in inches

De tweede manier is die van discrete variabelen en continue variabelen:

Discrete variabele: De volgende waarde is logisch en gekend
Bv. Aantal kinderen
Continue variabele: Tussen 2 waarden kan er altijd nog een derde waarde zitten, de volgorde is daardoor niet
gekend.
Bv. Graden Celsius

,Hoofdstuk 2: Basisinstructies in RStudio

1. De start van een sessie in RStudio

Setting working directory
= de folder waarin gewerkt wordt aanduiden als ‘working directory’
! geldig gedurende de sessie, telkens opnieuw herhalen bij openen van nieuwe RSessie, Rscript, folder, …
? Bij niet gespecifieerde locatie gaat de informatie naar de working directory

In RStudio

Files – document – stathum – folder – more – set as working directory

Laden en installeren van pakketten
= We hebben extra pakketten nodig voor sommige bewerkingen
! Je moet deze pakketten slechts 1x installeren, daarna gewoon altijd laden
! Best practice om alle nodige pakketten bovenaan je Rscript te zetten

In Rstudio

Installeren: install.packages(“naam”)
Laden: library(naam)

Het pakket ‘Tidyverse’ installeert heel wat functies onder een makkleijkere naam dan de BaseR namen. In 2
gevallen hebben functies dezelfde namen, RStudio gebruikt vanaf het laden van Tidyverse alle fucntienamen van
dat pakket.

Comments
= Voor jezelf en anderen omschrijven wat de eerstvolgende instructie zal doen met de dataset
? dmv een # te plaatsen voor de instructie weet RStudio dat dit een comment is en geen instructie

, 2. Bestanden importeren in RStudio
Bestanden inspecteren
= Voordat we een dataset opnemen in RStudio is het belangrijk om eerst de data te inspecteren om te zien of
er bepaalde eigenschappen zijn waarmee we rekening zullen moeten houden
? Afhankelijk van het bestandstype zijn er 2 manieren om data te inspecteren

Bij een .txt-bestand à klikken op de bastandsnaam in het veld rechts onderaan. Je krijgt de inhoud
linksboven te zien in een nieuw tabblad.
Bij een .csv-bestand à klikken op de bestandsnaam – in het pop-up-menu klik je op ‘view file’

CASUS:
We hebben een dataset ‘Students’ met daarin heel wat gegevens over de schoolprestaties van 10 studenten.
Voordat we deze dataset gaan beginnen bewerken in RStudio, is het belangrijk om deze eerst te inspecteren.
Stel:
- De data in de set werden genoteerd onder het format DD/MM/YYYY
- Het decimaalteken dat gebruikt werd is een komma “,”
- Bij missende data werd NA aangegeven

Het aangeven van missende data dmv NA is een goed ding, dat begrijpt het programma. De default voor data en
decimaaltekens in RStudio is echter anders. RStudio verwacht een punt “.” als decimaalteken en verwacht dat data
genoteerd worden als YYYY/MM/DD. We kunnen dit oplossen door gebruik te maken van de functie locale

Read_tsv en Locale
Read_tsv
= functie voor het importeren van bestanden in RStudio
A1 “naam_bestand”
? door het toevoegen van extra argumenten kan je non-default settings aanpassen

Locale
= toe te voegen argument bij read_tsv om te verduidelijken dat we locale settings willen aanpassen

In RStudio

# read the students dataset
d <- read_tsv (“students.csv”,
locale = locale (decimal_mark = “,” , date_format = “%d/%m/%Y”))

Verduidelijking
d <- is een toewijzing, staat voor ‘krijgt de waarde’. Het resultaat van de instructie wordt opgeslagen in ‘d’.
we noemen het resultaat van read_tsv een dataframe

%d en %m staan voor DD en MM, %Y staat voor YYYY

, Een functie verkennen
= de documentatie van een functie bekijken. Deze documentatie verschijnt in het HELP-panel

In RStudio

# request documentation for the function read_tsv()
?read_tsv

Als resultaat krijg je de functie met alle mogelijke argumenten. Het enige verplichte argument is de bestandsnaam
van het bestand dat je wil importeren. De overige argumenten zijn allemaal optioneel die indien niet vernoemd
gewoon hun default-instelling volgen

Andere opties:
Read_tsv voor bestanden met tab als kolomscheidingsteken
Read_csv voor bestanden met komma als kolomscheidingsteken
Read_csv2 voor bestanden met puntkomma als kolomscheidingsteken
Read_delim voor bestanden waarbij je zelf aangeeft wat het kolomscheidingsteken is

Ingelezen data bekijken en exploreren
= dmv de functie View(d) kunnen we een visuele representatie krijgen van object ‘d’.
! RStudio is hoofdlettergevoelig – deze functie moet met een hoofdletter genoteerd worden

In RStudio

# inspect the dataset
View (d)

= dmv de functie skim(d) kunnen we de verschillende eigenschappen van het object snel bekijken
! zie geen hoofdletter

In RStudio

# inspect proeperties of the dataset
skim(d)

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller laurebudts. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $5.91. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

69411 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 15 years now

Start selling

Summary

Statistiek voor de humane wetenschappen, een Nederlandse samenvatting

Document information

Subjects

Written for

1 review

Seller

Reviews received

Content preview

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Quick and easy check-out

Focus on what matters

Frequently asked questions

What do I get when I buy this document?

Satisfaction guarantee: how does it work?

Who am I buying these notes from?

Will I be stuck with a subscription?

Can Stuvia be trusted?