Samenvatting

Statistiek voor de humane wetenschappen, een Nederlandse samenvatting

Name: Statistiek voor de humane wetenschappen, een Nederlandse samenvatting
SKU: doc_1139599
Rating: 5.00 (1 reviews)
Author: laurebudts

1 beoordeling

7 keer verkocht

Instelling
Katholieke Universiteit Leuven (KU Leuven)

Examen gehaald met 18/20. Een volledige samenvatting van de cursus statistiek voor de humane wetenschappen in het Nederlands. de samenvatting is gebaseerd op de lessen en het cursusmateriaal van professor Dirk Speelman. In de samenvatting zitten extra verduidelijkingen, notities die stap voor sta...

[Meer zien]

Voorbeeld 4 van de 169 pagina's

Bekijk voorbeeld

Geupload op 31 mei 2021
Aantal pagina's 169
Geschreven in 2020/2021
Type Samenvatting

statistiek
statistiek voor de humane wetenschappen

1 beoordeling

Door: katoschonk • 1 jaar geleden

Volgen

laurebudts Lid sinds 3 jaar 28 documenten verkocht

€5,49

Ook beschikbaar in voordeelbundel v.a. €15,49

In winkelwagen

Opslaan

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Ook beschikbaar in voordeelbundel (1)

Bundel 2e semester schakeljaar bedrijfscommunicatie: Statistiek - Argumentatieleer - Sociologie van Media en ICT

€ 16,47 € 15,49

3x verkocht

3 items

1. Samenvatting - Samenvatting argumentatieleer 2021
2. Samenvatting - Samenvatting sociologie van media en ict 2020-2021 kuleuven
3. Samenvatting - Statistiek voor de humane wetenschappen, een nederlandse samenvatting
Meer zien

Statistiek voor de humane wetenschappen
Hoofdstuk 1: Basis van datasets

1. Verschillende soorten variabelen

ONDERSCHEID 1: STATISTISCHE vs. NON-STATISTISCHE VARIABELEN
Statische variabelen representeren eigenschappen die worden gemeten met het doel om er verdere statistieken
mee te berekenen. De software RStudio zal alle variabelen in een dataset bekijken als een bewerkbare variabele,
maar kolommen zoals ID representeren geen echte variabele. Kolommen zoals ID, die bestaan uit unieke non-
numerische waarden, zijn onbruikbaar voor statistieken. Ook als ID zou bestaan uit numerische waarden, is er geen
nut in het berekenen van gemiddelden, frequentie, …

ONDERSCHEID 2: CATEGORISCHE vs. NUMERISCHE VARIABELEN
Categorische variabelen zijn variabelen die een label zijn, geen cijfers. Binnen de categorische variabelen maken
we nog een onderscheid tussen nominale en ordinale variabelen.

Ordinale variabelen: Hebben een intrinsieke volgorde, er is een duidelijk hiërarchie/volgorde
Bv. Laag inkomen – gemiddeld inkomen – hoog inkomen
Nominale variabelen: Hebben geen intrinsieke volgorde, er is geen eenduidig antwoord welke waarde hoger is
Bv. Noord – West – Zuid – Oost

Numerische variabelen hebben wel cijfers als waarden en zijn erg relevant voor allerlei statische bewerkingen.
Numerische variabelen kunnen we op 2 verschillende manieren verder onderscheiden.
De eerste manier is die van interval variabelen en ratio variabelen:

Interval variabele: Hebben een arbitrair nulpunt en de verhouding tussen 2 intervallen heeft geen duidelijke
betekenis
Bv. Temperaturen
Ratio variabele: Hebben een natuurlijk nulpunt en de verhoudingen zijn duidelijk
Bv. Jaarlijkse hoeveelheid regen in inches

De tweede manier is die van discrete variabelen en continue variabelen:

Discrete variabele: De volgende waarde is logisch en gekend
Bv. Aantal kinderen
Continue variabele: Tussen 2 waarden kan er altijd nog een derde waarde zitten, de volgorde is daardoor niet
gekend.
Bv. Graden Celsius

,Hoofdstuk 2: Basisinstructies in RStudio

1. De start van een sessie in RStudio

Setting working directory
= de folder waarin gewerkt wordt aanduiden als ‘working directory’
! geldig gedurende de sessie, telkens opnieuw herhalen bij openen van nieuwe RSessie, Rscript, folder, …
? Bij niet gespecifieerde locatie gaat de informatie naar de working directory

In RStudio

Files – document – stathum – folder – more – set as working directory

Laden en installeren van pakketten
= We hebben extra pakketten nodig voor sommige bewerkingen
! Je moet deze pakketten slechts 1x installeren, daarna gewoon altijd laden
! Best practice om alle nodige pakketten bovenaan je Rscript te zetten

In Rstudio

Installeren: install.packages(“naam”)
Laden: library(naam)

Het pakket ‘Tidyverse’ installeert heel wat functies onder een makkleijkere naam dan de BaseR namen. In 2
gevallen hebben functies dezelfde namen, RStudio gebruikt vanaf het laden van Tidyverse alle fucntienamen van
dat pakket.

Comments
= Voor jezelf en anderen omschrijven wat de eerstvolgende instructie zal doen met de dataset
? dmv een # te plaatsen voor de instructie weet RStudio dat dit een comment is en geen instructie

, 2. Bestanden importeren in RStudio
Bestanden inspecteren
= Voordat we een dataset opnemen in RStudio is het belangrijk om eerst de data te inspecteren om te zien of
er bepaalde eigenschappen zijn waarmee we rekening zullen moeten houden
? Afhankelijk van het bestandstype zijn er 2 manieren om data te inspecteren

Bij een .txt-bestand à klikken op de bastandsnaam in het veld rechts onderaan. Je krijgt de inhoud
linksboven te zien in een nieuw tabblad.
Bij een .csv-bestand à klikken op de bestandsnaam – in het pop-up-menu klik je op ‘view file’

CASUS:
We hebben een dataset ‘Students’ met daarin heel wat gegevens over de schoolprestaties van 10 studenten.
Voordat we deze dataset gaan beginnen bewerken in RStudio, is het belangrijk om deze eerst te inspecteren.
Stel:
- De data in de set werden genoteerd onder het format DD/MM/YYYY
- Het decimaalteken dat gebruikt werd is een komma “,”
- Bij missende data werd NA aangegeven

Het aangeven van missende data dmv NA is een goed ding, dat begrijpt het programma. De default voor data en
decimaaltekens in RStudio is echter anders. RStudio verwacht een punt “.” als decimaalteken en verwacht dat data
genoteerd worden als YYYY/MM/DD. We kunnen dit oplossen door gebruik te maken van de functie locale

Read_tsv en Locale
Read_tsv
= functie voor het importeren van bestanden in RStudio
A1 “naam_bestand”
? door het toevoegen van extra argumenten kan je non-default settings aanpassen

Locale
= toe te voegen argument bij read_tsv om te verduidelijken dat we locale settings willen aanpassen

In RStudio

# read the students dataset
d <- read_tsv (“students.csv”,
locale = locale (decimal_mark = “,” , date_format = “%d/%m/%Y”))

Verduidelijking
d <- is een toewijzing, staat voor ‘krijgt de waarde’. Het resultaat van de instructie wordt opgeslagen in ‘d’.
we noemen het resultaat van read_tsv een dataframe

%d en %m staan voor DD en MM, %Y staat voor YYYY

, Een functie verkennen
= de documentatie van een functie bekijken. Deze documentatie verschijnt in het HELP-panel

In RStudio

# request documentation for the function read_tsv()
?read_tsv

Als resultaat krijg je de functie met alle mogelijke argumenten. Het enige verplichte argument is de bestandsnaam
van het bestand dat je wil importeren. De overige argumenten zijn allemaal optioneel die indien niet vernoemd
gewoon hun default-instelling volgen

Andere opties:
Read_tsv voor bestanden met tab als kolomscheidingsteken
Read_csv voor bestanden met komma als kolomscheidingsteken
Read_csv2 voor bestanden met puntkomma als kolomscheidingsteken
Read_delim voor bestanden waarbij je zelf aangeeft wat het kolomscheidingsteken is

Ingelezen data bekijken en exploreren
= dmv de functie View(d) kunnen we een visuele representatie krijgen van object ‘d’.
! RStudio is hoofdlettergevoelig – deze functie moet met een hoofdletter genoteerd worden

In RStudio

# inspect the dataset
View (d)

= dmv de functie skim(d) kunnen we de verschillende eigenschappen van het object snel bekijken
! zie geen hoofdletter

In RStudio

# inspect proeperties of the dataset
skim(d)

Dit zijn jouw voordelen als je samenvattingen koopt bij Stuvia:

Bewezen kwaliteit door reviews

Studenten hebben al meer dan 850.000 samenvattingen beoordeeld. Zo weet jij zeker dat je de beste keuze maakt!

In een paar klikken geregeld

Geen gedoe — betaal gewoon eenmalig met iDeal, Bancontact of creditcard en je bent klaar. Geen abonnement nodig.

Focus op de essentie

Studenten maken samenvattingen voor studenten. Dat betekent: actuele inhoud waar jij écht wat aan hebt. Geen overbodige details!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.