Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien
logo-home
Statistiek voor de humane wetenschappen, een Nederlandse samenvatting €5,49   Ajouter au panier

Resume

Statistiek voor de humane wetenschappen, een Nederlandse samenvatting

1 vérifier
 251 vues  7 fois vendu

Examen gehaald met 18/20. Een volledige samenvatting van de cursus statistiek voor de humane wetenschappen in het Nederlands. de samenvatting is gebaseerd op de lessen en het cursusmateriaal van professor Dirk Speelman. In de samenvatting zitten extra verduidelijkingen, notities die stap voor sta...

[Montrer plus]

Aperçu 4 sur 169  pages

  • 31 mai 2021
  • 169
  • 2020/2021
  • Resume
  • statistiek
Tous les documents sur ce sujet (2)

1  vérifier

review-writer-avatar

Par: katoschonk • 1 année de cela

avatar-seller
laurebudts
Statistiek voor de humane wetenschappen
Hoofdstuk 1: Basis van datasets


1. Verschillende soorten variabelen


ONDERSCHEID 1: STATISTISCHE vs. NON-STATISTISCHE VARIABELEN
Statische variabelen representeren eigenschappen die worden gemeten met het doel om er verdere statistieken
mee te berekenen. De software RStudio zal alle variabelen in een dataset bekijken als een bewerkbare variabele,
maar kolommen zoals ID representeren geen echte variabele. Kolommen zoals ID, die bestaan uit unieke non-
numerische waarden, zijn onbruikbaar voor statistieken. Ook als ID zou bestaan uit numerische waarden, is er geen
nut in het berekenen van gemiddelden, frequentie, …


ONDERSCHEID 2: CATEGORISCHE vs. NUMERISCHE VARIABELEN
Categorische variabelen zijn variabelen die een label zijn, geen cijfers. Binnen de categorische variabelen maken
we nog een onderscheid tussen nominale en ordinale variabelen.


Ordinale variabelen: Hebben een intrinsieke volgorde, er is een duidelijk hiërarchie/volgorde
Bv. Laag inkomen – gemiddeld inkomen – hoog inkomen
Nominale variabelen: Hebben geen intrinsieke volgorde, er is geen eenduidig antwoord welke waarde hoger is
Bv. Noord – West – Zuid – Oost




Numerische variabelen hebben wel cijfers als waarden en zijn erg relevant voor allerlei statische bewerkingen.
Numerische variabelen kunnen we op 2 verschillende manieren verder onderscheiden.
De eerste manier is die van interval variabelen en ratio variabelen:


Interval variabele: Hebben een arbitrair nulpunt en de verhouding tussen 2 intervallen heeft geen duidelijke
betekenis
Bv. Temperaturen
Ratio variabele: Hebben een natuurlijk nulpunt en de verhoudingen zijn duidelijk
Bv. Jaarlijkse hoeveelheid regen in inches


De tweede manier is die van discrete variabelen en continue variabelen:


Discrete variabele: De volgende waarde is logisch en gekend
Bv. Aantal kinderen
Continue variabele: Tussen 2 waarden kan er altijd nog een derde waarde zitten, de volgorde is daardoor niet
gekend.
Bv. Graden Celsius

,Hoofdstuk 2: Basisinstructies in RStudio


1. De start van een sessie in RStudio


Setting working directory
= de folder waarin gewerkt wordt aanduiden als ‘working directory’
! geldig gedurende de sessie, telkens opnieuw herhalen bij openen van nieuwe RSessie, Rscript, folder, …
? Bij niet gespecifieerde locatie gaat de informatie naar de working directory


In RStudio

Files – document – stathum – folder – more – set as working directory



Laden en installeren van pakketten
= We hebben extra pakketten nodig voor sommige bewerkingen
! Je moet deze pakketten slechts 1x installeren, daarna gewoon altijd laden
! Best practice om alle nodige pakketten bovenaan je Rscript te zetten


In Rstudio

Installeren: install.packages(“naam”)
Laden: library(naam)



Het pakket ‘Tidyverse’ installeert heel wat functies onder een makkleijkere naam dan de BaseR namen. In 2
gevallen hebben functies dezelfde namen, RStudio gebruikt vanaf het laden van Tidyverse alle fucntienamen van
dat pakket.




Comments
= Voor jezelf en anderen omschrijven wat de eerstvolgende instructie zal doen met de dataset
? dmv een # te plaatsen voor de instructie weet RStudio dat dit een comment is en geen instructie

, 2. Bestanden importeren in RStudio
Bestanden inspecteren
= Voordat we een dataset opnemen in RStudio is het belangrijk om eerst de data te inspecteren om te zien of
er bepaalde eigenschappen zijn waarmee we rekening zullen moeten houden
? Afhankelijk van het bestandstype zijn er 2 manieren om data te inspecteren


Bij een .txt-bestand à klikken op de bastandsnaam in het veld rechts onderaan. Je krijgt de inhoud
linksboven te zien in een nieuw tabblad.
Bij een .csv-bestand à klikken op de bestandsnaam – in het pop-up-menu klik je op ‘view file’


CASUS:
We hebben een dataset ‘Students’ met daarin heel wat gegevens over de schoolprestaties van 10 studenten.
Voordat we deze dataset gaan beginnen bewerken in RStudio, is het belangrijk om deze eerst te inspecteren.
Stel:
- De data in de set werden genoteerd onder het format DD/MM/YYYY
- Het decimaalteken dat gebruikt werd is een komma “,”
- Bij missende data werd NA aangegeven


Het aangeven van missende data dmv NA is een goed ding, dat begrijpt het programma. De default voor data en
decimaaltekens in RStudio is echter anders. RStudio verwacht een punt “.” als decimaalteken en verwacht dat data
genoteerd worden als YYYY/MM/DD. We kunnen dit oplossen door gebruik te maken van de functie locale


Read_tsv en Locale
Read_tsv
= functie voor het importeren van bestanden in RStudio
A1 “naam_bestand”
? door het toevoegen van extra argumenten kan je non-default settings aanpassen


Locale
= toe te voegen argument bij read_tsv om te verduidelijken dat we locale settings willen aanpassen


In RStudio

# read the students dataset
d <- read_tsv (“students.csv”,
locale = locale (decimal_mark = “,” , date_format = “%d/%m/%Y”))



Verduidelijking
d <- is een toewijzing, staat voor ‘krijgt de waarde’. Het resultaat van de instructie wordt opgeslagen in ‘d’.
we noemen het resultaat van read_tsv een dataframe


%d en %m staan voor DD en MM, %Y staat voor YYYY

, Een functie verkennen
= de documentatie van een functie bekijken. Deze documentatie verschijnt in het HELP-panel


In RStudio

# request documentation for the function read_tsv()
?read_tsv



Als resultaat krijg je de functie met alle mogelijke argumenten. Het enige verplichte argument is de bestandsnaam
van het bestand dat je wil importeren. De overige argumenten zijn allemaal optioneel die indien niet vernoemd
gewoon hun default-instelling volgen


Andere opties:
Read_tsv voor bestanden met tab als kolomscheidingsteken
Read_csv voor bestanden met komma als kolomscheidingsteken
Read_csv2 voor bestanden met puntkomma als kolomscheidingsteken
Read_delim voor bestanden waarbij je zelf aangeeft wat het kolomscheidingsteken is


Ingelezen data bekijken en exploreren
= dmv de functie View(d) kunnen we een visuele representatie krijgen van object ‘d’.
! RStudio is hoofdlettergevoelig – deze functie moet met een hoofdletter genoteerd worden


In RStudio

# inspect the dataset
View (d)



= dmv de functie skim(d) kunnen we de verschillende eigenschappen van het object snel bekijken
! zie geen hoofdletter


In RStudio

# inspect proeperties of the dataset
skim(d)

Les avantages d'acheter des résumés chez Stuvia:

Qualité garantie par les avis des clients

Qualité garantie par les avis des clients

Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.

L’achat facile et rapide

L’achat facile et rapide

Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.

Focus sur l’essentiel

Focus sur l’essentiel

Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur laurebudts. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €5,49. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis)

67096 résumés ont été vendus ces 30 derniers jours

Fondée en 2010, la référence pour acheter des résumés depuis déjà 14 ans

Commencez à vendre!
€5,49  7x  vendu
  • (1)
  Ajouter