Overzicht van alle statistiek en R-Studio stof die van toepassing is bij Onderzoeksmethoden en Bio-informatica. Inclusief uitwerkingen van alle werkcolleges en practica met codes en alles erop en eraan.
Aantekeningen Statistiek, R en RStudio
Inhoud
COO1 – Intro R........................................................................................................................................2
Generaties programmeertalen:..........................................................................................................2
Eenvoudige berekeningen..................................................................................................................3
Datatypes:..........................................................................................................................................3
Logische operatoren:..........................................................................................................................3
Datastructuren:..................................................................................................................................3
COO2 – Intro R importeren, selecteren, sorteren en missende gegevens..............................................4
Data importeren.................................................................................................................................4
Selecteren van data............................................................................................................................5
Sorteren en ordenen van de data.......................................................................................................6
Missende waarden.............................................................................................................................6
COO 3 – plotting.....................................................................................................................................7
Packages.............................................................................................................................................7
Basics van het plotten.........................................................................................................................7
Plots opslaan......................................................................................................................................8
Plots customizen.................................................................................................................................8
COO 4 – beschrijvende statistiek in R.....................................................................................................9
Beschrijvende statistiek voor een continue uitkomst, stap voor stap................................................9
Het beschrijven van meer dan 1 groep...............................................................................................9
Transformaties...................................................................................................................................9
MTE......................................................................................................................................................10
PR R Thema 1........................................................................................................................................11
Volledige zelfstudie..........................................................................................................................11
Steekproefvariatie en de centrale limietstelling...........................................................................11
Het verband tussen schatten en toetsen......................................................................................13
Schatten in de praktijk: een uitstapje naar een betrouwbaarheidsinterval voor het verschil in
twee steekproefgemiddelden.......................................................................................................13
Vragen en antwoorden zelfstudie....................................................................................................14
Werkcollege......................................................................................................................................14
Beschrijvende statistiek................................................................................................................14
Betrouwbaarheidsinterval voor een gemiddelde.........................................................................15
Betrouwbaarheidsinterval voor het verschil tussen twee gemiddelden.......................................16
OD data inlezen en analyseren.....................................................................................................17
1
,PR R Thema 2........................................................................................................................................19
Volledige zelfstudie..........................................................................................................................19
Betrouwbaarheidsinterval............................................................................................................19
Werkplan voor betrouwbaarheidsinterval....................................................................................21
Betrouwbaarheidsinterval, niet gebaseerd op een z-verdeling....................................................22
Lineaire regressie en correlatie, opfrissen....................................................................................25
Lineaire regressie: interferentie (betrouwbaarheids- en predictieinterval).................................27
Ijklijnen.........................................................................................................................................27
Vragen en antwoorden Zelfstudie....................................................................................................27
Werkcollege......................................................................................................................................28
Lineaire regressie..........................................................................................................................28
Stap 1: data uit .csv lezen.........................................................................................................28
Stap 2: spreidingsdiagram maken van de data.........................................................................28
Stap 3: Regressielijn schatten en toevoegen aan plot...............................................................28
Stap 4 voorspellingen met predictieintervallen........................................................................29
PR R Thema 3........................................................................................................................................30
Volledige zelftstudie.........................................................................................................................30
Inferentiële statistiek: toetstheorie aan de hand van een z-toets................................................30
Intermezzo – Hypotheses.........................................................................................................31
Intermezzo – Onbetrouwbaarheid en power...........................................................................32
Intermezzo – Onbetrouwbaarheid en power – vervolg............................................................32
Intermezzo – Onbetrouwbaarheid en power – vervolg............................................................33
Intermezzo – p-waarde en eenzijdig of tweezijdig toetsen......................................................34
Intermezzo – p-waarde en eenzijdig of tweezijdig toetsen – vervolg.......................................35
Toetsen in de praktijk: t-toets voor één steekproefgemiddelde...................................................36
Intermezzo – Model..................................................................................................................36
Toetsen in de praktijk: een uitstapje naar de chi-kwadraat toets.................................................38
Intermezzo – Chi-kwadraat toets..............................................................................................39
Intermezzo – R script................................................................................................................40
Werkcollege......................................................................................................................................41
Logische operatoren:
> < kleiner dan
> > groter dan
> <= kleiner of gelijk
> >= groter of gelijk
> == gelijk aan
> != ongelijk aan
> & en
> | of
Datastructuren:
Vector: lijst van elementen van hetzelfde datatype
> Maken d.m.v. combine functie c(…)
> A <- c(1, 2, 3)
> Maken d.m.v. sequence functie seq(…)
> A <- seq(1, 3, by=.5)
o Sequence van 1 tot en met 3, met stapjes van .5
o Gebruik je geen “by” dan gebruikt r automatisch 1
> Maken d.m.v. repetition functie rep(…)
> A <- rep(1,4)
o Vector met 1 wat 4 keer herhaald gaat worden
> A <- rep(1:3, 2)
o Gesloten interval operator : zorgt voor interval van 1 tot 3, wat 2 keer herhaald
wordt
> Maken d.m.v. normaalverdeling en uniform verdeling
> A <- nrnorm(5)
o Geeft 5 waarden uit een normaalverdeling
Matrix: tweediemensionale vector, met rijen en kolommen
> A <- matrix(1:6, nr=2, nc=3)
3
, > Geeft matrix met getallen 1 tot en met 6 met 2 rijen en 3 kolommen
.
> Je kan ook vectoren creëren en deze in een matrix zetten m.b.v. rbind() en cbind()
Lijst: hierbij kun je, in tegenstelling tot matrix en vector, verschillende datatypen door elkaar opslaan
> A <- list(“how”, “are”, “you”, “?”)
Dataframe: soort tabel waar verschillende soorten datatypen opgeslagen kunnen worden
Factor: datstructuur voor categorische date en levels zijn de mogelijke categoriënn
Hier heb je zelf de levels ingegeven!
COO2 – Intro R importeren, selecteren, sorteren en
missende gegevens
Data importeren
Datasets importeren doe je met de read.csv() of read.table() functie. Tussen de haakjes zet je de
locatie op de computer waar je je bestanden vandaan haalt.
> Read.csv() is een variant van de algemenere read.table(). Csv indiceert dat alle waarden door
een komma gescheiden zijn.
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper mark-burggraaf. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €12,49. Je zit daarna nergens aan vast.