Samenvatting statistiek A
1. Wat is statistiek?
1.1. Statistiek als ‘gevaarlijk’ hulpmiddel
• Geen representatieve groep → als je een uitspraak wil doen zal je een duidelijke groep van
mensen moeten afbakenen = populatie
• Selectieve censuur als de resultaten niet opleveren wat we verwachten (soms politiek
gevoelig)
• Statistiek vaan misbruikt voor verschillende doelstellingen → om statements meer
zeggingskracht te geven
• Interpretatie van de resultaten van statistische analysen moeten altijd met nodige
voorzichtigheid gebeuren → altijd alternatieve verklaringen ook controleren
• Kritisch kijken naar statistiek = ! → zeker in de media
1.2. Wat is statistiek?
Def.: Statistiek is de wetenschap van het verzamelen, organiseren, presenteren, analyseren en
interpreteren van gegevens of data volgens een numerieke logica.
(verschoven focus van het verzamelen van gegevens naar analyseren…)
Drie verschillende ladingen:
• Data (=gegevens) = aantal lln per onderwijsniveau, …
• Bewerking op data = gemiddeld inkomen, …
• Wetenschap = hoe data analyseren
Statistiek kan drie verschillende functies hebben:
1. Beschrijven
• Beschrijven van gegevens
• Vereenvoudiging te geven van een complexer realiteit.
• Beschrijvingen van een groep mensen → meer zicht te krijgen op de eigenschappen van die
groep
2. Verklaren
• Verbanden leggen tussen dingen
• Statistisch model opbouwen. (= grove vereenvoudiging van de realiteit, waarin je beschrijft
hoe de situaties in gemiddelde termen/in probalistische termen, werken)
• Statistiek kan ingezet worden om een bepaald fenomeen dat we vaststellen in de
werkelijkheid verklaren
• Bv: verband tussen roken van tabak en longkanker
3. Voorspellen
• Formuleren van voorspellingen over wat er kan gebeuren.
• Statistiek is niet exact te voorspellen. Het zijn geen definitieve voorspellingen, maar wel
voorspellingen in termen van kansen.
• Bv: gemiddelde temperatuur in het jaar 2100
1
, 2. Het statistisch programma R
2.1. R omgeving
R-omgeving
• R = taal en omgeving → statistische berekeningen te doen en grafisch weer te geven
• R = open source → gebruikers kunnen mee schrijven aan programma’s
• Aangevuld met packages
Rstudio
• 4 onderdelen:
o Script
o Console
o Global environment = workspace
o Plot (=grafieken) – packages – help
• Nieuw script:
o File > new file > R Script
• Rstudio als fabriek
o Input → process → output
o Input in script → R voert basisprocessen uit → output in console of plot
▪ Je materiaal vindt je in de global environment = workspace (overzicht van R-
objecten waarmee je aan de slag bent)
2.2. R Installeren
2.3. Installatie van pakketten (packages)
2.4. Werken met pakketten ‘packages’ (car – moments)
Packages activeren → 2 manieren:
1. ‘car’ en ‘moments’ aanvinken in de lijst met pakketten
2. In Rscript zetten!!!
a. Open een script: File > New file > R script
b. Noteer in script:
library(car)
library(moments)
c. Laat beide lijnen lopen via Run (Ctrl+R)
d. Ze staan nu in de console!
2.5. Conventies in R
• Functies (=opdrachten) gaan altijd vooraf door een pijl naar rechts >
• Als de functielijn te lang wordt voor 1 regel → splitsen met + teken op einde van eerste regel
• Toelichting schrijven: # teken voorafgaand aan de zin
• R is erg hoofdletter en spellinggevoelig!
2
, o Functies altijd met kleine letter
o Variabele of datamatrix → altijd beginnen met hoofdletter gevolgd door kleine
letters
• R zet functies in het blauw → functie = mini-machine → tussen die haakjes ga je argumenten
geven zodat R weet wat hij moet doen
Alle scripts starten met PDF-principe
• Packages activeren → 2 opties:
1. Car en moments aanvinken
2. In Rscript zetten!!!
▪ Open een script: File > New file > R script
▪ Noteer in script:
library(car)
library(moments)
▪ Laat beide lijnen lopen via Run (Ctrl+R)
▪ Ze staan nu in de console!
• Data laden → bestaande datasets inlezen → kijk naar extensie van dataset
1. RData
▪ File > Open File
▪ Zoek ‘Oefen2.Rdata’ en klik op ‘Open’
▪ Klik op ‘Yes’
▪ Controleer workspace
▪ Rechtstreek via: load(file.choose())
2. Csv
▪ Import Dataset > From Text(base)
▪ Zoek de dataset (Techtest.csv) en klik op ‘Open’
▪ Check de settings:
• Naam dataset: nummers en haakjes wegdoen!
• Heading: zijn het namen van variabelen? YES
• Separator → kijken naar inputfile en hoe ze gescheiden zijn (kan
komma, puntkomma,..)
▪ Klik op ‘import’
▪ Rechtstreeks via: Provant<-read.csv2(file.choose())
3. Xlsx data
▪ Rstudio → Files > Oefen1.xlsx > view file→ Excel document opent → Save as
> format : comma separated values (.csv) (gescheiden door
lijstscheidingsteken > save → Excel terug dicht doen
▪ Import Dataset > From Text(base)
• Functies laden → 2 opties
1. In Script zetten!!!
▪ Noteer in je script
source(file.choose())
▪ Laat die scriptlijn lopen via Run (Ctrl+R)
▪ Er opent een nieuw venster (zoeken!)
▪ Blader naar het bestand ‘OLP Functies.r’ en klik op ‘Open’
▪ De functies zijn nu bruikbaar in R (controleer in workspace)
3
, 2. Openen via file
▪ File > open file > OLP Functies.R > open
▪ De functies verschijnen als script
▪ Klik vervolgens rechtsboven op ‘source’
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper struyfe. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €16,69. Je zit daarna nergens aan vast.