STATISTIEK
Inhoud
HOOFDSTUK 1: WAT IS STATISTIEK ............................................................................................................................... 3
HOOFDSTUK 3: DATA (EN DE DATAMATRIX) .................................................................................................................. 5
H3.1 – wat is data en wat zijn variabelen.............................................................................................................................. 5
H3.2 – meetniveau van variabelen ....................................................................................................................................... 7
H3.3 – datamatrix (niet in PowerPoint)............................................................................................................................... 12
HOOFDSTUK 2: HET STATISCH PROGRAMMA R ........................................................................................................... 13
HOOFDSTUK 4: DATABEHEER IN R .............................................................................................................................. 15
H4.1 SOORTEN DATA ........................................................................................................................................................... 15
H4.2 AANMAKEN VAN DATA ............................................................................................................................................... 15
H4.3 DATABESTAND AANMAKEN ........................................................................................................................................ 15
H4.4 WERKEN IN EN MET EEN DATAFRAME ....................................................................................................................... 16
H4.5 BESTAANDE DATASETS INLEZEN .................................................................................................................................. 17
H5 FREQUENTIEVERDELING VAN EEN VARIABELE......................................................................................................... 18
H5.1 ABSOLUTE EN RELATIEVE FREQUENTIES..................................................................................................................... 18
H5.2 FREQUENTIETABEL ...................................................................................................................................................... 18
H5.3 CUMULATIEVE FREQUENTIES ..................................................................................................................................... 18
H5.4 HISTOGRAM (kwantitatieve variabelen) ..................................................................................................................... 19
H5.5 GRAFISCHE VOORSTELLINGEN VAN CATEGORISCHE VARIABELEN ............................................................................. 20
H6 PARAMETERS VAN LIGGING EN SPREIDING ........................................................................................................... 23
H6.1 PARAMETERS VAN LIGGING ........................................................................................................................................ 23
Oefeningen uit les ............................................................................................................................................................... 27
H6.2 PARAMETERS VAN SPREIDING .................................................................................................................................... 28
H6.3 GRAFISCHE WEERGAVE VAN LIGGING EN SPREIDING: DE BOXPLOT .......................................................................... 31
Oefeningen uit de les .......................................................................................................................................................... 34
H7 PARAMETERS VAN VORM ..................................................................................................................................... 35
H7.1 SCHEEFHEID ................................................................................................................................................................ 35
H7.2 PLATHEID (Kurtosis) .................................................................................................................................................... 36
H8 (STANDAARD)NORMAALVERDELING ..................................................................................................................... 37
H8.1 DE NORMAALVERDELING ........................................................................................................................................... 37
H8.2 Z-SCORES / gestandaardiseerde scores ...................................................................................................................... 39
Oefeningen uit les ............................................................................................................................................................... 41
H9 STEEKPROEFTHEORIE ........................................................................................................................................... 45
H9.1 WAT IS EEN POPULATIE? ............................................................................................................................................. 45
H9.2 STEEKPROEVEN ........................................................................................................................................................... 45
H9.3 DE ENE STEEK IS DE ANDERE NIET .............................................................................................................................. 45
H9.4 FOUT IN STEEKPROEVEN ............................................................................................................................................ 46
1
,H10 INTERFERENTIES OVER VERDELING VAN VARIABELEN IN POPULATIE .................................................................... 48
H10.1 BETROUWBAARHEIDSINTERVALLEN ROND HET GEMIDDELDE ................................................................................ 48
H10.2 BETROUWBAARHEIDSINTERVALLEN ROND DE VARIANTIE ...................................................................................... 50
H10.3 BETROUWBAARHEIDSINTERVALLEN VOOR DE KENGETALLEN VAN VORM .............................................................. 51
H10.4 BETROUWBAARHEIDSINTERVALLEN VOOR RELATIEVE FREQUENTIES = proportie .................................................. 51
H10 SAMENVATTEND .......................................................................................................................................................... 52
OEFENINGEN LES H9+10 ..................................................................................................................................................... 53
EXAMENINFO............................................................................................................................................................ 57
2
,HOOFDSTUK 1: WAT IS STATISTIEK
Geschiedenis en herkomst woord, lezen p13
Beschikken over info was een belangrijk instrument voor de staat om beslissingen te nemen
➢ Men wilde weten hoeveel mensen er woonden, geboren werden, stierven, hoeveel geld er in omloop was,…
➢ Vanuit nood daar deze informatie statistiek ontstaan
➢ Eerste statisch instrument = volkstellingen
➢ Verder statische technieken ontwikkeld door mensen/organisaties voor winst => ontwikkelen technieken om
geldstromen in kaart te brengen, levenskansen te berekenen, …
Statistiek is overal…
7
Wat is statistiek?
Betekenis:
1. Aantal leerlingen per onderwijsniveau, .... = Data
2. Gemiddeld inkomen,... = Bewerkingen op data
3. Hoe data te analyseren = Wetenschap
“Statistiek is de wetenschap van het verzamelen, organiseren,
presenteren, analyseren en interpreteren van gegevens of data
volgens een numerieke logica.”
Waarom statistiek? Waarom statistiek?
Verklaren: Voorspellen:
Opwarming van de aarde 2100
ROKEN » LONGKANKER
11 12
P14-15: 3 mogelijke functies van statistiek
1. Beschrijven
Bv: gegevens verzamelen van bevolking => vereenvoudiging geven van complexe realiteit zoals
leeftijdssamenstelling
Bv: zicht op eigenschappen van een groep
2. Verklaren
Statisch model: vereenvoudiging van de realiteit waarin je beschrijft hoe situaties in gemiddelde termen werken
=> fenomeen dat we vaststellen in werkelijkheid verklaren
Bv: verband tussen roken longkanker => men kan in het model rekening houden met sekse, leeftijd,
risicogedrag,…
3. Voorspellen
Bv: gemiddelde temperatuur over een jaar voorspellen (opwarming van de aarde)
Bv: levensverwachting schetsen obv waar iemand woont
Zie hoofdstuk 1 p19-22 responsen
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper StudentUantwerpenOOW. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,86. Je zit daarna nergens aan vast.