100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Statistiek samenvatting (19/20) €3,49
In winkelwagen

Samenvatting

Statistiek samenvatting (19/20)

 269 keer bekeken  8 keer verkocht

De samenvatting mag op het examen gebruikt worden. Ik heb met de samenvatting een score van 19/20 behaald! Deze samenvatting is een kleinere overzichtelijke samenvatting van het document "Statistiek samenvatting alle videos" waarin alle youtube videos verwerkt zijn. Dit vak wordt ook gedoceerd in b...

[Meer zien]

Voorbeeld 5 van de 81  pagina's

  • 9 juli 2020
  • 81
  • 2019/2020
  • Samenvatting
Alle documenten voor dit vak (3)
avatar-seller
isabeltseyen
Info over examen
Datasets die op het examen gebruikt worden:
“Descriptive – correlation matrices
→ “select stored dataset” → Examen1718 (komt ook 1 onderdeel van het examen)
Dit deeltje heeft betrekking op technieken die we bekijken.

Drie doelstellingen die daar getoetst worden. Je krijg een vraag.
1. Op basis van de vraag een adequate selectie maken. Een softwaremodule die daarvoor geschikt is,
selecteren.
Je hebt eigenlijk keuze tussen een 70-tal technieken. Jij moet hier de goede uitkiezen.
2. Berekening doen met juist ingevulde parameters. Output van die berekening interpreteren in termen
van de vraagstelling. Het antwoord dus vertalen in termen van wat oorspronkelijk gevraagd wordt.
3. Vraag die betrekking heeft op de assumpties. Soms mag je bepaalde technieken wel/niet gebruiken,
soms is er twijfel over. Op examen tweetal vragen waar je over moet nadenken of de onderliggende
assumpties wel voldaan zijn ja/nee. → eventueel een extra berekening/controle maken.
Dit alles is gebaseerd op deze dataset “Examen1718”.

Resid Residu’s/voorspellingsfouten die uit een model komen. (zie hoofdstuk 6)
TS1 Tijdreeksen/time series
TS2 → van belang: seizoenaliteit tijdreeks wordt gegeven
Intention_ Doelvariabelen: is iemand vrijwillig bereid om de software te gebruiken?
to_Use = intentie die de gebruiker heeft om de software te gebruiken als er geen dwang zou zijn. In welke
mate ben je bereid om die software dan te gebruiken?
Hoe wordt dit opgesteld? -> Men geeft een aantal stellingen die zijn gebaseerd op likertscores. Alles
scores worden opgeteld tot een nieuwe score.
MAAR. Herinner: je mag niet altijd likertscores optellen want het is niet altijd een kwalitatief
gegeven. Om die onduidelijkheid weg te nemen, zal je de opgetelde scores gewoon krijgen.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Relative_ Welke factoren gaan verklaren dat je een hogere intention to use (doelstelling) hebt?
Advantage Relative advantage betekent dat wanneer je twee/meer producten hebt, wat vind je dan dat de
software waar we de tevredenheid over willen weten een relatief voordeel heeft ten opzichte van
alternatieve?
→ Hoe hoger de relative advantage, hoe hoger de intention to use.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Perceived_ Niet relatief, maar absoluut gezien. Als je de software bekijkt, geeft het dan een meerwaarde? Kan
Usefulness je er iets mee doen? Je moet beoordelen of het resultaat dat je krijgt door het gebruik van de
software een waarde heeft voor jou.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software

Perceived_ Gebruiksvriendelijkheid van de software
Ease_of_Use → hoe hoger de ease of use, hoe hoger de intention to use.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Information De software geeft je de nodige uitleg om de software te gebruiken → ‘Help’
_Quality = berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software

System_ De uitvoering van de software/berekeningen → performance
Quality vb. een trage Excel, het laden duur lang, …
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
group B B = binair → Een variabele die 0 of 1 is.
Gender B vb. group (0,1), gender (0,1)
Name C C = als je labels wilt ipv nummers.
group C vb. group (bachelor/schakel), gender (m/f), ..
gender C
age C SPSS zegt of je in het verleden al eens gebruikt hebt gemaakt spss, of je ermee vertrouwd bent of
spss C niet. Iemand die al vertrouwd is met statistische software gaat anders kijken naar de beoordeling
van een statistisch product.



De intention to use kan positief beïnvloed worden door een hoge relative advantage, usefulness, ease of
use, information quality en system quality.
Het aantal vragen per variabele zijn niet gelijk. Sommige items zijn gebaseerd op meer vragen die gesteld
zijn.


Op examen:
- Deel 1: makkelijk deel met 10-tal vragen
Dataset: examen1718
→ deze kunnen snel worden uitgevoerd door 1 berekening en interpretatie om een antwoord te geven.

- Deel 2: denkoefening
Dataset: zoals oilimport en TAM/ISSM (tijdreeksen)
→ meer werk voor je een antwoord hebt. Je moet gegevens interpreteren, model maken en eventueel nog
kijken naar de residu’s etc.

, 1

Regression – multiple regression
Dataset: oil import ( = examendataset)
(Andere dataset = examen1718)

Oil import bevat een aantal belangrijke tijdreeksen. De belangrijkste is:
- barrels_purchased: aantal
- unit_ price: prijs per vat die je moet betalen
- total_value: waarde van de geïmporteerde hvlh aardolie
- cpi: consumptieprijsindex
→ hoe evalueren de gekochte vaten doorheen de tijd?
We gaan deze variabele proberen te verklaren op basis van de prijs en de cpi.

Hint: het situeert zich in een periode waar een aantal dingen zijn gebeurd op de markt.
De data van de barrels_purchased zal heel wat schommelingen bevatten. Dit gaat een rol spelen bij het
analyseren.
Rekening houden met tijdreeksaspecten en regressie-analyse.
Je gaat een regressieanalyse maken waar je verband legt met de barrels_purchased en de prijs, en de
barrels_purchased en de cpi.
Examenvraag: In welke mate gaat de unit prijs invloed hebben op de gevraagde hoeveelheid aardolie.

Delf_price = gedefleerde prijs = gecorrigeerd voor de cpi . het is de reële prijs.
Defl_price1 = gedefleerde prijs met 1 maand vertraagd.
Defl_price2 = gedefleerde prijs met 2 maanden vertraging.

,Inhoud
3.1 Statistical Measures for Probability Distributions (P57) ...........................................................................4
3.2 Discrete verdelingen (P57)..........................................................................................................................4
3.2.1 Bernoulli Distribution (P57) ...............................................................................................................4
3.2.2 Binomial Distribution (P59) ...............................................................................................................4
3.3 Continuous Verdelingen (P60) ....................................................................................................................5
3.3.1 Uniforme verdeling (P60) ..................................................................................................................5
3.3.2 Normaal verdeling/model (Gaussian Distribution) (P62) ..................................................................5
3.3.3 Chi verdeling (P69).............................................................................................................................6
3.3.4 Chi kwadraat verdeling (1 parameter) (P70) .....................................................................................6
3.3.6 Student t-verdeling (P79) ..................................................................................................................7
3.3.7 Fisher F-verdeling (P82) .....................................................................................................................7
4.1 Types van datagegevens (P89) ....................................................................................................................9
4.1.1 Kwalitatieve gegevens (P89) ............................................................................................................9
4.1.2. kwantitatieve gegevens (P89) .........................................................................................................9
4.2 Kwalitatieve data (P90) ............................................................................................................................ 10
4.2.2 Frequency Plot (Bar Plot) (P90) ...................................................................................................... 10
4.3.3 Frequentietabel (P92) ..................................................................................................................... 10
4.2.4 Contingency tabel (P94) ................................................................................................................. 10
4.2.5 Binomial Classifications Metrics (P95) ............................................................................................ 10
4.3 Kwantitatieve data (P97) .......................................................................................................................... 11
4.3.1 Stem-and-Leaf Plot (P97) ................................................................................................................ 11
4.3.2 Histogram (P98) .............................................................................................................................. 11
4.3.3 Quantiles (P103) ............................................................................................................................. 11
4.3.4 Central Tendency (P110) ................................................................................................................ 12
4.3.5 Variability (P127) ............................................................................................................................ 14
4.3.6 Skewness & Kurtosis (P136) ........................................................................................................... 14
4.3.8 Notched Boxplot (P147) ................................................................................................................. 15
4.3.9 Scatterplot (P151) ........................................................................................................................... 17
4.3.10 Pearson Correlation (P152) .......................................................................................................... 17
4.3.11 Rank Correlation (P157)................................................................................................................ 18
4.3.12 Partial Pearson Correlation (P161) ............................................................................................... 18
4.3.13 Simple Linear Regression (P163) BELANGRIJK .............................................................................. 19
4.3.15 Quantile-Quantile Plot (QQ Plot) (P168) ...................................................................................... 19

, 1

4.3.17 Probability Plot Correlation Coefficient Plot (PPCC Plot) (P171) .................................................. 19
4.3.18 Kernel Density Estimation (P173) ................................................................................................. 20
4.3.19 Bivariate Kernel Density Plot (P177) ............................................................................................. 20
4.3.20 Bootstrap Plot (Central Tendency) (P179) .................................................................................... 20
4.3.21 Survey Scores Rank Order Comparison (SSROC) (P183) ............................................................... 21
4.3.22 Cronbach Alpha (P186) ................................................................................................................. 22
4.4 Kwantitatieve data met tijdsdimensie (Time Series) (P188) ................................................................... 23
4.4.1 Equi-distant Time Series (P188) ...................................................................................................... 23
4.4.2 Time Series Plot (Run Sequence Plot) (P189) ................................................................................. 23
4.4.3 Mean Plot (P191) ............................................................................................................................ 23
4.4.4 Blocked Bootstrap Plot (Central Tendency) (P196) ........................................................................ 24
4.4.5 Standard Deviation-Mean Plot (P199) ............................................................................................ 24
4.4.6 Variance Reduction Matrix (P202).................................................................................................. 24
4.4.7 (Partial) Autocorrelation Function (P204) ...................................................................................... 25
4.4.8 Periodogram & Cumulative Periodogram (P209) ........................................................................... 26
5.8 The central limit theorem (revisited) (P247) ............................................................. 30
5.9 Statistical test of the population mean with known variance (P248) .................................................... 30
5.17 Hypothesis tsting for research purposes (P289) .................................................................................... 31
5.17.1 One Sample t-test (P289) ............................................................................................................. 31
5.17.2 Skewness & Kurtosis tests (P292) ................................................................................................. 32
5.17.3 Paired Two sample t-Test (P294) .................................................................................................. 34
5.17.4 Wilcoxon Signed-Rank Test (P297) ............................................................................................... 34
5.17.5 Unpaired Two Sample t-Test (P300) ............................................................................................. 35
5.17.6 Unpaired Two Sample Welch Test (P304) .................................................................................... 36
5.17.7 Mann-Whitney U-Test (Wilcoxon Rank-Sum Test) (P305) ........................................................... 36
5.17.8 Bayesian Two Sample Test (P308) -> niet gebruiken. .................................................................. 36
5.17.9 Median Test based on Nothed Boxplots (313) ............................................................................. 36
5.17.10 Chi-Squared Tests for Count Data (313) ..................................................................................... 37
5.17.11 One Way Analysis of Variance (1-way ANOVA) (P317) .............................................................. 38
5.17.12 Two Way Analysis of Variance (2-way ANOVA) (P321) .............................................................. 39
5.17.13 Testing Correlation (P236) .......................................................................................................... 40
5.17.14 A Note on Causality (P326) ......................................................................................................... 41
6.1 Simple Linear Regression Model (SLRM) (P333) ...................................................................................... 44
6.2 Multiple Linear Regression Model (MLRM) (P338) ................................................................................. 45
6.3 Hypothesis Testing with Linear Regression Models (from a Practical Point of View (P344) ................. 48

, 2

6.3.1 Relatie tussen Linear Regression Models en ANOVA (P344).......................................................... 48
6.3.2 Testen Regression Model Assumpties (P347) ................................................................................ 48
6.3.3 Testen van regressive coëfficiënten (P351).................................................................................... 50
6.3.4 Misspecificatie in regressie (P352) !!!!! .......................................................................................... 50
6.3.5 Multicollineariteit in regressie (P353) ............................................................................................ 50
7.3 Decomposition of Time Series (P360) ...................................................................................................... 62
7.3.1 Classical Decomposition of Time Series by Moving Averages (P360) ............................................ 62
7.3.2 Seasonal Decomposition of Time Series by Loess (P364) ............................................................... 63
= geavanceerder alternatief voor voorgaand model, maar weinig verschil. ............. 63
7.3.3 Decomposition by Structural Time Series Models (P366) .............................................................. 63
7.4 Ad hoc Forecasting of Time Series (P371) ................................................................................................ 64
7.4.1 Regression Analysis of Time Series (P371) ..................................................................................... 64
7.4.2 Smoothing Models (P376) .............................................................................................................. 65
8.2 data (P385) ................................................................................................................................................ 67
8.3 Theoretical concepts (P387) ..................................................................................................................... 67
8.3.0.1 Stationaliteit (P387) .................................................................................................................... 67
8.3.1 White Noise (Witte ruis) (P388) ..................................................................................................... 67
8.4 Stationarity (P391) .................................................................................................................................... 68
8.4.1 Stationariteit in het gemiddelde (P391) ......................................................................................... 68
8.4.2 Stationariteit in de variantie (P403) ............................................................................................... 68
8.5 Identifying ARMA parameters (P415) ...................................................................................................... 70
8.5.1 AR (1) Model (P415) ....................................................................................................................... 70
8.6 Estimating ARMA Parameters and Residual Diagnostics (P418) ............................................................. 70
8.7 Forecasting with ARIMA models (P422) ................................................................................................... 72

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper isabeltseyen. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €3,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 52510 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€3,49  8x  verkocht
  • (0)
In winkelwagen
Toegevoegd