De samenvatting mag op het examen gebruikt worden. Ik heb met de samenvatting een score van 19/20 behaald! Deze samenvatting is een kleinere overzichtelijke samenvatting van het document "Statistiek samenvatting alle videos" waarin alle youtube videos verwerkt zijn. Dit vak wordt ook gedoceerd in b...
Info over examen
Datasets die op het examen gebruikt worden:
“Descriptive – correlation matrices
→ “select stored dataset” → Examen1718 (komt ook 1 onderdeel van het examen)
Dit deeltje heeft betrekking op technieken die we bekijken.
Drie doelstellingen die daar getoetst worden. Je krijg een vraag.
1. Op basis van de vraag een adequate selectie maken. Een softwaremodule die daarvoor geschikt is,
selecteren.
Je hebt eigenlijk keuze tussen een 70-tal technieken. Jij moet hier de goede uitkiezen.
2. Berekening doen met juist ingevulde parameters. Output van die berekening interpreteren in termen
van de vraagstelling. Het antwoord dus vertalen in termen van wat oorspronkelijk gevraagd wordt.
3. Vraag die betrekking heeft op de assumpties. Soms mag je bepaalde technieken wel/niet gebruiken,
soms is er twijfel over. Op examen tweetal vragen waar je over moet nadenken of de onderliggende
assumpties wel voldaan zijn ja/nee. → eventueel een extra berekening/controle maken.
Dit alles is gebaseerd op deze dataset “Examen1718”.
Resid Residu’s/voorspellingsfouten die uit een model komen. (zie hoofdstuk 6)
TS1 Tijdreeksen/time series
TS2 → van belang: seizoenaliteit tijdreeks wordt gegeven
Intention_ Doelvariabelen: is iemand vrijwillig bereid om de software te gebruiken?
to_Use = intentie die de gebruiker heeft om de software te gebruiken als er geen dwang zou zijn. In welke
mate ben je bereid om die software dan te gebruiken?
Hoe wordt dit opgesteld? -> Men geeft een aantal stellingen die zijn gebaseerd op likertscores. Alles
scores worden opgeteld tot een nieuwe score.
MAAR. Herinner: je mag niet altijd likertscores optellen want het is niet altijd een kwalitatief
gegeven. Om die onduidelijkheid weg te nemen, zal je de opgetelde scores gewoon krijgen.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Relative_ Welke factoren gaan verklaren dat je een hogere intention to use (doelstelling) hebt?
Advantage Relative advantage betekent dat wanneer je twee/meer producten hebt, wat vind je dan dat de
software waar we de tevredenheid over willen weten een relatief voordeel heeft ten opzichte van
alternatieve?
→ Hoe hoger de relative advantage, hoe hoger de intention to use.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Perceived_ Niet relatief, maar absoluut gezien. Als je de software bekijkt, geeft het dan een meerwaarde? Kan
Usefulness je er iets mee doen? Je moet beoordelen of het resultaat dat je krijgt door het gebruik van de
software een waarde heeft voor jou.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Perceived_ Gebruiksvriendelijkheid van de software
Ease_of_Use → hoe hoger de ease of use, hoe hoger de intention to use.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Information De software geeft je de nodige uitleg om de software te gebruiken → ‘Help’
_Quality = berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
System_ De uitvoering van de software/berekeningen → performance
Quality vb. een trage Excel, het laden duur lang, …
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
group B B = binair → Een variabele die 0 of 1 is.
Gender B vb. group (0,1), gender (0,1)
Name C C = als je labels wilt ipv nummers.
group C vb. group (bachelor/schakel), gender (m/f), ..
gender C
age C SPSS zegt of je in het verleden al eens gebruikt hebt gemaakt spss, of je ermee vertrouwd bent of
spss C niet. Iemand die al vertrouwd is met statistische software gaat anders kijken naar de beoordeling
van een statistisch product.
De intention to use kan positief beïnvloed worden door een hoge relative advantage, usefulness, ease of
use, information quality en system quality.
Het aantal vragen per variabele zijn niet gelijk. Sommige items zijn gebaseerd op meer vragen die gesteld
zijn.
Op examen:
- Deel 1: makkelijk deel met 10-tal vragen
Dataset: examen1718
→ deze kunnen snel worden uitgevoerd door 1 berekening en interpretatie om een antwoord te geven.
- Deel 2: denkoefening
Dataset: zoals oilimport en TAM/ISSM (tijdreeksen)
→ meer werk voor je een antwoord hebt. Je moet gegevens interpreteren, model maken en eventueel nog
kijken naar de residu’s etc.
Oil import bevat een aantal belangrijke tijdreeksen. De belangrijkste is:
- barrels_purchased: aantal
- unit_ price: prijs per vat die je moet betalen
- total_value: waarde van de geïmporteerde hvlh aardolie
- cpi: consumptieprijsindex
→ hoe evalueren de gekochte vaten doorheen de tijd?
We gaan deze variabele proberen te verklaren op basis van de prijs en de cpi.
Hint: het situeert zich in een periode waar een aantal dingen zijn gebeurd op de markt.
De data van de barrels_purchased zal heel wat schommelingen bevatten. Dit gaat een rol spelen bij het
analyseren.
Rekening houden met tijdreeksaspecten en regressie-analyse.
Je gaat een regressieanalyse maken waar je verband legt met de barrels_purchased en de prijs, en de
barrels_purchased en de cpi.
Examenvraag: In welke mate gaat de unit prijs invloed hebben op de gevraagde hoeveelheid aardolie.
Delf_price = gedefleerde prijs = gecorrigeerd voor de cpi . het is de reële prijs.
Defl_price1 = gedefleerde prijs met 1 maand vertraagd.
Defl_price2 = gedefleerde prijs met 2 maanden vertraging.
4.3.17 Probability Plot Correlation Coefficient Plot (PPCC Plot) (P171) .................................................. 19
4.3.18 Kernel Density Estimation (P173) ................................................................................................. 20
4.3.19 Bivariate Kernel Density Plot (P177) ............................................................................................. 20
4.3.20 Bootstrap Plot (Central Tendency) (P179) .................................................................................... 20
4.3.21 Survey Scores Rank Order Comparison (SSROC) (P183) ............................................................... 21
4.3.22 Cronbach Alpha (P186) ................................................................................................................. 22
4.4 Kwantitatieve data met tijdsdimensie (Time Series) (P188) ................................................................... 23
4.4.1 Equi-distant Time Series (P188) ...................................................................................................... 23
4.4.2 Time Series Plot (Run Sequence Plot) (P189) ................................................................................. 23
4.4.3 Mean Plot (P191) ............................................................................................................................ 23
4.4.4 Blocked Bootstrap Plot (Central Tendency) (P196) ........................................................................ 24
4.4.5 Standard Deviation-Mean Plot (P199) ............................................................................................ 24
4.4.6 Variance Reduction Matrix (P202).................................................................................................. 24
4.4.7 (Partial) Autocorrelation Function (P204) ...................................................................................... 25
4.4.8 Periodogram & Cumulative Periodogram (P209) ........................................................................... 26
5.8 The central limit theorem (revisited) (P247) ............................................................. 30
5.9 Statistical test of the population mean with known variance (P248) .................................................... 30
5.17 Hypothesis tsting for research purposes (P289) .................................................................................... 31
5.17.1 One Sample t-test (P289) ............................................................................................................. 31
5.17.2 Skewness & Kurtosis tests (P292) ................................................................................................. 32
5.17.3 Paired Two sample t-Test (P294) .................................................................................................. 34
5.17.4 Wilcoxon Signed-Rank Test (P297) ............................................................................................... 34
5.17.5 Unpaired Two Sample t-Test (P300) ............................................................................................. 35
5.17.6 Unpaired Two Sample Welch Test (P304) .................................................................................... 36
5.17.7 Mann-Whitney U-Test (Wilcoxon Rank-Sum Test) (P305) ........................................................... 36
5.17.8 Bayesian Two Sample Test (P308) -> niet gebruiken. .................................................................. 36
5.17.9 Median Test based on Nothed Boxplots (313) ............................................................................. 36
5.17.10 Chi-Squared Tests for Count Data (313) ..................................................................................... 37
5.17.11 One Way Analysis of Variance (1-way ANOVA) (P317) .............................................................. 38
5.17.12 Two Way Analysis of Variance (2-way ANOVA) (P321) .............................................................. 39
5.17.13 Testing Correlation (P236) .......................................................................................................... 40
5.17.14 A Note on Causality (P326) ......................................................................................................... 41
6.1 Simple Linear Regression Model (SLRM) (P333) ...................................................................................... 44
6.2 Multiple Linear Regression Model (MLRM) (P338) ................................................................................. 45
6.3 Hypothesis Testing with Linear Regression Models (from a Practical Point of View (P344) ................. 48
, 2
6.3.1 Relatie tussen Linear Regression Models en ANOVA (P344).......................................................... 48
6.3.2 Testen Regression Model Assumpties (P347) ................................................................................ 48
6.3.3 Testen van regressive coëfficiënten (P351).................................................................................... 50
6.3.4 Misspecificatie in regressie (P352) !!!!! .......................................................................................... 50
6.3.5 Multicollineariteit in regressie (P353) ............................................................................................ 50
7.3 Decomposition of Time Series (P360) ...................................................................................................... 62
7.3.1 Classical Decomposition of Time Series by Moving Averages (P360) ............................................ 62
7.3.2 Seasonal Decomposition of Time Series by Loess (P364) ............................................................... 63
= geavanceerder alternatief voor voorgaand model, maar weinig verschil. ............. 63
7.3.3 Decomposition by Structural Time Series Models (P366) .............................................................. 63
7.4 Ad hoc Forecasting of Time Series (P371) ................................................................................................ 64
7.4.1 Regression Analysis of Time Series (P371) ..................................................................................... 64
7.4.2 Smoothing Models (P376) .............................................................................................................. 65
8.2 data (P385) ................................................................................................................................................ 67
8.3 Theoretical concepts (P387) ..................................................................................................................... 67
8.3.0.1 Stationaliteit (P387) .................................................................................................................... 67
8.3.1 White Noise (Witte ruis) (P388) ..................................................................................................... 67
8.4 Stationarity (P391) .................................................................................................................................... 68
8.4.1 Stationariteit in het gemiddelde (P391) ......................................................................................... 68
8.4.2 Stationariteit in de variantie (P403) ............................................................................................... 68
8.5 Identifying ARMA parameters (P415) ...................................................................................................... 70
8.5.1 AR (1) Model (P415) ....................................................................................................................... 70
8.6 Estimating ARMA Parameters and Residual Diagnostics (P418) ............................................................. 70
8.7 Forecasting with ARIMA models (P422) ................................................................................................... 72
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller isabeltseyen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.74. You're not tied to anything after your purchase.