De samenvatting mag op het examen gebruikt worden. Ik heb met de samenvatting een score van 19/20 behaald! Deze samenvatting is een kleinere overzichtelijke samenvatting van het document "Statistiek samenvatting alle videos" waarin alle youtube videos verwerkt zijn. Dit vak wordt ook gedoceerd in b...
Info over examen
Datasets die op het examen gebruikt worden:
“Descriptive – correlation matrices
→ “select stored dataset” → Examen1718 (komt ook 1 onderdeel van het examen)
Dit deeltje heeft betrekking op technieken die we bekijken.
Drie doelstellingen die daar getoetst worden. Je krijg een vraag.
1. Op basis van de vraag een adequate selectie maken. Een softwaremodule die daarvoor geschikt is,
selecteren.
Je hebt eigenlijk keuze tussen een 70-tal technieken. Jij moet hier de goede uitkiezen.
2. Berekening doen met juist ingevulde parameters. Output van die berekening interpreteren in termen
van de vraagstelling. Het antwoord dus vertalen in termen van wat oorspronkelijk gevraagd wordt.
3. Vraag die betrekking heeft op de assumpties. Soms mag je bepaalde technieken wel/niet gebruiken,
soms is er twijfel over. Op examen tweetal vragen waar je over moet nadenken of de onderliggende
assumpties wel voldaan zijn ja/nee. → eventueel een extra berekening/controle maken.
Dit alles is gebaseerd op deze dataset “Examen1718”.
Resid Residu’s/voorspellingsfouten die uit een model komen. (zie hoofdstuk 6)
TS1 Tijdreeksen/time series
TS2 → van belang: seizoenaliteit tijdreeks wordt gegeven
Intention_ Doelvariabelen: is iemand vrijwillig bereid om de software te gebruiken?
to_Use = intentie die de gebruiker heeft om de software te gebruiken als er geen dwang zou zijn. In welke
mate ben je bereid om die software dan te gebruiken?
Hoe wordt dit opgesteld? -> Men geeft een aantal stellingen die zijn gebaseerd op likertscores. Alles
scores worden opgeteld tot een nieuwe score.
MAAR. Herinner: je mag niet altijd likertscores optellen want het is niet altijd een kwalitatief
gegeven. Om die onduidelijkheid weg te nemen, zal je de opgetelde scores gewoon krijgen.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Relative_ Welke factoren gaan verklaren dat je een hogere intention to use (doelstelling) hebt?
Advantage Relative advantage betekent dat wanneer je twee/meer producten hebt, wat vind je dan dat de
software waar we de tevredenheid over willen weten een relatief voordeel heeft ten opzichte van
alternatieve?
→ Hoe hoger de relative advantage, hoe hoger de intention to use.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Perceived_ Niet relatief, maar absoluut gezien. Als je de software bekijkt, geeft het dan een meerwaarde? Kan
Usefulness je er iets mee doen? Je moet beoordelen of het resultaat dat je krijgt door het gebruik van de
software een waarde heeft voor jou.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Perceived_ Gebruiksvriendelijkheid van de software
Ease_of_Use → hoe hoger de ease of use, hoe hoger de intention to use.
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
Information De software geeft je de nodige uitleg om de software te gebruiken → ‘Help’
_Quality = berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
System_ De uitvoering van de software/berekeningen → performance
Quality vb. een trage Excel, het laden duur lang, …
= berekende resultaten uit een bevraging→ voorspelt welk de succesfactoren zijn van software
group B B = binair → Een variabele die 0 of 1 is.
Gender B vb. group (0,1), gender (0,1)
Name C C = als je labels wilt ipv nummers.
group C vb. group (bachelor/schakel), gender (m/f), ..
gender C
age C SPSS zegt of je in het verleden al eens gebruikt hebt gemaakt spss, of je ermee vertrouwd bent of
spss C niet. Iemand die al vertrouwd is met statistische software gaat anders kijken naar de beoordeling
van een statistisch product.
De intention to use kan positief beïnvloed worden door een hoge relative advantage, usefulness, ease of
use, information quality en system quality.
Het aantal vragen per variabele zijn niet gelijk. Sommige items zijn gebaseerd op meer vragen die gesteld
zijn.
Op examen:
- Deel 1: makkelijk deel met 10-tal vragen
Dataset: examen1718
→ deze kunnen snel worden uitgevoerd door 1 berekening en interpretatie om een antwoord te geven.
- Deel 2: denkoefening
Dataset: zoals oilimport en TAM/ISSM (tijdreeksen)
→ meer werk voor je een antwoord hebt. Je moet gegevens interpreteren, model maken en eventueel nog
kijken naar de residu’s etc.
Oil import bevat een aantal belangrijke tijdreeksen. De belangrijkste is:
- barrels_purchased: aantal
- unit_ price: prijs per vat die je moet betalen
- total_value: waarde van de geïmporteerde hvlh aardolie
- cpi: consumptieprijsindex
→ hoe evalueren de gekochte vaten doorheen de tijd?
We gaan deze variabele proberen te verklaren op basis van de prijs en de cpi.
Hint: het situeert zich in een periode waar een aantal dingen zijn gebeurd op de markt.
De data van de barrels_purchased zal heel wat schommelingen bevatten. Dit gaat een rol spelen bij het
analyseren.
Rekening houden met tijdreeksaspecten en regressie-analyse.
Je gaat een regressieanalyse maken waar je verband legt met de barrels_purchased en de prijs, en de
barrels_purchased en de cpi.
Examenvraag: In welke mate gaat de unit prijs invloed hebben op de gevraagde hoeveelheid aardolie.
Delf_price = gedefleerde prijs = gecorrigeerd voor de cpi . het is de reële prijs.
Defl_price1 = gedefleerde prijs met 1 maand vertraagd.
Defl_price2 = gedefleerde prijs met 2 maanden vertraging.
4.3.17 Probability Plot Correlation Coefficient Plot (PPCC Plot) (P171) .................................................. 19
4.3.18 Kernel Density Estimation (P173) ................................................................................................. 20
4.3.19 Bivariate Kernel Density Plot (P177) ............................................................................................. 20
4.3.20 Bootstrap Plot (Central Tendency) (P179) .................................................................................... 20
4.3.21 Survey Scores Rank Order Comparison (SSROC) (P183) ............................................................... 21
4.3.22 Cronbach Alpha (P186) ................................................................................................................. 22
4.4 Kwantitatieve data met tijdsdimensie (Time Series) (P188) ................................................................... 23
4.4.1 Equi-distant Time Series (P188) ...................................................................................................... 23
4.4.2 Time Series Plot (Run Sequence Plot) (P189) ................................................................................. 23
4.4.3 Mean Plot (P191) ............................................................................................................................ 23
4.4.4 Blocked Bootstrap Plot (Central Tendency) (P196) ........................................................................ 24
4.4.5 Standard Deviation-Mean Plot (P199) ............................................................................................ 24
4.4.6 Variance Reduction Matrix (P202).................................................................................................. 24
4.4.7 (Partial) Autocorrelation Function (P204) ...................................................................................... 25
4.4.8 Periodogram & Cumulative Periodogram (P209) ........................................................................... 26
5.8 The central limit theorem (revisited) (P247) ............................................................. 30
5.9 Statistical test of the population mean with known variance (P248) .................................................... 30
5.17 Hypothesis tsting for research purposes (P289) .................................................................................... 31
5.17.1 One Sample t-test (P289) ............................................................................................................. 31
5.17.2 Skewness & Kurtosis tests (P292) ................................................................................................. 32
5.17.3 Paired Two sample t-Test (P294) .................................................................................................. 34
5.17.4 Wilcoxon Signed-Rank Test (P297) ............................................................................................... 34
5.17.5 Unpaired Two Sample t-Test (P300) ............................................................................................. 35
5.17.6 Unpaired Two Sample Welch Test (P304) .................................................................................... 36
5.17.7 Mann-Whitney U-Test (Wilcoxon Rank-Sum Test) (P305) ........................................................... 36
5.17.8 Bayesian Two Sample Test (P308) -> niet gebruiken. .................................................................. 36
5.17.9 Median Test based on Nothed Boxplots (313) ............................................................................. 36
5.17.10 Chi-Squared Tests for Count Data (313) ..................................................................................... 37
5.17.11 One Way Analysis of Variance (1-way ANOVA) (P317) .............................................................. 38
5.17.12 Two Way Analysis of Variance (2-way ANOVA) (P321) .............................................................. 39
5.17.13 Testing Correlation (P236) .......................................................................................................... 40
5.17.14 A Note on Causality (P326) ......................................................................................................... 41
6.1 Simple Linear Regression Model (SLRM) (P333) ...................................................................................... 44
6.2 Multiple Linear Regression Model (MLRM) (P338) ................................................................................. 45
6.3 Hypothesis Testing with Linear Regression Models (from a Practical Point of View (P344) ................. 48
, 2
6.3.1 Relatie tussen Linear Regression Models en ANOVA (P344).......................................................... 48
6.3.2 Testen Regression Model Assumpties (P347) ................................................................................ 48
6.3.3 Testen van regressive coëfficiënten (P351).................................................................................... 50
6.3.4 Misspecificatie in regressie (P352) !!!!! .......................................................................................... 50
6.3.5 Multicollineariteit in regressie (P353) ............................................................................................ 50
7.3 Decomposition of Time Series (P360) ...................................................................................................... 62
7.3.1 Classical Decomposition of Time Series by Moving Averages (P360) ............................................ 62
7.3.2 Seasonal Decomposition of Time Series by Loess (P364) ............................................................... 63
= geavanceerder alternatief voor voorgaand model, maar weinig verschil. ............. 63
7.3.3 Decomposition by Structural Time Series Models (P366) .............................................................. 63
7.4 Ad hoc Forecasting of Time Series (P371) ................................................................................................ 64
7.4.1 Regression Analysis of Time Series (P371) ..................................................................................... 64
7.4.2 Smoothing Models (P376) .............................................................................................................. 65
8.2 data (P385) ................................................................................................................................................ 67
8.3 Theoretical concepts (P387) ..................................................................................................................... 67
8.3.0.1 Stationaliteit (P387) .................................................................................................................... 67
8.3.1 White Noise (Witte ruis) (P388) ..................................................................................................... 67
8.4 Stationarity (P391) .................................................................................................................................... 68
8.4.1 Stationariteit in het gemiddelde (P391) ......................................................................................... 68
8.4.2 Stationariteit in de variantie (P403) ............................................................................................... 68
8.5 Identifying ARMA parameters (P415) ...................................................................................................... 70
8.5.1 AR (1) Model (P415) ....................................................................................................................... 70
8.6 Estimating ARMA Parameters and Residual Diagnostics (P418) ............................................................. 70
8.7 Forecasting with ARIMA models (P422) ................................................................................................... 72
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur isabeltseyen. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €3,49. Vous n'êtes lié à rien après votre achat.