1
Voorbeeldexamen extra 1
P0S37A Thema’s uit de kwantitatieve methodologie
Academiejaar 2022-2023
1. Het Toledo-bestand VRAAG1.txt in de folder “Cursusdocumenten / Gegevensbestanden / Oefeningen
voorbeeldexamen extra 1” bevat 1000 observaties voor drie variabelen: ONGEVAL, VERKOOP en INTERVEN. De
1000 observaties voor de variabele ONGEVAL geven het aantal fietsongevallen per dag gedurende 1000 dagen in
België weer. De 1000 observaties voor de variabele VERKOOP geven het aantal verkochte fietsen per dag
gedurende die 1000 dagen in België weer. De variabele INTERVEN is een dichotome variabele die de waarde 0
heeft gedurende de eerste 500 dagen en de waarde 1 gedurende de laatste 500 dagen. Deze laatste variabele is
aan het bestand toegevoegd omdat er gedurende de laatste 500 dagen een grootschalige nationale educatieve
campagne liep om het aantal fietsongevallen te doen afnemen.
Veronderstel dat aan jou wordt gevraagd om het effect van die educatieve campagne te onderzoeken. Maak
gebruik van een ARIMA-interventiemodel om na te gaan of de educatieve campagne een statistisch significant
effect op het aantal fietsongevallen per dag heeft. De gegevens kunnen in R worden ingelezen met de instructie
read.table(file.choose(new=FALSE))
Beantwoord de volgende vragen:
(a) Welk ARIMA model past bij de tijdreeks van het aantal ongevallen en wat zijn de parameterschat tingen en de
standaardfouten van de parameters in dit model?
(b) Is er een statistisch significant effect van de educatieve campagne op het aantal fietsongevallen per dag als het
5% significantieniveau zou worden gehanteerd? Hoe kan je dat in de uitvoer aflezen?
(c) Gebruik samen met het ARIMA-interventiemodel bovendien een ARIMA-transfermodel om de samenhang
tussen het aantal fietsongevallen per dag en het aantal verkochte fietsen per dag te onderzoeken. Wat valt op in
de crosscorrelatie plot?
(d) Is er een statistisch significante lineaire samenhang tussen het aantal fietsongevallen per dag en het aantal
verkochte fietsen per dag als het 5% significantieniveau zou worden gehanteerd? Hoe kan je dat in de uitvoer
aflezen?
Tijdreeksanalyse
A) Welk ARIMA model past bij de tijdreeks van het aantal ongevallen en
wat zijn de parameterschattingen en de standaardfouten van de parameters in dit model?
Een ARIMA(0,0,1) model past bij de tijdreeks van het aantal fietsongevallen. De parameterschattingen zijn −0.5859
voor de moving average parameter en 995.6038 voor het intercept. De standaardfouten bedragen 0.0250 voor de
moving average parameter en 1.2738 voor het intercept.
Script
#Stap 1
>Oef1 <- read.table(file.choose(new=FALSE))
>Oef1
#Stap 2
> acf(Oef1$ONGEVAL,plot=FALSE)
, 2
> acf(Oef1$ONGEVAL)
#Stap 3
> pacf(Oef1$ONGEVAL,plot=FALSE)
> pacf(Oef1$ONGEVAL)
Het patroon in de autocorrelaties en partiële autocorrelaties is indicatief voor een moving average model, dus we
proberen het meest eenvoudige eerst:
#Stap 4
> model1 <- arima(oef1,order=c(1,0,0))
> model1
> tsdiag(model1)
Dit model lijkt meteen relatief goed bij de gegevens aan te sluiten.
, 3
Om het effect van de interventie na te gaan, moet een predictor worden toegevoegd:
#Stap 5
>Model2 <- arima(Oef1$ONGEVAL,order=c(0,0,1),xreg=Oef1$INTERVEN)
>Model2
>tsdiag(Model2)
Het model blijft goed bij de gegevens passen en dus kunnen we de volgende uitvoer gebruiken om het effect van de
interventie te toetsen
Om een transfermodel toe te voegen, bekijk je best eerst de crosscorrelaties:
#Stap 6
> ccf(Oef1$ONGEVAL,Oef1$VERKOOP,plot=FALSE)
Voorbeeldexamen extra 1
P0S37A Thema’s uit de kwantitatieve methodologie
Academiejaar 2022-2023
1. Het Toledo-bestand VRAAG1.txt in de folder “Cursusdocumenten / Gegevensbestanden / Oefeningen
voorbeeldexamen extra 1” bevat 1000 observaties voor drie variabelen: ONGEVAL, VERKOOP en INTERVEN. De
1000 observaties voor de variabele ONGEVAL geven het aantal fietsongevallen per dag gedurende 1000 dagen in
België weer. De 1000 observaties voor de variabele VERKOOP geven het aantal verkochte fietsen per dag
gedurende die 1000 dagen in België weer. De variabele INTERVEN is een dichotome variabele die de waarde 0
heeft gedurende de eerste 500 dagen en de waarde 1 gedurende de laatste 500 dagen. Deze laatste variabele is
aan het bestand toegevoegd omdat er gedurende de laatste 500 dagen een grootschalige nationale educatieve
campagne liep om het aantal fietsongevallen te doen afnemen.
Veronderstel dat aan jou wordt gevraagd om het effect van die educatieve campagne te onderzoeken. Maak
gebruik van een ARIMA-interventiemodel om na te gaan of de educatieve campagne een statistisch significant
effect op het aantal fietsongevallen per dag heeft. De gegevens kunnen in R worden ingelezen met de instructie
read.table(file.choose(new=FALSE))
Beantwoord de volgende vragen:
(a) Welk ARIMA model past bij de tijdreeks van het aantal ongevallen en wat zijn de parameterschat tingen en de
standaardfouten van de parameters in dit model?
(b) Is er een statistisch significant effect van de educatieve campagne op het aantal fietsongevallen per dag als het
5% significantieniveau zou worden gehanteerd? Hoe kan je dat in de uitvoer aflezen?
(c) Gebruik samen met het ARIMA-interventiemodel bovendien een ARIMA-transfermodel om de samenhang
tussen het aantal fietsongevallen per dag en het aantal verkochte fietsen per dag te onderzoeken. Wat valt op in
de crosscorrelatie plot?
(d) Is er een statistisch significante lineaire samenhang tussen het aantal fietsongevallen per dag en het aantal
verkochte fietsen per dag als het 5% significantieniveau zou worden gehanteerd? Hoe kan je dat in de uitvoer
aflezen?
Tijdreeksanalyse
A) Welk ARIMA model past bij de tijdreeks van het aantal ongevallen en
wat zijn de parameterschattingen en de standaardfouten van de parameters in dit model?
Een ARIMA(0,0,1) model past bij de tijdreeks van het aantal fietsongevallen. De parameterschattingen zijn −0.5859
voor de moving average parameter en 995.6038 voor het intercept. De standaardfouten bedragen 0.0250 voor de
moving average parameter en 1.2738 voor het intercept.
Script
#Stap 1
>Oef1 <- read.table(file.choose(new=FALSE))
>Oef1
#Stap 2
> acf(Oef1$ONGEVAL,plot=FALSE)
, 2
> acf(Oef1$ONGEVAL)
#Stap 3
> pacf(Oef1$ONGEVAL,plot=FALSE)
> pacf(Oef1$ONGEVAL)
Het patroon in de autocorrelaties en partiële autocorrelaties is indicatief voor een moving average model, dus we
proberen het meest eenvoudige eerst:
#Stap 4
> model1 <- arima(oef1,order=c(1,0,0))
> model1
> tsdiag(model1)
Dit model lijkt meteen relatief goed bij de gegevens aan te sluiten.
, 3
Om het effect van de interventie na te gaan, moet een predictor worden toegevoegd:
#Stap 5
>Model2 <- arima(Oef1$ONGEVAL,order=c(0,0,1),xreg=Oef1$INTERVEN)
>Model2
>tsdiag(Model2)
Het model blijft goed bij de gegevens passen en dus kunnen we de volgende uitvoer gebruiken om het effect van de
interventie te toetsen
Om een transfermodel toe te voegen, bekijk je best eerst de crosscorrelaties:
#Stap 6
> ccf(Oef1$ONGEVAL,Oef1$VERKOOP,plot=FALSE)