Management Science HC
H1/2/3:
Er zijn drie verschillende voorspelmodellen:
1. Causale modellen: Deze modellen maken voorspellingen op basis van
verklarende variabelen die een oorzakelijk verband hebben met de
voorspellingsvariabele. Dit betekent dat er een oorzaak-gevolgrelatie is
tussen de verklarende variabele (x) en de te voorspellen variabele (y). Hoe
meer van deze oorzakelijke variabelen worden meegenomen in het model,
hoe beter het verband kan worden verklaard. De verklarende variabelen
moeten echter altijd vooraf gemeten worden, voordat de
voorspellingsvariabele bekend is.
2. Correlatiemodellen: In plaats van oorzakelijke verbanden te leggen,
kijken correlatiemodellen naar de samenhang tussen variabelen. Hierbij
worden waarschijnlijkheden omgezet in hypothesen. Een samenhang die in
het verleden heeft bestaan, hoeft niet noodzakelijkerwijs in de toekomst te
blijven bestaan, aangezien variabelen die eerder een rol speelden nu
misschien geen invloed meer hebben. Het model richt zich dus op
verbanden tussen variabelen zonder per se een oorzakelijk verband te
veronderstellen.
3. Autocorrelatiemodellen: Deze modellen gebruiken eerdere waarden van
dezelfde variabele om een voorspelling te doen, bijvoorbeeld het
voorspellen van het weer van vandaag op basis van het weer van gisteren.
Hoewel dit model een zekere mate van samenhang kan aantonen, blijft het
gebaseerd op waarschijnlijkheden. De wegingsfactoren die worden
gebruikt om de variabelen te beoordelen, worden "parameters" genoemd.
Regressieanalyse
In een regressiemodel, met name het lineaire regressiemodel, voorspelt de
verklarende variabele (x) de afhankelijke variabele (y). Het model wordt
weergegeven als:
Y = a + bX.
waarbij 'b' de richtingscoëfficiënt is en aangeeft hoe sterk y verandert wanneer x
verandert. Als 'b' dicht bij 0 ligt, heeft x weinig invloed op y, en is x dus niet
significant. De mate van samenhang tussen x en y kan worden uitgedrukt door
de correlatiecoëfficiënt (r). Een waarde van r dicht bij 0 geeft aan dat er geen
samenhang is, terwijl r dicht bij +1 een sterke positieve correlatie aangeeft, en r
dicht bij -1 een sterke negatieve correlatie. Als b negatief is, is er sprake van een
negatieve correlatie tussen x en y.
Tot slot, de p-waarde geeft de statistische significantie aan. Als deze waarde voor
de verklarende variabele x kleiner is dan 0,05, dan is x significant en wijkt deze
duidelijk af van 0, wat betekent dat x invloed heeft op y.
Autocorrelatiemodellen verschillen van elkaar op drie belangrijke punten:
1. Het aantal eerdere waarnemingen dat wordt meegenomen bij het maken
van een voorspelling, ook wel de ‘span’ genoemd.
, 2. De gewichten (parameters) die aan eerdere waarnemingen worden
toegekend.
3. De patronen die in de data worden verondersteld, zoals trends of
seizoensinvloeden.
Minder eenvoudige (niet-naïeve) autocorrelatiemodellen maken gebruik van meer
gegevens uit het verleden om een nauwkeurigere voorspelling te berekenen. We
onderscheiden drie belangrijke groepen van autocorrelatiemodellen:
Autoregressiemodellen: deze passen regressie toe op eerdere
waarnemingen om voorspellingen te maken.
Moving Average-modellen: deze berekenen de voorspelling op basis van
het voortschrijdend gemiddelde van de meest recente waarnemingen.
Exponential Smoothing-modellen: deze gebruiken een gewogen som
van alle eerdere waarnemingen om een voorspelling te berekenen, waarbij
meer recente waarnemingen een zwaarder gewicht krijgen.
Autoregressiemodellen:
Autoregressiemodellen gebruiken eerdere waarnemingen (Y1, ..., Yt) om een
voorspelling te doen voor periode t + i, waarbij i ten minste 1 moet zijn. Het
aantal eerdere waarnemingen dat een eigen gewicht krijgt, kan variëren tussen
verschillende modellen.
Moving Average-modellen:
Moving Average-modellen gebruiken het gemiddelde van de meest recente
waarnemingen als voorspelling voor de volgende periode. Het aantal recente
waarnemingen dat wordt meegenomen, heet de ‘span’. Een span van 1 resulteert
in een naïef voorspelmodel, waarbij alleen de laatste waarneming wordt gebruikt.
Exponential Smoothing-modellen:
Deze modellen berekenen de voorspelling op basis van een gewogen gemiddelde
van alle eerdere waarnemingen, waarbij meer recente waarnemingen een
zwaarder gewicht krijgen. Het hoogste gewicht, de smoothing-constante (α),
wordt toegekend aan de meest recente waarneming. De waarde van α ligt
doorgaans tussen 0.1 en 0.4. Als hogere waarden voor α betere voorspellingen
geven, kan dit duiden op een verkeerde specificatie van het model. Bij
Exponential Smoothing-modellen met trend wordt bovendien een
trendcomponent toegevoegd, waarbij elke periode t een stijging van y met een
waarde Tt kent.
Seizoenspatronen en correcties:
Soms vertoont een tijdreeks een seizoenspatroon, waarbij het gedrag van de
data zich herhaalt na een aantal perioden. In dit geval kan een seizoensfactor (ts)
worden berekend en gebruikt om de voorspellingen voor de toekomst te
corrigeren. De waarde van de seizoensfactor ligt doorgaans dicht bij 1. Een
waarde van bijvoorbeeld 1.05 betekent dat de voorspelling met 5% naar boven
wordt bijgesteld vanwege het seizoen, terwijl een waarde van 0.95 een correctie
van 5% naar beneden aangeeft.
Voorspelfouten en nauwkeurigheid:
Het verschil tussen de werkelijke waarde en de voorspelde waarde wordt de
voorspelfout genoemd. De voorspelfout kan positief of negatief zijn. Er zijn