Optimaliseren
H13: Decision making under uncertainty
1. Deal or no deal?
→ Quizshow met koffertjes en geldbedragen koffertje kiezen
→ andere koffertjes elimineren bank doet bod deal or no deal?
→ Beslissingsboom: kans dat bank een bod doet van 300.000 = 2/3
→ Keuze? Risico-attitude van de deelnemer
2 1
- Bod aanvaarden: 𝑢(𝑘𝑙𝑒𝑖𝑛) > 𝑢(𝑔𝑟𝑜𝑜𝑡) + 𝑢(𝑔𝑒𝑒𝑛)
3 3
2 1
- Bod verwerpen: 𝑢(𝑘𝑙𝑒𝑖𝑛) < 𝑢(𝑔𝑟𝑜𝑜𝑡) + 𝑢(𝑔𝑒𝑒𝑛)
3 3
→ Nutsfunctie vb: 𝑈(𝑥) = 1 − 𝑒 𝑥/𝑅 R = risico-tolerantie
→ Bank doet bod gelijk aan verwachte waarde?
→ verlies is dubbel zo groot als potentiële extra winst
2. Decision criteria
2.1 Introductie
→ Vb: reserveren in de faculty club
- De situatie: registratie van 120 mensen rond 12u doorgeven hoeveel mensen komen eten
- De overwegingen: doorgegeven aantal > werkelijk aantal verlies geld
doorgegeven aantal < werkelijk aantal mensen geen eten
→ Actieverzameling
- Mogelijke acties: actieverzameling = A = {120, 110, 100, 90, 80, 70}
- We gaan ervanuit dat #mensen dat komt = states/toestanden = S = {70, 80, 90, 100, 110, 120}
- In dit geval: S = A (niet altijd zo)
→ Kost van verschil tussen actie en toestand
- Kwantificeren van de overwegingen?
- 1 maaltijd = €10 vs. niet beschikbaar hebben van een maaltijd = €1000
2.2 Kostentabel
→ = elke rij correspondeert met een mogelijke actie, elke kolom met een mog toestand
→ Een cel geeft kosten weer van de corresponderende actie en toestand
→ kosten ve cel = (actie x 100) + max(toestand – actie, 0) x 1000
Vb: a5 en s4 80 mensen doorgegeven = 10 geen eten
→ 4 criteria voor oplossing te kiezen
1) Verwachte waarde = beschikt over kansverdeling vd toestanden
→ Kies de actie met de beste verwachte waarde (laagste kost)
2) Maximin = actie kiezen waarvan hoogste kosten minimaal zijn
- Voor elke mogelijke actie, de slechtst mogelijke uitkomst aanduiden
- Kies nu de minst slechte situatie = oplossing = a1 120 maaltijden bestellen
3) Maximax = actie kiezen waarvan laagste kosten minimaal zijn
- Voor elke mogelijke actie, de best mogelijke uitkomst aanduiden
- Kies nu de beste situatie = oplossing = a6 70 maaltijden bestellen
4) Minimax regret = bepaal voor elke toestand, actie met laagste kosten
- Bepaal voor elke kolom de rij met de laagste kosten = vermijd spijt achteraf
- Stel regret matrix op = kosten – laagste kosten
→ spijt = 0 = geen spijt (beste actie gekozen)
- Pas minimax principe toe: actie waar grootste spijt min is
→ oplossing = a1 120 maaltijden bestellen
1
, 3. Utility theory
3.1 Nutsfuncties en loterijen
→ Beslisser is een optimist (maximax) of pessimist (maximin) heeft een nutsfunctie
→ Nutsfunctie opstellen door loterijen met elkaar te vergelijken
→ Voorbeeld nutsfunctie: 𝐿 = (𝑝1 , 𝑟1 ; 𝑝2 , 𝑟2 )
→ Lotterij L met reward 𝑟𝑖 en probability 𝑝𝑖
→ Vb: 2 lotterijen 𝐿1 en 𝐿2 welke prefereer je?
- 𝐸𝑉(𝐿1 ) = 10.000 < 𝐸𝑉(𝐿2 ) = 15.000
- Toch kiezen de meeste 𝐿1 verwachte opbrengst lager maar minder onzekerheid
Als je 𝐿1 prefereert over 𝐿2 𝐿1 𝑝𝐿2
Als je 𝐿2 prefereert over 𝐿1 𝐿2 𝑝𝐿1
Als je indifferent bent tussen 𝐿1 en 𝐿2 𝐿1 𝑖𝐿2 𝐿1 en 𝐿2 zijn equivalent
→ Hoe kunnen we 4 loterijen rangschikken?
- Aan elk van de uitkomsten (r), een nut toekennen (u(r))
→ Nutsfunctie kent aan elke uitkomst een getal tss 0 (slecht) en 1 (goed) toe
- Eerst best (30.000) en slechtst mogelijke (-10.000) uitkomst vinden
- Daarna voor andere uitkomst kans p bepalen zodat beslisser indifferent tav
→ u(r) = p niet bekend, maar gevraagd aan de persoon (voorkeur)
→ Simple vs compound lottery herformuleren loterijen ifv laagste/hoogste uitkomst
→ Het verwachte nut van een loterij (voor persoon met deze voorkeuren) L1 p L2 p L4 p L3
- E(U van L1)= p x u(10.000) = 1 x 0,90 = 0,90
- E(U van L2)= p x u(30.000) + (1-p) x u(0) = (1/2 x 1) + (1/2 x 0,60 )= 0,80
- E(U van L3)= p x u(0) = 1 x 0,60 = 0,60
- E(U van L4)= p x u(-10.000) + (1-p) x u(500) = 0,02 x 0 + 0,98 x 0,62 = 0,6076
3.2 5 axioma’s van Neumann en Morgenstern
→ Aan welke voorwaarden moeten de preferenties ve persoon voldoen
→ opdat kiezen van loterijen kan gebeuren op basis van het verwachte nut?
→ 5 axioma’s zijn hiervoor voldoende (niet vanbuiten begrijpen + interpreteren)
1) Complete ordening transitiviteit: als 𝑟1 > 𝑟2 𝑒𝑛 𝑟2 < 𝑟3 → 𝑟1 > 𝑟3
2) Continuïteit: als 𝑟1 (ℎ𝑜𝑜𝑔𝑠𝑡𝑒 𝑢𝑖𝑡𝑘𝑜𝑚𝑠𝑡) > 𝑟2 (𝑡𝑢𝑠𝑠𝑒𝑛𝑢𝑖𝑡𝑘𝑜𝑚𝑠𝑡) en 𝑟2 > 𝑟3 (𝑙𝑎𝑎𝑔𝑠𝑡𝑒)
→ dan is er een p (0 < p < 1) zodanig dat 𝐿1 𝑖𝐿2
3) Onafhankelijkheid: stel indifferent tss 𝑟1 en 𝑟2 en 𝑟3 andere opbrengst 𝐿1 𝑖𝐿2
4) Ongelijke kansen: stel 𝑟1 > 𝑟2 2 loterijen met enige uitkomsten 𝑟1 en 𝑟2 keuze voor 𝑟1
5) Samengestelde loterij (compound lottery): kans 𝑝𝑖 op opbrengst 𝑟𝑖
→ L’ = (p1, r1; p2, r2; … ; pn, rn) L i L’
3.3 Zekerheid en risico
→ Het zekerheidsequivalent van een loterij L = ZE(L)
- Beslisser is indifferent tussen de loterij L en het gewoon krijgen vd opbrengst ZE(L)
- Stel 𝐿1 𝑖𝐿2 𝑍𝐸(𝐿1 ) = −3400
→ De risicopremie = E(L) – ZE(L) met E(L) = verwachte opbrengst van loterij L
→ RP(L1) = E(L1) – ZE(L1) = 10000 – (- 3400) = 13400
→ Risicopreferenties
- Risico-avers: RP(L) > 0 nutsfunctie = strikt concaaf
- Risico-neutraal: RP(L) = 0 nutsfunctie = lineair
- Risico-zoekend: RP(L) < 0 nutsfunctie = strikt convex
2