Strategy, an introduction to Game Theory - Watson
Chapter 2 - The extensive form
Om een strategische interactie tussen dingen te representeren kan een boom gebruikt worden. In de
boom zitten knopen en takken. Knooppunten staan voor plaatsen waar iets gebeurt in het spel (bijv.
een beslissing van één van de spelers) en takken geven de verschillende acties aan die de spelers
kunnen kiezen. Knooppunten zijn cirkels en takken zijn pijlen die de knooppunten verbinden. Een
goed geconstrueerde boom wordt een uitgebreide vorm van representatie genoemd.
Het initiële knooppunt is het begin van het spel, hiervan is er in elke boom maar één. Bij het
knooppunt staat het initiaal van de speler die de beslissing moet maken. Bij de pijl staat de beslissing
die gemaakt wordt.
Vaak weten spelers niet van elkaar waar ze zich in de boom
bevinden t.o.v. elkaar. In het voorbeeld weet K bijvoorbeeld niet
of hij zich bij c of d bevindt. Het missen van informatie wordt
aangegeven met een stippellijn en het initiaal hoeft maar bij één
knooppunt.
Beslissingspunten Dit zijn de knooppunten waarop de spelers
een beslissing in het spel nemen.
Terminale knooppunten Dit zijn de knooppunten die de resultaten van het spel laten zien. Bij deze
punten eindigt het spel.
Het is gebruikelijk om de term informatie set te gebruiken om de informatie van de spelers op de
beslissingspunten in het spel te specificeren. Een informatie set beschrijft welke beslissingspunten
met elkaar verbonden zijn door stippellijnen. Elke beslissingsknooppunt is opgenomen in een
informatie set; sommige informatie sets bestaan uit slechts één knooppunt. In een informatie set
wordt wel maar één beslissing genomen.
De knooppunten kan je ook ranken op voorkeur. Het is meestal het handigst om de
voorkeursranglijst van de spelers weer te geven met getallen, die payoffs of nutsvoorzieningen
worden genoemd. Grotere uitbetalingsnummers betekenen meer
voorkeursuitkomsten.
Het eerste getal achter het knooppunt gaat om speler K en het
tweede getal gaat om speler E. Hier staan de getal voor hoeveel
miljoen winst er gemaakt kan worden.
Chapter 3 – Strategies and the normal form
In de speltheorie is het belangrijkste concept de notie van een strategie.
Strategie Een strategie is een compleet contingenteringsplan voor een speler in het spel.
Een compleet contingenteringsplan bevat een specificatie van het gedrag van de speler, welke de
acties beschrijft die de speler zou nemen.
Om een strategie te schrijven, moet je eerst de labels samenstellen die overeenkomen met de acties
die bij elke informatie set moeten worden gekozen.
1
,Gezien een spel, laten we Si de strategieruimte (ook wel de strategieset genoemd) van speler i
aanduiden. Dat wil zeggen, Si is een set die elk van de mogelijke strategieën van speler i in het spel
bevat. Voor het spel afgebeeld in Figuur 2.7(a) is de strategieruimte van speler 1 S1 = {H, L}, en de
strategieruimte van speler 2 S2 ={HH, HL, LH, LL}. We gebruiken kleine letters om enkele strategieën
aan te duiden (generieke leden van deze sets). Dus, s i ∈ Si is een strategie voor speler i in het spel.
We zouden dus bijvoorbeeld s1 = L en s2 = LH kunnen hebben.
Een strategieprofiel is een vector van strategieën, één voor elke speler. Met andere woorden, een
strategieprofiel beschrijft strategieën voor alle spelers in het spel.
Stel dat we bijvoorbeeld een spel met n spelers bestuderen. Een typisch strategieprofiel is dan een
vector s = (s1, s2, c, sn), waarbij si de strategie van speler i is, voor i = 1, 2, c, n. Laat S de set van
strategieprofielen aanduiden. Wiskundig gezien schrijven we S = S1 × S2 × c× Sn. Merk op dat het
symbool "×" staat voor het Cartesiaanse product. Gezien een enkele speler i, moeten we vaak
spreken over de strategieën die door alle andere spelers in het spel zijn gekozen. Als een kwestie van
notatie, zal het handig zijn om de term -i te gebruiken om te verwijzen naar deze spelers. Zo is s-i een
strategieprofiel voor iedereen behalve speler i:
s-i = (s1, s2, c, si-1, si+1, c, sn).
De definitie van een strategie (een compleet contingentplan) vereist een specificatie van de keuze
van speler l bij zijn tweede informatie set, zelfs in de situatie waarin hij van plan is om de pijl te
kiezen waarbij het spel eindigt, te selecteren bij zijn eerste informatie set.
Een geloof is een vermoeden over welke strategie de andere speler gebruikt; daarom moet de
strategie van speler l een voorschrift bevatten voor zijn tweede informatie set, ongeacht wat deze
strategie voorschrijft voor zijn eerste informatie set. Een strategie is ook belangrijk omdat spelers
fouten maken tijdens het spel.
The normal form
Voor elke speler i kunnen we een functie u i definiëren: S R (een functie waarvan het domein de set
van strategieprofielen is en waarvan het bereik de echte cijfers zijn) zodat, voor elk strategieprofiel s
∈ S dat de spelers konden kiezen, ui(s) is speler i's payoff in het spel. Deze functie u i wordt player i's
payoff functie genoemd. Om ui(s) te bepalen voor elk strategieprofiel s, start u gewoon bij het eerste
knooppunt en volgt u de acties die in dit strategieprofiel worden gespecificeerd.
Een handige manier om de strategievelden van de spelers en hun pay-off functies te beschrijven voor
spellen voor twee spelers waarin elke speler een eindig aantal strategieën heeft, is het tekenen van
een matrix. Elke rij van de matrix komt overeen met een strategie van speler 1, en elke kolom komt
overeen met een strategie van speler 2. Zo komt elke cel van de matrix (die een enkele rij en kolom
aanduidt) overeen met een strategieprofiel. Binnen een bepaalde cel schrijven we de pay-off vector
die met het strategieprofiel overeenkomt.
Een spel in normale vorm (ook wel strategische vorm genoemd) bestaat uit een set spelers, {1, 2, c,
n}, strategievelden voor de spelers, S1, S2 , c, Sn, en payoff-functies voor de spelers, u 1 , u2, c, un.
Zoals eerder opgemerkt, kunnen normale vormspellen voor twee spelers met eindige strategie
spaties beschreven worden door matrices. Dus, dergelijke spellen worden soms "matrix spellen"
genoemd.
2
,Classic normal-form games
In een matrix worden vaak spellen tussen twee spelers gespeeld. In veel dilemma’s zijn de spelers
afhankelijk van elkaars beslissing of ze goed uit het spel komen of niet. Bij het pareto efficiënt neemt
een speler een beslissing voor zichzelf en is de ander slechter af.
Interpretation of the normal form
Een manier om de normale vorm te bekijken is dat het een situatie modelleert waarin spelers
tegelijkertijd en onafhankelijk volledige voorwaardelijke plannen voor een uitgebreid vormspel
selecteren.
Speltheoretici hebben gedebatteerd over de vraag of de normale vorm alle relevante informatie over
strategische instellingen bevat. Zonder de argumenten te herzien, moet u zich realiseren dat er geen
discrepantie is tussen de normale en uitgebreide vormen in de instellingen waarin de spelers al hun
beslissingen nemen voordat ze observeren wat andere spelers doen, zoals het geval is bij gelijktijdige
en onafhankelijke zetten. Dergelijke spellen worden "one-shot" of "statische" spellen genoemd, en ze
zijn duidelijk goed gemodelleerd in de normale vorm.
Chapter 14 – Details of the extensive form
Knooppunten die op door de pijlen te volgen, bereikt kunnen worden, heten opvolgers van het
knooppunt waar je begint. Vertakkingen van een bepaald knooppunt zijn directe opvolgers. Analoog,
door vanuit een gegeven knooppunt de boom terug te volgen, kunt u de voorgangers van een
knooppunt en de directe voorganger definiëren.
Uiteraard is een gegeven knooppunt x een opvolger van knooppunt y als en slechts als y een
voorloper is van x. Merk ook op dat voor knooppunten x, y en z, als x een voorloper is van y en y een
voorloper van z, dan moet het zijn dat x een voorloper is van z. Dat wil zeggen dat bomen een
"transitieve voorrangsrelatie" hebben.
Het eerste knooppunt moet duidelijk het begin van de boom aanduiden en dus ligt er een regel aan
de boom:
Boomregel 1 Elke knoop is een opvolger van de initiële knoop, en de initiële knoop is de enige met
deze eigenschap.
Een pad door de boom is een opvolging van knooppunten, welke begint met de initiële knoop,
eindigt met de terminale knoop en heeft de eigenschap dat de opeenvolgende knooppunten in de
reeks directe opvolgers van elkaar zijn.
Elke terminale knoop beschrijft een compleet en uniek pad. Twee paden kunnen dus niet kruizen.
Boomregel 2 Elk knooppunt, behalve het initiële knooppunt, heeft precies één onmiddellijke
voorganger. Het eerste knooppunt heeft geen voorgangers.
Boomregel 3 Meerdere takken die zich uitstrekken vanaf hetzelfde knooppunt hebben
verschillende actie-etiketten.
Boomregel 4 Elke informatie set bevat beslissingspunten voor slechts één van de spelers.
Boomregel 5 Alle knooppunten in een bepaalde informatie set moeten hetzelfde aantal directe
opvolgers hebben en ze moeten dezelfde set actie-etiketten hebben op de takken die naar deze
opvolgers leiden.
3
, Je kan er vanuit gaan dat speler hun eigen vorige acties onthouden en ook andere evenementen die
ze gezien hebben. Een spel dat aan deze veronderstelling voldoet, zou een perfecte herinnering
vertonen.
Als elke informatie set van de uitgebreide vorm is een enkele knoop (geen stippellijnen), dan heeft
het spel perfecte informatie. Bij imperfecte informatie is er tenminste één knoop waarbij de speler
niet weet waar hij is in de boom.
Als er een heel veel keuzes zijn voor een speler, wordt dit
aangegeven met de laagste en de hoogste optie als pijl en
daartussen een boog. Deze boog geeft aan dat ook alle nummers
ertussen een optie zijn. We labelen deze grafische configuratie
met een variabele (in dit geval de letter a), die staat voor firm 1's
actie. In het binnenste van de boog tekenen we een generieke
knoop die de boom voortzet. Merk op dat in het spel geïllustreerd
in Figuur 14.4(a), de payoffs van de spelers afhankelijk zijn van a.
In een andere versie van het spel neemt speler 2 het reclame-
niveau van firma 1 niet in acht, zoals weergegeven in Figuur
14.4(b).
In de regel kan men, ongeacht wat er te koop is, altijd onderhandelen over de prijs. Omdat
onderhandelen zo'n wijdverbreid middel is om de handelsvoorwaarden vast te stellen, proberen
economen, zakenmensen en alledaagse consumenten te begrijpen hoe de onderhandelingen
plaatsvinden en hoe ze zich de kunst ervan eigen kunnen maken.
Het meest simpele model van onderhandelen is ultimatum-offerte onderhandelen. Stel dat als de
partijen niet snel tot overeenstemming komen over de prijs, dan verdwijnt de kans op handel. In
feite is er slechts tijd voor één take-it-or-leave-it aanbod van
één van de partijen. In figuur 14.5 is dit te zien. Als het aanbod
niet wordt aangenomen, krijgen beide partijen niets. Als het
aanbod wordt aangenomen, dan krijgt de verkoper de prijs en
de koper de waarde van de onderhandeling voor haar (verschil
tussen wat voor haar het ding waard is en de prijs).
Beschouw het zojuist beschreven ultimatum-aanbod onderhandelingsspel. In dit spel is de strategie
van speler 1 gewoon een getal p, waarvan we kunnen aannemen dat het tussen 0 en 100 ligt. De
strategieruimte voor speler 1 is dus S1 = [0, 100]. De strategie van speler 2 komt van een
ingewikkelder veld. Merk op dat speler 2 een oneindig aantal informatiesets heeft, één voor elk van
de haalbare aanbiedingen van speler 1. Bijvoorbeeld, een informatie set komt overeen met speler 1
die net het aanbod heeft gedaan p = 28; een andere informatie set volgt het aanbod p = 30,75; een
andere volgt het aanbod p = 62; en zo verder. Omdat er een oneindig aantal punten in het interval [0,
100] is, heeft speler 2 een oneindig aantal informatiesets.
Vergeet niet dat een strategie voor een speler een compleet contingenteringsplan is. Dus, de
strategie van speler 2 moet de keuze van speler 2 tussen Ja en Nee specificeren bij elke
informatieverzameling van speler 2. Met andere woorden, de strategie van speler 2 beschrijft of ze
een aanbod van p = 28 zal aanvaarden, of ze een aanbod van p = 30,75 zal aanvaarden, of ze een
aanbod van p = 62 zal aanvaarden, enzovoort. Formeel kan de strategie van speler 2 in dit spel
worden uitgedrukt als een functie die het prijsaanbod van speler 1 op de set {Ja, Nee} in kaart brengt.
Dat wil zeggen, gezien p ∈ [0, 100], kunnen we de strategie van speler 2 schrijven als een of andere
functie s2 : [Yes, No]. Dan, voor welk aanbod p die speler 1 ook doet, is het antwoord van speler 2
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller RivdP. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.15. You're not tied to anything after your purchase.