Neš ravnovesje. Teorija iger za ekonomiste (John Nash)

John 1930 Neumann in Oscar Morgenstern sta v tridesetih letih 20. stoletja postala ustanovitelja novega zanimivega področja matematike, ki se je imenovalo "teorija iger". V petdesetih letih se je za to področje začel zanimati mladi matematik John Nash. Teorija ravnotežja je postala predmet njegove disertacije, ki jo je napisal, ko je bil star 21 let. Tako se je rodila nova strategija za igre, imenovana Nash Equilibrium, ki je Nobelovo nagrado prejela mnogo let pozneje, leta 1994.

Dolga vrzel med pisanjem diplomske naloge in univerzalnim sprejemanjem je bila matematiku test. Genij brez prepoznavnosti je imel za posledico resne duševne kršitve, vendar je John Nash to težavo rešil zahvaljujoč odličnemu logičnemu umu. Njegova teorija o "Nashovem ravnovesju" je prejela Nobelovo nagrado, njegova filmska priredba pa v filmu "Lep um" ("Miselne igre").

Na kratko teorija iger

Ker teorija Nash-ovega ravnotežja pojasnjuje vedenje ljudi v smislu interakcije, je zato vredno razmisliti o temeljnih konceptih teorije iger.

Teorija iger preučuje vedenje udeležencev (agentov) v pogojih medsebojnega delovanja glede na vrsto igre, ko je izid odvisen od odločitve in vedenja več ljudi. Udeleženec sprejema odločitve na podlagi svojih napovedi glede vedenja drugih, ki se imenuje strategija igre.

Obstaja tudi prevladujoča strategija, v kateri udeleženec dobi optimalen rezultat za vsako vedenje drugih udeležencev. To je igralčeva najboljša strategija win-win.

Zaporniška dilema in znanstveni preboj

Dilema zapornika je primer z igro, ko so udeleženci prisiljeni sprejemati razumne odločitve in v konfliktu alternativ doseči skupni cilj. Vprašanje je, katero od teh možnosti bo izbral, upoštevajoč svoj osebni in skupni interes, pa tudi nezmožnost pridobiti oboje. Zdi se, da so igralci zaprti v težkih igralnih razmerah, zaradi česar včasih razmišljajo zelo produktivno.

To dilemo je raziskoval ameriški matematik John Nash. Ravnotežje, ki ga je pripeljal, je postalo takšno revolucionarno. Ta nova misel je še posebej živo vplivala na mnenje ekonomistov o tem, kako se tržni akterji odločajo ob upoštevanju interesov drugih s tesno interakcijo in presečanjem interesov.

Najbolje je preučiti teorijo iger s konkretnimi primeri, saj ta matematična disciplina sama po sebi ni teoretska.

Primer dileme zapornikov

Primer, dve osebi sta bili oropani, padli v roke policije in zaslišani v ločenih celicah. Obenem policisti nudijo vsakemu udeležencu ugodne pogoje, pod katerimi bo izpuščen, če bo pričal proti partnerju. Vsak od kriminalcev ima naslednji nabor strategij, ki jih bo upošteval:

Oba hkrati pričata in dobivata 2, 5 leta zapora.
Oba sta tiho hkrati in vsako leto prejemata po 1 leto, saj bo v tem primeru dokazna osnova njune krivde majhna.
Eden daje dokaze in dobi svobodo, drugi pa molči in dobi 5 let zapora.

Očitno je rezultat primera odvisen od odločitve obeh udeležencev, vendar se ne moreta sporazumeti, ker sedita v različnih celicah. Jasno je viden tudi konflikt njihovih osebnih interesov v boju za skupni interes. Vsak zapornik ima dve možnosti za ukrepanje in 4 možnosti za izid.

Sklepna veriga

Torej, kazenski A razmišlja o naslednjih možnostih:

Jaz sem tiho in moj partner molči - oba bova dobila 1 leto zapora.
Dajem svojega partnerja in on meni - oba dobimo 2, 5 leta zapora.
Jaz sem tiho, moj partner pa me izroči - dobil bom 5 let zapora, on pa bo prost.
Svojega partnerja najamem, on pa molči - dobil sem svobodo in on je 5 let zapora.

Za jasnost dajemo matrico možnih rešitev in rezultatov.

Tabela verjetnih izidov dileme zapornika.

Vprašanje je, kaj bo izbral vsak udeleženec?

"Tišina, ne moreš govoriti" ali "Tišina ne moreš govoriti"

Če želite razumeti izbiro udeleženca, morate iti skozi verigo njegovih misli. Po utemeljitvi kaznivega dejanja A: če bom molčal in molčal svojega partnerja, bomo dobili minimalni rok (1 leto), vendar ne morem izvedeti, kako se bo obnašal. Če priča proti meni, je tudi zame bolje, če pričam, sicer lahko sedim pet let. Raje bi sedel 2, 5 leta kot 5 let. Če ne bo povedal ničesar, potem moram še toliko bolj pričevati, saj bom na ta način dobil svobodo. Tudi poslanec B trdi na enak način.

Lahko je razumeti, da je prevladujoča strategija vsakega od kriminalcev pričevanje. Optimalna točka te igre se zgodi, ko oba kriminalista podata dokaze in prejmeta svojo "nagrado" - 2, 5 leta zapora. Nashova teorija iger pravi, da je ravnovesje.

Nash Optimal Optimal Solution

Revolucija Naševega stališča je, da takšno ravnovesje ni optimalno, če upoštevamo posameznega udeleženca in njegov osebni interes. Navsezadnje je najboljša možnost, da molčite in greste svobodni.

Ravnotežje Nash-a je stična točka, kjer vsak udeleženec izbere možnost, ki je zanj optimalna le, če ostali udeleženci izberejo določeno strategijo.

Glede na možnost, ko oba kriminalca molčita in prejemata le eno leto, jo lahko imenujemo pareto-optimalna možnost. Vendar je mogoče le, če bi se kriminalisti lahko vnaprej dogovorili. Toda tudi to ne bi zagotovilo tega izida, saj je skušnjava, da bi se prepričali in se izognili kaznovanju, velika. Pomanjkanje popolnega zaupanja drug v drugega in nevarnost, da bosta stara 5 let, si prisili, da izbere možnost s priznanjem. Razmišljanje o tem, da se bodo udeleženci držali možnosti s tišino, ki deluje skladno, je preprosto neracionalno. Tak sklep lahko naredimo, če preučimo ravnotežje Nash-a. Primeri to samo dokazujejo.

Sebični ali racionalni

Teorija ravnotežja Nasa je dala osupljive zaključke in zanikala že obstoječa načela. Adam Smith je na primer vedel vedenje vsakega od udeležencev kot popolnoma sebično, kar je sistem pripeljalo v ravnovesje. To teorijo so poimenovali "nevidna roka trga."

John Nash je videl, da če vsi udeleženci delujejo v skladu z lastnimi interesi, potem to nikoli ne bo privedlo do optimalnega skupinskega rezultata. Glede na to, da je racionalno mišljenje lastno vsakemu udeležencu, je izbira, ki jo ponuja Nash-ova ravnotežna strategija, bolj verjetna.

Čisto moški eksperiment

Jasen primer je igra "blond paradoks", ki je, čeprav se zdi neprimerno, živa ponazoritev, kako deluje teorija iger Nash.

V tej igri si morate predstavljati, da je v lokal prišla družba brezplačnih fantov. Sledi družba deklet, od katerih je eno boljše od ostalih, recimo blondinka. Kako se fantje obnašajo, da bi dobili najboljše dekle zase?

Torej, sklepanja fantov: če se vsi začnejo seznanjati z blondinko, potem najverjetneje ne bo prišla nikomur, potem se njeni prijatelji ne bodo želeli srečati. Nihče ne želi biti drugi povratni igralec. Če pa se fantje odločijo izogniti se blondinki, potem je verjetnost, da bo vsak izmed fantov med dekleti našel dobro dekle.

Razmere Nash-ovega ravnovesja niso najbolj optimalne za fante, saj bi si, samo pri svojih sebičnih interesih, vsi izbrali blond. Očitno je, da bo zasledovanje samo sebičnih interesov pomenilo propad skupinskih interesov. Nash ravnovesje bo pomenilo, da vsak fant deluje v svojih osebnih interesih, ki so v stiku z interesi celotne skupine. To ni optimalna možnost za vse osebno, ampak optimalno za vse, ki temelji na celotni strategiji uspeha.

Celotno naše življenje je igra

Sprejemanje odločitev v realnih razmerah je zelo podobno igri, ko od drugih udeležencev pričakujete določeno racionalno vedenje. V poslu, delu, ekipi, podjetju in celo v odnosih z nasprotnim spolom. Od velikih transakcij do navadnih življenjskih situacij vse uboga en ali drug zakon.

Seveda so obravnavane situacije v igri s kriminalci in šankom le odlične ilustracije, ki kažejo, da je Nash uravnotežen. Primeri takšnih dilem se pogosto pojavljajo na resničnem trgu, še posebej pa to deluje v primerih z dvema monopolistoma, ki nadzorujeta trg.

Mešane strategije

Pogosto sodelujemo ne v eni, ampak v več igrah hkrati. Izbira ene od možnosti za eno igro, ki jo vodi racionalna strategija, vendar se lotite druge igre. Po več racionalnih odločitvah boste morda ugotovili, da vam rezultat ne ustreza. Kaj storiti?

Upoštevajte dve vrsti strategije:

Čista strategija je vedenje udeležencev, ki izhaja iz razmišljanja o možnem vedenju drugih udeležencev.
Mešana strategija ali naključna strategija je izmenjava čistih strategij naključno ali izbira čiste strategije z določeno verjetnostjo. To strategijo imenujemo tudi randomizirana.

Glede na to vedenje dobimo nov pogled na Nashovo ravnovesje. Če je bilo prej rečeno, da igralec enkrat izbere strategijo, potem si lahko zamislimo drugo vedenje. Lahko priznamo možnost, da igralci izberejo strategijo naključno z določeno verjetnostjo. Igre, v katerih Nash ravnovesja ni mogoče najti v čistih strategijah, jih imajo vedno v mešanih.

Neš ravnovesje v mešanih strategijah imenujemo mešano ravnovesje. To je takšno ravnovesje, kjer vsak udeleženec izbere optimalno frekvenco za izbiro svojih strategij, pod pogojem, da drugi udeleženci izberejo svoje strategije z dano frekvenco.