Strategii avansate pentru teoria jocurilor pentru luarea deciziilor

Rezolvarea problemelor de Management - Anul 1 | Regula Optimalității (Noiembrie 2024)

Rezolvarea problemelor de Management - Anul 1 | Regula Optimalității (Noiembrie 2024)
Strategii avansate pentru teoria jocurilor pentru luarea deciziilor

Cuprins:

Anonim

Teoria jocurilor, studiul luării deciziilor strategice, reunește discipline disparate, cum ar fi matematica, psihologia și filosofia. Teoria jocurilor a fost inventată de John von Neumann și Oskar Morgenstern în 1944 și a parcurs un drum lung de atunci. Importanța teoriei jocurilor pentru analiza și luarea deciziilor moderne poate fi determinată de faptul că, începând cu anul 1970, au fost premiate cu premii Nobel pentru științe economice, în valoare de 12 lideri economiști și oameni de știință, pentru contribuția lor la teoria jocurilor.

Teoria jocurilor este aplicată într-o serie de domenii, inclusiv afaceri, finanțe, economie, științe politice și psihologie. Înțelegerea strategiilor de teorie a jocurilor - atât cele populare, cât și unele dintre stratagemele relativ mai puțin cunoscute - este importantă pentru a îmbunătăți abilitățile de raționament și de luare a deciziilor într-o lume complexă.

Dilema prizonierului - pe scurt

Una dintre cele mai populare și strategii de bază ale teoriei jocului este Dilema prizonierului. Acest concept explorează strategia de luare a deciziilor luată de doi indivizi care, acționând în interesul propriului lor individ individual, ajung la rezultate mai rele decât dacă ar coopera unul cu altul în primul rând.

În Dilema prizonierului, doi suspecți care au fost reținuți pentru o crimă sunt ținute în camere separate și nu pot comunica între ele. Procurorul le informează fiecare în mod individual că dacă el (numindu-l Suspect 1) mărturisește și mărturisește împotriva celuilalt, poate să se elibereze, dar dacă nu cooperează și Suspectul 2 o face, Suspectul 1 va fi condamnat la trei ani de închisoare. Dacă ambii mărturisesc, vor primi o sentință de doi ani, iar dacă nici nu mărturisesc, vor fi condamnați la un an de închisoare.

În timp ce cooperarea este cea mai bună strategie pentru cei doi suspecți, atunci când se confruntă cu o astfel de dilemă, cercetările arată că cei mai raționali oameni preferă să mărturisească și să depună mărturie împotriva celeilalte persoane, decât să rămână tăcuți și să ia șansa cealaltă parte mărturisește.

Strategii de teorie a jocurilor

Dilema prizonierului pune bazele strategiilor avansate ale teoriei jocurilor, dintre care cele populare includ:

Matching Pennies

: Acesta este un joc cu sumă zero care implică doi jucători Jucătorul A și Jucătorul B) introducând simultan un ban pe masă, cu plata în funcție de suma de bani. Dacă ambii marunți sunt capete sau cozi, Jucătorul A câștigă și păstrează pennyul jucătorului B. Dacă nu se potrivesc, jucătorul B câștigă și păstrează pennyul jucătorului A. Deadlock

: Acesta este un scenariu de dilemă socială precum Dilema prizonierului prin faptul că doi jucători pot să coopereze sau să defecteze (i.e. nu cooperează). In Deadlock, daca jucatorul A si jucatorul B coopereaza, fiecare obtine o recompensa de 1, iar daca ambele defecte, fiecare obtine o recompensa de 2. Dar daca jucatorul A coopereaza si defectele jucatorului B, atunci A primeste o recompensa 0 și B obține un câștig de 3. În diagrama de plată de mai jos, prima cifră din celule (a) până la (d) reprezintă câștigul jucătorului A, iar al doilea este cel al jucătorului B: Jucător B

Cooperați

Defect

Player A

Cooperați

(c) 3 , 0

(d) 2, 2

Blocajele diferă de Dilema prizonierului prin faptul că acțiunea de cel mai mare beneficiu reciproc (adică ambele defecte) este de asemenea strategia dominantă. O strategie dominantă pentru un jucător este definită ca una care produce cea mai mare sumă de câștig a oricărei strategii disponibile, indiferent de strategiile folosite de ceilalți jucători.

Un exemplu frecvent citat de Deadlock este cel al două puteri nucleare care încearcă să ajungă la un acord pentru a elimina arsenalele lor de bombe nucleare. În acest caz, cooperarea implică aderarea la acord, în timp ce înfrângerea înseamnă refuzarea în mod secret a acordului și păstrarea arsenalului nuclear. Cel mai bun rezultat pentru oricare dintre națiuni, din nefericire, este acela de a refuza acordul și de a păstra opțiunea nucleară, în timp ce cealaltă națiune își elimină arsenalul, deoarece acest lucru îi va da un avantaj ascuns extraordinar față de cel din urmă dacă războiul se va sfârși vreodată între cele două. Cea de-a doua opțiune este aceea de a defeca sau de a nu coopera, deoarece aceasta își păstrează statutul de putere nucleară.

Concurența Cournot

: Acest model este conceptual similar cu Dilema prizonierului și este numit după matematicianul francez Augustin Cournot, cel care la introdus în 1838. Cea mai comună aplicație a modelului Cournot este descrierea unui duopol sau două principale producătorilor de pe o piață.

De exemplu, presupuneți că două societăți A și B produc un produs identic și pot produce cantități mari sau mici. Dacă ambii cooperează și sunt de acord să producă la niveluri scăzute, atunci oferta limitată se va traduce într-un preț ridicat pentru produsul de pe piață și profituri substanțiale pentru ambele companii. Pe de altă parte, dacă acestea defectează și produc la niveluri înalte, piața va fi inundată și va avea ca rezultat un preț scăzut pentru produs și, prin urmare, profituri mai mici. Dar dacă cineva cooperează (adică produce la niveluri scăzute) și celelalte defecte (și anume produce pe ascuns la niveluri înalte), atunci primul se rupe chiar și în timp ce acesta din urmă câștigă un profit mai mare decât dacă ambele cooperează.

Este prezentată matricea de plăți pentru companiile A și B (cifrele reprezintă profitul în milioane de dolari). Astfel, dacă A cooperează și produce la niveluri scăzute, în timp ce B defectează și produce la niveluri ridicate, câștigul este așa cum este arătat în celula (b) - rentabilitatea pentru compania A și profitul de 7 milioane USD pentru compania B.

Matrice

Compania B Cooperare

Defect

Compania A

Cooperare

(c) ) 7, 0

(d) 2, 2

Coordonare

: Coordonator, jucătorii câștigă câștiguri mai mari atunci când selectează același mod de acțiune.

Luați în considerare, de exemplu, doi giganți de tehnologie care decid între introducerea unei noi tehnologii radicale în chipurile de memorie care le-ar putea câștiga sute de milioane de profituri sau o versiune revizuită a unei tehnologii mai vechi care le-ar câștiga mult mai puțin. Dacă o singură companie decide să continue cu noua tehnologie, adoptarea pieței de către consumatori ar fi semnificativ mai scăzută și, ca rezultat, ar câștiga mai puțin decât dacă ambele companii decid asupra aceluiași mod de acțiune. Matricea de plată este prezentată mai jos (cifrele reprezintă profitul în milioane de dolari).

Astfel, dacă ambele companii decid să introducă noua tehnologie, ar câștiga 600 de milioane de dolari, în timp ce introducerea unei versiuni revizuite a tehnologiei mai vechi ar câștiga câte 300 milioane de dolari fiecare, după cum se arată în celula d. Dar dacă Compania A decide singură să introducă noua tehnologie, ar câștiga doar 150 de milioane de dolari, chiar dacă Compania B ar câștiga 0 $ (probabil pentru că consumatorii ar putea să nu fie dispuși să plătească pentru tehnologia sa învechită acum). În acest caz, este sensibil ca ambele companii să colaboreze mai degrabă decât pe cont propriu.

Compania B

Compania B

Noua tehnologie

Tehnologia veche

Compania A Tehnologie veche

(c) 150, 0

(d) 300, 300

Jocul Centipede

cota parte dintr-un depozit de bani în creștere încet. Jocul Centipede este secvențial, deoarece jucătorii își fac mutările una după alta, mai degrabă decât simultan; fiecare jucător știe de asemenea strategiile alese de jucătorii care au jucat înaintea lor. Jocul se încheie de îndată ce un jucător ia cartonasul, cu acel jucător care primește porțiunea mai mare, iar celălalt jucător primește porțiunea mai mică.

De exemplu, dacă jucătorul A și playerul B joacă jocul Centipede, presupuneți că jucătorul A merge mai întâi și trebuie să decidă dacă ar trebui să "ia" sau să "treacă" stash-ul, care în prezent se ridică la 2 $. Dacă primește, atunci A și B obțin câte 1 $ fiecare, dar dacă trece A, decizia de a "Take or Pass" acum trebuie făcută de către Jucătorul B. Dacă B ia, primește 3 $ (adică restul de $ 2 + $ 1 ) și A primește $ 0. Dar dacă B trece, A acum decide să ia sau să treacă, și așa mai departe. Dacă ambii jucători aleg întotdeauna să treacă, fiecare dintre ei primește câte o sumă de 100 $ la sfârșitul jocului.

Punctul jocului este că dacă A și B cooperează și "trec" până la sfârșitul jocului, ei primesc câștigul maxim de 100 $ fiecare. Însă dacă nu au încredere în celălalt jucător și se așteaptă ca ei să "ia" la prima ocazie, atunci echilibrul Nash prezice că jucătorii vor lua cea mai mică creanță posibilă (1 $ în acest caz). Studiile experimentale au arătat totuși că acest comportament "rațional" (așa cum este prezis de teoria jocurilor) este rar expus în viața reală. Acest lucru nu este intuitiv surprinzător, având în vedere dimensiunea mică a plății inițiale în raport cu cea finală. Un comportament similar al subiecților experimentali a fost expus și în Dilema Călătorului.

Dilema călătorului

: Acesta este un joc cu sumă diferită de zero, în care ambii jucători încearcă să maximizeze propriile câștiguri fără a lua în considerare cealaltă. Conceput de economistul Kaushik Basu în 1994, în "Dilema călătorilor", o companie aeriană este de acord să plătească celor doi călători o despăgubire pentru daune materiale identice. Cu toate acestea, cei doi călători sunt obligați separat să evalueze valoarea articolului, cu un minim de $ 2 și un maxim de $ 100. Dacă ambele înregistrează aceeași valoare, compania aeriană va rambursa fiecare dintre ele suma respectivă. Dar dacă valorile diferă, compania aeriană le va plăti valoarea inferioară, cu un bonus de 2 USD pentru călătorul care a înregistrat această valoare mai mică și o penalizare de 2 USD pentru călătorul care a notat valoarea cea mai mare.

Nivelul de echilibru Nash, bazat pe inducția înapoi, este de 2 USD în acest scenariu. Dar, la fel ca în jocul Centiped, experimentele de laborator demonstrează în mod constant că majoritatea participanților - naiv sau altfel - aleg un număr mult mai mare decât $ 2.

Dilema călătorilor poate fi aplicată pentru a analiza o varietate de situații din viața reală. Procesul de inducție înapoi, de exemplu, poate ajuta la explicarea modului în care două companii implicate în competiția de tip cutthroat pot să scadă constant prețurile produselor cu clichet în încercarea de a câștiga cote de piață, ceea ce poate duce la pierderi din ce în ce mai mari în acest proces.

Strategii suplimentare privind teoria jocurilor

Bătălia de la sexe

: Aceasta este o altă formă a jocului de coordonare descris mai devreme, dar cu unele asimetrii de plată. Este în esență un cuplu care încearcă să-și coordoneze seara. Deși au fost de acord să se întâlnească fie la jocul cu minge (preferința bărbatului), fie la o piesă (preferința femeii), au uitat ceea ce au decis și au compus problema, nu pot comunica unul cu celălalt. Unde ar trebui să meargă? Matricea de plată este așa cum arată - cifrele din celule reprezintă gradul relativ de bucurie a evenimentului pentru femeie și bărbat, respectiv. De exemplu, celula (a) reprezintă câștigul (în termeni de nivele de bucurie) pentru femeie și respectiv pentru bărbat, la joc (se bucură mult mai mult decât el). Celula (d) este câștigul salarial, dacă ambele ajung la jocul cu mingea (se bucură de el mai mult decât face). Celula (c) reprezintă nemulțumirea dacă ambele nu merg numai în locația greșită, ci și în cazul în care se bucură cel mai puțin - femeia la jocul cu mingea și omul la joc.

Battle of the Sexes Matrix Man

Play

Joc cu bile

Femeie Play

(b) 2, 2 > Joc cu bile

(c) 0, 0

(d) 3, 6

Joc dictator : Este un joc simplu în care Jucătorul A trebuie să decidă cum să împartă un premiu în bani cu Jucătorul B , care nu are nicio contribuție la decizia jucătorului A. Deși aceasta nu este o strategie de teorie a jocului

în sine

, ea oferă câteva informații interesante despre comportamentul oamenilor. Experimentele arată că aproximativ 50% păstrează toți banii pentru ei înșiși; 5% au împărțit-o în mod egal, iar celelalte 45% îi dau un alt participant mai mic. Jocul dictator este strâns legat de jocul ultimatum, în care jucătorului A i se acordă o sumă stabilită, o parte din care trebuie acordată jucătorului B, care poate accepta sau respinge suma dată.Câștigul este că dacă al doilea jucător respinge suma oferită, atât A cât și B nu obțin nimic. Jocurile dictator și ultimatum dețin lecții importante pentru probleme cum ar fi darul caritabil și filantropia.

Pace-război

: o variantă a dilemei prizonierului, în care deciziile "Cooperare sau Defect" sunt înlocuite cu "Pace sau război". "O analogie ar putea fi două companii implicate într-un război al prețurilor. Dacă ambele se abțin de la reducerea prețurilor, ele se bucură de o prosperitate relativă (celula a), dar războiul prețurilor ar reduce dramatic beneficiile (celula d). Cu toate acestea, dacă A se angajează în reducerea prețurilor (război), dar B nu, A ar avea o remunerație mai mare de 4, deoarece ar putea capta o cotă de piață substanțială, iar acest volum mai mare ar compensa prețurile mai scăzute ale produselor.

Compania B

Pacea

Războiul

Compania A

Pace

(a) 3, 3

> Război

(c) 4, 0 (d) 1, 1 Dilema voluntarului : Dilema unui voluntar, cineva trebuie să facă o slujbă sau o slujbă pentru binele comun. Cel mai grav rezultat posibil este realizat dacă nimeni nu se oferă voluntariat. De exemplu, luați în considerare o companie în care frauda contabilă este agresivă, dar managementul de top nu este conștient de aceasta. Unii angajați juniori din departamentul contabil sunt conștienți de fraudă, dar ezită să le spună conducerii superioare, deoarece ar duce la concedierea angajaților implicați în fraudă și, cel mai probabil, la urmărirea penală. Fiind etichetat ca "avertizor de avertisment" poate avea, de asemenea, unele repercusiuni pe linie. Dar, dacă nimeni nu este voluntar, fraudele de amploare pot duce la eventuala faliment al companiei și la pierderea locurilor de muncă ale tuturor.

Linia de fund Teoria jocurilor poate fi utilizată foarte eficient ca instrument pentru luarea deciziilor, fie într-un cadru economic, de afaceri sau personal.