Principal » negocis » Com millora l'estratègia de teoria de jocs la presa de decisions

Com millora l'estratègia de teoria de jocs la presa de decisions

La teoria de jocs, l’estudi de la presa de decisions estratègiques, reuneix disciplines diferents com les matemàtiques, la psicologia i la filosofia. La teoria dels jocs va ser inventada per John von Neumann i Oskar Morgenstern el 1944 i ha recorregut un llarg camí des de llavors. La importància de la teoria de jocs per a l’anàlisi i la presa de decisions modernes es pot apreciar pel fet que des del 1970, fins a dotze economistes i científics principals han estat guardonats amb el Premi Nobel de Ciències Econòmiques per les seves contribucions a la teoria de jocs.

La teoria de jocs s’aplica en diversos camps, incloent negocis, finances, economia, ciències polítiques i psicologia. Comprendre les estratègies de teoria de jocs, tant les populars com algunes de les estratagemes relativament menys conegudes, és important per millorar el raonament i les habilitats de presa de decisions en un món complex.

Dilema del pres

Una de les estratègies bàsiques més populars i bàsiques de la teoria del joc és el dilema del pres. Aquest concepte explora l'estratègia de presa de decisions de dues persones que, actuant en el seu propi interès individual, acaben amb pitjors resultats que si haguessin cooperat entre ells en primer lloc.

En el dilema del pres, dos sospitosos capturats per un delicte són retinguts a habitacions independents i no es poden comunicar entre ells. El fiscal informa individualment al Sospitós 1 i el Sospecte 2 que, si confessa i testifica contra l’altre, pot sortir lliure, però si no coopera i l’altre sospitós, serà condemnat a tres anys de presó. Si tots dos confessen, obtindran una condemna de dos anys i, si cap dels dos confessen, seran condemnats a un any de presó.

Si bé la cooperació és la millor estratègia per als dos sospitosos, quan s’enfronten a aquest dilema, les investigacions mostren que la majoria de persones racionals prefereixen confessar-se i testificar contra l’altra persona que no callar i tenir l’oportunitat que l’altra part confessa.

(Per a informació relacionada, vegeu: El dilema del empresonat i l'economia .)

Estratègies de teoria de jocs

El dilema del presoner fonamenta les estratègies avançades de la teoria dels jocs, entre les quals les més populars inclouen:

Coincideixen amb els Pennies

Es tracta d’un joc de suma zero que implica dos jugadors (anomenen-los jugador A i jugador B) que posen simultàniament un cèntim a la taula, amb la recompensa depenent de si coincideixen els centaus. Si els dos cèntims són cap o cua, el jugador A guanya i manté el cèntim del jugador B. Si no coincideixen, el jugador B guanya i manté el cèntim del jugador A.

Termini

Aquest és un escenari de dilema social com el dilema del presoner, ja que dos jugadors poden cooperar o perjudiciar (és a dir, no cooperar). En un punt mort, si el jugador A i el jugador B col·laboren tots dos, obtenen un benefici d’1, i si ambdós defecten, cadascun obté un benefici de 2. Però si el jugador A coopera i els jugadors B defectes, A obté una recompensa. de 0 i B obté un benefici de 3. En el diagrama de recompenses següent, el primer numeral de les cel·les (a) a (d) representa la recompensa del jugador A i el segon número és el del jugador B:

Matriu de liquidació de terminis		Jugador B	Jugador B
		Cooperar	Defecte
Jugador A	Cooperar	(a) 1, 1	(b) 0, 3
	Defecte	(c) 3, 0	(d) 2, 2

El punt mort es diferencia del dilema dels presos, ja que l'acció del màxim benefici mutu (és a dir, ambdós defectes) és també l'estratègia dominant. Una estratègia dominant per a un jugador es defineix com aquella que produeix el màxim benefici de qualsevol estratègia disponible, independentment de les estratègies emprades pels altres jugadors.

Un exemple habitualment esmentat de punt mort és el de dues potències nuclears que intenten arribar a un acord per eliminar els seus arsenals de bombes nuclears. En aquest cas, la cooperació implica adherir-se a l’acord, mentre que la defecció significa renegar en secret de l’acord i retenir l’arsenal nuclear. Malauradament, el millor resultat per a qualsevol de les nacions és recórrer a l’acord i conservar l’opció nuclear mentre que l’altra nació elimina el seu arsenal, ja que això donarà a la primera un avantatge oculta tremenda respecte a la segona si alguna guerra esclata entre els dos. La segona millor opció és que els dos defectuïn o no cooperen, ja que manté la seva condició de potència nuclear.

Cournot Competició

Aquest model també és similar conceptualment al dilema dels presos i rep el nom del matemàtic francès Augustin Cournot, que el va introduir el 1838. L’aplicació més comuna del model Cournot consisteix a descriure un duopoli o dos principals productors en un mercat.

Per exemple, suposem que les empreses A i B produeixen un producte idèntic i poden produir quantitats elevades o baixes. Si tots dos cooperen i acorden produir a nivells baixos, l’oferta limitada es traduirà en un preu elevat per al producte al mercat i beneficis importants per a les dues empreses. D'altra banda, si es produeixen un defecte i es produeixen a nivells elevats, el mercat s'invertirà en un preu baix per al producte i, per tant, més baixos beneficis per a tots dos. Però si un coopera (és a dir, produeix nivells baixos) i els altres defectes (és a dir, produeixen subreptíticament a nivells alts), els primers només es trenquen, mentre que els segons obtenen un benefici més alt que si tots dos cooperen.

Es mostra la matriu de recompenses de les empreses A i B (les xifres representen un benefici en milions de dòlars). Així, si A coopera i produeix a nivells baixos mentre que B defecta i produeix a nivells alts, la recompensa és com es mostra a la cel·la (b), fins a la companyia A i 7 milions de dòlars en beneficis per a la companyia B.

Cournot Payoff Matrix		Empresa B	Empresa B
		Cooperar	Defecte
Empresa A	Cooperar	(a) 4, 4	(b) 0, 7
	Defecte	(c) 7, 0	(d) 2, 2

Coordinació

En coordinació, els jugadors guanyen beneficis més elevats quan seleccionen el mateix curs d’acció.

Com a exemple, considereu dos gegants tecnològics que decideixin entre introduir una tecnologia nova i radical en xips de memòria que puguin guanyar-los centenars de milions de beneficis o una versió revisada d’una tecnologia més antiga que els guanyaria molt menys. Si només una empresa decideix tirar endavant la nova tecnologia, la taxa d’adopció per part dels consumidors seria significativament inferior i, per tant, guanyaria menys que si ambdues empreses decideixin el mateix curs d’acció. A continuació es mostra la matriu de recompenses (les xifres representen un benefici en milions de dòlars).

Així, si ambdues empreses decideixen introduir la nova tecnologia, guanyarien 600 milions de dòlars la peça, mentre que la introducció d’una versió revisada de la tecnologia antiga els guanyaria 300 milions de dòlars cadascuna, tal com es mostra a la cel·la (d). Però si la companyia A decideix introduir la nova tecnologia, només guanyaria 150 milions de dòlars, tot i que la companyia B guanyaria 0 dòlars (presumptament perquè els consumidors poden no estar disposats a pagar per la seva tecnologia ja obsoleta). En aquest cas, té sentit que ambdues empreses treballin junts que no pas per compte propi.

Matriu de Playoff de coordinació		Empresa B	Empresa B
		Nova tecnologia	Antiga Tecnologia
Empresa A	Nova tecnologia	(a) 600, 600	(b) 0, 150
	Antiga Tecnologia	(c) 150, 0	(d) 300, 300

Joc de Centipede

Es tracta d’un joc de forma extensa en què dos jugadors tenen alternativament la possibilitat d’aconseguir la part més gran d’una quantitat de diners que s’incrementa lentament. El joc centpeu és seqüencial ja que els jugadors fan els seus moviments un després de l'altre més que simultàniament; cada jugador també coneix les estratègies escollides pels jugadors que jugaven abans. El joc conclou tan aviat com un jugador pren el cos, aquest jugador obtindrà la porció més gran i l’altre jugador obtindrà la porció més petita.

A tall d’exemple, suposem que el jugador A va primer i ha de decidir si ha de “prendre” o “passar” la coixeta, que actualment ascendeix a 2 dòlars. Si agafa, A i B obtenen 1 $ cadascun, però si A passa, la decisió de prendre o passar ara ha de ser presa pel jugador B. Si B pren, ella obté 3 dòlars (és a dir, la quantitat anterior de $ 2 + $ 1) i A obté 0 dòlars. Però si B passa, A ara decideix si agafar o passar, i així successivament. Si els dos jugadors sempre opten per passar, cada un rep una despesa de 100 dòlars al final del joc.

L'objectiu del joc és si A i B col·laboren i continuen passant fins al final del joc, aconsegueixen el pagament màxim de 100 dòlars cadascun. Però si desconfien de l’altre jugador i esperen que “prenguin” la primera oportunitat, l’equilibri de Nash preveu que els jugadors prendran la menor demanda possible ($ 1 en aquest cas). Els estudis experimentals han demostrat, però, que aquest comportament “racional” (tal com preveia la teoria dels jocs) rarament s’exposa a la vida real. Això no resulta sorprenentment intuïtivament, donada la mida reduïda del pagament inicial en relació amb la final. Un comportament similar dels subjectes experimentals també ha estat exposat en el dilema del viatger.

El dilema del viatger

Aquest joc de suma diferent de zero, en què tots dos jugadors intenten maximitzar el seu propi pagament sense tenir en compte l’altra, va ser ideat per l’economista Kaushik Basu el 1994. Per exemple, en el dilema del viatger, una companyia aèria accepta pagar dos viatgers una indemnització per danys i perjudicis. a ítems idèntics. No obstant això, els dos viatgers estan obligats a estimar el valor de l’article, amb un mínim de 2 dòlars i un màxim de 100 dòlars. Si ambdues anoten el mateix valor, la companyia aèria reemborsarà aquest import. Però si els valors difereixen, l’aerolínia els pagarà el valor inferior, amb una bonificació de 2 dòlars per al viatger que va anotar aquest valor inferior i una penalització de 2 dòlars per al viatger que va anotar el valor més alt.

El nivell d'equilibri de Nash, basat en la inducció endarrerida, és de 2 dòlars en aquest escenari. Però, com en el joc de centpeus, els experiments de laboratori demostren de manera constant que la majoria de participants trien un nombre molt superior a 2 dòlars.

El dilema del viatger es pot aplicar per analitzar diverses situacions de la vida real. El procés d’inducció endarrerida, per exemple, pot ajudar a explicar com dues companyies que participen en una competència de tall retallat poden baixar constantment els preus dels productes per fer un trànsit inferior a l’objectiu d’aconseguir quota de mercat, cosa que pot provocar pèrdues cada cop més grans en el procés.

Batalla de les Sexes

Aquesta és una altra forma del joc de coordinació descrit anteriorment, però amb algunes asimetries de recompensa. Es tracta bàsicament d’una parella que intenta coordinar la nit. Mentre havien acordat reunir-se tant en el joc de pilota (la preferència de l’home) com en una jugada (la preferència de la dona), han oblidat el que van decidir i es van complicar el problema, que no poden comunicar-se entre ells. On han d’anar? A continuació, es mostra la matriu de recompensa amb els nombres a les cel·les que representen el grau de gaudi relatiu de l'esdeveniment per a la dona i l'home, respectivament. Per exemple, la cel·la (a) representa la recompensa (en termes de nivells de gaudi) per a la dona i l’home a la jugada (en gaudeix molt més que no pas). Cell (d) és la recompensa si ambdues arriben al joc de pilota (ell gaudeix més del que ella). La cèl·lula (c) representa la insatisfacció si tots dos no només van a la ubicació equivocada, sinó també en el cas que gaudeixin menys: la dona al joc de pilota i l’home a la jugada.

Matriu de pagaments de la Batalla de les Sexes		Home	Home
		Jugar	Joc de pilota
dona	Jugar	(a) 6, 3	(b) 2, 2
	Joc de pilota	(c) 0, 0	(d) 3, 6

Joc de dictador

Es tracta d’un joc senzill en què el jugador A ha de decidir com es pot repartir un premi en metàl·lic amb el jugador B, que no té cap entrada en la decisió del jugador A. Tot i que aquesta no és una estratègia de teoria de jocs per si mateixa, però proporciona algunes visions interessants sobre el comportament de les persones. Els experiments revelen que prop del 50% guarda tots els diners, el 5% el divideix per igual i l’altre 45% proporciona a l’altre participant una quota més petita. El joc dictador està estretament relacionat amb el joc d’ultimàtum, en què se li dóna un jugador fixat al jugador A, una part del qual s’ha de lliurar al jugador B, que pot acceptar o rebutjar la quantitat donada. La captura és si el segon jugador rebutja la quantitat que s’ofereix, tant A com B no aconsegueixen res. Els jocs dictator i ultimàtum ofereixen lliçons importants per a temes com ara la caritat i la filantropia.

Guerra de la pau

Aquesta és una variació del dilema del presoner en què les decisions de "cooperar o defecte" són substituïdes per "pau o guerra". Una analogia pot ser de dues empreses dedicades a la guerra de preus. Si tots dos s’abstenen de retallar preus, gaudeixen d’una relativa prosperitat (cèl·lula a), però una guerra de preus reduiria notablement les retribucions (cèl·lula d). Tanmateix, si A participés en la retallada de preus (guerra), però B no, A tindria un benefici superior de 4, ja que podria obtenir una quota de mercat substancial i aquest volum més alt compensaria els preus més baixos del producte.

Matriu d’indemnitzacions de la guerra de la pau		Empresa B	Empresa B
		Pau	Guerra
Empresa A	Pau	(a) 3, 3	(b) 0, 4
	Guerra	(c) 4, 0	(d) 1, 1

Dilema del voluntari

En el dilema d'un voluntari, algú ha de dur a terme una tasca o un treball per al bé comú. El pitjor resultat possible s’aconsegueix si ningú no s’ofereix. Per exemple, considereu una empresa on el frau de comptabilitat és espantós, però que la seva gestió superior no en tingui coneixement. Alguns empleats més joves del departament de comptabilitat són conscients del frau, però no dubten a comunicar-los a la direcció superior perquè donaria lloc als empleats involucrats en el frau i serien perseguits judicialment.

L’etiquetatge com a denunciat també pot tenir algunes repercussions a la línia de baix. Però si ningú no es fa voluntari, el frau a gran escala pot causar la fallida eventual de l’empresa i la pèrdua de llocs de treball de tots.

La línia de fons

La teoria de jocs es pot utilitzar de manera molt eficaç com a eina per a la presa de decisions ja sigui en un entorn econòmic, empresarial o personal.

(Per a lectura relacionada, vegeu: Teoria del joc: més enllà dels fonaments bàsics .)

Comparació de comptes d'inversió Nom del proveïdor Descripció del anunciant × Les ofertes que apareixen a aquesta taula provenen de col·laboracions per les quals Investopedia rep una compensació.

← Curt (Posició curta)

Límits de tres Sigma →

Recomanat

Deixa El Teu Comentari