La formulació clàssica del dilema del presoner és:
La policia arresta dos sospitosos. No hi ha proves suficients per condemnar-los i, després d'haver-los separat, els interroga i els ofereix el mateix tracte. Si un confessa i el seu còmplice no, el còmplice serà condemnat a la pena total, deu anys, i el primer serà alliberat. Si un calla i el còmplice confessa, el primer rebrà aquesta pena i serà el còmplice que surti lliure. Si ambdós romanen callats, tot el que podran fer serà tancar-los durant sis mesos per un càrrec menor. Si ambdós confessen, ambdós seran condemnats a sis anys. | » | |
Això pot resumir-se en forma de taula:
El presoner B calla | El presoner B confessa | |
---|---|---|
El presoner A calla | Ambdós son condemnats a sis mesos | A és condemnat a deu anys. B surt lliure |
El presoner A confessa | A surt lliure. B és condemnat a deu anys | Ambdós son condemnats a sis anys |
Suposarem que ambdós presoners són completament egoistes i que el seu únic objectiu és reduir la seva pròpia condemna. Cada presoner té dues opcions: cooperar amb el seu còmplice i romandre callat, o trair-lo i confessar. El resultat de cada elecció depèn de l'elecció del còmplice. Desafortunadament, un no coneix què ha decidit fer l'altre. Fins i tot si poguessin parlar entre ells, no podrien estar segurs de confiar l'un en l'altre.
Si un dels dos espera que el còmplice esculli cooperar amb ell i romandre en silenci, l'opció òptima per al primer seria confessar, ja que això significaria ser alliberat immediatament, mentre el còmplice hauria de complir una condemna de 10 anys. Si espera que el seu còmplice decideixi confessar, la millor opció torna a ser confessar, ja que almenys no rebrà la condemna completa de 10 anys, i només n'haurà d'esperar 6, igual com el còmplice. Si, tanmateix, ambdós decidissin cooperar i romandre en silenci, ambdós serien alliberats en només 6 mesos. Confessar és una estratègia dominant per a ambdós jugadors: sigui quina sigui l'elecció de l'altre jugador, poden reduir sempre la seva sentència confessant. Per desgràcia per als presoners, això condueix a un resultat regular, en el qual ambdós confessen i ambdós reben llargues condemnes. Aquí es troba el punt clau del dilema. El resultat de les interaccions individuals produeix un resultat que no és òptim en el sentit de Pareto; existeix una situació tal que el resultat per a un dels detinguts podria millorar (fins i tot per a ambdós) sense que això impliqui un empitjorament per a la resta. En altres paraules, el resultat en el qual ambdós detinguts no confessen domina al resultat en el qual els dos elegeixen confessar. Aquesta situació, en termes més tècnics, il·lustra perfectament que en un joc de suma no nul·la un equilibri de Nash no és necessàriament un òptim de Pareto.
Si hom ha tingut una oportunitat per castigar l'altre jugador per haver confessat, llavors pot mantenir-se un resultat cooperatiu. La forma iterada d'aquest joc ofereix una oportunitat per a aquest tipus de càstig. En aquest joc, si el còmplice traeix i confessa una vegada, se'l pot castigar traint-lo a la pròxima. Així, el joc iterat ofereix una opció de càstig que és absent en la forma clàssica del joc.
L'equilibri de Nash és un tipus de concepte de solució d'un joc en què participen dos o més jugadors i on cap d'ells té res a guanyar pel fet de canviar unilateralment la seva estratègia. En altres paraules, si cada jugador ha escollit una estratègia i cap jugador es pot beneficiar d'un canvi en la seva pròpia estratègia mentre els altres no la canviïn, llavors el conjunt actual d'estratègies escollides pels jugadors i llurs beneficis corresponents són un equilibri de Nash.
No hay comentarios:
Publicar un comentario