Libro Juegos Cap 2
Libro Juegos Cap 2
Libro Juegos Cap 2
Extensión mixta
33
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
Definición
2.2 (Extensiónmixta de un juego en forma normal). Sea G =
N, {Si }i=1,...,n , {πi }i=1,...,n un juego en forma normal. La extensión mixta
del juego es el juego en forma estratégica:
donde el pago neto de cada jugador es una extensión del pago neto πi definido
por π i : Σ → R donde:
34
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
1\2 R P S
R 0,0 -1,1 1,-1
P 1,-1 0,0 -1,1
S -1,1 1,-1 0,0
2.1.1. Dominancia
Vale la pena resaltar que los pagos esperados de cualquier estrategia mixta
son combinaciones convexas de los pagos de las estrategias puras involucra-
das, por lo que nunca van a superar el pago de la estrategia pura con el pago
35
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
más alto. Esto implica que para establecer que una estrategia mixta es do-
minada no es necesario probar con cada σ−i ∈ Σ−i . Solo hace falta probarlo
para las estrategias puras s−i ∈ S−i .
Definición 2.5 (Dominancia débil de mixtas por mixtas). Decimos que para
el agente i ∈ N una estrategia mixta σi ∈ Σi es dominada débilmente por
bi ∈ Σi si para todo σ−i ∈ Σ−i :
una estrategia σ
Esta definición es más débil que la definición que dimos en el caso de es-
trategias puras. Es decir, si una estrategia es dominada débilmente por una
estrategia pura, entonces es dominada débilmente por una estrategia mixta.
El converso claramente no es cierto como muestra el siguiente ejemplo.
1\2 A B
X 1,* 1,*
Y 3,* 0,*
Z 0,* 3,*
Ejemplo 2.7. Para el siguiente juego se van a encontrar todas las estretegias
mixtas que dominan a C.
1\2 A B C
X 1,0 1,4 3,1
Y 5,7 0,2 5,5
Z 0,4 3,0 0,1
36
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
37
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
1\2 X Y Z
A 1,7 2,2 0,3
B 0,0 4,4 1,0
C 3,1 2,0 0,2
De esta manera es posible concluir que Σ∞ = {(B, Y )} = {((0, 1, 0), (0, 1, 0))}.
Ejercicio 2.11. Encuentre Σ∞ para el siguiente juego:
1\2 X Y Z
A -2,4 3,1 30,0
B 0,0 9,1 2,4
C 1,1 1,0 1,5
38
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
1. Sea Ri0 = Σi .
∞
Ri = ∩ Riq se llama el conjunto de estrategias racionalizables del jugador
q=1
i. Una estrategia conjunta σ se llama racionalizable si la estrategia que le
n
corresponde a cada jugador es racionalizable: σ ∈ R = Π Ri
i=1
39
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
un jugador es de grado 1 si este sabe que los demás jugadores son racionales.
Es de grado 2 si el sabe que los demás saben que los demás jugadores son
racionales (i.e., si el sabe que los demás tienen conocimiento de grado 1), etc.
En la definición de estrategias racionalizables, q denota, intuitivamente, el
grado de conocimiento que se asume de cada jugador en la definición de cada
conjunto de estrategias mixtas Riq . También está implícito en la definición de
estrategia racionalizable el hecho de que los agentes escogen sus estrategias
de forma independiente y esto restringe las expectativas que los agentes se
forman de las estrategias de los demás.
No es difícil convencerse que cualquier estrategia que forma parte de un
equilibrio de Nash - Cournot es racionalizable. Luego, ser racionalizable es
más débil que ser un equilibrio de Nash - Cournot. Por ejemplo, en la Ba-
talla de los Sexos, el conjunto de estrategias racionalizables es la totalidad
del conjunto de estrategias, luego el concepto de estrategia racionalizable es
estrictamente más débil que el de Nash - Cournot. Este caso pone en eviden-
cia que el concepto de estrategia racionalizables puede ser un concepto muy
débil y con poco poder predictivo en muchos casos.
El concepto de estrategias mixtas que sobreviven el proceso de eliminación
débil, es un concepto aún más débil que el de estrategias racionalizables.
En efecto, si una estrategia mixta es dominada, ciertamente no puede ser la
respuesta óptima a ninguna estrategia conjunta que los demás jugadadores
jueguen. Se sigue que el conjunto de estrategias mixtas no dominadas su-
cesivamente contiene al conjunto de estrategias racionalizables. En el caso
de juegos bilaterales, estos dos conjuntos coinciden (Perace, 1984) pero, en
general, la contenencia es estricta. Si permitiéramos que los agentes se forma-
ran expectativas correlacionadas sobre las estrategias de los demás, ambos
conceptos coincidirían (esto explica por qué en juegos bilaterales no es ne-
cesario hacer esta extensión). La siguiente figura muestra la relación entre
estos conceptos.
Ejercicio 2.15. Demuestre que el conjunto de estrategias mixtas no domi-
nadas iterativamente contiene al conjunto de estrategias racionalizables.
Parece intutivo que una estrategia racionalizable le asigne probabilidad po-
sitiva solo a aquellas estrategias que se juegan con probabilidad positiva en
algún equilibrio de Nash. Sin embargo esto no es cierto como lo demuestra
un ejemplo de Bernheim (véase Vega - Redondo, tabla 2.10). Por lo tanto el
concepto de estrategia racionalizable, así como el concepto de estrategias no
dominadas iterativamente, no es propiamente un concepto de equilibrio en
el sentido de que no existan incentivos a desviaciones unilaterales.
40
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
π i (b b−i ) ≥ π i (σi , σ
σi , σ b−i )
1. σ
b es un equilibrio de Nash.
Nota técnica 2.17. Esta proposición es útil para calcular equilibrios de Nash
en estrategias mixtas. En particular el numeral tres afirma que en un equili-
brio de Nash en estrategias mixtas todas las estrategias puras con probabi-
lidad positiva arrojan la misma utilidad que la utilidad en equilibrio.
4
Una estrategia pura esta en el soporte de una estrategia mixta si tiene probabilidad
positiva.
41
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
1\2 C S
C 1,-1 -1,1
S -1,1 1,-1
Para ver esto, considere la forma de actuar de cada jugador cuando el supone
cierto conportamiento sobre los demás. Jugador 1: Cree el jugador 2 va jugar
σ2 = (β, 1 − β). Este vector indica que con probabilidad β, el jugador uno
cree que dos va a jugar C y con probabilidad 1 − β cree que va a jugar sello.
Ahora se obtiene el pago esperado de jugar para cada una de sus estrategias
puras cuando el otro jugador juega una mixta. Recuerde que, cómo se men-
cionó antes, el pago de jugar un equilibrio de Nash es igual al pago de jugar
cualquier estrategia en el soporte de σ̂i . Esto implica que los pagos esperados
de las estrategias puras van a ser menores o iguales al pago de la mixta que
es equilibrio de Nash.
π1 (C, σ2 ) = β ∗ 1 + (1 − β) ∗ (−1) = 2β − 1
Ahora se comparan los pagos para saber cual va a ser la mejor respuesta del
jugador 1 para cualquier estrategia del jugador 2.
1
El jugardor 1 va a jugar cara si y solo si: 2β − 1 ≥ −2β + 1 →β ≥ 2
De esto es posible establecer que la mejor respuesta del jugador 1 es:
C
si β > 21
BR1 (β) = C o S si β = 21
si β < 21
S
42
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
Ahora para encontrar el equilibrio de Nash solo hay que encontrar los puntos
en los que se intersectan las dos mejores respuestas. Para esto usaremos el
siguiente gráfico:
1 BR1 (β)
BR2 (α)
0,5
β
0
0 0,5 1
α
1\2 E G
E 100,100 0,0
G 0,0 1000,1000
Muestre que este juego tiene dos equilibrio de Nash en estrategias puras y
un equilibrio de Nash en estrategias mixtas (10/11, 1/11). Muestre también
que este equilibrio satisface las condiciones del numeral tres de la proposición
anterior.
43
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
1\2 F C
N 0,2 0,2
E -1,-1 1,1
Este juego tiene dos equilibrios de Nash en estrategias puras (E, C) y (N, F ).
Haciendo el proceso del ejemplo anterior se llega a que:
N
si β > 21
BR1 (β) = N o S si β = 21
si β < 21
S
(
C si α < 1
BR2 (α) =
CoF si α = 1
Lo que gráficamente se ve de la siguiente forma:
1 BR1 (β)
BR2 (α)
0,5
β
0
0 1
α
44
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
45
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
Jugador 1 \ Jugador 2 L C R
L 0 1 1
C 1 0 1
R 1 1 0
Es fácil verificar que el único equilibrio de Nash (o Maxmin dado que es suma
cero) es jugar 13 para cada opción. En la práctica los arqueros reconocen que,
aunque estén ubicados en la misma dirección en la que se patea el balón no
tienen 100 % de probabilidad de tapar el tiro, de igual forma los cobradores
saben que, aunque lancen en una dirección diferente a la posición en la que
estará el arquero, esto no garantiza que marquen el gol. Por esto, los pagos
para cada jugador se definen por las probabilidades de marcar (πi,j ) o de
tapar (1 − πi,j ), donde i = {L, C, R} representa la elección del cobrador y
j = {L, C, R} representa la decisión del arquero.
Los resultados de la evidencia empírica muestran que cuando se reduce el
juego a un escenario 2X2({L, R} X {L, R}) los jugadores profesionales ac-
túan jugando una estrategia mixta de acuerdo a la probabilidad de acierto
observada, otro resultado muestra como las decisiones tanto de cobradores
como arqueros son serialmente independientes es decir las acciones tomadas
anteriormente no influyen en la probabilidad de escoger la siguiente acción
palacios2003professionals. En la siguiente tabla se presenta la probabilidad
de anotar observada
46
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
Jugador 1 \ Jugador 2 L R
L πL,L = 58,3 % πL,R = 94,97 %
R πR,L = 92,91 % πR,R = 69,92 %
Fuente: [?]
[?] encuentra que el equilibrio optimo para los anteriores datos son P (i =
L) = 0,3854 y P (j = L) = 0,4199, mientras que lo observado en los datos
es P (i = L) = 0,3998 y P (j = L) = 0,4231, presentando diferencias no
significativas entre lo que predice la teoría y lo que se observa en la realidad.
Cuando se amplía el análisis al escenario 3X3 el resultado puede no ser tan
claro, la evidencia empírica ha mostrado que los arqueros son proclives a un
tipo particular de desviación al agente racional nombrado como “sesgo de
acción” bar2007action. Este sesgo nos muestra que cuando un arquero deci-
de su estrategia, puede sentir menor culpabilidad de fallar si actúa como se
espera (saltar ya sea a la derecha o a la izquierda) generando en la practica
una probabilidad observada de mantenerse en el centro menor a lo que seria
optimo para ellos.
Con los ejemplos anteriores podemos observar el uso práctico de la teoría
económica para la predicción de comportamientos estratégicos en juegos no
cooperativos como el de cobrar un penal, información que quizás hubiera
dado mas probabilidades a Gianluigi Buffon de mantenerse en el centro del
arco, dirección en la que Zinedine Zidane hizo su lanzamiento para convertir
el gol con el que Francia comenzaría ganando la final del mundial, que iró-
nicamente perdería frente a Italia en la serie de penales.
Jugador 1 \ Jugador 2 L C R
L 71,1 % 100 % 96,4 %
C 82,3 % 50 % 94,1 %
R 94,2 % 100 % 55,2 %
Teorema 2.27 (Nash 1950). Todo juego finito (i.e., el número de jugadores
y conjunto de estrategias de cada jugador es finito) tiene un equilibrio de
Nash en estrategias mixtas.
47
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
48
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
49
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
fuertes para este caso que los que se obtienen del teorema de Von Neumann
(1928) que exponemos en esta sección.
Definición 2.35. Un juego bilateral de suma cero es un juego G = ({1, 2} ,
{Si }i=1,2 , {πi }i=1,2 ) tal que para todo s ∈ S, π1 (s) + π2 (s) = 0.
50
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
v1 ≤ máx π1 (σ1 , σ2 )
σ1 ∈Σ1
v1 ≤ v2
51
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
Sea v = máx mı́n π1 (σ1 , σ2 ) el valor del juego. Sean (σ1∗ , σ2∗ ) un par de estra-
σ1 ∈Σ1 σ2 ∈Σ2
tegias tales que σ1∗ = arg max mı́n π1 (σ1 , σ2 ) y σ2∗ = arg min máx π1 (σ1 , σ2 ).
σ1 ∈Σ1 σ2 ∈Σ2 σ2 ∈Σ2 σ1 ∈Σ1
Por definición esto implica que para todo σ1 se cumple π1 (σ1 , σ2∗ ) ≤ v y
análogamente se tiene que para todo σ2 se cumple π1 (σ1∗ , σ2 ) ≥ v. Como
π1 (σ1∗ , σ2∗ ) = v, entonces σ1∗ es mejor respuesta para σ2∗ (pues alcanza el
máximo de π1 (·, σ2∗ )). Análogamente, σ2∗ es mejor respuesta para σ1∗ y por
tanto es equilibrio de Nash-Cournot.
El teorema anterior implica que el valor del juego es el mismo para cada
jugador independientemente de qué equilibrio de Nash jueguen. En efecto,
no es necesario que los jugadores jueguen un equilibrio de Nash específico
para que que se realice ese valor.
Más aún, del teorema se deduce fácilmente que si (σ1 , σ2 ), (σ10 , σ20 ) son dos
equilibrios de Nash entonces (σ10 , σ2 ), (σ1 , σ20 ) son equilibrios de Nash. Es
decir, basta con que cada jugador utilice como estrategia alguna que sea
perteneciente a una estrategia conjunta que sea un equilibrio y que él espere
que los demás hagan lo mismo y viceversa. Esta propiedad se conoce como
intercambiabilidad del equilibrio en juegos bilaterales de suma cero. 8
Ejercicio 2.37. Demostrar la propiedad de intercambiabildad del equilibrio
para juegos de suma cero.
52
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
53
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
y para todo i, j :
N
X M
X
pi aij ≥ v ≥ qj aij (2.2)
i=1 j=1
54
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
N
N,
P
Supongamos que para todo p ∈ R+ pi = 1 existe j tal que:
i=1
N
X
pi aij < v (2.4)
i=1
en particular:
N
X N X
X N
∗ ∗
σ1,i aij < v ⇒ mı́n σ1,i aij σ2,j < v (2.5)
σ2 ∈Σ2
i=1 j=1 i=1
luego,
mı́n máx π1 (σ1 , σ2 ) < v (2.6)
σ2 ∈Σ2 σ1 ∈Σ1
2.6. Ejercicios
1. Adivinar el promedio. Considere el siguiente juego. Cada jugador tiene
que, de forma simultánea, escoger un número entero entre 1 y 100
(incluídos). La persona más cercana a un tercio del promedio de las
ofertas gana $100 y los demás nada. En caso de empate, el premio se
divide proporcionalmente entre los ganadores.
55
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
Solución:
1\2 C S
C 1,-1 -1,1
S -1,1 1,-1
56
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
Tome el caso de σ2∗ = (1/3, 2/3), que implica: Π1 (C, σ2∗ ) = −1/3
y Π1 (σ1∗ , σ2∗ ) = 1/9, lo cual completa el contrajemplo.
b) Esta afirmación es verdadera, puesto que si para todo i, σi∗ es
∗ , entonces σ ∗ es un equilibrio de Nash. Por
mejor respuesta a σ−i
otro lado, se sabe que la eliminación iterada de estrategias estric-
tamente dominadas no elimina equilibrios de Nash, entonces σ ∗
tuvo que haber sobrevivido al proceso de eliminación.
57
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
2
y ello sucede cuando σ2 = 3
En conclusión los valores de seguridad de ambos jugadores(V1 , V2 ) son
iguales a 23 .
5. Encuentre todos los equilibrios de Nash (tanto estrategias puras como
mixtas) del siguiente juego:
1\2 L M R
U 8,3 3,5 6,3
C 3,3 5,5 4,8
D 5,2 3,7 4,9
58
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
1\2 X2 Y2
X1 2,2 0,6
Y1 6,0 1,1
1\2 X2 Y2 S2
X1 2,2 0,6 0,6
Y1 6,0 1,1 1,1
S1 6,0 1,1 2,2
1\2 F C
N 0,2 0,2
E -1,-1 1,1
8. Dado un juego en forma normal, mostrar que para cada jugador todo
equilibrio de Nash tiene un pago mayor o igual al valor minmax del
jugador (no tiene que ser un juego bilateral ni un juego de suma cero).
59
Riascos, A. Juegos Estratégicos y sus Aplicaciones Versión 5.0, 2022
60