Unidad 4 teoría de juegos 1

Page 1

Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear

Universidad Abierta y a Distancia de México Licenciatura en Matemáticas 11° Cuatrimestre Programa de la asignatura Investigación de Operaciones Clave 050941142

Unidad 4. Teoría de Juegos

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear

´Indice general Introducci´ on

3

1. Teor´ıa de juegos 1.1. Conceptos b´asicos de teor´ıa de juegos . . . . . . . . . . . . . . . . . . 1.2. Soluci´on de juegos matriciales . . . . . . . . . . . . . . . . . . . . . . 1.3. Estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5 5 6 7

Bibliograf´ıa

11

1

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear

Introducci´ on Como sabemos, un juego involucra un n´ umero determinado de jugadores, N, un conjunto de estrategias para ellos y un cobro o recompensa que les corresponde luego de cada partida. Las estrategias para cada jugador pueden ser muy complicadas, ya que describen el proceder en cada situaci´on posible. La estrategia depender´a del juego; por ejemplo, si el juego tiene pocos movimientos las estrategias son sencillas, pero en juegos como el ajedrez hay un gran n´ umero de posibles movimientos y tambi´en de estrategias. Los juegos que abodaremos en esta unidad incluyen a dos jugadores, es decir, N = 2. Adem´as, generan un n´ umero finito de estrategias y lo que gana un jugador, el otro lo pierde. Estos se llaman juegos de dos personas finitos de suma cero. Cabe mencionar que la mayor´ıa de los juegos son de suma diferente de cero. Llam´emosle a los jugadores I y II; supongamos que el jugador I elige una de sus m posibles estrategias digamos i, i = 1, ..., m, y el jugador II a su vez elige la estrategia j, j = 1, ..., n. Si calculamos el pago para cada jugador con esta elecci´on de estrategias y resulta que el jugador I gana Aji , entonces II pierde Aji , porque el juego es de suma cero. Con esto, podemos definir la matriz de pagos para el jugador I, la llamada matriz de pagos del juego, los jugadores I y II se denotan con J I y J II respectivamente.

JI

Estrategia 1 .. .

Estrategia 1 A11 .. .

Estrategia m

A1m

J II ··· ··· ···

Estrategia n An1 .. . Anm

Suponemos que ambos jugadores quieren elegir estrategias que maximicen sus pagos individuales, de otra manera no hay un conflicto de intereses y el juego no tiene sentido. Adem´as, se supone que el juego se realiza una cierta cantidad de veces. Los renglones son llamados estrategias puras para el jugador I y las columnas son llamadas estrategias puras para el jugador II. Estos nombres se les dan tomando en cuenta que hay formas de jugar eligiendo combinaciones de estrategias puras y a estas estrategias se les llaman estrategias mixtas; m´as adelante se ilustra este concepto con ejemplos. 3

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear ´ INTRODUCCION Los juegos matriciales se pueden resolver encontrando el punto silla de la ganancia esperada, ya sea con estrategias puras o con estrategias mixtas.

4

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear

Cap´ıtulo 1 Teor´ıa de juegos 1.1.

Conceptos b´ asicos de teor´ıa de juegos

A continuaci´on, describimos algunos conceptos b´asicos de la teor´ıa de juegos. Juego matricial de suma cero. Es un juego que involucra a dos jugadores y el n´ umero de estrategias que tiene cada jugador es finito adem´as, la suma de las ganancias de ambos jugadores es cero. Matriz de pagos de un juego. Un juego matricial de suma cero lo podemos representar con una matriz A = (Aji ), i = 1, ..., m, j = 1, ..., n. Donde Aji es el pago que recibe el jugador I del jugador II si el jugador I elige jugar con la estrategia i y el jugador II elige su estrategia j.

JI

Estrategia 1 .. .

Estrategia 1 A11 .. .

Estrategia m

A1m

J II ··· ···

Estrategia n An1 .. . Anm

···

Los renglones son llamados estrategias puras para el jugador I y las columnas son llamadas estrategias puras para el jugador II. Valor inferior y valor superior del juego. En un juego matricial de suma cero que tiene asociada la matriz de pagos Am×n se definen: el valor inferior del juego α = m´ax

m´ın Aji

i=1,...,m j=1,...,n

y el valor superior del juego β = m´ın

m´ax Aji ,

j=1,...,n i=1,...,m

α representa el menor monto que el jugador I puede garantizar recibir y β representa el monto m´as grande que el jugador II puede perder. 5

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear TEOR´IA DE JUEGOS Valor del juego. Si en la matriz de pagos de un juego el valor inferior del juego coincide con el valor superior del juego, dicho valor se denomina valor del juego y se denota por ν, es decir, ν = α = β. En el otro caso, cuando α < β el valor del juego ν se define como la ganancia esperada E(x∗ , y ∗ ), donde x∗ y y ∗ son las estrategias mixtas ´optimas para cada jugador. Una forma de interpretar el valor del juego es tom´andolo como una medici´on de la ventaja; es decir, si ν >0 el jugador I deber´a pagar un monto ν al jugador II para hacer el juego justo. Punto silla de estrategias puras. Se dice que (i∗ , j ∗ ) es un punto silla de estrategias puras del juego si: ∗

Aji ≤ Aji∗ ≤ Aji∗ ∀ i, j, i = 1, ..., m, j = 1, ..., n. Como es sabido, un juego matricial tiene punto silla de estrategias puras si y s´olo si el valor inferior del juego (α) es igual al valor superior del juego (β) [Barron, p.12] ∗ adem´as, el rengl´on i∗ y la columna j ∗ que corresponden al pago Aji∗ = α = β se denomina punto silla de estrategias puras. Las estrategias i∗ y j ∗ tambi´en se llaman estrategias ´optimas, porque si cualquier jugador se desv´ıa de jugar su correspondiente estrategia i∗ o j ∗ entonces el otro jugador puede tomar ventaja y mejorar su ganancia, en este sentido cada parte de la silla es la mejor respuesta para el oponente. Estrategia mixta. Dada una matriz asociada a un juego, Am×n , una estrategia mixta para un jugador es un vector x = (x1 , ..., xk ), donde k = m ´o n dependiendo de cual jugador sea la estrategia y se cumple que: k P xi ≥ 0, i = 1, ..., k, xi = 1. i=1

Las componentes xi representan la probabilidad con la que la estrategia pura i ser´a usada por el jugador. Soluci´ on del juego. La soluci´on del juego consta de las estrategias ´optimas para cada jugador, as´ı como del valor del juego. Ya sean estrategias puras ´optimas, o bien, estrategias mixtas ´optimas.

1.2.

Soluci´ on de juegos matriciales

Cuando se intenta resolver un juego matricial, generalmente primero se trata de identificar un punto silla de estrategias puras. En el siguiente ejemplo ilustramos la forma de resolver un juego que tiene punto silla de estrategias puras.

6

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear ESTRATEGIAS MIXTAS Ejemplo 1. Soluci´on del juego con estrategias puras. Encontrar la soluci´on del juego con la siguiente matriz de pagos:

A=

11 16 14 16

10 21 17 21

7 5 2 7

13 3 19 19

7 3 2

Calculando el m´ınimo por renglones y el m´aximo por columnas encontramos una posici´on donde coinciden estos n´ umeros, entonces el punto silla es (1,3) y el valor del juego es ν = 7. El prop´osito del siguiente ejemplo es ilustrar el concepto de estrategias. Ejemplo 2. Adivina y Pon. El juego consiste en mostrar 1 ´o 2 dedos y al mismo tiempo adivinar lo que mostrar´a el oponente, por ejemplo, si el jugador I pone 1 y dice 2, significa que muestra un dedo y adivina que el otro jugador mostrar´a 2 dedos; si s´olo un jugador le adivina al otro los dedos mostrados entonces, gana una cantidad igual al n´ umero de dedos que se ven, en otro caso es empate. En este juego, la primera entrada de cada pareja ordenada representa el n´ umero de dedos mostrados y la segunda indica lo que se espera mostrar´a el oponente. La matriz de pagos para el jugador I es la siguiente.

(1,1) (1,2) (2,1) (2,2)

1.3.

(1,1) (1,2) (2,1) (2,2) 0 2 -3 0 -2 0 0 3 3 0 0 -4 0 -3 4 0

Estrategias mixtas

Si consideramos la matriz de pagos del juego Adivina y Pon, notamos que no es posible resolverlo a trav´es de un punto silla de estrategias puras. Si se elige siempre la misma estrategia, el oponente sabr´a sacar ventaja de ello, entonces conviene cambiar de estrategia, pero sin una secuencia determinada para evitar que se use esta informaci´on en contra, entonces la elecci´on de las estrategias debe ser aleatoria y surge la pregunta: ¿con qu´e distribuci´on de probabilidad vamos a elegir las estrategias? Elegir una combinaci´on de estrategias puras a partir de un proceso probabil´ıstico es lo que se entiende por estrategia mixta. 7

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear TEOR´IA DE JUEGOS En un juego que tiene asociada la matriz de pagos Am×n , si el jugador I usa una estrategia mixta con la distribuci´on de probabilidad x = (x1 , ..., xm ) y el jugador II utiliza su estrategia j, la ganancia esperada para el jugador I, denotada por E(x, j), es x1 Aj1 + ... + xm Ajm . De forma similar E(i, y) es la p´erdida esperada para el jugador II cuando toma una estrategia mixta y y el jugador I elige la estrategia i. Para elegir la distribuci´on de probabilidad con la que se elegir´an las estrategias x = (x1 , ..., xm ), y = (y1 , ..., yn ) y conocer cu´al ser´a la ganancia esperada del juego, nos basamos en el siguiente resultado. Todas las matrices Am×n definen funciones continuas, c´oncavas en x, convexas en y, f : C × D −→ R, (x, y) 7→ xAy T . Donde x ∈ Rm , y ∈ Rn son vectores rengl´on. Si los conjuntos C y D se definen como: m n P P C = {x ∈ Rm / xi = 1, x ≥ 0}, D = {y ∈ Rn / yj = 1, y ≥ 0}. i=1

j=1

Entonces C y D son conjuntos convexos cerrados y acotados, pero todas ´estas condiciones son las hip´otesis del teorema de Von Neumann (minimax) [Barron], que garantiza que existe un punto silla en C × D para tales funciones. Esto significa que todos los juegos matriciales de suma cero tienen soluci´on con estrategias mixtas. A continuaci´on, ejemplificamos la soluci´on de un juego a trav´es de estrategias mixtas. Ejemplo 3. Estrategias mixtas. Resolver el juego con la siguiente matriz de pagos: -10 40 30 -20 Si el jugador I usa una estrategia mixta aleatoria con la distribuci´on de probabilidad x = (x, 1 − x) y el jugador II usa su estrategia 1, la ganancia esperada para I es: E(x, 1) = −10x + 30(1 − x) = −40x + 30, E(x, 2) = 60x − 20. La Figura siguiente muestra la gr´afica de las ganancias esperadas para el jugador I, en funci´on de la variable x. E(x, j) 40

E(x, 2)

30

10 x

1 E(x, 1)

-10 -20

Figura 1 8

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear ESTRATEGIAS MIXTAS La menor ganancia esperada para el jugador I est´a indicada con l´ınea gruesa en la gr´afica. De esta situaci´on, el mayor valor posible (maximin) es cuando E(x, 1) = E(x, 2); es decir, cuando −40x+30 = 60x−20, x = 12 entonces, x∗ = ( 12 , 12 ) y la ganancia esperada es E(x∗ , j) = 10. Ahora, buscamos la estrategia ´optima para el jugador II; si el jugador II usa una estrategia mixta aleatoria con la distribuci´on de probabilidad y = (y, 1 − y) y el jugador I usa su estrategia pura 1, la ganancia esperada para el jugador II es: E(1, y) = −10y + 40(1 − y) = −50y + 40, E(2, y) = 50y − 20. La Figura siguiente muestra la gr´afica de las p´erdidas para el jugador II (ganancias para el jugador I), en funci´on de la variable y. E(i, y) 40 E(2, y)

30

10 y

1 E(1, y)

-10 -20

Figura 2 La mayor p´erdida esperada para el jugador II es la poligonal de l´ınea gruesa y el menor valor de esta p´erdida (minimax) se encuentra cuando E(1, y) = E(2, y); es decir: −50y + 40 = 50y − 20, 60 = 100y =⇒ y = 35 . Entonces, y ∗ = ( 35 , 25 ) y la ganancia esperada del juego es ν = 10; como el valor del juego es positivo, podemos decir que hay ventaja para el jugador I.

9

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Investigación de Operaciones Unidad 4. Teoría de Juegos Contenido nuclear

Bibliograf´ıa Barron, E.N. (2008). Game Theory An Introduction. U.S.A. John Wiley Sons.

11

Ciencias exactas e ingenierías/Licenciatura en Matemáticas


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.