Compendio de técnicas para la toma de decisiones

Page 1

A単o 14 No. 1


Directorio

Contenido

Directorio David Mastantuono

Programación lineal……………..1

Editor de arte

Método simplex…………………..2

David Mastantuono

Lógica Bayesana ……………….8

Redactor

Teoría de juego………………….9 Método de localización y transporte……………………….14 Técnica de monte carlo……….17

David Mastantuono Diseño grafico David Mastantuono


1

La programación lineal es una técnica matemática relativamente reciente (siglo XX), que consiste en una serie de métodos y procedimientos que permiten resolver problemas de optimización en el ámbito, sobre todo, de las Ciencias Sociales. Nos centraremos en este tema en aquellos problemas simples de programación lineal, los que tienen solamente 2 variables, problemas bidimensionales. Para sistemas de mas variables, el procedimiento no es tan sencillo y se resuelven por el llamado método Simplex (ideado por G.B.Danzig, matemático estadounidense en 1951). Recientemente (1984) el matemático indio establecido en Estados Unidos, Narenda Karmarkar, ha encontrado un algoritmo, llamado algoritmo de Karmarkar, que es mas rápido que el método simplex en ciertos casos. Los problemas de este tipo, en el que intervienen gran numero de variables, se implementan en ordenadores.

Una inecuación lineal con 2 variables es una expresión de la forma: ax+ by ≤ c (donde el sımbolo ≤ puede ser también ≥ , < o bien >), donde a, b y c son números reales y x e y las incógnitas. Para resolver estas inecuaciones, se recordara de otros cursos, hay que representar graficamente en el plano la recta dada por la correspondiente ecuación lineal y marcar una de las dos regiones en que dicha recta divide al plano. Ejemplo: Si queremos resolver la inecuación: 2x+ 3y ≥ −3, representamos en primer lugar la recta 2x+ 3y = −3: 127


2

• • • • • • • •

PASO 1. Poner el problema en forma estandar: La funci¶on objetivo se minimiza y las restricciones son de igualdad. PASO 2. Encontrar una soluci¶on b¶asica factible (SBF). PASO 3. Testar la optimalidad. PASO 4. Elegir una variable de entrada. PASO 5. Elegir la variable de salida. PASO 6. Actualizar la base y la soluci¶on b¶asica factible. PASO 7. Volver al PASO 3


3

PASO 1: Poner el problema en forma estandar. Supongamos que tenemos el siguiente problema de programaci¶on lineal (PPL): maximizar 3x1 + 5x2 1 sujeto a x1 + x2 · 50 2 x1 + x2 ¸ 25 3 x1; x2 ¸ 0 4 Necesitamos que la funci¶on objetivo (#1) sea de minimizaci¶on, y que todas las restricciones sean igualdades (#2,#3). La ¶ultima restricci¶on se denomina restricci¶on no negativa (#4), y no var¶³a. Este PPL no est¶a en forma estandar. Entonces hay dos pasos que tenemos que realizar: ² Cambiar de maximizaci¶on a mimizaci¶on: Multiplicamos la funci¶on objetivo (#1) por -1. En este caso, la funci¶on objetivo ser¶a minimizar ¡3x1 ¡ 5x2 1 sujeto a x1 + x2 · 50 2 x1 + x2 ¸ 25 3 x1; x2 ¸ 0 4 ² Convertir las inequaciones en ecuaciones: A~nadimos variables de holgura. Consideremos la desigualdad # 2. Tenemos la desigualdad ·. Como x1 +x2 tiene que se menor que 50, podemos a~nadir una variable x3 positiva que nos hace alcanzar el 50. Ahora tenemos x1 + x2 + x3 = 50 y x3 ¸ 0. Cuando a~nadimos variables a las restricciones, tenemos que tener en cuenta la funci¶on objetivo. El coste asociado a estas nuevas variables ser¶a 0. minimizar ¡3x1 ¡ 5x2 1 sujeto a x1 + x2 + x3 = 50 2 x1 + x2 ¸ 25 3 x1; x2; x3 ¸ 0 4 La siguiente desigualdad es del tipo ¸ y actuaremos de forma similar: x1 + x2 es mayor que 25, necesitamos restar una variable positiva x4 para obtener 25. Su coste asociado ser¶a 0. minimizar ¡3x1 ¡ 5x2 1 sujeto a x1 + x2 + x3 = 50 2 x1 + x2 ¡ x4 = 25 3 x1; x2; x3; x4 ¸ 0 4


4

• Resolver mediante el método simplex el siguiente problema: MaximizarZ = f(x,y) = 3x + 2ysujeto a:2x + y ≤ 18 2x + 3y ≤ 42 3x + y ≤ 24 x ≥ 0 , y ≥ 0Se consideran las siguientes fases: Realizar un cambio de variables y normalizar el signo de los términos independientes.Se realiza un cambio en la nomenclatura de las variables. Estableciéndose la correspondencia siguiente: x pasa a ser X1 y pasa a ser X2 Como los términos independientes de todas las restricciones son positivos no es necesario hacer nada. En caso contrario habría que multiplicar por "-1" en ambos lados de la inecuación (teniendo en cuenta que esta operación también afecta al tipo de restricción). Normalizar las restricciones.Se convierten las inecuaciones en ecuaciones agregando variables de holgura, exceso y artificiales según la tabla siguiente: Tipo de desigualdadTipo de variable que aparece≥- exceso + artificial=+ artificial≤+ holguraEn este caso se introduce una variable de holgura (X3, X4 y X5) en cada una de las restricciones del tipo ≤, para convertirlas en igualdades, resultando el sistema de ecuaciones lineales: 2·X1 + X2 + X3 = 182·X1 + 3·X2 + X4 = 423·X1 + X2 + X5 = 24 Igualar la función objetivo a cero.Z - 3·X1 - X2 - 0·X3 - 0·X4 - 0·X5 = 0 Escribir la tabla inicial del método Simplex.La tabla inicial del método Simplex está compuesta por todos los coeficientes de las variables de decisión del problema original y las de holgura, exceso y artificiales agregadas en el paso 2 (en las columnas, siendo P0el término independiente y el resto de variables Pi coinciden con Xi), y las restricciones (en las filas). La columna Cb contiene los coeficientes de las variables que se encuentran en la base. La primera fila está formada por los coeficientes de la función objetivo, mientras que la última fila contiene el valor la función objetivo y los costes reducidos Zj - Cj. La última fila se calcula como sigue: Zj = Σ(Cbi·Pj) para i = 1..m, donde si j = 0, P0 = bi y C0 = 0, y en caso contrario Pj = aij. Aunque al tratarse de la primera tabla del método Simplex y ser todos los Cb nulos se puede simplificar el cálculo, y por esta vez disponer Zj = -Cj.


5 Condición de parada.Si el objetivo es la maximización, cuando en la última fila (fila indicadora) no existe ningún valor negativo entre los costes reducidos (columnas P1 en adelante) se alcanza la condición de parada. En tal caso se llega al final del algoritmo ya que no existe posibilidad de mejora. El valor de Z (columna P0) es la solución óptima del problema. Otro caso posible es que en la columna de la variable entrante a la base todos los valores son negativos o nulos. Esto indica que el problema no se encuentra acotado y su solución siempre resultará mejorable. Ante esta situación no es necesario continuar iterando indefinidamente y también se puede dar por finalizado el algoritmo. De no ser así, se ejecutan los siguientes pasos de forma iterativa. Elección de la variable entrante y saliente de la base. Se determina en primer lugar la variable que entra en la base. Para ello se escoge la columna cuyo valor en la fila Z sea el menor de entre todos los negativos. En este caso sería la variable X1 (P1) de coeficiente -3. Si existiesen dos o más coeficientes iguales que cumplan la condición anterior (caso de empate), entonces se optará por aquella variable que sea básica. La columna de la variable que entra en la base se llama columna pivote (en color verde). Una vez obtenida la variable que entra en la base, se procede a determina cual será la variable que sale de la misma. La decisión se toma en base a un sencillo cálculo: dividir cada término independiente (columna P0) entre el elemento correspondiente de la columna pivote, siempre que ambos elementos sean estrictamente positivos (mayores que cero). Se escoge la fila cuyo resultado haya resultado mínimo. Si hubiera algún elemento menor o igual a cero no se realiza dicho cociente. En caso de que todos los elementos de la columna pivote fueran de ésta condición se habría cumplido la condición de parada y el problema tendría una solución no acotada (ver teoría del método Simplex). En este ejemplo: 18/2 [=9] , 42/2 [=21] y 24/3 [=8] El término de la columna pivote que en la división anterior dio lugar al menor cociente positivo indica la fila de la variable de holgura que sale de la base. En este caso resulta ser X5 (P5), de coeficiente 3. Esta fila se llama fila pivote (en color verde). Si al calcular los cocientes, dos o más resultados cumplen la condición para elegir el elemento saliente de la base (caso de empate), se escoge aquella que no sea variable básica (siempre que sea es posible).


6

En la fila del elemento pivote cada nuevo elemento se calcula como:Nuevo Elemento Fila Pivote = Anterior Elemento Fila Pivote / Pivote En el resto de las filas cada elemento se calcula:Nuevo Elemento Fila = Anterior Elemento Fila - (Anterior Elemento Fila en Columna Pivote * Nuevo Elemento Fila Pivote) Con esto se normaliza el elemento pivote y su valor pasa a ser 1, mientras que el resto de elementos de la columna pivote se anulan (análogo al método de Gauss-Jordan). Se muestran a continuación los cálculos para la fila P4: Anterior fila P44223010 ------Anterior Elemento Fila en Columna Pivote222222 xxxxxxNueva fila pivote811/3001/3 ======Nueva fila P42607/301-2/3La tabla correspondiente a esta segunda iteración es: Tabla II . Iteración nº 2 32000BaseCbP0P1P2P3P4P5P30201/310-2/3P402607/3012/3P13811/3001/3Z 240-1001 Al comprobar la condición de parada se observa que no se cumple ya que entre los elementos de la última fila hay uno negativo, -1. Se continúa iterando nuevamente los pasos 4, 5 y 6. 5.1. La variable que entra en la base es X2 (P2), por ser la variable que corresponde a la columna donde se encuentra el coeficiente -1. 5.2. Para calcular la variable que sale, se dividen los términos de la columna P0 entre los términos correspondientes de la nueva columna pivote: 2 / 1/3 [=6] , 26 / 7/3 [=78/7] y 8 / 1/3 [=24]. Como el menor cociente positivo es 6, la variable que sale de la base es X3 (P3). 5.3. El elemento pivote es 1/3. 6. Actualizando nuevamente los valores de la tabla se obtiene:


7

Tabla III . Iteración nº 3 32000BaseCbP0P1P2P3P4P5P2260130-2P401200-714P13610101Z 300030-1 Una nueva comprobación de la condición de parada revela que entre los elementos de la fila indicadora vuelve a haber uno negativo, -1. Significa que aun no se ha llegado a la solución óptima y hay que seguir iterando (pasos 4, 5 y 6): 5.1. La variable que entra en la base es X5 (P5), por ser la variable que corresponde al coeficiente -1. 5.2. Se escoge la variable que sale calculando el cociente entre los términos de la columna de términos independientes y los términos correspondientes de la nueva columna pivote: 6/(-2) [=-3] , 12/4 [=3], y 6/1 [=6]. En esta ocación es X4 (P4). 5.3. El elemento pivote es 4. 6. Después de actualizar todas las filas, se obtiene la tabla siguiente: Tabla IV . Iteración nº 4 32000BaseCbP0P1P2P3P4P5P221201-1/21/20P503007/41/41P133103/4-1/40Z 33005/41/40 Fin del algoritmo.Se observa que en la última fila todos los coeficientes son positivos cumpliéndose, por tanto la condición de parada. La solución óptima viene dada por el valor de Z en la columna de los términos independientes (P0), en este ejemplo: 33. En la misma columna se puede ver el punto donde se alcanza, observando las filas correspondientes a las variables de decisión que han entrado en la base: X1 = 3 y X2 = 12. Deshaciendo el cambio de variables se obtiene x = 3 e y = 12.


8

Se encarga de estudiar y analizar al consumidor, se observan las características y los atributos que describen el comportamiento del potencial cliente. Consiste en aislar los atributos que la persona en cuestión le asigna al determinado producto, y una vez hecho esto aislarlo, y estudiarlo y analizarlo. Se dejan de lado todos los otros factores, como características del producto, del cliente, etc., y se centra simplemente en este atributo encontrado. La teoría Bayesiana les da la libertad a los investigadores de estudiar la complejidad del comportamiento humano de una forma mucho más realista, de lo que era previamente posible. Aunque ningún método es 100 % exacto ya que la psiquis humana es demasiado compleja como para simplificarla en una teoría. El razonamiento bayesiano proporciona un enfoque probabilístico a la inferencia. Está basado en la suposición de que las cantidad de interés son gobernadas por distribuciones de probabilidad y que se pueden tomar decisiones óptimas razonando sobre estas probabilidades junto con los datos obtenidos. Este enfoque está siendo utilizado en multitud de campos de investigación, de los que cabe destacar la robótica móvil y la visión computacional, ambas relacionadas con el contenido de esta tesis. En este apéndice queremos definir dos de las herramientas utilizadas en el desarrollo de esta tesis: el teorema de Bayes y el principio de longitud de descripción mínima.


9

La Teoría de Juegos estudia de manera formal y abstracta las decisiones óptimas que deben tomar diversos adversarios en conflicto, pudiendo definirse como el estudio de modelos matemáticos que describen el conflicto y la cooperación entre entes inteligentes que toman decisiones. Tales decisiones se consideran estratégicas, es decir, que los entes que participan en el juego actúan teniendo en cuanta las acciones que tomarían los demás. La teoría de juegos es capaz de ofrecer cuestiones de interés para estudiantes de todas las ramas de las Ciencias Sociales y la Biología, así como técnicas para tomar decisiones prácticas. Aunque la palabra “juego” tiene connotaciones lúdicas y relativas al azar, la teoría de juegos no tiene como principal objetivo el estudio de los juegos de salón, aunque sí entran dentro de su dominio. Una terminología alternativa que ilustra más claramente el objeto de la Teoría de Juegos es el “análisis matemático de conflictos” y la “toma interactiva de decisiones”.


10

Los jugadores son entes decidores que se consideran racionales, no necesariamente humanos, porque las nuevas tendencias de la Biología explican la formación de los instintos o de numerosos mecanismos de cooperación animal por medio de la Teoría de Juegos. Como ejemplos característicos de juegos podrían citarse no sólo los juegos de mesa, sino también conflictos militares, modelos de evolución biológica, campañas políticas, de publicidad o de comercialización y una innumerable lista de situaciones de competencia entre empresas. El principio fundamental para hallar la solución de un juego de decisiones simultáneas, donde los jugadores poseen información completa, es el equilibrio de Nash. También es posible tratar juegos dinámicos donde los jugadores toman sus decisiones de forma consecutiva, empleando el principio de inducción hacia atrás.


EJEMPLO DE LA TEORIA DE JUEGO El Dilema del Prisionero es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado por la Teoría de Juegos, que ha sido utilizado como crítica hacia el enfoque de la elección racional (preconiza que todo acto humano, norma o institución debía ser juzgado según la "utilidad", esto es, según el placer o el sufrimiento que producen en las personas, no de acuerdo a criterios morales o normativos ajenos a las mismas). Dos delincuentes son detenidos y encerrados en celdas de aislamiento de tal forma que no pueden comunicarse entre ellos. La policía tiene la certeza de que han participado en el robo a mano armada de un banco, delito cuya pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel. Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco. .

11


EJEMPLO DE LA TEORIA DE JUEGO

12

Dilema del prisionero Matriz de Pagos (años de cárcel)

Dilema del prisionero Matriz de Pagos (orden de preferencias)

Preso YLealtadTraiciónPrisionero XLealtad2 / 210 / 1Traición1 / 105 / 5

Preso YLealtadTraiciónPrisionero XLealtad2 / 2* 4 / 1Traición* 1 / 43 / 3

Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos.

La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y está señalado en la matriz mediante un asterisco.

En vez de expresar los pagos en años de cárcel, podríamos indicar simplemente el orden de preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicación más general.


EJEMPLO DE LA TEORIA DE JUEGO • El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula, bipersonal, biestratégico y simétrico. Fue formalizado y analizado por primera vez por A . W. Tucker en 1950. Es posiblemente el juego más conocido y estudiado en la teoría de juegos. En base a él se han elaborado multitud de variaciones, muchas de ellas basadas en la repetición del juego y en el diseño de estrategias reactivas.

13


METODO DE TRANSPORTE El Modelo de transporte es una clase especial de problema de Programación Lineal. Trata la situación en la cual se envía un bien de los puntos de origen (fábricas), a los puntos de destino (almacenes, bodegas, depósitos). El objetivo es determinar las cantidades a enviar desde cada punto de origen hasta cada punto de destino, que minimicen el costo total de envío, al mismo tiempo que satisfagan tanto los límites de la oferta como los requerimientos de la demanda. El modelo supone que el costo de envío de una ruta determinada es directamente proporcional al número de unidades enviadas en esa ruta. Sin embargo, algunas de sus aplicaciones importantes (como la Programación de la Producción) de hecho no tienen nada que ver con el transporte. El algoritmo de transporte sigue los pasos exactos del método simplex. Sin embargo, en vez de utilizar la tabla simplex regular, aprovechamos la estructura especial del modelo de transporte para presentar el algoritmo en una forma más conveniente:

14


METODO DE TRANSPORTE EJEMPLO Construya el modelo matemático de la siguiente matriz de transporte:

15

El Modelo matemático se expresará como: MINIMIZAR Z = 41 A1 + 27 B1 + 28 C1 + 24 D1 + 40 A2 + 29 B2 + 50 C2 + 23 D2 + 37 A3 + 30 B3 + 27 C3 + 21 D3 Sujeta a las siguientes restricciones:

Respuesta: Tomando en cuenta que los resultados se van a indicar en una tabla similar a la siguiente:

-“Restricciones horizontales”: A1 + B1 + C1 + D1 = 60 (1) A2 + B2 + C2 + D2 = 15 (2) A3 + B3 + C3 + D3 = 45 (3) -“Restricciones verticales “: A1 + A2 + A3 = 20 (4) B1 + B2 + B3 = 30 (5) C1 + C2 + C3 = 30 (6) D1 + D2 + D3 = 40 (7) Note que el número de restricciones es igual a la suma de los orígenes más los destinos (m+n).


METODO DE TRANSPORTE Los pasos 2 y 3 del sugerido “nuevo” algoritmo se realizan a partir del siguiente problema. En los casos especiales, donde la oferta sea mayor que la demanda, se construye el modelo matemático con la variación de que las “restricciones horizontales” serán del tipo “ < = “ y no igualdades . En los casos especiales, donde la oferta sea menor que la demanda, se construye el modelo matemático con la variación de que las “restricciones verticales” serán del tipo “ < = “ y no igualdades. Para fijar bien la idea de estos casos especiales, más adelante, se abordará y solucionará un caso de cada tipo, además de una situación especial donde se nos señalan límites inferiores y superiores de la demanda (demanda mínima necesaria y demanda ideal).

16


METODO MONTE CARLO

17

El método de Montecarlo permite resolver problemas matemáticos mediante la simulación de variables aleatorias. John Von Neumann, en los años 40 y con los primeros ordenadores, aplica la simulación para resolver problemas complejos que no podrıan ser resueltos de forma analítica. Montecarlo y su casino están relacionados con la simulación. La ruleta, juego estrella de los casinos, es uno de los aparatos mecánicos mas sencillos que nos permiten obtener números aleatorios para simular variables aleatorias.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.