Elaborado Por: Damas, Anyelina Caicedo, Waleska Mรกrquez, Gabriel
CONTENIDO Pág. Optimización Sin Restricción y Función de Dos Variables
3
Importancia
4
Función de Dos Variables
5
Métodos
6
Etapas
22
Casos Prácticos
27
Pasa Tiempos
31
Optimización Sin Restricciones (Función de Dos Variables) En optimización sin restricciones se minimiza una función objetivo que depende de variables reales sin restricciones sobre los valores de esas variables. La formulación Punto A es el máximo local matemática es: Punto B es el mínimo local (OSR) min x∈IRn f(x) No hay máximo no mínimo global.
La flecha en el lado derecho indica que la función continua aumenta cuando x aumenta si x es mayor que el nivel asociado con punto B. La flecha en el lado izquierdo indica que la función disminuye cuando x disminuye si x es menor que el nivel asociado con punto A.
3
Optimización Sin Restricciones (Función de Dos Variables)
De La Optimización Sin Restricciones
Hay problemas que se pueden formular sin Restricciones. Permiten introducir muchos conceptos y explorar ideas que se usarán en problemas NLP Muchos problemas de optimización utilizan en alguna fase algoritmos sin restricciones. Algunos problemas NLP pueden reformularse como problemas sin restricciones
4
Optimización Sin Restricciones
Función Objetivo: de dos variables 3. El producto de las derivadas parciales de segundo orden en el punto critico deben exceder el producto de las derivadas parciales cruzadas también evaluadas en dicho punto. Esta 1. Las derivadas parciales de primer orden condiciendo adicional es necesaria para deben simultáneamente ser iguales a cero. evitar punto de inflexión o punto de silla. Ello indica que un punto dado (8ª c) llamado “Punto Critico la función no esta creciendo ni decreciendo con respecto a los ejes principales sino a una superficie relativa. ¡¡Tips¡¡ Para que una función como f = z(x,y) tenga un mínimo o máximo relativo, tres condiciones deben ser satisfechas:
2. Las derivadas parciales de segundo orden deben ser negativas, cuando ellas son evaluadas en el punto critico (a,b) para un máximo relativo y positivas para un mínimo relativo. Ello asegura que la función es cóncava y moviéndose hacia abajo en relación a los ejes principales en el caso de un máximo relativo y la función convexo y moviéndose hacia arriba en relación a los ejes principales en el caso de un mínimo relativo.
En la situación que fxx fyy < (fxy) cuando fxx y fyy tienen el mismo signo , la función esta en un punto de inflexión . Caso contrario , la función estará en un punto de silla
Nota: Las derivadas parciales de segundo orden son evaluadas en el punto critico (a,b) o los puntos críticos que hubiere.
5
Optimización Sin Restricciones
NEWTON Es un método numérico que se utiliza para encontrar ceros de una función. Sea F : Rn → Rn un campo vectorial de clase ζ1(Rn). Un punto x ∈ Rn será un cero de F si: F(x)=0; También el método newton es uno de los mas utilizados para localizar raíces ya que en general es muy eficiente y siempre converge para una función polinomial.
6
Optimización Sin Restricciones
NEWTON
Ventajas: El procedimiento presenta convergencia cuadrática. Para una función cuadrática, el mínimo se obtiene en un solo paso.
Desventajas: Se puede calcular tanto f´(x) como f´´(x). 0 el método converge muy lentamente. Si f´´(x) Si existe mas de un extremo , el método podría no converger al extremo deseado, además el método podría oscilar
7
Optimizaci贸n Sin Restricciones
De la Secante Los m茅todos de secante toman dos puntos, y resuelve una ecuaci贸n similar a la dada en el m茅todo de Newton
8
Optimización Sin Restricciones
De la Secante El método de la secante parece bastante “crudo” pero funciona bastante bien en la práctica. El orden de convergencia para funciones de una sola variable es de :
El método de la secante aproxima la segunda derivada por una línea recta. Cuando xq→x p el valor de m se aproximará al valor de la segunda derivada. En este sentido el método de la secante se podría considerar también un método cuasi Newton. Admitiendo que la función es unimodal, el método comienza con dos puntos cualquiera del intervalo de tal manera que la primera derivada tenga signos diferentes. Calculando el cero de la ecuación de partida se obtiene:
9
Optimización Sin Restricciones Esquema iteración del Método Gradiente
Método del Gradiente o de Cauchy Sea f : Rn → R diferenciable. La derivada direccional de f en la dirección d ∈ Rn está dada por: Df(x; d) = ∇f(x) td Para obtener la dirección de máximo descenso de la función f en un punto x ∈ Rn tal que ∇f(x) 6= 0, se debe resolver el problema:
La solución problema es:
de
este
Y por lo tanto la dirección de máximo descenso de la función f es: d = −∇f(x)
El gradiente de una función en un punto indica la dirección, a partir de ese punto, en la que dicha función crece más rápidamente y, además, la dirección ortogonal a las curvas de nivel de f (curvas en las que la función tiene un valor constante)
10
Optimización Sin Restricciones Método del Gradiente Conjugado Sea (PC) el problema1/2xt Qx − bt x (PC) de optimizacióndonde Q es una cuadrático definidomatriz definida por: positiva min x∈Rn q(x) =
Definición: método del gradiente conjugado es un algoritmo para resolver numéricamente los sistema de ecuaciones lineales cuyas matrices son simétricas y definidas positivas. Es un método iterativo, así que se puede aplicar a los sistemas dispersos que son demasiado grandes para ser tratados por métodos directos como la descomposición de Cholesky tales sistemas surgen frecuentemente cuando se resuelve numéricamente las ecuaciones en derivadas parciales.
11
Nota: Si el Método de Gradiente Conjugado no termina en
Optimización Sin Restricciones
Método de FletcherReeves El método de Fletcher-Reeves debiera converger en N iteraciones o menos para el caso de una función cuadrática. Sin embargo, para cuadráticas mal condicionadas (aquellas cuyos contornos son altamente excéntricos y distorsionados), el método puede requerir mucho más de N iteraciones para converger.
Ejemplo
12
Optimización Sin Restricciones Método de Newton Kantorovich El método de Newton es un método numérico que se utiliza para encontrar ceros de una función. Sea F : Rn → Rn un campo vectorial de clase ζ1(Rn). Un punto x ∈ Rn será un cero de F si: F(x)=0
Método de DFP: Davidon Fletcher- Powell
Método de Powell BFGS
El método de BFGS se deriva de Método del neutonio en la optimización, usa técnicas que busca punto inmóvil de una función, donde gradiente es 0. El método del neutonio asume que la función se puede localmente aproximar como ecuación cuadrática en la región alrededor del grado óptimo, y utiliza los primeros y segundos derivados para encontrar el punto inmóvil.
Ha sido y sigue siendo una técnica de gradiente ampliamente utilizada. El método tiende a ser robusto; esto es, típicamente tiende a tener un buen comportamiento en una amplia variedad de problemas prácticas. La mayor desventaja de este tipo de métodos es su necesidad de almacenar la matriz A de N × N. Una de las dificultades practicas comunes de estos métodos es la tendencia de A(k+1) a estar mal condicionada, lo que causa una mayor dependencia a un procedimiento de re inicialización.
13
Optimización Sin Restricciones
Ascenso Rápido/ Pronunciado se usaran diseños experimentales factoriales o fraccionados la economía y simplicidad del diseño pueden ser muy importantes. El resultado del proceso de construcción de un modelo es una ecuación. El procedimiento de construcción del modelo experimental y la secuencia experimental son usados en la búsqueda de una región para la respuesta de mejora que es el método de ascendencia rápida . El diseño de experimentos es un procedimiento que construye una secuencia de experimentos para obtener una región de mejora que constituya un método de mejora ascendente. Una de las cosas que siempre
debemos tener presentes es que la estrategia involucra una secuencia de movimientos específica para cada región de factores. Así el resultado total de operaciones puede involucrar más de un experimento. Uno de los principios que asumimos es que el modelo se puede representar en un plano lo cual es una aproximación razonable de un sistema inicial en la región X1, X2, X3,…Xk Entonces el método de ascenso pronunciado contiene los siguientes pasos.
14
Optimización Sin Restricciones
Pasos
Ascenso Rápido/ Pronunciado
Decidimos un modelo de primer orden apropiado a un plano o un hiperplano usando el diseño ortogonal. Dos niveles de diseño pueden ser los apropiados aunque las corridas centrales sean las más recomendadas. Calcular una trayectoria de ascenso pronunciado si se quiere maximizar la respuesta (máximo incremento). Si se requiere la mínima respuesta, uno debe calcular la trayectoria descendente (máximo decremento). La conducta experimental corre separada de la trayectoria. Esto es que se tiene una corrida y se realizan otras para comparar los resultados. Los resultados normalmente muestran los valores de la respuesta mejorada. Para alguna región la mejora desciende y eventualmente desaparece. Frecuentemente la primera corrida es tomada cerca del perímetro del diseño.(Se busca el valor de 1 para la variable más importante y así se confirma el experimento).
15
Optimización Sin Restricciones
Pasos
Ascenso Rápido/ Pronunciado
Para algún punto tenemos una aproximación del máximo o del mínimo que se localiza en la trayectoria. Se elige la base del segundo experimento. El diseño puede ser otra vez de primer orden. Se toma las corridas centrales para probar la curvatura y los grados de libertad. Se realiza un segundo experimento se ajusta a los datos. Se realiza la prueba de carencia de ajuste. Si la carencia de ajuste no es significativa, se obtiene una segunda trayectoria de un nuevo modelo. Esto generalmente se llama corrección a medio camino. Se conducen experimentos sencillos o replicados para obtener una segunda trayectoria. Es una razón por la cual la mejora no es tan fuerte como en la primera trayectoria. Después que la mejora va disminuyendo se elaboran experimentos y procesos de optimización más sofisticados.
16
Optimización Sin Restricciones
N O T A S R A P I D A S
1 El ascenso pronunciado es la primera técnica de optimización. Funciona si empezamos en un punto alejado del óptimo. Si usas un punto en el extremo de la superficie de respuesta el ascenso pronunciado lo conseguirás moviéndote muy poco del punto de salida.
2. En ocasiones es útil hacer observaciones individuales en cada punto de la trayectoria, replicas u otras corridas 3. También se pueden aplicar otras técnicas de optimización. Existen algunos métodos para el ascenso más rápido
17
Optimización Sin Restricciones Método de LaGranje En los problemas de optimización, el método de los multiplicadores de LaGrange, llamados así en honor a Joseph Louis LaGrange, es un procedimiento para encontrar los máximos y mínimos de funciones de múltiples variables sujetas a restricciones. Este método reduce el problema restringido con n variables a uno sin restricciones de n + k variables, donde k es igual al número de restricciones, y cuyas ecuaciones pueden ser resueltas más fácilmente. Estas nuevas variables escalares desconocidas, una para cada restricción, son llamadas multiplicadores de LaGrange.
El método dice que los puntos donde la función tiene un extremo condicionado con k restricciones, están entre los puntos estacionarios de una nueva función sin restricciones construida como una combinación lineal de la función y las funciones implicadas en las restricciones, cuyos coeficientes son los multiplicadores.
18
Optimización Sin Restricciones Método de LaGranje Demostración Consideremos inicialmente una relación equivalencia sobre el grupo G, definida como:
de
Dado que sabemos por hipótesis que G es finito, sabemos que únicamente puede existir un número finito de clases de equivalencia distintas, es decir, el orden de G:H es finito. Se puede demostrar que: Es la clase de equivalencia para la relación . Supongamos entonces que las clases de equivalencia distintas son: . Dado que son distintas y son todas las posibles, G es unión disjunta de estas clases:
19
Optimizaci贸n Sin Restricciones M茅todo de LaGranje Consecuencias Una consecuencia inmediata del teorema de LaGrange es que todo grupo de orden primo es c铆clico, pues el orden de un elemento de debe dividir , y si dicho elemento es distinto de la identidad de , entonces resulta que el orden de s贸lo puede ser , de modo que es un generador de .
20
Optimizaci贸n Sin Restricciones M茅todo de LaGranje Generalizaci贸n El teorema de LaGrange es en realidad un caso especial del hecho siguiente:
21
Optimizaci贸n Sin Restricciones
22
Optimizaci贸n Sin Restricciones
23
Optimizaci贸n Sin Restricciones
Optimizaci贸n Sin Restricciones
25
Optimizaci贸n Sin Restricciones
26
CASOS PRACTICOS
27
,
EJERCICIO 1
Se lanza un nuevo producto al mercado. El volumen de ventas x se incrementa como una función del tiempo t y después también de la cantidad A gastada en la compañía publicitaria. Si, cn t medido en meses y A en dólares.
La derivada parcial / representa la tasa de incremento en el volumen de ventas con respecto al tiempo cuando el gasto en publicidad se mantiene fijo. Esto quiere decir que se emplea 1 en función del tiempo y se gasta en campaña de publicidad 400. Entonces “x” se incrementa en 335 por cada incremento unitario en “t” y “x” se incrementa en 0.11 por cada incremento de “A”.
28
,
EJERCICIO 2
Una empresa ha decidido mejorar su seguridad instalando 9 alarmas. Un especialista en el tema señala que dad la estructura de la empresa solo puede optar por dos tipos de alarmas, de tipo A o de tipo B; además que la seguridad de la empresa se puede expresar como la décima parte del producto entre el número de alarmas de tipo A instaladas y el cuadro del número de alarmas instaladas de tipo B. ¿Cuántas alarmas de cada tipo se deben instalar en la empresa para maximizar su seguridad? Determinar la función: Llamemos x a las alarmas de tipo B instaladas, con lo que las alarmas de tipo A serán (9-x) La seguridad de la empresa viene expresada por la función f(x)= (9-x)x2/10 = (9x2-x3)/10 b. Calcular el máximo Calculamos f'(x)= (18x-3x2)/10 Resolvemos la ecuación: f'(x)=0. Soluciones: x=0, x=6 Calculamos f''(x)= (18-6x)/10 y su signo en estos valores. El máximo se obtiene en x=6 c. Criticar las soluciones Deberemos instalar 6 alarmas de tipo B y 3 de tipo A (9-x) = 9 – 3 = 6.
29
,
EJERCICIO 3
Para la fabricación de un determinado producto, se necesita invertir dinero en contratar empleados y comprar maquinas. El dueño de la fábrica ha estimado que si compra “x” máquinas y contrata “y” empleados, el número de unidades de productos que podría fabricar vendría dado por la función f(X,Y) = 90 cada máquina le supone una inversión de 2500$ y cada contrato de un nuevo empleado otro de 1500$, si el empresario solo dispone de un presupuesto de 22500$ para este fin, determine el número de obreros que debe contratar y el número de máquinas que debe comprar maximizar la producción.
Llamamos X = n° de máquinas; y = n° de empleados Hacemos de maximizar la función f(X,Y) = 90. Imponemos las restricciones del enunciado:
30
PASA TIEMPOS
31
32
33