Algoritmi per l'ottimizzazione convessa by Vittoriano Muttillo

Università degli Studi dell’Aquila Facoltà di Ingegneria

ALGORITMI PER L’OTTIMIZZAZIONE CONVESSA Prof.ssa Elena De Santis

Luca Finocchio Vittoriano Muttillo

Introduzione • I problemi di ottimizzazione convessa studiano il problema di minimizzare funzioni convesse su insiemi convessi. • Essi sono stati studiati per circa un secolo e diversi sviluppi recenti hanno portato nuovo interesse per l'argomento: • Il primo è il riconoscimento che i metodi a punto interno, sviluppati nel 1980 per risolvere problemi di programmazione lineare, possono essere utilizzati per risolvere problemi di ottimizzazione convessa pura • Il secondo sviluppo è la scoperta che i problemi di ottimizzazione convessa (al di là dei problemi di minimi quadrati e di programmazione lineari) sono più frequenti nella pratica di quello che si pensava.

Introduzione (2) • Dal 1990 molte applicazioni dell’ottimizzazione convessa sono state scoperte in settori quali: 1. 2. 3. 4. 5. 6.

sistemi automatici di controllo sistemi di stima e di elaborazione dei segnali sistemi di comunicazione e di reti progettazione di circuiti elettronici analisi e modellazione dei dati sistemi statistici e della finanza

• Grandi sono i vantaggi per il riconoscimento o la formulazione di un problema come un problema di ottimizzazione convessa. Il vantaggio fondamentale è che il problema può essere risolto, in modo affidabile ed efficiente, utilizzando metodi interni o un altro speciale metodo per l'ottimizzazione.

Introduzione (3) â&#x20AC;˘ Questi metodi di soluzione sono abbastanza affidabili per essere incorporati in una progettazione assistita da computer o da strumenti di analisi, in un sistema reattivo in tempo reale oppure in un sistema di controllo automatico. â&#x20AC;˘ Ci sono anche vantaggi teorici e concettuali nel formulare un problema come un problema di ottimizzazione convessa come, ad esempio, il problema duale associato che spesso ha una interessante interpretazione in termini di problema originale, e talvolta Ă¨ fonte di un metodo efficiente o distribuito per risolverlo. â&#x20AC;˘ Prima di mostrare alcuni metodi di soluzione per problemi di ottimizzazione convessa daremo alcuni richiami di teoria.

Insiemi convessi â&#x20AC;˘ Un insieme C Ă¨ convesso se il segmento che congiunge due punti qualsiasi di C Ă¨ contenuto in C, cioĂ¨: â&#x2C6;&#x20AC; đ?&#x2018;Ľ1, đ?&#x2018;Ľ2 â&#x2C6;&#x2C6; đ??ś e ogni đ?&#x153;&#x192; â&#x2C6;ś 0 â&#x2030;¤ đ?&#x153;&#x192; â&#x2030;¤ 1, si ha che : đ?&#x153;&#x192;đ?&#x2018;Ľ1 + (1 â&#x2C6;&#x2019; đ?&#x153;&#x192;)x2 â&#x2C6;&#x2C6; đ??ś â&#x20AC;˘ Chiameremo un punto nella forma (đ?&#x153;&#x192;1đ?&#x2018;Ľ1 + Âˇ Âˇ Âˇ + đ?&#x153;&#x192;đ?&#x2018;&#x2DC;đ?&#x2018;Ľđ?&#x2018;&#x2DC; ), dove (đ?&#x153;&#x192;1 + Âˇ Âˇ Âˇ + đ?&#x153;&#x192;đ?&#x2018;&#x2DC; = 1, đ?&#x153;&#x192;đ?&#x2018;&#x2013; â&#x2030;Ľ 0, đ?&#x2018;&#x2013; = 1, . . . , đ?&#x2018;&#x2DC;) come combinazione convessa dei punti (đ?&#x2018;Ľ1, . . . , đ?&#x2018;Ľđ?&#x2018;&#x2DC;) â&#x20AC;˘ Un insieme, quindi, e convesso se e solo se contiene ogni combinazione convessa dei suoi punti

Insiemi convessi (2) â&#x20AC;˘ Consideriamo un insieme S definito da vincoli di uguaglianza e disuguaglianza: â&#x20AC;˘ Nel caso in cui đ?&#x2018;&#x201D;đ?&#x2018;&#x2013; per đ?&#x2018;&#x2013; = 1, . . , đ?&#x2018;&#x161; e â&#x201E;&#x17D;đ?&#x2018;&#x2014; per đ?&#x2018;&#x2014; = 1 , . . , đ?&#x2018;? siano funzioni lineari, S Ă¨ un poliedro e quindi un insieme convesso. Se invece qualche đ?&#x2018;&#x201D;đ?&#x2018;&#x2013; đ?&#x2018;&#x153; â&#x201E;&#x17D;đ?&#x2018;&#x2014; Ă¨ non lineare possiamo utilizzare il seguente teorema che fornisce una condizione solo sufficiente per la convessitĂ di S. â&#x20AC;˘ TEOREMA Sia: Se per ogni i le funzioni đ?&#x2018;&#x201D;đ?&#x2018;&#x2013; (đ?&#x2018;Ľ) sono convesse in đ?&#x2018;&#x2026;đ?&#x2018;&#x203A;, e per ogni đ?&#x2018;&#x2014; le funzioni â&#x201E;&#x17D;đ?&#x2018;&#x2014; sono funzioni del tipo đ?&#x2018;&#x17D;đ?&#x2018;&#x2014;đ?&#x2018;&#x2021; đ?&#x2018;Ľ â&#x2C6;&#x2019; đ?&#x2018;?đ?&#x2018;&#x2014;, allora l'insieme S Ă¨ convesso.

Convex hull • Particolare importanza è data dal cosiddetto convex hull • Si definisce convex hull di un insieme C, e lo chiameremo conv C, l’insieme di tutte le combinazioni convesse dei punti di C: • Come suggerisce il nome, il convex hull è sempre convesso. Esso è il più piccolo insieme convesso che contiene C: se C ⊆ B insieme convesso, allora conv C ⊆ B

Insieme non convesso in quanto il segmento che unisce i due punti, mostrato in figura, non è contenuto nel’insieme.

Convex hull dell’insieme mostrato nella figura di sinistra

Funzioni convesse â&#x20AC;˘ Una funzione đ?&#x2018;&#x201C;: đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; â&#x2C6;&#x2019;> đ?&#x2018;&#x2026; Ă¨ convessa se đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; Ă¨ un insieme convesso e se, â&#x2C6;&#x20AC; đ?&#x2018;Ľ, đ?&#x2018;Ś â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C;, 0 â&#x2030;¤ đ?&#x153;&#x192; â&#x2030;¤ 1, si ha che: đ?&#x2018;&#x201C; (đ?&#x153;&#x192;đ?&#x2018;Ľ +

Esempio di grafico di una funzione convessa

Condizioni del primo ordine (1) â&#x20AC;˘ Supponiamo đ?&#x2018;&#x201C; differenziabile (cioĂ¨ il gradiente đ?&#x203A;ťđ?&#x2018;&#x201C; esiste in ogni punto di đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; insieme aperto). Allora đ?&#x2018;&#x201C; Ă¨ convessa se e solo se đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; Ă¨ convesso e la disequazione: đ?&#x2018;&#x201C; đ?&#x2018;Ś â&#x2030;Ľ đ?&#x2018;&#x201C; đ?&#x2018;Ľ + đ?&#x203A;ťđ?&#x2018;&#x201C; đ?&#x2018;Ľ đ?&#x2018;&#x2021;(đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ)

vale â&#x2C6;&#x20AC; đ?&#x2018;Ľ, đ?&#x2018;Ś â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C;.

Grafico che visualizza le condizione del primo ordine per la convessitĂ di una funzione

Condizioni del primo ordine (2) â&#x20AC;˘ OSS: La funzione: đ?&#x2018;&#x201C; đ?&#x2018;Ľ + đ?&#x203A;ťđ?&#x2018;&#x201C; đ?&#x2018;Ľ đ?&#x2018;&#x2021;(đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ) Ă¨ lâ&#x20AC;&#x2122;approssimazione di Taylor del primo ordine di f nellâ&#x20AC;&#x2122;intorno di x

â&#x20AC;˘ La disuguaglianza: đ?&#x2018;&#x201C; đ?&#x2018;Ś â&#x2030;Ľ đ?&#x2018;&#x201C; đ?&#x2018;Ľ + đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ)đ?&#x2018;&#x2021;(đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ) ci mostra che, se đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ) = 0, allora â&#x2C6;&#x20AC; đ?&#x2018;Ś â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; risulta che đ?&#x2018;&#x201C;(đ?&#x2018;Ś) â&#x2030;Ľ đ?&#x2018;&#x201C;(đ?&#x2018;Ľ), cioĂ¨ đ?&#x2018;Ľ Ă¨ un punto di minimo globale della funzione đ?&#x2018;&#x201C;.

Condizioni del secondo ordine â&#x20AC;˘ Assumiamo, adesso f differenziabile due volte, cioĂ¨ la sua matrice Hessiana đ?&#x203A;ť2đ?&#x2018;&#x201C; esiste in ogni punto di đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; insieme aperto. Allora đ?&#x2018;&#x201C; Ă¨ convessa se e solo se đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; Ă¨ convesso e la matrice Hessiana Ă¨ semidefinita positiva, cioĂ¨: đ?&#x203A;ť2đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) â&#x2030;Ľ 0 â&#x2C6;&#x20AC; đ?&#x2018;Ľ â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; â&#x20AC;˘ Analogamente đ?&#x2018;&#x201C; Ă¨ concava se e solo se đ?&#x2018;&#x2018;đ?&#x2018;&#x153;đ?&#x2018;&#x161; đ?&#x2018;&#x201C; Ă¨ convesso e risulta che:

đ?&#x203A;ť2đ?&#x2018;&#x201C; đ?&#x2018;Ľ â&#x2030;¤ 0 â&#x2C6;&#x20AC; đ?&#x2018;Ľ â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C;

Problemi di ottimizzazione • Dal punto di vista delle proprietà di convessità possiamo distinguere:  Problemi di programmazione convessa: sono i problemi di minimo in cui la funzione obiettivo è convessa e l'insieme ammissibile è un insieme convesso (o anche i problemi di massimo in cui la funzione obiettivo è concava e l'insieme ammissibile è convesso)  Problemi di programmazione concava: sono i problemi di minimo in cui la funzione obiettivo è concava e l'insieme ammissibile è un insieme convesso (o anche i problemi di massimo in cui la funzione obiettivo è convessa e l'insieme ammissibile è convesso)  Problemi generali, in cui non sono soddisfatte tali condizioni.

Problemi di ottimizzazione (2) â&#x20AC;˘ Un problema di ottimizzazione ha la seguente forma:

dove: ď&#x201A;§ đ?&#x2018;Ľ = (đ?&#x2018;Ľ1, â&#x20AC;Ś , đ?&#x2018;Ľđ?&#x2018;&#x203A;) Ă¨ la variabile di ottimizzazione del problema ď&#x201A;§ đ?&#x2018;&#x201C;0 â&#x2C6;ś đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; â&#x2C6;&#x2019;> đ?&#x2018;&#x2026; Ă¨ la funzione obiettivo ď&#x201A;§ đ?&#x2018;&#x201C;đ?&#x2018;&#x2013; â&#x2C6;ś đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; â&#x2C6;&#x2019;> đ?&#x2018;&#x2026; , đ?&#x2018;&#x2013; = 1, . . , đ?&#x2018;&#x161; sono le funzioni di vincolo ď&#x201A;§ đ?&#x2018;?1 , . . , đ?&#x2018;?đ?&#x2018;&#x161; sono i limiti dei vincoli

â&#x20AC;˘ Un vettore đ?&#x2018;Ľ* Ă¨ detto ottimo, oppure soluzione del problema di ottimizzazione, se: â&#x2C6;&#x20AC; đ?&#x2018;§ â&#x2C6;ś đ?&#x2018;&#x201C; 1(đ?&#x2018;§) â&#x2030;¤ đ?&#x2018;?1 , . . , đ?&#x2018;&#x201C; đ?&#x2018;&#x161;(đ?&#x2018;§) â&#x2030;¤ đ?&#x2018;?đ?&#x2018;&#x161; risulta che đ?&#x2018;&#x201C; 0(đ?&#x2018;§) â&#x2030;Ľ đ?&#x2018;&#x201C; 0(đ?&#x2018;Ľ*)

Problemi di ottimizzazione convessa (1) â&#x20AC;˘ Un problema di ottimizzazione convessa Ă¨ nella forma:

dove le funzioni đ?&#x2018;&#x201C;0 , . . , đ?&#x2018;&#x201C;đ?&#x2018;&#x161; â&#x2C6;ś đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; â&#x2C6;&#x2019;> đ?&#x2018;&#x2026; sono funzioni convesse, cioĂ¨ soddisfano lâ&#x20AC;&#x2122;equazione: đ?&#x2018;&#x201C; đ?&#x153;&#x192;đ?&#x2018;Ľ + 1 â&#x2C6;&#x2019; đ?&#x153;&#x192; đ?&#x2018;Ś â&#x2030;¤ đ?&#x153;&#x192;đ?&#x2018;&#x201C; đ?&#x2018;Ľ + 1 â&#x2C6;&#x2019; đ?&#x153;&#x192; đ?&#x2018;&#x201C;(đ?&#x2018;Ś) â&#x2C6;&#x20AC; đ?&#x2018;Ľ, đ?&#x2018;Ś â&#x2C6;&#x2C6; đ?&#x2018;&#x2026; đ?&#x2018;&#x203A; đ?&#x2018;&#x2019; đ?&#x2018;&#x153;đ?&#x2018;&#x201D;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013; đ?&#x153;&#x192; â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;, đ?&#x2018;?đ?&#x2018;&#x153;đ?&#x2018;&#x203A; 0 â&#x2030;¤ đ?&#x153;&#x192; â&#x2030;¤ 1. â&#x20AC;˘ Il problema dei minimi quadrati e il problema di programmazione lineare sono due casi particolari del problema generale di ottimizzazione convessa

Problemi di ottimizzazione convessa (2) â&#x20AC;˘ Per riconoscere se un problema Ă¨ convesso o concavo utilizziamo il seguente teorema: â&#x20AC;˘ TEOREMA Sia dato il problema:

â&#x20AC;˘ Si assuma che i vincoli di disuguaglianza siano dati da funzioni gi(x) convesse in đ?&#x2018;&#x2026;đ?&#x2018;&#x203A;, e che i vincoli di uguaglianza siano dati da funzioni del tipo đ?&#x2018;&#x17D;đ?&#x2018;&#x2014;đ?&#x2018;&#x2021;đ?&#x2018;Ľ â&#x20AC;&#x201C; đ?&#x2018;? đ?&#x2018;&#x2014; , allora: ď&#x201A;§ Se la funzione obiettivo đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) Ă¨ una funzione convessa in đ?&#x2018;&#x2026;đ?&#x2018;&#x203A;, il problema Ă¨ convesso. ď&#x201A;§ Se la funzione obiettivo đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) Ă¨ una funzione concava in đ?&#x2018;&#x2026;đ?&#x2018;&#x203A;, il problema Ă¨ concavo.

Problemi di ottimizzazione convessa (3) â&#x20AC;˘ I problemi di ottimizzazione convessi sono di particolare importanza per due motivi: â&#x20AC;˘ Il primo Ă¨ che la grande maggioranza dei problemi di ottimizzazione che si incontrano nella pratica sono convessi. â&#x20AC;˘ Il secondo Ă¨ che la convessitĂ induce alcune proprietĂ che semplificano l'analisi e la soluzione di un problema convesso.

â&#x20AC;˘ Una delle proprietĂ piĂš significative Ă¨ la seguente: TEOREMA (Assenza di ottimi locali): Sia đ?&#x2018;&#x2020; â&#x160;&#x2020; đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; un insieme convesso e f una funzione convessa su đ?&#x2018;&#x2020;. Allora il problema:

o non ha soluzione, o ha solo soluzioni globali

Problemi di minimizzazione convessa (4) • Una serie di problemi di ottimizzazione convessa sono i seguenti:       

Minimi quadrati Programmazione Lineare Minimizzazione quadratica convessa con vincoli lineari Ottimizzazione conica Programmazione geometrica Programmazione conica del secondo ordine Programmazione semi-definita

Metodi risolutivi di problemi di programmazione convessa â&#x20AC;˘ Ottimizzazione non vincolata 1. 2.

Metodo del gradiente Metodo di Newton

â&#x20AC;˘ Minimizzazione con condizioni di uguaglianza 1. 2.

Metodo di Newton Eliminazione delle condizioni di uguaglianza

â&#x20AC;˘ Minimizzazione con condizioni di disuguaglianza 1.

Metodo Interior-point

Ottimizzazione non vincolata PROBLEMA: minimizzare đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) dove â&#x20AC;˘ đ?&#x2018;&#x201C; â&#x2C6;ś đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; â&#x2020;&#x2019; đ?&#x2018;&#x2026; Ă¨ convessa e differenziabile almeno 2 volte Essendo đ?&#x2018;&#x201C; differenziabile e convessa, condizione necessaria e sufficente affinchĂ¨ un punto đ?&#x2018;Ľ â&#x2039;&#x2020; sia ottimo Ă¨ che đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ â&#x2039;&#x2020;) = 0. Pertanto, la soluzione del problema di minimizzazione non vincolata Ă¨ la stessa di đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ â&#x2039;&#x2020;) = 0 che Ă¨ un insieme di n equazioni nelle n variabili đ?&#x2018;Ľ 1,...,đ?&#x2018;Ľ n Di solito, perĂ˛, il problema viene risolto da un algoritmo iterativo

ConvessitĂ stretta â&#x20AC;˘ Da adesso in poi assumeremo che la funzione obbiettivo sia strettamente convessa su S. Questo implica che deve esistere un đ?&#x2018;&#x161; > 0 tale che: đ?&#x203A;ť2đ?&#x2018;&#x201C; đ?&#x2018;Ľ â&#x2030;Ľ đ?&#x2018;&#x161;đ??ź đ?&#x2018;?đ?&#x2018;&#x2019;đ?&#x2018;&#x; đ?&#x2018;&#x153;đ?&#x2018;&#x201D;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013; đ?&#x2018;Ľ â&#x2C6;&#x2C6; đ?&#x2018;&#x2020;. â&#x20AC;˘ La convessitĂ stretta implica moltre conseguenza interessanti . Ad esempio per đ?&#x2018;Ľ, đ?&#x2018;Ś â&#x2C6;&#x2C6; đ?&#x2018;&#x2020; abbiamo che 1 đ?&#x2018;&#x201C;(đ?&#x2018;Ś) = đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) + đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ)đ?&#x2018;&#x2021;(đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ) + (đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ)đ?&#x2018;&#x2021;đ?&#x203A;ť2đ?&#x2018;&#x201C;(đ?&#x2018;§)(đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ) 2 per qualche đ?&#x2018;§ sul segmento [đ?&#x2018;Ľ, đ?&#x2018;Ś]. â&#x20AC;˘ Dallâ&#x20AC;&#x2122;ipotesi di convessitĂ in senso stretto lâ&#x20AC;&#x2122;ultimo termine della parte destra đ?&#x2018;&#x161; dellâ&#x20AC;&#x2122;equazione Ă¨ al massimo 2 đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ 2 ottendendo la disuguaglianza đ?&#x2018;&#x201C;(đ?&#x2018;Ś) â&#x2030;Ľ đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) + đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ)đ?&#x2018;&#x2021;(đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ) +

per ogni x e y in S.

đ?&#x2018;&#x161; 2

| đ?&#x2018;Ś â&#x2C6;&#x2019; đ?&#x2018;Ľ |2

â&#x20AC;˘ Quando m= 0, ritroviamo la disuguaglianza base che caraterizza la convessitĂ ; per m > 0 otteniamo un migliore lower bound di đ?&#x2018;&#x201C;(đ?&#x2018;Ś) che segue solo dalla convessitĂ

Scelta del punto iniziale â&#x20AC;˘ I metodi che descriveremo richiedono un punto di partenza adatto đ?&#x2018;Ľ (0). Questo punto deve ovviamente appartenere al đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; , e inoltre lâ&#x20AC;&#x2122;insieme dei sottolivelli đ?&#x2018;&#x2020; = {đ?&#x2018;Ľ â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C;| đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) â&#x2030;¤ đ?&#x2018;&#x201C;(đ?&#x2018;Ľ(0))} deve essere chiuso. â&#x20AC;˘ Questa condizione Ă¨ soddisfatta per tutte le đ?&#x2018;Ľ (0) â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; se la funzione đ?&#x2018;&#x201C; Ă¨ chiusa, cioĂ¨ se tutti i sottolivelli sono chiusi

â&#x20AC;˘ Funzioni continue con đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; = đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; sono chiuse , quindi se đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; = đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; , la condizione iniziale dellâ&#x20AC;&#x2122;insieme dei sottolivelli Ă¨ soddisfatta per ogni đ?&#x2018;Ľ (0)

Metodi di discesa Questo algoritmo lavora producendo una sequenza minimizzante đ?&#x2018;Ľ (k), đ?&#x2018;&#x2DC; = 1,..., dove: â&#x20AC;˘ â&#x20AC;˘ â&#x20AC;˘ â&#x20AC;˘

đ?&#x2018;Ľ (k+1) = đ?&#x2018;Ľ (k) + đ?&#x2018;Ą(k) â&#x2C6;&#x2020;đ?&#x2018;Ľ (k) đ?&#x2018;Ą(k) â&#x2030;Ľ 0 Ă¨ chiamato â&#x20AC;&#x153;step lengthâ&#x20AC;&#x153; â&#x2C6;&#x2020;đ?&#x2018;Ľ Ă¨ un vettore in đ?&#x2018;&#x2026;n chiamato â&#x20AC;&#x153;search directionâ&#x20AC;&#x153; metodo di discesa implica che đ?&#x2018;&#x201C;(đ?&#x2018;Ľ (k+1)) < đ?&#x2018;&#x201C;(đ?&#x2018;Ľ (k)), tranne quando đ?&#x2018;Ľ (k) Ă¨ ottimo

Per le condizioni del primo ordine sulla convessitĂ , đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ (k))T (yâ&#x2C6;&#x2019;x(k)) â&#x2030;Ľ 0 implica đ?&#x2018;&#x201C; (đ?&#x2018;Ś) â&#x2030;Ľ đ?&#x2018;&#x201C;(đ?&#x2018;Ľ (k)), quindi la â&#x20AC;&#x153;search directionâ&#x20AC;? nei metodi di discesa deve verificare đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ (k))T â&#x2C6;&#x2020;đ?&#x2018;Ľ (k) < 0

Metodi di discesa L’algoritmo procede tramite i seguenti passi: Given a starting point x ∈ dom f repeat 1. Determine a descent direction ∆x 2. Line search : Choose a step size t >0 3. Update x:= x+t∆x until stopping criterion is satisfied

Line search Excat line search â&#x20AC;˘ t Ă¨ scelto in modo da minimizzare f lungo la direzione {đ?&#x2018;Ľ + đ?&#x2018;Ąâ&#x2C6;&#x2020;đ?&#x2018;Ľ | đ?&#x2018;Ą â&#x2030;Ľ 0} â&#x20AC;˘ t = argminsâ&#x2030;Ľ0 đ?&#x2018;&#x201C;(đ?&#x2018;Ľ + đ?&#x2018; â&#x2C6;&#x2020;đ?&#x2018;Ľ) â&#x20AC;˘ Potrebbe risultare computazionalmente difficile

Backtracking line search â&#x20AC;˘ t Ă¨ scelto per minimizzare in modo approssimato f lungo la direzione {đ?&#x2018;Ľ + đ?&#x2018;Ąâ&#x2C6;&#x2020;đ?&#x2018;Ľ | đ?&#x2018;Ą â&#x2030;Ľ 0}, o anche solo per ridurre f â&#x20AC;&#x153;abbastanzaâ&#x20AC;? â&#x20AC;˘ Îąâ&#x2C6;&#x2C6;(0,0.5),Î˛â&#x2C6;&#x2C6;(0,1) t:= 1 while f(x+tâ&#x2C6;&#x2020;x)> f(x) +Îątâ&#x2C6;&#x2021;f(x)Tâ&#x2C6;&#x2020;x, t:= Î˛t

Backtracking line search

Algoritmo del gradiente Una scelta naturale per la â&#x20AC;&#x153;search directionâ&#x20AC;? Ă¨ il gradiente negativo â&#x2C6;&#x2020;đ?&#x2018;Ľ = â&#x2C6;&#x2019;đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ). Il risultante algoritmo Ă¨ chiamato algoritmo del gradiente o metodo del gradiente di discesa:

Metodo di Newton Per ogni đ?&#x2018;Ľ â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C;, il vettore â&#x2C6;&#x2020;đ?&#x2018;Ľđ?&#x2018;&#x203A;đ?&#x2018;Ą = â&#x2C6;&#x2019;đ?&#x203A;ť2đ?&#x2018;&#x201C;(đ?&#x2018;Ľ)â&#x2C6;&#x2019;1 đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ) Ă¨ chiamato passo Newton (per đ?&#x2018;&#x201C;, in đ?&#x2018;Ľ)

Essendo đ?&#x203A;ť 2đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) definito positivo, vale che đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ)T â&#x2C6;&#x2020;đ?&#x2018;Ľđ?&#x2018;&#x203A;đ?&#x2018;Ą = â&#x2C6;&#x2019;đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ)T đ?&#x203A;ť 2đ?&#x2018;&#x201C;(đ?&#x2018;Ľ)â&#x2C6;&#x2019;1 đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ) < 0 tranne che per đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ) = 0, quindi il passo di Newton Ă¨ una direzione di discesa (tranne se đ?&#x2018;Ľ Ă¨ ottimo)

Metodo di Newton La quantitĂ đ?&#x153;&#x2020;(đ?&#x2018;Ľ) = (đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ)T â&#x2C6;&#x2021;2f(x)â&#x2C6;&#x2019;1 â&#x2C6;&#x2021;f(x))1/2 Ă¨ chiamata decremento di Newton per x.

Questa gioca un ruolo importante nellâ&#x20AC;&#x2122;analisi del metodo di Newton ed utile anche come criterio di stop, infatti đ?&#x153;&#x2020;2 2 Ă¨ una stima di f(x)â&#x2C6;&#x2019;f(xâ&#x2039;&#x2020;)basata perĂ˛ sullâ&#x20AC;&#x2122;approsimazione del secondo ordine di f in x.

Metodo di Newton Lâ&#x20AC;&#x2122;algotimo che ne viene fuori Ă¨ il seguente

Minimizzazione con condizione di uguaglianza PROBLEMA : minimizzare đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) sotto la condizione che đ??´đ?&#x2018;Ľ = đ?&#x2018;?, dove: â&#x20AC;˘ đ?&#x2018;&#x201C;: đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; â&#x2020;&#x2019; đ?&#x2018;&#x2026; Ă¨ convessa e differenziabile almeno 2 volte â&#x20AC;˘ đ??´ â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;đ?&#x2018;?Ă&#x2014;n con il rango di đ??´ = đ?&#x2018;? < đ?&#x2018;&#x203A;

Ricordiamo che il punto đ?&#x2018;Ľ â&#x2039;&#x2020; â&#x2C6;&#x2C6; đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x2018;&#x201C; Ă¨ ottimo se e solo se esiste una certa đ?&#x153;&#x2C6; â&#x2039;&#x2020; â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;đ?&#x2018;? tale che đ??´đ?&#x2018;Ľâ&#x2039;&#x2020;= đ?&#x2018;?, đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľâ&#x2039;&#x2020;) + đ??´đ?&#x2018;&#x2021; đ?&#x153;&#x2C6;â&#x2039;&#x2020;= 0

Risolvere un problema di minimizzazione con condizione di uguaglianza Ă¨ equivalente, pertanto, a trovare la soluzione delle equazioni sopracitata, che Ă¨ un insieme di n+p equazioni nelle n+p variabili đ?&#x2018;Ľ â&#x2039;&#x2020;, đ?&#x153;&#x2C6; â&#x2039;&#x2020;

Minimizzazione quadratica con condizione di uguaglianza PROBLEMA : minimizzare đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) =

1 2

đ?&#x2018;Ľ T đ?&#x2018;&#x192; đ?&#x2018;Ľ + đ?&#x2018;&#x17E;đ?&#x2018;&#x2021; đ?&#x2018;Ľ + đ?&#x2018;&#x;

sotto le condizioni đ??´đ?&#x2018;Ľ = đ?&#x2018;?, dove đ?&#x2018;&#x192; â&#x2C6;&#x2C6; đ?&#x2018;&#x2020; đ?&#x2018;&#x203A; and đ??´ â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;pĂ&#x2014;n In questo caso le condizioni ottimali sono le seguenti đ??´đ?&#x2018;Ľâ&#x2039;&#x2020; = đ?&#x2018;?, đ?&#x2018;&#x192;đ?&#x2018;Ľâ&#x2039;&#x2020; + đ?&#x2018;&#x17E; + đ??´T đ?&#x153;&#x2C6;â&#x2039;&#x2020; = 0

che possiamo scrivere come

Questo insieme di n+p equazioni lineari in n+p variabili đ?&#x2018;Ľ â&#x2039;&#x2020;, đ?&#x153;&#x2C6; â&#x2039;&#x2020; Ă¨ chiamato il sistema KKT per il problema di minimizzazione quadratica con condizione di uguaglianza . La matrice dei coefficienti Ă¨ chiamata matrice KKT.

Metodo di Newton Per derivare il passo di Newton â&#x2C6;&#x2020;đ?&#x2018;Ľđ?&#x2018;&#x203A;đ?&#x2018;Ą per il problema di minimizzazione con condizione di uguaglianza , dobbiamo sostituire la funzione obbiettivo con la sua approssimazione di Taylor del secondo ordine in x: â&#x20AC;˘ minimizzare đ?&#x2018;&#x201C; (đ?&#x2018;Ľ + đ?&#x2018;Ł) = đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) + đ?&#x203A;ťđ?&#x2018;&#x201C;(đ?&#x2018;Ľ)T đ?&#x2018;Ł +

1 2

đ?&#x2018;ŁTâ&#x2C6;&#x2021;2đ?&#x2018;&#x201C; đ?&#x2018;Ľ đ?&#x2018;Ł

â&#x20AC;˘ sotto la condizione đ??´(đ?&#x2018;Ľ + đ?&#x2018;Ł) = đ?&#x2018;?, con đ?&#x2018;Ł variabile Il passo di Newton â&#x2C6;&#x2020;đ?&#x2018;Ľđ?&#x2018;&#x203A;đ?&#x2018;Ą Ă¨ caratterizzato da

dove đ?&#x2018;¤ Ă¨ la variabile ottima duale associata per il problema quadratico

Metodo di Newton Definiamo ora il decremento di Newton per il problema minimizzazione quadratica con condizione di uguaglianza đ?&#x153;&#x2020;(đ?&#x2018;Ľ) = (â&#x2C6;&#x2020;đ?&#x2018;ĽTnt đ?&#x203A;ť 2đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) â&#x2C6;&#x2020;đ?&#x2018;Ľđ?&#x2018;&#x203A;đ?&#x2018;Ą)1/2

Lâ&#x20AC;&#x2122;algoritmo a questo punto diventa il seguente:

Eliminazione dellâ&#x20AC;&#x2122;equazione di uguaglianza Un approccio generale per risolvere il problema di minimizzazione con condizione di uguaglianza Ă¨ eliminare i vincoli e quindi risolvere il risultante problema non vincolato Per prima cosa troviamo una matrice đ??š â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;nĂ&#x2014;(nâ&#x2C6;&#x2019;p) e un vettore đ?&#x2018;Ľ â&#x2C6;&#x2C6; Rn che parametrizzino lâ&#x20AC;&#x2122;insieme: {đ?&#x2018;Ľ | đ??´đ?&#x2018;Ľ = đ?&#x2018;?} = {đ??šđ?&#x2018;§ + đ?&#x2018;Ľ | đ?&#x2018;§ â&#x2C6;&#x2C6; đ?&#x2018;&#x2026; nâ&#x2C6;&#x2019;p} Qui đ?&#x2018;Ľ puĂ˛ essere scelto come soluzione particolare di đ??´đ?&#x2018;Ľ = đ?&#x2018;?, e đ??š â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;nĂ&#x2014;(nâ&#x2C6;&#x2019;p) una matrice il cui rango Ă¨ contenuto nel nullo di đ??´. Possiamo quindi formulare il seguente problema non vincolato: minimizzare đ?&#x2018;&#x201C; (đ?&#x2018;§) = đ?&#x2018;&#x201C;(đ??šđ?&#x2018;§ + đ?&#x2018;Ľ ) Dalla soluzione đ?&#x2018;§â&#x2039;&#x2020;, possiamo trovare la soluzione del problema con vincoli di uguaglianza come đ?&#x2018;Ľ â&#x2039;&#x2020; = đ??šđ?&#x2018;§â&#x2039;&#x2020;+ đ?&#x2018;Ľ

Problemi di minimizzazione con vincoli di disuguaglianza PROBLEMA: dove: â&#x20AC;˘ đ?&#x2018;&#x201C;0, â&#x20AC;Ś , đ?&#x2018;&#x201C;đ?&#x2018;&#x161;: đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; â&#x2020;&#x2019; đ?&#x2018;&#x2026; sono convesse e almeno due volte differenziabili â&#x20AC;˘ đ??´ â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;pĂ&#x2014;n con il rango di đ??´ = đ?&#x2018;? < đ?&#x2018;&#x203A; â&#x2039;&#x2020;

Inoltre esiste una đ?&#x2018;Ą duale ottima đ?&#x153;&#x2020;â&#x2039;&#x2020;â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;đ?&#x2018;&#x161;, đ?&#x153;&#x2C6; â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;đ?&#x2018;?, che insieme con đ?&#x2018;Ľ â&#x2039;&#x2020; soddisfano le condizioni KKT

Metodi Interior-point I metodi interior-point risolvono il problema precedente applicando il metodo di Newton ad una sequenza di problemi con vincoli di uguaglinza, o ad una sequenza di versioni modificate delle condizioni KKT.

In questa disamina ci concentreremo su un algoritmo in particolare, il “barrier method”. Il nostro obiettivo sarà, quindi, quello di formulare il problema con vincoli di disuguaglianza come problemi con vincoli di uguaglianza a cui può essere applicato il metodo di Newton

Metodi Interior-point Il primo passo Ă¨ quello di riscrivere il problema mettendo le funzioni di disuguaglianza implicitamente dentro la funzione obiettivo:

dove đ??ź â&#x2C6;&#x2019;: đ?&#x2018;&#x2026; â&#x2020;&#x2019; đ?&#x2018;&#x2026; Ă¨ la funzione indicatore per i reali non positivi

Logarithmic barrier Lâ&#x20AC;&#x2122;idea che sta alla base del â&#x20AC;&#x153;barrier methodâ&#x20AC;? Ă¨ di approssimare la funzione indicatore I- attraverso la funzione

dove đ?&#x2018;Ą > 0 Ă¨ un parametro che controlla lâ&#x20AC;&#x2122;accuratezza dellâ&#x20AC;&#x2122;approssimazione. Come Iâ&#x2C6;&#x2019;, la funzione đ??ź â&#x2C6;&#x2019; Ă¨ convessa e non decrescente, e (per convenzione) assumiamo il valore â&#x2C6;&#x17E; per đ?&#x2018;˘ > 0. Diversamente da Iâ&#x2C6;&#x2019;, invece, đ??ź â&#x2C6;&#x2019; Ă¨ differenzibile Ă¨ chiuso: tende ad â&#x2C6;&#x17E; quando đ?&#x2018;˘ tende a 0. Allâ&#x20AC;&#x2122;aumentare di đ?&#x2018;Ą, lâ&#x20AC;&#x2122;appprossimazione diventa piĂš accurata.

Logarithmic barrier Sostituendo đ??ź â&#x2C6;&#x2019; a Iâ&#x2C6;&#x2019; otteniamo che:

1 â&#x2C6;&#x2019; log(â&#x2C6;&#x2019;đ?&#x2018;˘) đ?&#x2018;Ą

La nuova funzione obiettivo Ă¨ convessa, poichĂ¨ convessa e crescente in đ?&#x2018;˘, e differenziabile. Chiamiamo

Ă¨

e con đ?&#x2019;&#x2026;đ?&#x2019;?đ?&#x2019;&#x17D; đ?&#x153;&#x2018; = đ?&#x2018;Ľ â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;đ?&#x2018;&#x203A; đ?&#x2018;&#x201C;đ?&#x2018;&#x2013; đ?&#x2018;Ľ < 0, đ?&#x2018;&#x2013; = 1, â&#x20AC;Ś , đ?&#x2018;&#x161;} chiamiamo la â&#x20AC;&#x153;logarithmic barrierâ&#x20AC;? per il problema. Questo dominio Ă¨ un insieme di punti che soddisfa le condizioni di disuguaglianza

Central path Il central path associato con il problema Ă¨ definito come lâ&#x20AC;&#x2122;insieme di punti đ?&#x2018;Ľâ&#x2039;&#x2020;(đ?&#x2018;Ą), đ?&#x2018;Ą > 0, che chiameremo punti centrali . I punti del central path sono caraterrizzati dalle seguenti condizioni necessarie e sufficenti: â&#x20AC;˘ đ?&#x2018;Ľ â&#x2039;&#x2020;(đ?&#x2018;Ą) deve soddisfare le seguenti condizioni đ??´đ?&#x2018;Ľâ&#x2039;&#x2020; đ?&#x2018;Ą = đ?&#x2018;?, đ?&#x2018;&#x201C;đ?&#x2018;&#x2013;(đ?&#x2018;Ľâ&#x2039;&#x2020;(đ?&#x2018;Ą)) < 0, đ?&#x2018;&#x2013; = 1, â&#x20AC;Ś , đ?&#x2018;&#x161; â&#x20AC;˘ esiste un đ?&#x2018;Ł â&#x2C6;&#x2C6; đ?&#x2018;&#x2026;đ?&#x2018;? tale che 0 = đ?&#x2018;Ąđ?&#x203A;ťđ?&#x2018;&#x201C;0(đ?&#x2018;Ľâ&#x2039;&#x2020;(đ?&#x2018;Ą)) + đ?&#x203A;ťđ?&#x153;&#x2018;(đ?&#x2018;Ľâ&#x2039;&#x2020;(đ?&#x2018;Ą)) + đ??´đ?&#x2018;&#x2021; đ?&#x2018;Ł đ?&#x2018;&#x161;

= đ?&#x2018;Ąđ?&#x203A;ťđ?&#x2018;&#x201C;0

(đ?&#x2018;Ľâ&#x2039;&#x2020;(đ?&#x2018;Ą))

+ đ?&#x2018;&#x2013;=1

1 â&#x2039;&#x2020;(đ?&#x2018;Ą)) + đ??´đ?&#x2018;&#x2021; đ?&#x2018;Ł đ?&#x203A;ťđ?&#x2018;&#x201C; (đ?&#x2018;Ľ đ?&#x2018;&#x2013; â&#x2C6;&#x2019;đ?&#x2018;&#x201C;đ?&#x2018;&#x2013; (đ?&#x2018;Ľâ&#x2039;&#x2020;(đ?&#x2018;Ą))

Barrier method

Conclusioni

FONTI BIBLIOGRAFICHE • S. Boyd, L. Vandenberghe, “Convex Optimation” , Cambridge University Press, 2004 • http://en.wikipedia.org/wiki/Convex_optimization

• H. Hindi, “A Tutorial on Convex Optimization II: Duality and Interior Point Methods”, Palo Alto Research Center (PARC), Palo Alto, California • H. Hindi, “A tutorial on convex optimization”, American Control Conference, Boston, 2004.