Appunti Matematici 30

Page 1

Patrizio Gravano

APPUNTI MATEMATICI

INTRODUZIONE ALLA RICERCA OPERATIVA numero 30 - giugno 2017



INTRODUZIONE STORICA

La ricerca operativa e’una disciplina scientifica relativamente giovane. Possiamo sicuramente dire che il suo atto di nascita coincide con l’istituzione nel 1936 nel Regno Unito di un gruppo di lavoro, diretto da Patrick Maynard Stuart Blackett, il cosiddetto “Blackett Circus”. La copertina di questo numero e’ dedicata al londinese Blackett, militare (arrivo’al grado di Ammiraglio della Royal Navy), politico (socialista) e fisico di primissimo piano, Nobel per la Fisica nel 1949. La materia nasce dunque in ambito militare quale ausilio alla ottimizzazione delle risorse. Una delle primissime applicazioni della materia fu lo studio della allocazione frastagliata

efficiente costa

del

della Sud

rete del

radar Rengo

britannica Unito

in

lungo

la

funzione

di

intercettazione dei potenziali pericoli dei bombardamenti aerei.


Oggi la Ricerca operativa ha innumerevoli e fondamentali applicazioni anche in campo economico e finanziario, oltre che di gestione delle risorse, fino all’elettronica. La lettura della bibliografia citata in appendice consentira’ di comprendere l’ampiezza delle sue attuali applicazioni nei piu’ svariati settori. Trattandosi di una ricerca introduttiva non si dara’ conto se non dei tratti essenziali di una materia vasta e ampiamente foriera di ricadute pratiche ed effettuali.

Patrizio Gravano patrizio.gravano@libero.it


INTRODUZIONE ALLA RICERCA OPERATIVA

0. Prerequisiti matematici

Ho deciso di inserire in testa a questo elaborato sintetico sulla Ricerca operativa un piccolo glossario matematico utile a ricordare alcune semplici nozioni e concetti matematici utilizzati nel corso della trattazione. Esso non e’ assolutamente esaustivo ma limitato a parti essenziali per la comprensione degli sviluppi Si tratta comunque di nozioni ben note e di ampia rilevanza.

1. Sommatoria e doppia sommatoria La somma di n numeri viene compattamente rappresentata dal simbolo di sommatoria. In questo elaborato si considerano solo numeri reali. La scrittura ∑đ?‘›đ?‘–=1 đ?‘Žđ?‘– e’ una forma compatta per indicare la somma di n numeri interi. Solitamente n e’ un numero dato.


Si puo’ quindi scrivere ∑đ?‘›đ?‘–=1 đ?‘Žđ?‘– = đ?‘Ž1 +đ?‘Ž2 + â‹Ż . +đ?‘Žđ?‘› La sommatoria e’ un operatore lineare nel senso che valgono le seguenti relazioni: ∑đ?‘›đ?‘–=1 đ?‘˜đ?‘Žđ?‘– = đ?‘˜ ∑đ?‘›đ?‘–=1 đ?‘Žđ?‘– ∑đ?‘›đ?‘–=1(đ?‘Žđ?‘– + đ?‘?đ?‘– )= ∑đ?‘›đ?‘–=1 đ?‘Žđ?‘– + ∑đ?‘›đ?‘–=1 đ?‘?đ?‘– In termini sintetici e compatti e’ possibile scrivere che: ∑đ?‘›đ?‘–=1(đ?‘˜đ?‘Žđ?‘– +h đ?‘?đ?‘– )=k ∑đ?‘›đ?‘–=1 đ?‘Žđ?‘– +h ∑đ?‘›đ?‘–=1 đ?‘?đ?‘– i e’ detto indice muto. I numeri k e h sono delle costanti intere dette scalari. Non infrequentemente ci si impatte nelle doppie sommatorie, ovvero in scritture del tipo: đ?‘› ∑đ?‘š đ?‘—=1 ∑đ?‘–=1 đ?‘Žđ?‘–,đ?‘—

Giova osservare che in questo caso vi sono ben due indici muti, ovvero i e j. Detta scrittura e’ suscettibile della seguente interpretazione.


Il primo indice, ovvero i, varia da 1 a n, mentre j resta costante quindi si passa da j a j + 1, e si fa variare (per j + 1 costante) i da 1 fino ad n, quindi si implementa j. Un esempio pratico e’ utile a chiarire la situazione. ∑3đ?‘—=1 ∑4đ?‘–=1 đ?‘Žđ?‘–,đ?‘— In questo caso n = 3 e m = 4. Pertanto, in questo caso si ha: ∑3đ?‘—=1 ∑4đ?‘–=1 đ?‘Žđ?‘–,đ?‘— = đ?‘Ž1,1 +đ?‘Ž2,1 +đ?‘Ž3,1 +đ?‘Ž4,1 +đ?‘Ž1,2 +đ?‘Ž2,2 +đ?‘Ž3,2 +đ?‘Ž4,2 +đ?‘Ž1,3 +đ?‘Ž2,3 +đ?‘Ž3,3 +đ?‘Ž4,3 = ∑4đ?‘–=1 đ?‘Žđ?‘–,1 + ∑4đ?‘–=1 đ?‘Žđ?‘–,2 + ∑4đ?‘–=1 đ?‘Žđ?‘–,3 In generale si ha: đ?‘› đ?‘› đ?‘› đ?‘› ∑đ?‘š đ?‘—=1 ∑đ?‘–=1 đ?‘Žđ?‘–,đ?‘— = ∑đ?‘–=1 đ?‘Žđ?‘–,1 + ∑đ?‘–=1 đ?‘Žđ?‘–,2 +‌‌.. + ∑đ?‘–=1 đ?‘Žđ?‘–,đ?‘›

In questo caso una doppia sommatoria diviene la somma di m sommatorie.

2. Le funzioni da đ?‘šđ?’? → đ?‘š In termini molto operativi si hanno n variabili indipendenti đ?‘Ľđ?‘–≤đ?‘› cui corrisponde univocamente un valore y = đ?‘Ś(đ?‘Ľ1 , đ?‘Ľ2 , ‌ . , đ?‘Ľđ?‘› ).


La variabile y e’ detta variabile dipendente. In termini pratici ad un n-pla di numeri reali corrisponde uno ed uno solo numero reale. Se ci si riferisce a grandezze indipendenti (esse sono n) viene definita una operazione di derivazione parziale nel modo seguente. Data una y = đ?‘Ś(đ?‘Ľ1 , đ?‘Ľ2 , ‌ . , đ?‘Ľđ?‘› ) viene definita derivata parziale di y rispetto ad una variabile indipendente đ?‘Ľđ?‘–≤đ?‘› la scrittura: đ?œ• đ?œ•đ?‘Ľđ?‘–≤đ?‘›

�(�1 , �2 , ‌ . , �� )

Anche in questo caso la derivata e’ sempre il limite di un rapporto incrementale ma sotto la condizione di imporre che ∀ đ?‘Ľđ?‘˜ ≠đ?‘Ľđ?‘– sia costante. Ad esempio, data la funzione z = đ?‘Žđ?‘Ľ 2 +đ?‘?đ?‘Ľđ?‘Ś đ?‘˜ e’ possibile derivare rispetto ad x oppure rispetto ad y, avendo, nei due casi quanto segue: đ?œ• đ?œ•đ?‘Ľ

đ?œ•

đ?œ•

đ?œ•

đ?œ•

(đ?‘Žđ?‘Ľ 2 +đ?‘?đ?‘Ľđ?‘Ś đ?‘˜ ) = đ?œ•đ?‘Ľ đ?‘Žđ?‘Ľ 2 + đ?œ•đ?‘Ľ đ?‘?đ?‘Ľđ?‘Ś đ?‘˜ = 2ađ?œ•đ?‘Ľ đ?‘Ľ +đ?‘?đ?‘Ś đ?‘˜ đ?œ•đ?‘Ľ đ?‘Ľ = 2a+đ?‘?đ?‘Ś đ?‘˜

(�� questo caso si e’ ammesso sia y costante) La seconda derivata parziale prima, rispetto alla y, e’:


đ?œ•

đ?œ•

đ?œ•

(đ?‘Žđ?‘Ľ 2 +đ?‘?đ?‘Ľđ?‘Ś đ?‘˜ ) = đ?œ•đ?‘Ś đ?‘Žđ?‘Ľ 2 + đ?œ•đ?‘Ś đ?‘?đ?‘Ľđ?‘Ś đ?‘˜ = 2a(0) +đ?‘?đ?‘Ľđ?‘Ś đ?‘˜âˆ’1= đ?‘?đ?‘Ľđ?‘Ś đ?‘˜âˆ’1 đ?œ•đ?‘Ś

Vorrei osservare che queste funzioni sono ulteriormente derivabili, esistendo quindi pure la derivata seconda. In questo testo non e’ mai necessario derivare parzialmente, oltre il primo ordine.

3. Le funzioni R → R Si tratta delle normali funzioni dell’Analisi 1. Nei termini piu’ semplici una funzione R → R e’ una corrispondenza che associa ad un elemento x ∈ X uno ed un solo elemento y ∈ Y. Si scrive che y = f(x). L’insieme degli y ∈ Y tali che y e’ associato ad x ∈ X tramite la f e’ detto codominio della funzione. L’insieme degli x ∈ X tali che ad essi e’ associato un elemento del codominio e’ detto insieme di definizione della funzione.


Non necessariamente il dominio di f coincide con R. E’ il caso delle funzioni irrazionali quale ad esempio: y = √7đ?‘Ľ + đ?‘? In questo caso deve essere 7x + b ≼ 0 da cui 7x ≼ −đ?‘?. đ?‘?

Ovvero x ≼ − 7 .

4. Piano cartesiano ortogonale La rappresentazione cartesiana delle coppie e delle terne di numeri reali e’ stata sviluppata a partire da Cartesio. Dato un piano euclideo e’ possibile considerare due rette orientate ortogonali. Al punto di interzezione di esse (unico) detta origine corrisponde la coppia ordinate (0, 0). Si ammette che il sistema sia monometrico. Il piano resta diviso in quattro quadranti, numerati in senso antiorario.


Ad un punto del piano corrisponde una ed una sola coppia di numeri reali (corrispondenza biunivoca).

Nel quadrante I (primo quadrante) entrambe le coordinate sono positive. Ad esempio si e’ rappresentato il punto P di coordinate 2 e 1. La prima coordinata viene riferita all’asse delle x ed e’ detta ascissa. La seconda coordinata viene riferita all’asse delle y, ed e’ detta ordinata. I punti del II quadrante sono tali che x< 0 e y > 0. Per il terzo quadrante entrambe le coordinate sono negative.


Per il quarto quadrante si ha x > 0 e y < 0.

5. La funzione lineare Le funzioni lineare e affine attengono alla rappresentazione nel piano cartesiano della retta, passante o meno per l’origine del sistema cartesiano ortogonale. La funzione lineare e’ del tipo: y = mx la grandezza m e’ una costante di proporzionalita’ ed e’ il coefficiente angolare della retta. Ogni retta di equazione y = mx passa per l’origine, in quanto per x = 0 si ha y = 0. m puo’ essere intesa anche come derivata della funzione y, ovvero đ??ˇđ?‘Ľ mx = đ?‘š .


1

In questo caso risulta m = 3. Volendo e’ possibile calcolare l’angolo đ?œ— che la retta forma con il semiasse positivo delle ascisse. 1

In particolare risulta đ?œ— = arctg( ) 3

La funzione y = mx + b non passa per l’origine quando b ≠0. Due rette �1 = m’x + b’ e �2 = m’’x + b’’ sono parallele se e solo se m’ = m’’. Se m’ ≠m’’ le due rette si intersecano in un punto detto di intersezione.

6. Intersezione di rette del piano Due rette del piano si intersecano in un punto (unico) quando esse non sono parallele. Due rette del piano �1 = m’x + b’ e �2 = m’’x + b’’ sono la medesima retta quando m’ = m’’ e b’ = b’’.


Le funzioni lineari e affini sono stettamente monotone. A distinti x corrispondono distinti y = f(x). Si tratta di funzioni illimitate (sia superiormente che inferiormente) in quando il loro dominio di definizione e’ (−∞ , +∞). Dette funzioni sono limitabili per restrizione, considerando un dom f ⊂ (−∞ , +∞). Una funzione lineare o affine e’ strattamente crescente per m > 0. Una funzione lineare o una affine e’ strettamente decrescente per m < 0. Nel caso m = 0 si ha una retta di equazione y = b. Detta retta e’ parallela all’asse delle ascisse ad una quota b.


Le funzioni lineari e quelle affini sono evidentemente ad un solo valore (funzioni monodrome). Per dette funzioni puo’ essere utile determinare le intersezioni con gli assi cartesiani. Esse si ottengono banalmente come segue. L’ intersezione della retta con l’asse delle x si ottiene per sostituzione nell’equazione di essa della coppia (x, y=f(x)) con la coppia (x, 0). In buona sostanza nell’equazione della retta si pone y = 0. L’intersezione della retta con l’asse delle ordinate si ottiene con la sostituzione seguente: (x, y) → (0, y). Sulla retta si dira’ di piu’ se e in quanto strattamente necessario ai fini della ricercar presente.


Ovviamente la coppia (x, y) non e’ un punto qualunque del piano bensi’ un punto del luogo che si considera.

7. La funzione quadratica in forma semplificata La funzione quadratica in forma semplificata e’ sostanzialmente l’equazione della parabola del tipo: y = ađ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? . I parametri a, b e c sono numeri reali. Deve risultare a ≠0. Per a > 0 si ha una situazione del tipo seguente, riferita alla curva rossa. Il caso in blu esprime la condizione a < 0.


Relativamente alle funzioni introdotte le intersezioni con l’asse delle y si ottengono per sostituzione ovvero con la sostituzione (x, ađ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? ) → (0, ađ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? ). In buona sostanza, il punto (0, c) indica le coordinate del punto di intersezione del luogo con l’asse delle y. Le intersezioni della parabola con l’asse delle ascisse, se esistono, sono le soluzioni reali dell’equazione y = ađ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? = 0 ottenute dalla ben nota formula risolutiva, ovvero:

đ?‘Ľ1,2 =

−đ?‘?Âąâˆšđ?‘?2 −4đ?‘Žđ?‘? 2đ?‘Ž

La esistenza delle intersezioni e’ legata alla condizione di realta’ del radicale, ovvero đ?‘? 2 − 4đ?‘Žđ?‘? ≼ 0. Se đ?‘? 2 − 4đ?‘Žđ?‘? > 0 si hanno due radici reali e distinte. Nel caso đ?‘? 2 − 4đ?‘Žđ?‘? = 0 si ha una unica radice (di molteplicita’ algebrica 2).


Nel primo caso ( đ?‘? 2 − 4đ?‘Žđ?‘? > 0 ) le intersezioni con l’asse delle ascisse sono due, mentre nel secondo caso considerato la curva interseca l’asse delle ascisse in un unico punto. đ?‘?

In questo caso il punto di intersezione e’ di coordinate (− 2đ?‘Ž , 0). Vi sono alcuni casi particolari, invero ben noti. Infatti, y = ađ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? ammette come caso particolare c = 0. In questo caso si ha y = ađ?‘Ľ 2 + đ?‘?đ?‘Ľ Posto x = 0 si comprende che y = 0, pertanto la curva passa per (0, 0). L’altro punto di intersezione si ottiene utilizzando la proprieta’ di raccoglimento a fattore comune, avendo che: y = ađ?‘Ľ 2 + đ?‘?đ?‘Ľ = x(ax +đ?‘?) . Per la legge di annullamento del prodotto si ha y = 0 â&#x;ş x(ax +đ?‘?) = 0 ⇒ x = 0 oppure ax + b = 0 (o al limite pari a zero entrambi i fattori). đ?‘?

Da ax + b = 0 si ottiene ax =− đ?‘? , ovvero x = − đ?‘Ž.


đ?‘?

đ?‘?

đ?‘?

E’ immediato calcolare f(− đ?‘Ž) = a(− đ?‘Ž)2 + đ?‘?(− đ?‘Ž ) =

đ?‘?2 đ?‘Ž

−

đ?‘?2 đ?‘Ž

= 0, c.v.d..

Per a > 0 si ha questa rappresentazione grafica.

đ?‘?

Si ha − đ?‘Ž > 0 đ?‘?đ?‘’đ?‘&#x; đ?‘? < 0. Se a e b sono concordi allora detta soluzione e’ a sinistra dello zero.

Esiste un terzo caso particolare quello per il quale nell’equazione y = ađ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? si pone b = 0. In questo caso la funzione diviene y = ađ?‘Ľ 2 + đ?‘? Per x = 0 si ha y = đ?‘?. Pertanto la curva passa per (0, c). L’intersezione con l’asse delle x si ottiene ponendo y = 0.


0 = ađ?‘Ľ 2 + đ?‘? − ađ?‘Ľ 2 = đ?‘? đ?‘?

đ?‘Ľ2= − đ?‘Ž

2

đ?‘?

đ?‘Ľ = Âą √− đ?‘Ž

đ??żđ?‘Ž condizione di realta’ dei radicali di ordine 2n impone che a e c siano discordi (condizione di esistenza di soluzioni reali).

8. Esempi E’ utile fare considerare alcuni esempi, tratti da esercizi contenuti in un testo citato in bibliografia ⌋RussoâŚŒ, seppure con adattamenti. a. distanza di un punto del piano dagli assi. La distanza di un punto P ≥ (x, y) del piano dagli assi cartesiani e’ la misura del segmenti di retta passanti per i punti x ed y rispettivamente delle rette ortogonali per detti punti agli assi cartesiani. La distanza del punto P dall’asse delle ascisse misura |x|mentre la distanza del punto P dall’asse delle ordinate misura |y| .


Ad esempio le distanze del punto P ≥ (2, −7) dagli assi sono rispettivamente |2| = 2 e |−7 | = 7.

b. distanza tra due punti. La distanza tra due punti e’ quella ordinaria euclidea. Ad esempio la distanza tra i punti A e B di coordinate (đ?‘Ľđ??´ , đ?‘Ľđ??ľ ) e (đ?‘Ľđ??ľ , đ?‘Śđ??ľ ) sono date applicando il teorema di Pitagora ed avendo quindi che d(A, B ) = √(|đ?‘Ľđ??´ − đ?‘Ľđ??ľ )2 + (|đ?‘Śđ??´ − đ?‘Śđ??ľ |)2 = d(B, A). Ad esempio per i punti R ed S del piano di coordinate (1, 3) e (− 3, 2) si puo’ scrivere che d(R, S) = d(S, R) = √(1 − (−3))2 + (3 − 2)2 = √42 + 12 = √17. c. punto medio di un segmento. Dati due punti A e B di cui sono note le coordinate cartesiane (đ?‘Ľđ??´ , đ?‘Ľđ??ľ ) e (đ?‘Ľđ??ľ , đ?‘Śđ??ľ ) del puto medio M tra A e B sono:

đ?‘Ľđ?‘€ =

đ?‘Ľđ??´ +đ?‘Ľđ??ľ

đ?‘Śđ?‘€ =

đ?‘Śđ??´ +đ?‘Śđ??ľ

2

2

Pertanto, si puo’ scrivere che M ≥ (

đ?‘Ľđ??´ +đ?‘Ľđ??ľ 2

,

đ?‘Śđ??´ +đ?‘Śđ??ľ 2

).


d. appartenenza e non appartenenza di un punto ad un luogo. Un punto di coordinate (đ?‘Ľ0 , đ?‘Ś0 ) appartiene al luogo geometrico y = f(x) quando đ?‘Ś0 − đ?‘“(đ?‘Ľ0 ) = 0. Ad esempio data la funzione đ?‘Ś = đ?‘Ľ 2 − 3đ?‘Ľ + 1 verificare se il punto (1, 2) appartiene al luogo considerato (parabola). Si avrebbe 2 −12 +3 − 1 = 3 ≠0. Quindi detto punto del piano non appartiene alla curva data.

9.

Derivate di funzioni. Nozione e applicazione alle funzioni esaminate.

Data una funzione f: A ⊆ � → B ⊆ R e’ possibile definire una funzione detta derivata di f e definita come segue:

f’(x) = lim

ℎ→0

đ?‘“(đ?‘Ľ+â„Ž)−đ?‘“(đ?‘Ľ) â„Ž

Non e’ detto che una funzione sia derivabile. Quelle che verranno considerate in questo elaborato sono derivabili almeno due volte, salvo che non si dica altrimenti.


Per il calcolo delle derivate esistono particolari teoremi ma la derivata si puo’ ottenere a partire dalla definizione: Ad esempio, data la funzione affine y = ax + b, si puo’ ottenere, a partire dalla definizione di derivata nella notazione di Fouruer, la funzione derivate prima, come segue:

f’(x) = lim

ℎ→0

đ?‘“(đ?‘Ľ+â„Ž)−đ?‘“(đ?‘Ľ) â„Ž

= lim

đ?‘š(đ?‘Ľ+â„Ž)−đ?‘šđ?‘Ľ

ℎ→0

â„Ž

= lim

ℎ→0

đ?‘šđ?‘Ľ +đ?‘šâ„Žâˆ’đ?‘šđ?‘Ľ â„Ž

= lim

đ?‘šâ„Ž

ℎ→0 ℎ

= m.

Pertanto, concisamente si scrive: đ?‘‘ đ?‘‘đ?‘Ľ

(mx + b) = đ??ˇđ?‘Ľ (mx + b) = đ?‘š.

Con l’utilizzo della definizione si puo’ dimostrare agevolmente che per la funzione costante y = k, si evince che: � ��

k = đ??ˇđ?‘Ľ k = đ?‘˜.

A partire dalla definizione si puo’ anche calcolare la derivata prima della funzione di secondo grado, ovvero e’ possibile calcolare: � ��

(đ?‘Žđ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘?) = đ??ˇđ?‘Ľ (đ?‘Žđ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘?)


E’ quindi possibile partire dalla definizione di derivate, avendosi: đ?‘“(đ?‘Ľ+â„Ž)−đ?‘“(đ?‘Ľ) â„Ž ℎ→0

f’(x)= lim

đ?‘Ž(đ?‘Ľ+â„Ž)2 +đ?‘?(đ?‘Ľ +â„Ž)+đ?‘? −đ?‘Ž(đ?‘Ľ)2 −đ?‘?(đ?‘Ľ) −đ?‘? â„Ž ℎ→0

= lim

đ?‘Žđ?‘Ľ 2 +2đ?‘Žđ?‘Ľâ„Ž+đ?‘Žâ„Ž 2 +đ?‘?đ?‘Ľ +đ?‘?â„Ž +đ?‘? −đ?‘Žđ?‘Ľ 2 −đ?‘?đ?‘Ľ −đ?‘? â„Ž ℎ→0

= lim

2đ?‘Žđ?‘Ľâ„Ž+đ?‘Žâ„Ž 2 đ?‘? +đ?‘?â„Ž â„Ž ℎ→0

= lim

= lim 2đ?‘Žđ?‘Ľ + đ?‘Žâ„Žđ?‘? + đ?‘? ℎ→0

= 2đ?‘Žđ?‘Ľ + b

Con cio’ e’ stata ricavata la derivata della funzione di secondo grado. La derivata della funzione costante vale 0. Anche questa asserzione puo’ essere provata a partire dalla definizione di funzione derivata. La derivata e’ una funzione e come tale ha un dominio e un codominio. Data la funzione derivata se ne puo’ ovviamente calcolare il valore in un punto.

Puo’ essere utile fare un esempio di calcolo di una derivata in un punto. Ad esempio data la funzione y = −đ?‘Ľ 2 + 2 Si calcola la derivata prima a partire dalla funzione data ottenendo la seguente funzione


đ?‘“(đ?‘Ľ+â„Ž)−đ?‘“(đ?‘Ľ) â„Ž ℎ→0

f’(x)= lim

−(đ?‘Ľ+â„Ž)2 +2 −(−đ?‘Ľ 2 +2) â„Ž ℎ→0

= lim

−đ?‘Ľ 2 −2đ?‘Ľâ„Ž −ℎ2 +2 +đ?‘Ľ 2 −2 â„Ž ℎ→0

=lim

= lim

ℎ→0

(−2đ?‘Ľ − â„Ž) = −2đ?‘Ľ Quando x = − 2 allora si ha f’(−2) =−2(−2) = 4

In genere per calcolare le derivate si utilizzano ben noti teoremi. Si rimanda per la consultazione ad un buon testo elementare di Analisi matematica ⌋Campitelli, Campodonico, GaldiâŚŒ. Puo’ risultare utile ricordare che la derivata e’ un operatore lienare. Ad esempio, limitandoci alle funzioni elementari considerate si puo’ scrivere che đ?‘‘ đ?‘‘đ?‘Ľ

đ?‘‘

đ?‘‘

đ?‘‘

(đ?‘Žđ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘?) = đ?‘‘đ?‘Ľ (đ?‘Žđ?‘Ľ 2 ) + đ?‘‘đ?‘Ľ (đ?‘?đ?‘Ľ) + đ?‘‘đ?‘Ľ đ?‘?

Sulla derivabilita’ di una funzione credo sia utile precisare che: a) Una funzione f(.) e’ derivabile in un punto x = đ?‘Ľ0 se essa e’ definita e continua in un intorno simmetrico del punto dato, ovvero in (đ?‘Ľ0 − đ?œ€ , đ?‘Ľ0 + đ?œ€) đ?‘’ đ?‘ đ?‘’ đ?‘Ľ = đ?‘Ľ0 ∈ đ?‘‘đ?‘œđ?‘š đ?‘“′(đ?‘Ľ).


b) Una funzione f(.) e’ derivabile in un intervallo ⌋a, bâŚŒ quando essa e’ derivabile in ogni punto đ?‘Ľ0 ∈ ⌋a, bâŚŒ.

Va rimarcato che una funzione derivabile puo’ ammettere una derivate, detta derivate seconda. La derivata seconda di una una funzione, se esiste, e’ la derivata prima della derivata di una data funzione. In termini formali la derivata seconda e’ formalizzata come segue: �

đ?‘‘

đ?‘‘2

f ‘’(x) = đ?‘‘đ?‘Ľ (đ?‘‘đ?‘Ľ f(x)) = đ?‘‘đ?‘Ľ 2 f(x)

9. Criteri per la determinazione dei massimi e dei minimi Nel caso delle funzioni ad una sola variabile indipendente i punti di massimo e di minimo sono da individuare tra quelli per i quali f’(x)= 0. Detti punti sono collettivamente detti punti stazionari. Non ogni punto stazionario e’ di massimo o di minimo.


Infatti, gli đ?‘Ľ0 tali che đ??ˇđ?‘Ľ đ?‘“(đ?‘Ľ)|đ?‘Ľ =đ?‘Ľ0 = 0 possono essere: a) punto di massimo b) punto di minimo c) punto di flesso (o di interflessione). Un buon metodo per determinare se la curva ha un massimo relativo e’ lo studio del segno della derivata prima. Se si dimostra che f’(x) ≼ 0 per đ?‘Ľ ≤ đ?œ‘ allora la f ha nel punto (đ?œ‘, f(đ?œ‘) ) un punto di massimo. I punti di minimo si hanno quando f’(x) ≼ 0 per đ?‘Ľ ≼ đ?œ‡ e il punto di minimo e’ dato dalla coppia (đ?œ‡ , f(đ?œ‡) ). Non infrequentemente per la ricercar dei minimi e dei massimi si utilizza il criterio della derivata seconda o delle derivate di ordine 2n. Gli step sono sostanzialmente i seguenti: a) e’ data la funzione f(x) b) si determina la derivata prima f’(x) e la si pone eguale a 0. c) si determinano gli đ?‘Ľđ?‘– | đ?‘“′(đ?‘Ľđ?‘– ) = 0


d) si determina la f’’ (x) e si calcolano per gli đ?‘Ľđ?‘– dati i valori f’’ (đ?‘Ľđ?‘– ) . e) Se f’’ (đ?‘Ľđ?‘– ) < 0 allora il punto (đ?‘Ľđ?‘– , đ?‘“(đ?‘Ľđ?‘– ) e’ un punto di massimo. f) Se f’’ (đ?‘Ľđ?‘– ) > 0 allora il punto (đ?‘Ľđ?‘– , đ?‘“(đ?‘Ľđ?‘– ) e’ un punto di minimo. Ai fini di questa elaborazione non si tiene conto della teoria dei punti di interflessione. Sia data f(x, y, z) una superficie di R3 . Sia (đ?‘Ľ0 , đ?‘Ś0 , đ?‘§0 ) un punto critico, ovvero un punto per il quale sia: đ?œ• đ?œ•đ?‘Ľ

đ?œ• đ?œ•đ?‘Ś

f(x, y, z) = 0

f(x, y, z) = 0

�(�, �, �) e’ il luogo dei punti dello spazio che definiscono una superficie. Sezionando detta superficie con un piano x = �0 si ha una curva i cui punti sono pure punti del luogo f(x, y, z). Si puo’ ammettere di rappresentare la curva ottenuta per intersezione (tra la superficie data e il piano considerato) considerando la y come una variabile indipendente e la z come variabile dipendente.


Sia g(.) detta funzione. đ?‘‘

đ?‘‘

Se đ?‘‘đ?‘Ś (đ?‘‘đ?‘Ś (g(y))|đ?‘Ś =đ?‘Śđ?‘œ < 0 allora il punto (đ?‘Ľ0 , đ?‘Ś0 , đ?‘§0 ) e’ un punto di massimo. đ?‘‘2

Se đ?‘‘đ?‘Ś 2 (g(y))| đ?‘Ś=đ?‘Śđ?‘œ > 0 allora il punto (đ?‘Ľ0 , đ?‘Ś0 , đ?‘§0 ) e’ un punto di minimo.

10. Disequazioni di I e II grado

Ci si limita a considerare le disequazioni di I e di II grado razionali.

Dati due punti della retta reale A e B tali che đ?‘Ľđ??´ < đ?‘Ľđ??ľ i punti (infiniti) aventi ascissa r tale che đ?‘Ľđ??´ < đ?‘&#x; < đ?‘Ľđ??ľ costituiscono un luogo detto intervallo aperto di estremi A e B. I punti A e B che non fanno parte del luogo sono chiamati rispettivamente estremo inferiore ed estremo superiore. L’intervallo (−∞ , +∞) coincide con l’insieme R dei numeri reali. Possono essere dati intervalli del tipo (−∞ , k) e (h , +∞) ove k ed h sono numeri reali, anche negativi o nulli.


Una disequazione e’ una diseguaglianza verificata per particolari valori della incognita x. Una disequazione e’ intera quando la x compare solo a numeratore. Una diequazione lineare e’ ogni disequazione nell’indeterminata x che possa essere portata, per passaggi algebrici, ad una delle forme seguenti: ax > b ax < b Dette forme sono dette forme normali delle disequazioni lineari (di primo grado). Le disequazioni di secondo grado sono quelle riconducibili alle due sguenti forme canoniche: đ?‘Žđ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? > 0 đ?‘Žđ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? < 0 Alcuni esempi chiariranno come si procede in relazione a questi casi di disequazioni. Si puo’ ad esempio risolvere la segunte disequazione. 3đ?‘Ľâˆ’1 2

>

đ?‘Ľâˆ’2 3

–4


đ?‘š.c.m. (2, 3)= 6 3(3đ?‘Ľ − 1) > 2( đ?‘Ľ − 2 ) −24 9x – 3 > 2x – 4 −24 9x − 2đ?‘Ľ > − 25 7x > − 25

x>−

25 7

Per le disequazioni valgono sostanzialmente le stesse regole date per le equazioni, dovendo pero’ essere precisato che dato ax > b (o ax < b) se si moltiplicano ambo i membri per un numero negativo k si ha kax < đ?‘˜đ?‘? (kax > đ?‘˜đ?‘? ). Per le disequazioni di secondo grado si procede in questo modo. La disequazione va ricondotta per passaggi algebrici ad una delle due forme canoniche note. Va risolta l’equazione di secondo grado avendo posto đ?‘Žđ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘? = 0 .


Se essa non ha soluzioni reali o ne ha una solamente (condizione đ?‘? 2 − 4đ?‘Žđ?‘? ≤ 0 ) il segno di y coincide con la positivita’ o negativita’ del parametro a ≠0. Se essa ha due soluzioni reali e distinte ovvero se đ?‘? 2 − 4đ?‘Žđ?‘? > 0 allora si condierano le due soluzioni (intersezioni di f(x) con l’asse delle ascisse). Siano đ?‘Ľ1 đ?‘’ đ?‘Ľ2 dette soluzioni con đ?‘Ľ1 < đ?‘Ľ2 . Se a > 0 allora f(x) > 0 in (−∞, đ?‘Ľ1 ) âˆŞ ( đ?‘Ľ2 , +∞) e f(x) < 0 ∀đ?‘Ľ âˆś đ?‘Ľ ∈ (đ?‘Ľ1 , đ?‘Ľ2 ) Se a < 0 allora f(x) > 0 ∀đ?‘Ľ âˆś đ?‘Ľ ∈ (đ?‘Ľ1 , đ?‘Ľ2 ) e f(x) < 0 ∀đ?‘Ľ âˆś đ?‘Ľ ∈ (−∞, đ?‘Ľ1 ) âˆŞ ( đ?‘Ľ2 , +∞). E’ possibile fare un esempio di discussione di una disequazione di secondo grado contenente un parametro. (2đ?‘˜ − 3)đ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘˜ > 0 đ??źđ?‘› essa k deve intendersi un parametro di discussione (al variare di k‌‌) mentre b deve intendersi un parametro costante. La discussione potresse essere intavolata come segue. Si puo’ porre (2đ?‘˜ − 3)đ?‘Ľ 2 + đ?‘?đ?‘Ľ + đ?‘˜ = 0


Usando la formula risolutiva delle equazioni di secondo grado si ottiene.

đ?‘Ľ1,2 =

−đ?‘?Âąâˆšđ?‘? 2 −4(2đ?‘˜ −3)đ?‘˜ 2(2đ?‘˜ −3)

đ?‘„đ?‘˘đ?‘Žđ?‘›đ?‘‘đ?‘œ đ?‘? 2 − 4(2đ?‘˜ − 3)đ?‘˜ ≤ 0 allora f(x) ≼ 0 quando 2đ?‘˜ − 3 ≼ 0 ovvero 2k ≼ 3

3 đ?‘œđ?‘Łđ?‘Łđ?‘’đ?‘&#x;đ?‘œ k ≼ 2 . Da đ?‘? 2 − 4(2đ?‘˜ − 3)đ?‘˜ ≤ 0 si ottiene đ?‘? 2 ≤ 4(2đ?‘˜ − 3)đ?‘˜ â&#x;şđ?‘? 2 ≤ 8đ?‘˜ 2 − 12đ?‘˜ â&#x;ş đ?‘? 2 − 8đ?‘˜ 2 + 12đ?‘˜ ≤ 0 â&#x;ş 8đ?‘˜ 2 − 12đ?‘˜ −đ?‘? 2 ≼ 0. La 8đ?‘˜ 2 − 12đ?‘˜ −đ?‘? 2 ≼ 0 puo’ essere studiata agevolmente solo che si attribuisca alla k il ruolo di una indeterminata, come solitamente si fa con la x quado si risolvono le equazioni di secondo grado. 3

Si tratta di calcoli e del coordinamento con la condizione di vincolo k ≼ 2. 3

Si deve poi rammentare che, a contrariis, a = 2đ?‘˜ − 3 ≼ 0, (ovvero per k ≼ 2.) impone che sia f(x) > 0 per x ∈ (−∞, đ?‘Ľ1 ) âˆŞ ( đ?‘Ľ2 , +∞) , Affinche’ si abbiano due soluzioni reali e distinte deve verificarsi che sia 8đ?‘˜ 2 − 12đ?‘˜ −đ?‘? 2 < 0


Essa va studiata considerando k una indeterminata, riportandola alla corrispondente equazione di secondo grado in k del tipo: 8đ?‘˜ 2 − 12đ?‘˜ −đ?‘? 2 = 0.

đ?‘˜1,2 =

12Âąâˆš144−32 16

=

12Âą11 16

Questa non e’ la sede ma gli aspetti di coordiamento potrebbero essere perfezionati.

Molte volte, specie nella ricerca operativa, vanno considerate relazioni del tipo ax ≤ b ax ≼ b messe a sistema. Occorre ampliare quanto detto per passare da un sistema di equazioni lineari a un distema disequazioni lineari, per evidenziare che un sistema di disequazioni lineari ammette soluzione quando â‹‚đ?‘–≤đ?‘› đ??źđ?‘– ≠∅. đ??źđ?‘– individua l’intervallo che verifica la condizione (≤, ≼, <, >) assegnata relativamente alla i-esima equazione.


11. Equazione canonica della retta L’equazione della retta in forma normale e’ data da y = mx + n. L’equazione della retta puo’ equivalentemente essere scritta come: ax + by + c = 0 risulubile rispetto alla y avendosi che: �

đ?‘?

y = − đ?‘? đ?‘Ľ − đ?‘? = mx + b Risulta quindi che: đ?‘Ž

m = −đ?‘? đ?‘?

b = −đ?‘? E’ preferibile utilizzare la forma canonica piu’ utilizzata nella ricerca operativa.

12. Semipiani delimitati da una retta Data l’equazione della retta in forma canonica ax + by + c = 0 e’ possibile sisegnare la retta corrispondente nel piano cartesiano.


La parte al di sotto della retta definisce il semipiano, in viola e idealmente infinito... (ovviamente) per il quale e’: ax + by + c < 0 ovvero ax + by + c ≤ 0 La parte infinita di piano al di sopra della retta e’ il luogo dei punti per il quale risulta: ax + by + c > 0.


13. Ottimizzazione L’ottimizzazione presuppone che sia data una funzione matematica. Detta funzione deve essere massimizzata o minimizzata, a seconda dei casi concreti. Solitamente la massimizzazione o la minimizzazione di una funzione si realizzano in presenza di vincoli matematici, espresso in forma di funzioni matematiche. Solitamente e’ assegnata una funzione di n variabili indipendenti. Detta funzione, usualmente, e’ lineare, ovvero del tipo z = ∑đ?‘–≤đ?‘› đ?‘?đ?‘– đ?‘Ľđ?‘– . La linerarita’ deriva dal fatto che identicamente le variabili đ?‘Ľđ?‘– sono di primo grado. Nei casi piu’ elementari si ammette che pure i vincoli siano funzioni lineari. Solitamente il modello introduce piu’ di un vincolo. Le funzioni vincolari lineari sono ponibili nella forma đ?‘Łđ?‘— = ∑đ?‘–≤đ?‘›,đ?‘—≤đ?‘š đ?‘?đ?‘–đ?‘— đ?‘Ľđ?‘– . La sembianza tipica del modello di ottimizzazione e’ il seguente: min (max) = z = ∑đ?‘–≤đ?‘› đ?‘?đ?‘– đ?‘Ľđ?‘– . đ?‘Łđ?‘— = ∑đ?‘–≤đ?‘›,đ?‘—≤đ?‘› đ?‘?đ?‘–đ?‘— đ?‘Ľđ?‘– â‹„ đ?‘?đ?‘—≤đ?‘š


đ?‘œđ?‘Łđ?‘’ â‹„ puo’ essere uno dei simboli ≤ , =, ≼. Le variabili đ?‘Ľđ?‘– sono associate a input. A volte si ammette che le le variabili input possano assumere solo valori interi. In questo caso si parla di programmazione a valori interi. Va precisato che non infrequentemente vanno esplicitate le eventuali relazioni non date formalmente ma che possono comunque ricavarsi, in relazione a condizioni funzionali tra variabili.

14. Funzioni convesse Data una funzione di una variabile reale f(x) si dice che essa e’ convessa se assegnato un intervallo I tale che I ⊆ dom f(.) ∀ (đ?‘Ľ1 , đ?‘Ľ2 ) ∈ I, đ?›ź âˆˆâŚ‹ 0, 1 âŚŒ risulta: f(đ?›źđ?‘Ľ1 + (1 − đ?›ź)đ?‘Ľ2 ) ≤ đ?›źf(đ?‘Ľ1 ) + (1−đ?›ź)đ?‘“(đ?‘Ľ2 ) Una funzione f e’ strattamente convessa quando la relazione introdotta e’ vera per đ?›ź ∈ ( 0, 1 ) e non per đ?›ź = 1, đ?‘’ đ?‘?đ?‘’đ?‘&#x; đ?›ź = 0 . đ?‘‘2

Per una funzione convessa si ha �� 2 f(x) ≼ 0.


Sono evidenti i nessi convessita-ricerca del minimo.

15. Tabella a doppia entrata Le tabelle a doppia entrata rientrano sostanzialmente nella logica matriciale. Un esempio concreto e’ sicuramente utile a comprendere. Si possono considerare ad esempio 5 sperimentatori chiamati a misurare 3 distinte grandezze fisiche. Si avrebbe questa situazione grafica. Grandezza 1

Grandezza 2

Grandezza 3

Speriment. 1 Speriment. 2 Speriment. 3

10 sec

Speriment. 4 Speriment. 5

Ad esempio se il terzo sperimentatore misura per la seconda grandezza fisica considerate un periodo di 10 secondi, detto valore verra’ inserito nella posizione corrispondente. Gli altri valori sperimentali si pongono corrispondentemente.


16. Vettori I vettori sono elementi di un insieme detto spazio vettoriale. Nello spazio tridimensionale si puo’ ammettere che un punto di esso possa essere associare ad una terna di numero reali (x, y, z). Viceversa ad una terna (x, y, z) e’ associate un punto P. Si scrive P ≥ (x, y, z). In uno spazio astratto ad n dimensioni un vettore e’ sostanzialmente una sequnza ordinata di n numeri reali, ovvero del tipo (đ?‘Ľ1 , đ?‘Ľ2 , ‌ . . , đ?‘Ľđ?‘– ‌ . . đ?‘Ľđ?‘› ). I vettori sono moltiplicabili per uno scalare k avendosi k(đ?‘Ľ1 , đ?‘Ľ2 , ‌ . . , đ?‘Ľđ?‘– ‌ . . đ?‘Ľđ?‘› ) =(đ?‘˜đ?‘Ľ1 , đ?‘˜đ?‘Ľ2 , ‌ . . , đ?‘˜đ?‘Ľđ?‘– ‌ . . đ?‘˜đ?‘Ľđ?‘› ). E’ data la somma di due, o piu’ vettori, come segue: (đ?‘Ľ1 , đ?‘Ľ2 , ‌ . . , đ?‘Ľđ?‘– ‌ . . đ?‘Ľđ?‘› ) + (đ?‘Ś1 , đ?‘Ś2 , ‌ . . , đ?‘Śđ?‘– ‌ . . đ?‘Śđ?‘› ) = (đ?‘Ľ1 + đ?‘Ś1 , đ?‘Ľ2 + đ?‘Ś2 , ‌ . . , đ?‘Ľđ?‘– + đ?‘Śđ?‘– , ‌ ‌ . , đ?‘Ľđ?‘› + đ?‘Śđ?‘› ) La struttura di spazio vettoriale lineare e’ sintetizzabile con la seguente affermazione.


Se (�1 , �2 , ‌ . . , �� ‌ . . �� ) � (�1 , �2 , ‌ . . , �� ‌ . . �� ) sono elementi di uno spazio vettoriale allora anche il vettore k(�1 , �2 , ‌ . . , �� ‌ . . �� ) + h(�1 , �2 , ‌ . . , �� ‌ . . �� ) e’ un elemento di detto spazio. In questo elaborato le componenti dei due vettori sono numeri reali. Parimenti h e k sono scalari reali. E’ ammesso il caso h = k = 0.

17. Matrici e operazioni su di esse Una matrice e’ sostanzialmente una tabella costituita da m righe e da n colonne. Ogni elemento di essa, detto componente della matrice, si caratterizza per due indici, il primo e’ riferito alla riga ed il secondo alla colonna. Una matrice avente un eguale numero di righe e di colonne e’ detta matrice quadrata. �11 A=( ⋎ ��1

â‹Ż â‹ą â‹Ż

đ?‘Ž1đ?‘› â‹Ž ) đ?‘Žđ?‘šđ?‘›

Una matrice e’ moltiplicabile per uno scalare, avendosi che: �11 kA = k( ⋎ ��1

â‹Ż â‹ą â‹Ż

đ?‘Ž1đ?‘› đ?‘˜đ?‘Ž11 â‹Ž ) =( â‹Ž đ?‘Žđ?‘šđ?‘› đ?‘˜đ?‘Žđ?‘š1

â‹Ż â‹ą â‹Ż

đ?‘˜đ?‘Ž1đ?‘› â‹Ž ) đ?‘˜đ?‘Žđ?‘šđ?‘›


In forma concisa si scrive A =⌋đ?‘Žđ?‘–đ?‘— âŚŒ da cui kA = đ?‘˜âŚ‹đ?‘Žđ?‘–đ?‘— âŚŒ=⌋đ?‘˜đ?‘Žđ?‘–đ?‘— âŚŒ. Per k = - 1 si ottiene la matrice opposta di A, ovvero −đ??´. Due o piu’ matrici dello stesso ordine (eguale numero di righe ed eguale numero di colonne) sono sommabili secondo la regola seguente: A + B = ⌋đ?‘Žđ?‘–đ?‘— âŚŒ +⌋đ?‘?đ?‘–đ?‘— âŚŒ = ⌋đ?‘Žđ?‘–đ?‘— +đ?‘?đ?‘–đ?‘— âŚŒ Un esempio concreto con le matrici del secondo ordine chiarisce il formalismo adottato. 1 3 1 ( )+( 2 8 3

1+1 3+1 1 2 )=( ) =( 2+3 8+1 1 5

4 ) 9

A particolari condizioni e’ possibile moltiplicare tra loro due matrici. Data una matrice A ed una matrice B esse si possono moltiplicare tra loro se il numero delle colonne della prima e’ eguale al numero delle righe della seconda. Dette matrici si indicano come segue: đ??´(đ?‘š,đ?‘›) e đ??ľ(đ?‘›,đ?‘&#x;) .

La matrice prodotto AB e’ una matrice del tipo đ??´đ??ľ(đ?‘š,đ?‘&#x;) .


In generale la moltiplicazione tra matrici non e’ in generale commutativa. Occorre fare un passo indietro e considerare l’operazione di prodotto interno tra vettori. Il risultato dell’operazione e’ uno scalare definita come segue. Per ragioni pratiche si considera il caso di vettori a tre dimensioni. đ?‘?1 (đ?‘Ž1 đ?‘Ž2 đ?‘Ž3 ) (đ?‘?2 ) = đ?‘Ž1 đ?‘?1 + đ?‘Ž2 đ?‘?2 + đ?‘Ž3 đ?‘?3 đ?‘?3 La sostanza delle cose non cambia al variare della dimnesione dei vettori (numero di componenti). La moltiplicazione tra matrici e’ una moltiplicaizione righe per colonne. Le regole multiplicative sono sostanzialmente le seguenti. 1. Si deve verificare se le matrici sono conformabili per la moltiplicazione (numero di colonne della prima eguale al numero di righe della seconda). 2. Gli elementi della matrice prodotto, đ?‘?đ?‘–đ?‘— , sono il risultato, scalare, dell’operazione di prodotto scalare tra il vettore i cui elementi sono quelli della


i-esima riga della prima matrice e il vettore i cui elementi sono quelli della jesima colonna della seconda matrice.

Un esempio concreto potrebbe essere utile a chiarire la situazione.

4 0 Date le matrici A = ( −1 − 2

−3 ) eB=( 3

2 −3 5 −1 −1 0

0 1 −4 2 ) 0 3

Si chiede di calcolare AB. Preliminarmente si osserva che il numero delle colonne della prima (tre) e’ eguale al numero delle righe della seconda, quindi le due matrici sono conformabili per la moltiplicazione. E’ quindi possibile calacolare AB.

La matrice considerata AB ha due righe e quattro colonne. Siano đ?‘?đ?‘–đ?‘— gli elementi di detta matrice. 2 Occorre calcolare đ?‘?11 = (4 0 −3) ( 5 ) = 4Ă— 2 + 0 Ă— 5 + (−3)(−1) = 8 +0 + −1 3 = 11.


−3 Si ha đ?‘?12 = (4 0 −3) (−1) = 4 Ă— (−3) + 0(−1) + (−3) Ă—0 = −12 0 0 Si ha đ?‘?13 = (4 0 −3) (−4) = 0 0 1 Si ha đ?‘?14 = (4 0 −3) (2) = 4Ă— 1 + 0 Ă— 2 + (−3) Ă— 3 = 4 + 0 − 9 = −5 3 Calcolo ora gli altri elementi a partire da 2 đ?‘?21 = (−1 − 2 3) ( 5 ) = (−1) Ă— 2 + (−2) Ă— (5) + 3 Ă— (−1) = −2 − 10 − −1 3 = −15 Fino a questo punto sono stati trovati i seguenti elementi come collocate nella matrice, ovvero: đ?‘?11 đ?‘?12 AB = ( đ?‘? đ?‘? 21 22

đ?‘?13 đ?‘?14 11 đ?‘?23 đ?‘?24 ) = (−15

Gli elementi mancanti, ovvero dato.

−12 0 −5 ) ‌‌‌‌‌‌‌‌‌‌‌

đ?‘?22 , đ?‘?23 đ?‘’ đ?‘?24 sono calcolabili con il criterio


18. Trasposta di una matrice Data una matrice A di m righe ed n colonne la matrice trasposta di essa, indicate come đ??´đ?‘‡ e’ ottenuta da A scambiando ordinatamente le righe con le colonne. La prima riga di A diviene la prima colonna di đ??´đ?‘‡ , etc. In generale le matrici A e đ??´đ?‘‡ non coincidono mai quando A e’ una matrice rettangolare. Nel caso delle matrici quadrate e’ possibile che risulti A = đ??´đ?‘‡ . Nel qual caso le due matrici si dicono simmetriche.

1 0 2 4 1 2 1 1 Data la matrice A = ( ) la matrice trasposta di A, ovvero đ??´đ?‘‡ = ( ) 1 3 0 4 3 2 1 2 Esiste anche la trasposizione di un vettore, nel senso che un vettore colonna diviene un vettore riga. 1 Dato V = (0) â&#x;ş đ?‘‰đ?‘‡ = (1 0 9). 9

19. Determinante di una matrice quadrata


Data una matrice quadrata ad essa e’ associabile uno scalare detto determinante della marice quadrata. La corrispondenza non e’ biunivoca. E’ noto che il determinante di una matrice di ordine 2 e’: �11 det A = det (�

21

đ?‘Ž12 đ?‘Ž22 ) = đ?‘Ž11 đ?‘Ž22 − đ?‘Ž21 đ?‘Ž12

In generale per definire il determinante di una matrice quadrata di ordine n si considera una permutazione đ?œŽ dell’insieme dei primi n interi assoluti. L’insieme i cui elementi sono tutte le possibili permutazioni di n elementi si indica đ?‘†đ?‘› ed ha cardinalita’ n! Vanno definite le inversioni riferite ad una delle possibili permutazioni. In pratica con riferimento ad ogni permutazione si contano rispetto ad ogni elemento di essa quanti numeri maggiori del dato elemento sono strettamente maggiori di esso. Il numero di relazioni > che si verificano rispetto ad ogni elemento della stringa considerando i numeri a sinistra del numero di volta in volta considerato.


Se il numero di dette relazioni e’ pari la permutazione e’ pari, altrimenti e’ dispari. Nel caso in cui detto numero sia pari si dice che la permutazione e’ pari e si dice che il suo segno di parita’ vale + 1 altrimenti si dice che essa e’ dispari con segno di parita’ eguale a – 1. Concisamente si scrive sgn(đ?œŽ) = Âą 1. Una permutazione viene scritta nella forma đ?œŽ = đ?‘—1 đ?‘—2 ‌ . đ?‘—đ?‘› Data una matrice quadrata di ordine n si condidera un prodotto di elementi di essa tale che esso non contenga piu’ di un elemento proveniente da una data riga e non contenga piu’ di un elemento proveniente dalla medesima colonna. Detti prodotti sono del tipo đ?‘Ž1đ?‘—1 đ?‘Ž2đ?‘—2 ‌ đ?‘Žđ?‘›đ?‘—đ?‘› Il determinante e’ la sommatoria degli n! prodotti preceduti da sgn(đ?œŽ) e si scrive Det (A)= ∑đ?œŽđ?œ–đ?‘†đ?‘›(đ?‘ đ?‘”đ?‘›(đ?œŽ)) đ?‘Ž1đ?‘—1 đ?‘Ž2đ?‘—2 ‌ đ?‘Žđ?‘›đ?‘—đ?‘› Il caso delle matrici quadrate del terzo ordine e’ molto utile per fare comprendere tutto questo formalismo.


Per ragioni pratiche in relazione a matrici di ordine superiore al terzo si utilizza il metodo di Laplace. Vanno premesse alcune definizioni. Dato un elemento đ?‘Žđ?‘–đ?‘— di una matrice quadrata viene soppressa la riga e la colonna cui detto elemento appartiene. Il determanante di ordine (n – 1) cosi’ ottenuto e’ detto minore complementare dell’elemento đ?‘Žđ?‘–đ?‘— . Esso e’ solitamente indicato come đ?‘€đ?‘–đ?‘— . Dati i e j la grandezza (−1)đ?‘–+đ?‘— đ?‘€đ?‘–đ?‘— e’ detto complemento algebrico o anche cofattore. Per ragioni pratiche si utilizza una regola pratica detta di Laplace. E’ detto determinante di una matrice quadrato il valore scalare ottenuto con la seguente relazione. det đ??´đ?‘›,đ?‘› = ∑đ?‘›đ?‘—≤1 đ?‘Žđ?‘–0 đ?‘— (−1)đ?‘–0 +đ?‘— đ?‘€đ?‘–0 +đ?‘—


In essa si e’ ragionato considerando data da riga, quindi ponendo e considerando costante đ?‘–0 ≤ n. Questa e’ una possibile formalizzazione della definizione di Laplace per la quale il determinante di una matrice e’ la sommatoria degli elementi della riga moltiplicati per i rispettivi cofattori. Se si ragiona con riferimento ad una colonna allora detta relazione viene riformaulata come segue: det đ??´đ?‘›,đ?‘› = ∑đ?‘›đ?‘–≤1 đ?‘Žđ?‘–,đ?‘—đ?‘œ (−1)đ?‘–+đ?‘—0 đ?‘€đ?‘– + đ?‘—0

20. Matrici invertibili. Inversa. Data una matrice quadrata A la matrice inversa di A, indicata come đ??´âˆ’1 , e’ quella unica matrice, se esiste, tale che đ??´âˆ’1 đ??´ = Ađ??´âˆ’1 = I . La matrice I e’ detta unitaria (e’ l’elemento neutro rispetto alla moltiplicazione tra matrici) . Gli elementi đ?‘Žđ?‘–đ?‘— sono tali che đ?‘Žđ?‘–đ?‘— = 0 quando i ≠j e đ?‘Žđ?‘–đ?‘— = 1 quando i = j. Gli elementi đ?‘Žđ?‘–đ?‘— đ?‘?đ?‘’đ?‘&#x; i = j sono detti elementi della diagonale principale.


Una matrice quadrata tale che detA ≠0 e’ detta non singolare, altrimenti e’ singolare. Condizione necessaria e sufficiente affinche’ una matrice quadrata ammetta l’inversa e’ che essa sia non singolare. La procedura che consente di calcolare l’inversa di una matrice quadrata e’ il seguente: 1) si scrive la matrice trasposta 2) si sostituisce ad ogni elemento di essa il cofattore 3) si divide la matrice ottenuta per detA.

21. Dipendenza ed indipendenza lineare Sia dato uno spazio vettoriale đ?‘‰đ?‘œđ?‘› . Il vettore nullo 0 e’ elemento di đ?‘‰đ?‘œđ?‘› . Un insieme di vettori v ∈ đ?‘‰đ?‘œđ?‘› costituisce una combinazione linearmente dipendente di vettori se esistono degli scalari đ?‘Žđ?‘– non tutti nulli per i quali sia ∑đ?‘–≤đ?‘› đ?‘Žđ?‘– đ?’—đ?’Š = 0


Se detta relazione e’ vera quando �� e’ identivamente zero per ogni i, allora la combinazione e’ riferita a vettori linearmente indipendenti.

22. Combinazione convessa di vettori ad n dimensioni n vettori dello spazio vettoriale dato costituiscono una combinazione lineare convessa se oltre alla condizione vettoriale ∑đ?‘–≤đ?‘› đ?‘Žđ?‘– đ?’—đ?’Š = 0 e’ contemporaneamente verificata quella scalare ∑đ?‘–≤đ?‘› đ?‘Žđ?‘– = 1 . Puo’ ad esempio essere richiesto di stabilire se il vettore (1, 2) e’ una combinazione convessa dei due seguenti vettori (1, 1) e (2 , − 1). 1 1 2 Affinche’ lo sia deve risultare ( ) = x( ) +đ?‘Ś ( ) sotto la condizione x + y = 1 . 2 1 −1 1 1 2 1 2 1 1 Ma per la condizione data sarebbe ( ) = (1 −đ?‘Ś) ( ) +đ?‘Ś ( ) = ( ) + y( ( ) − ( )) = ( ) + y 2 1 −1 1 −1 1 1 (

1 ). −2

Affinche’ detto vettore sia una combinazione convessa deve essere assegnato uno scalare y per il quale sia: 1+đ?‘Ś 1 ( )=( ) 1 − 2đ?‘Ś 2


Cio’ non puo’ essere in quanto per la prima componente dovrebbe risultare y = 0 mentre per la seconda sarebbe un y < 0 soluzione della equazione lineare in y seguente: 2 = 1 −2y.

23. Insiemi convessi Un insieme di vettori di dimensione n e’ convesso se per ogni coppia di vettori dell’insieme dato vi appartiene pure il segmento congiungente. Esistono comunque punti che non sono esprimibili come una combinazione linerare convessa di punti del dato insieme. Detti punti sono detti punti estremi.

24. Vettore gradiente E’ data una funzione đ?œ‘(x,y, z) il gradiente di detta funzione, indicato con il simbolo ∇ đ?œ‘(x,y, z) la grandezza vettoriale đ?œ•

đ?œ•

đ?œ•

∇ đ?œ‘(x,y, z) = đ?œ•đ?‘Ľ đ?œ‘(x,y, z)i + đ?œ•đ?‘Ś đ?œ‘(x,y, z)j + đ?œ•đ?‘§ đ?œ‘(x,y, z)k Quella indicata e’ la forma cartesiana del gradiente.


25. Matrice di Hess Nello spazio a tre dimenzioni data una funzione f(x, y) il gradiente di tale funzione scalare e’ un vettore le compomenti sono le derivate parziali della funzione rispetto alle variabili indipendenti x ed y. I punti (đ?‘Ľ0 , đ?‘Ś0 ) per i quali risulta ∇f(x,y) = 0 sono detti punti stazionari. Per la ricerca dei massimi e dei minimi della funzione si utilizza la matrice delle derivate seconde parziali, detta matrice hessiana nella forma seguente: đ?‘“′′đ?‘Ľđ?‘Ľ ( đ?‘“′′đ?‘Śđ?‘Ľ

�′′�� ) �′′��

cui corrisponde un determinante detto hessiano della f(x,y). Se l’hessiano H(x,y) in un punto (đ?‘Ľ0 , đ?‘Ś0 ) per il quale ∇f(đ?‘Ľ0 , đ?‘Ś0 ) = 0, e’ positivo, ovvero se H(đ?‘Ľ0 , đ?‘Ś0 ) > 0 allora: la funzione per (đ?‘Ľ0 , đ?‘Ś0 ) e’ di minimo se đ?‘“′′đ?‘Ľđ?‘Ľ (đ?‘Ľ0 , đ?‘Ś0 ) > 0 e đ?‘“′′đ?‘Śđ?‘Ś (đ?‘Ľ0 , đ?‘Ś0 ) > 0; la funzione data per (đ?‘Ľ0 , đ?‘Ś0 ) e’ di massimo đ?‘ đ?‘’ đ?‘“′′đ?‘Ľđ?‘Ľ (đ?‘Ľ0 , đ?‘Ś0 ) < 0 e đ?‘“′′đ?‘Śđ?‘Ś (đ?‘Ľ0 , đ?‘Ś0 ) < 0. Un esempio potrebbe essere una funzione f(x, y, z) di tre variabili indipendenti quale la seguente:


f(x,y,z) = � ��� + ln

� ��

Si tratta di una funzione, create a partire da una piu’ semplice che rinvenni nella manualistica, da �3 a valori di R nel senso che a una terna ordinate di valori reali (x, y, z) corrisponde uno ed un solo valore f(x, y, z) secondo il formalismo (x, y, z) → f(x, y, z).

Si deve considerare il dominio di definizione di essa, osservando che devono essere introdotte precise limitazioni per le tre variabili indipedenti x, y e z. L’argomento dell’esponenziale non pone problemi ma il logaritmo naturale e il suo argomento impongono particolari restrizioni, In particolare deve essere yx ≠0, ovvero deve essere sempre x ≠0 e pure y ≠0. Ulteriormente deve risultare

� ��

> 0 . La condizione data presuppone che tra le

variabili sussistano le seguenti condizioni: x > 0, y > 0 , z > 0

x < 0, y < 0 , � < 0

La funzione non e’ definita nel punto (0, 0, 0) in quanto in esso sarebbe ln(0) non definite in R. La ricerca di punti stazionari si ha eguagliando a zero il gradiente.

26. Sistemi lineari (varie tipologie e criteri di risoluzione di essi)


Una equazione lineare con n distinte incognite e’ ponibile nella forma: đ?‘Ž1 đ?‘Ľ1 + đ?‘Ž2 đ?‘Ľ2 + đ?‘Ž3 đ?‘Ľ3 + ‌ ‌ + đ?‘Žđ?‘› đ?‘Ľđ?‘› = đ?‘? ove le incognite sono gli đ?‘Ľđ?‘– . Quando b = 0 l’equazione lineare e’ detta omogenea. Un sistema di m equazioni ed n ingognite e’ ponibile nella forma: đ?‘Ž11 đ?‘Ľ1 + đ?‘Ž12 đ?‘Ľ2 + đ?‘Ž13 đ?‘Ľ3 + ‌ ‌ + đ?‘Ž1đ?‘› đ?‘Ľđ?‘› = đ?‘?1 đ?‘Ž21 đ?‘Ľ1 + đ?‘Ž22 đ?‘Ľ2 + đ?‘Ž23 đ?‘Ľ3 + ‌ ‌ + đ?‘Ž2đ?‘› đ?‘Ľđ?‘› = đ?‘?2 ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌. đ?‘Žđ?‘š1 đ?‘Ľ1 + đ?‘Žđ?‘š2 đ?‘Ľ2 + đ?‘Žđ?‘š3 đ?‘Ľ3 + ‌ ‌ + đ?‘Žđ?‘šđ?‘› đ?‘Ľđ?‘› = đ?‘?đ?‘š2 đ?‘ đ?‘œđ?‘› necessariamente il numero delle equazioni, m, coindice con il numero delle soluzioni, n. đ?‘ đ?‘’đ?‘– manuali di algebra lineare sono indicati con rigore i metodi per la risoluzione delle equazioni lineari. Tra di essi e’ bene conoscere il metodo di eliminazione di Gauđ?›˝.


Nel proseguio della trattazione verranno considerati anche altri metodi.

Ho deciso di formalizzare un algoritmo lungo quanto a numero di operazioni ma rispetto al quale ho sperimentato meno facilmente suscettibile di errori di calcolo in ragione della sua semplicita’. Ho applicato i ragionamenti ad un sistema di tre equazioni in tre incognite che nella manualistica in mio possesso viene risolto con il metodo dell’eliminazione di Gauβ.

Esso e’ il seguente:

x + 2đ?‘Ś − 3đ?‘§ = 1

2x + 5đ?‘Ś − 8đ?‘§ = 4

3x + 8đ?‘Ś − 13đ?‘§ = 7

E’ possibile considerare le prime due equazioni, moltiplicando per 2 la prima e sottraendo membro a membro. Si avrebbe: 2x + 4đ?‘Ś − 6đ?‘§ = 2

2x + 5đ?‘Ś − 8đ?‘§ = 4

Da cui si ottiene:


− đ?‘Ś + 2đ?‘§ = − 2

E’ possibile moltiplicare la prima equazione per 3 e metterla a sistema con la terza sottraendo membro a membro, avendo: 3x + 6đ?‘Ś − 9đ?‘§ = 3

3x + 8đ?‘Ś − 13đ?‘§ = 7

Sottraendo membro a membro si ottiene: − 2đ?‘Ś + 4đ?‘§ =− 4

Le due equazioni considerate possono essere messe a sistema, ovvero si ha:

− đ?‘Ś + 2đ?‘§ = − 2

− 2đ?‘Ś + 4đ?‘§ =− 4

Si osserva che la seconda equazione e’ multipla della prima secondo il numero intero 2.

Dalla prima equazione si ricava che: y − 2đ?‘§ = 2

y = 2 + 2z

Detto altrimenti si puo’ dire che fissato z, ovvero posto z = �0 , allora risulta che y = 2 ( 1 + �0 ). Il corrispondente valore della x vale:


x = 1 +3đ?‘§0 −2(2 ( 1 + đ?‘§0 )). Il modo di procedure e’ generalizzabile al caso di m equazioni ed n incognite. La sostanza delle cose sta nel fatto che due qualunque equazioni di un sistema possono per passaggi successivi essere ridotte a due equazioni con due sole incognite. Si consideri ad esempio il caso di due equazioni di un sistema di cinque equazioni. ađ?‘Ľ1 + đ?‘?đ?‘Ľ2 + đ?‘?đ?‘Ľ3 + đ?‘‘đ?‘Ľ4 = h đ?‘’đ?‘Ľ2 + đ?‘“đ?‘Ľ3 + đ?‘”đ?‘Ľ4 + đ?‘šđ?‘Ľ5 = k Si puo’ decidere di eliminare l’incognita đ?‘Ľ2 . Questa argomentazione e’ legittima in quanto detta incognita e’ comune alle due equazioni. Si ottiene, dopo che si e’ sottratto membro a membro, una relazione del tipo: a′đ?‘Ľ1 + đ?‘?′đ?‘Ľ3 + đ?‘‘′đ?‘Ľ4 − đ?‘šđ?‘Ľ5 = h’ Ma la stessa argomentazione puo’ essere fatta in relazione alle variabili incognite đ?‘Ľ3 đ?‘’ đ?‘Ľ4 . Si avrebbe, ad esempio: a′′đ?‘Ľ1 + đ?‘?′′đ?‘Ľ2 + đ?‘‘′′đ?‘Ľ4 − đ?‘šđ?‘Ľ5 = h’’ Non e’ in generale possibile eliminare due variabili in un colpo. Ma in astratto il sistema deve sempre consentire la eliminazione delle variabili.


Forse e’ bene considerare un caso concreto, ovvero il seguente sistema di 4 incognite in 4 equazioni. �1 + 2�2 + 33 + 4�4 = 5

2đ?‘Ľ1 + đ?‘Ľ2 + 2đ?‘Ľ3 + 3đ?‘Ľ4 = 1 3đ?‘Ľ1 + 2đ?‘Ľ2 + đ?‘Ľ3 + 2đ?‘Ľ4 = 1 4đ?‘Ľ1 + 3đ?‘Ľ2 + 2đ?‘Ľ3 + 1đ?‘Ľ4 = -5 La prima equazione moltiplicata per 2 puo’ essere messa a sistema con la seconda e si puo’ sottrarre membro a membro. La prima equazione puo’ essere moltiplicata per 3 e messa a sistema con la terza e quindi si puo’ sottrarre membro a membro. La prima equazione puo’ essere moltiplicata per 4 e messa a sistema con la terza e quindi si puo’ sottrarre membro a membro. Si e’ ottenuto un sistema di tre equazioni in tre incognite che e’ trattabile iterando il procedimento. Alla fine si otterra’ un sistema di due equazioni in due incognite. Se detto sistema ammette soluzione e detta soluzione e’ unica allora il sistema di n equazioni in n incognite ammette una unica soluzione. Esiste quindi una unica n-pla ordinata di numeri reali per la quale la sostituzione (đ?‘ 1 , đ?‘ 2 , ‌ . đ?‘ đ?‘– ‌ ‌ đ?‘ đ?‘› ) → (đ?‘Ľ1 , đ?‘Ľ2 , ‌ ‌ , đ?‘Ľđ?‘– , đ?‘Ľđ?‘› ) verifica contemporaneamente le n equazioni del sistema.


Va osservato che detto metodo eтАЩ vero anche quando quale parametro sia ЁЭСОЁЭСЦЁЭСЧ = 0.

Gli step completi sono: ЁЭСе1 + 2ЁЭСе2 + 33 + 4ЁЭСе4 = 5 2ЁЭСе1 + ЁЭСе2 + 2ЁЭСе3 + 3ЁЭСе4 = 1

2ЁЭСе1 + 4ЁЭСе2 + 6ЁЭСе3 + 8ЁЭСе4 = 10 2ЁЭСе1 + ЁЭСе2 + 2ЁЭСе3 + 3ЁЭСе4 = 1

3ЁЭСе2 + 4ЁЭСе3 + 5ЁЭСе4 = 9 3ЁЭСе1 + 6ЁЭСе2 + 9ЁЭСе3 + 12ЁЭСе4 = 15 3ЁЭСе1 + 2ЁЭСе2 + ЁЭСе3 + 2ЁЭСе4 = 1

4ЁЭСе2 + 8ЁЭСе3 + 10ЁЭСе4 = 14

ЁЭСе1 + 2ЁЭСе2 + 3ЁЭСе3 + 4ЁЭСе4 = 5 4ЁЭСе1 + 3ЁЭСе2 + 2ЁЭСе3 + 1ЁЭСе4 = -5

4ЁЭСе1 + 8ЁЭСе2 + 12ЁЭСе3 + 16ЁЭСе4 = 20 4ЁЭСе1 + 3ЁЭСе2 + 2ЁЭСе3 + 1ЁЭСе4 = -5

5ЁЭСе2 + 10ЁЭСе3 + 15ЁЭСе4 = 25 тЖТ ЁЭСе2 + 2ЁЭСе3 + 3ЁЭСе4 = 5

Ecco il nuovo sistema ottenuto

3ЁЭСе2 + 4ЁЭСе3 + 5ЁЭСе4 = 9 4ЁЭСе2 + 8ЁЭСе3 + 10ЁЭСе4 = 14


đ?‘Ľ2 + 2đ?‘Ľ3 + 3đ?‘Ľ4 = 5

A questo punto le tre equazioni sono pronte per la scomparsa di una incognita ad esempio đ?‘Ľ2 . Si ha 3đ?‘Ľ2 + 4đ?‘Ľ3 + 5đ?‘Ľ4 = 9 đ?‘Ľ2 + 2đ?‘Ľ3 + 3đ?‘Ľ4 = 5

3đ?‘Ľ2 + 4đ?‘Ľ3 + 5đ?‘Ľ4 = 9 3đ?‘Ľ2 + 6đ?‘Ľ3 + 9đ?‘Ľ4 = 15

Si ottiene la prima equazione in due incognite. −2đ?‘Ľ3 − 4đ?‘Ľ4 = − 6 → −đ?‘Ľ3 − 2đ?‘Ľ4 = − 3 → đ?‘Ľ3 + 2đ?‘Ľ4 = 3

La seconda equazione si ottiene da 4đ?‘Ľ2 + 8đ?‘Ľ3 + 10đ?‘Ľ4 = 14 đ?‘Ľ2 + 2đ?‘Ľ3 + 3đ?‘Ľ4 = 5

4đ?‘Ľ2 + 8đ?‘Ľ3 + 10đ?‘Ľ4 = 14 4đ?‘Ľ2 + 8đ?‘Ľ3 + 12đ?‘Ľ4 = 20

− 2đ?‘Ľ4 = −6

→

2đ?‘Ľ4 = 6 ovvero đ?‘Ľ4 = 3

(đ?‘žđ?‘˘đ?‘’đ?‘ đ?‘Ąđ?‘œ đ?‘’ ′ đ?‘˘đ?‘› đ?‘?đ?‘Žđ?‘ đ?‘œ đ?‘“đ?‘œđ?‘&#x;đ?‘Ąđ?‘˘đ?‘›đ?‘Žđ?‘Ąđ?‘œ đ?‘’ đ?‘“đ?‘œđ?‘&#x;đ?‘Ąđ?‘˘đ?‘–đ?‘Ąđ?‘œ đ?‘›đ?‘’đ?‘™ đ?‘ đ?‘’đ?‘›đ?‘ đ?‘œ đ?‘?â„Žđ?‘’ đ?‘›đ?‘œđ?‘› đ?‘™đ?‘œ đ?‘ đ?‘Žđ?‘?đ?‘’đ?‘Łđ?‘œ ! di scomparsa di due variabili.)

Dall’equazione đ?‘Ľ3 + 2đ?‘Ľ4 = 3 per x4 = 3 so ottiene đ?‘Ľ3 = 3 −2đ?‘Ľ4 = 3 − 6 = − 3


Per sostituzione e’ possibile ottenere la seconda incognita

đ?‘Ľ2 + 2đ?‘Ľ3 + 3đ?‘Ľ4 = 5 ⇒ đ?‘Ľ2 = − (2đ?‘Ľ3 + 3đ?‘Ľ4 ) + 5 = 6 − 9 + 5 = 2

đ?‘ƒđ?‘’đ?‘&#x; sostituzione si ottiene pure la prima variabile.

Anche i sistemi di due equazioni in due incognite possono essere risolti per sostituzione.

Sia dato il sistema seguente: ax + by = c dx + ey = f Si voglia eliminare la x. Si puo’ procedure come segue. Si moltiplica la prina equazione per d e la seconda per a avendosi che: adx + bdy = dc adx + aey = af Sottraendo membro a membro si ottiene dby – aey = dc – af y(bd – ae) = dc−af


y=

đ?‘‘đ?‘?−đ?‘Žđ?‘“ đ?‘?đ?‘‘ – đ?‘Žđ?‘’

Questa e’ una forma algebrica di un teorema detto di Cramer. Vorrei osservare che solitamente nella enunciazione standard del teorema di Cramer che tutti noi apprendiamo negli studi superiori esiste evidentemente anche una relazione simile per l’altra incognita ovvero la x. Una espressione equivalente per la x (non quella dei manuali‌‌) potrebbe aversi per sostituzione come segue: ax + by = c ax = c – by x=

đ?‘? – đ?‘?đ?‘Ś đ?‘Ž

=

đ?‘?−đ?‘?

đ?‘‘đ?‘?−đ?‘Žđ?‘“ đ?‘?đ?‘‘ – đ?‘Žđ?‘’

đ?‘Ž

Si puo’ ammettere sia y = đ?‘Ľđ?‘› ed x = đ?‘Ľđ?‘›âˆ’1. Andando a ritroso si dovrebbe ricavare la relazione tra i coefficienti riferiti ai vari step della risoluzione del sistema.

Un sistema lineare di n incongite in n equazioni e’ della forma đ?‘Ž11 đ?‘Ľ1 + đ?‘Ž12 đ?‘Ľ2 + đ?‘Ž13 đ?‘Ľ3 + ‌ ‌ + đ?‘Ž1đ?‘› đ?‘Ľđ?‘› = đ?‘?1 đ?‘Ž21 đ?‘Ľ1 + đ?‘Ž22 đ?‘Ľ2 + đ?‘Ž23 đ?‘Ľ3 + ‌ ‌ + đ?‘Ž2đ?‘› đ?‘Ľđ?‘› = đ?‘?2 ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌. đ?‘Žđ?‘›1 đ?‘Ľ1 + đ?‘Žđ?‘›2 đ?‘Ľ2 + đ?‘Žđ?‘›3 đ?‘Ľ3 + ‌ ‌ + đ?‘Žđ?‘›đ?‘› đ?‘Ľđ?‘› = đ?‘?đ?‘›


che e’ ponibile in forma compatta come đ??´đ?‘‹ = B, ove A e’ la matrice quadrata di ordine n , X il vettore colonna delle incognite e B il vettore colonna delgi n coefficienti noti. Quando B = 0 il sistema e’ omogeneo e si ha đ?‘?đ?‘– identicamente nullo. Deve risultare detA ≠0. Se risulta detA ≠0 allora ∃! đ??´âˆ’1| đ??´âˆ’1 đ??´ = đ??´đ??´âˆ’1 = I. Quindi đ??´đ?‘‹ = B â&#x;ş đ??´âˆ’1 đ??´X = đ??´âˆ’1 B â&#x;ş (đ??´âˆ’1 đ??´)X = đ??´âˆ’1 B â&#x;ş IX = đ??´âˆ’1 B Quindi si ha X = đ??´âˆ’1 B. Quindi il vettore colonna delle soluzioni đ?‘Ľđ?‘– si ottiene premoltiplicando la matrice inversa di A per il vettore colonna dei termini noti.

27. Rango di una matrice. Teorema di Rouche’-Capelli Ai fini che qui rilevano il rango (o caratteristica) di una matrice rileva ai fini della risoluzione dei sistemi lineari, utilizzando il teorema di Rouche’ – Capelli. Data una matrice A di m riche ed n colonne, ovvero una matrice đ??´đ?‘š,đ?‘› Sia r un numero intero tale che r ≤ min (m, n).


Gli elementi della matrice che si trovano all’incrocio della p-esima riga e della pesima colonna formano una matrice quadrata di ordine p detta sottomatrice estratta. Il determinante di essa e’ detto minore. Il minore di ordine r e’ un qualunque determinante di ordine r (a partire quindi da una matrice quadrata di ordine r‌) ottenuto con gli elementi comuni a r colonne e a r righe. Il đ?‘&#x;đ?‘šđ?‘Žđ?‘Ľ per il quale esiste un determinante non nullo definisce il rango di una matrice. đ?‘&#x;đ?‘šđ?‘Žđ?‘Ľ = 0 quando đ?‘Žđ?‘—đ?‘˜ = 0 identicamente. Un sistema lineare di n incongite in n equazioni e’ della forma đ?‘Ž11 đ?‘Ľ1 + đ?‘Ž12 đ?‘Ľ2 + đ?‘Ž13 đ?‘Ľ3 + ‌ ‌ + đ?‘Ž1đ?‘› đ?‘Ľđ?‘› = đ?‘?1 đ?‘Ž21 đ?‘Ľ1 + đ?‘Ž22 đ?‘Ľ2 + đ?‘Ž23 đ?‘Ľ3 + ‌ ‌ + đ?‘Ž2đ?‘› đ?‘Ľđ?‘› = đ?‘?2 ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌. đ?‘Žđ?‘š1 đ?‘Ľ1 + đ?‘Žđ?‘š2 đ?‘Ľ2 + đ?‘Žđ?‘š3 đ?‘Ľ3 + ‌ ‌ + đ?‘Žđ?‘šđ?‘› đ?‘Ľđ?‘› = đ?‘?đ?‘š đ??źđ?‘› generale m ≠n. đ??żđ?‘Ž matrice dei coefficienti đ?‘Žđ?‘–đ?‘— e’ detta matrice incompleta.


đ??ˇđ?‘Ž questa matrice si ottiene una nuova matrice detta matrice completa avente una ulteriore colonna, i cui elementi sono i đ?‘?đ?‘– . Il teorema in oggetto ammette che il sistema abbia soluzione (una o infinite) quando le due matrici hanno il medesimo rango.

28. Moltiplicatori di Lagrange Data una funzione f(x, y, z) soggetta ad un vincolo assegnato, ovvero g(x, y, z) = k i massimi e i minimi della funzione f(x,y,z) si determinano risolvendo il sistema vettoriale seguente: ∇f(x, y, z) = đ?œŽâˆ‡g(x, y, z) con il vincolo g(x, y, z) = k I punti x, y, z ottenuti come soluzioni del sistema sono candidati. Quindi si calcola per ogni (x,y,z) trovata il corrispondente valore della f in esso. A volte sono presenti ben due vincoli. In questo caso si ha la seguente equazione vettoriale: ∇f(x, y, z) = đ?œŽâˆ‡g(x, y, z) +đ?›˝h(x,y,z)


ove i vincoli sono g(x, y, z) = đ?‘?1 đ?‘’ h(x,y,z) = đ?‘?2 . Giova ricordare che le equazioni vettoriali vanno risolte per componenti quindi si ha un sistema di 5 equazioni in 5 equazioni, ovvero: đ?œ• đ?œ•đ?‘Ľ

đ?œ• đ?œ•đ?‘Ś

đ?œ• đ?œ•đ?‘§

đ?œ•

f(x,y,z) = đ?œŽ đ?œ•đ?‘Ľ g(x,y,z)+đ?›˝ đ?œ•

f(x,y,z) = đ?œŽ đ?œ•đ?‘Ś g(x,y,z)+đ?›˝ đ?œ•

f(x,y,z) = đ?œŽ đ?œ•đ?‘§ g(x,y,z)+đ?›˝

đ?œ• đ?œ•đ?‘Ľ

đ?œ• đ?œ•đ?‘Ś

đ?œ• đ?œ•đ?‘§

h(x,y,z)

h(x,y,z)

h(x,y,z)

g(x, y, z) = đ?‘?1 h(x,y,z) = đ?‘?2 . Ďƒ, β, đ?‘?1 đ?‘’ đ?‘?2 sono scalari reali, đ?‘?1 đ?‘’ đ?‘?2 sono noti. Molte volte nel calcolare i massimi e i minimi con il metodo di Lagrange e’ possibile gestire la situazione con artifici. E’ il caso di questa funzione rinvenuta in un ottimo manuale di Analisi 2. f(x,y) = đ?‘Ľ 2 y sotto il vincolo đ?‘Ľ 2 + đ?‘Ś 2 = 1 Il vincolo puo’ essere riscritto come đ?‘Ľ 2 = 1 −đ?‘Ś 2


Detta espressione puo’ essere sostituita nella funzione avendosi che f(x,y) = (1 −đ?‘Ś 2 )y = đ?‘Ś − đ?‘Ś 3 Derivando rispetto alla y si ha đ?‘“đ?‘Ś (x, y) = 1 – 3đ?‘Ś 2 .

1

Posto đ?‘“đ?‘Ś (x, y) = 1 – 3đ?‘Ś 2 = 0 ovvero 1 = 3đ?‘Ś 2 e quindi y = Âą √3

I due valori trovati, simmetrici dell’origine lungo l’asse y sono sostituibili nella espressione analitica della funzione obiettivo, avendo nei due casi:

1

1

f(x, √3) = đ?‘Ľ 2 √3

1

1

3

3

f(x, −√ ) = − đ?‘Ľ 2 √

E’ pero’ immediato ragionare sulla funzione, come coordinata dalla relazione 1

vincolare, ovvero f(x,y) = đ?‘Ś − đ?‘Ś 3 e studiarla per y = Âą √3.

1

1

1

1 3

Per y = √3 si ha f(x, √3 ) = đ?‘Ś − đ?‘Ś 3 = √3 −( 3)2

1

1

1

1

Per y = −√3 si ha f(x, −√3 ) = đ?‘Ś − đ?‘Ś 3 = −√3 – (−√3)3


1

1

Dal confronto tra f(x, √3 ) e f(x, −√3 ) si ottengono il massimo e il minimo nel 1

1

senso che max (f(x, √3 ) , f(x, −√3 ) ) = max f(x,y,z) per il dato vincolo noto e, 1

1

ovviamente, si ha pure che min (f(x, √3 ) , f(x, −√3 ) ) = min f(x,y,z).

Non infrequentemente il problema della ricerca dei massimi e dei minimi di una funzione contiene piu’ di un vincolo, e detti vincoli possono essere del tipo â„Žđ?‘– (x,y,z) = đ?‘?đ?‘– al variare di i da 1 a k (essendo k il numero dei vincoli). I vincoli devono essere compatibili nel senso che ogni vincolo collega funzionalmente variabili che soddisfano la f(x, y, z). Detta altrimenti i punti del luogo â„Žđ?‘– (x,y,z) = đ?‘?đ?‘– sono anche punti di f(x, y, z), al variare di i ≤ k. Non e’ vero il contrario nel senso che non ogni punto di f(x, y, z) lo e’ del vincolo per un assegnato i. Con una certa forzatura ho introdotto una operazione sui vincoli che ho definito intersezione funzionale di vincoli.


Ho ammesso sia: â‹‚đ?‘– ≤ đ?‘˜ â„Žđ?‘– (đ?‘Ľ, đ?‘Ś, đ?‘§) − đ?‘?đ?‘– = k(x, y, z) − đ?‘?đ?‘˜ La relazione va intesa in senso logico. La compatibilita’ dei vincoli richiede che sia dom f(x,y,z) ⊆ dom â„Žđ?‘– (đ?‘Ľ, đ?‘Ś, đ?‘§) Per esempio siano dati due vincoli, ovvero â„Ž1 (x,y,z) = x + đ?‘Ś + đ?‘§ − đ?‘Ž â„Ž2 (x,y,z) = đ?‘Ľ 2 +đ?‘Ś 2 +đ?‘§ 2 − đ?‘? in ragione dei quali si possa scrivere x + đ?‘Ś + đ?‘§ = đ?‘Ž → z = a –( x + y)

đ?‘Ľ 2 +đ?‘Ś 2 +đ?‘§ 2 = đ?‘? → z = √đ?‘? − (đ?‘Ľ 2 +đ?‘Ś 2 )

z = a –( x + y) = √đ?‘? − (đ?‘Ľ 2 +đ?‘Ś 2 ) L’eliminazione della variabile z ha il merito di ottenere un unico vincolo che collega le variabili x ed y.


Nel caso di specie risulterebbe la seguente relazione: a –( x + y) = √đ?‘? − (đ?‘Ľ 2 +đ?‘Ś 2 ) ⇒ ⌋đ?‘Ž – ( đ?‘Ľ + đ?‘Ś) âŚŒ2 = đ?‘? − (đ?‘Ľ 2 +đ?‘Ś 2 ) â&#x;ş đ?‘Ž2 −2đ?‘Ž(x+đ?‘Ś) + (đ?‘Ľ + đ?‘Ś)2 = đ?‘? − (đ?‘Ľ 2 +đ?‘Ś 2 ) â&#x;ş đ?‘Ž2 −2đ?‘Žđ?‘Ľ −2đ?‘Žđ?‘Ś + (đ?‘Ľ + đ?‘Ś)2 = đ?‘? − (đ?‘Ľ 2 +đ?‘Ś 2 ) â&#x;ş đ?‘Ž2 −2đ?‘Žđ?‘Ľ −2đ?‘Žđ?‘Ś + (đ?‘Ľ + đ?‘Ś)2 − đ?‘? + (đ?‘Ľ 2 +đ?‘Ś 2 ) = 0. Sviluppando la relazione trovata si ottiene đ?‘Ž2 −2đ?‘Žđ?‘Ľ −2đ?‘Žđ?‘Ś + 2đ?‘Ľ 2 + 2đ?‘Ś 2 + 2xy −đ?‘? = 0.

Osservazione – Le considerazioni fatte non vanno confuse con quanto e’ possibile dire in relazione ai vincoli da un punto di vista ben piu’ consolidato. Mi riferisco, in particolare, alla “logica� solitamente sottesa nella risoluzione dei sistemi. La “logica� dell’intersezione e’ ponibile solitamente nei seguenti termini. Ad esempio, dato il sistema seguente: x+y=5 2x – y = 1


Dire che x = 2 e y = 3 e’ la soluzione del sistema dato equivale anche in questo caso ad ammettere che la coppia (2, 3) e’ interpretabile come l’intersezione delle infinite coppie che verificano la prima equazione e le infinite coppie che verificano la seconda. Geometricamente detta coppia e’ il punto di intersezione delle rette date.

29. Grafi Un grafo e’ un oggetto matematico costituito da punti detti nodi e da archi che collegano alcune coppie di nodi, quindi viene definito come G = (N, A) . I nodi vengono indicati solitamente con lettere maiuscole A, B, C, ... oppure con numeri 1, 2, 3, … . Un arco che collega due nodi puo’ essere indicato con le lettere dei nodi, ad esempio, un arco che passa per i nodi A e B viene indicato come arco AB. Due archi si dicono connessi quando hanno un nodo in comune. Un cammino e’ costituito da una sequenza di archi connessi in modo tale che non si passi due o piu’ volte per uno stesso nodo.


L’arco e’ orientato quando e’ introdotta una direzione. Nell’arco orientato si intende distinguere lo spostamento da un punto A ed un nodo B, dallo spostamento opposto dal nodo B al nodo A. Da ultimo va ricordato il concetto di grafo connesso. Un grado e’ connesso se per ogni coppia di nodi di esso esiste almeno un cammino che li congiunge. “almeno” definisce la circostanza che possono esistere piu’ cammini. Un grafo connesso nel quale tra il numero n degli archi e il numero a degli archi valga la relazione n = a + 1.

30. Teorema di Bayes. Criteri a priori e a posteriori. Il teorema di Bayes dato uno spazio campione S di cui A e B sono due eventi possibili. Viene definita, come e’ noto, una probabilita’ detta condizionata scrivendo P(B|A ) da intendere come la probabilita’ che si verifichi l’evento B quando si sia verificato l’evento A.


Gli eventi A e B evidentemente non debbono essere incompatibili.

Si dimostra che P(B|A) =

đ?‘ƒ(đ??´ ∊đ??ľ) đ?‘ƒ(đ??´)

Simmetricamente si ha:

P(A|B) =

đ?‘ƒ(đ??´ ∊đ??ľ) đ?‘ƒ(đ??ľ)

Quando A e B sono eventi cincompatibili allora risulta đ??´ ∊ đ??ľ =∅. Conseguentemente si ha đ?‘ƒ(đ??´ ∊ đ??ľ) = 0. La relazione di Bayes e’ coordinabile con il caso di un numero arbitrario finito di eventi a due a due incompatibili.


La programmazione matematica e la teoria delle decisioni

1. Ottimizzazione. Programmazione matematica Il primo passo nello studio dei modelli matematici e’ quello di considerare equazioni lineari aventi il prametro b non negativo. In caso di vincoli descritti da disequazioni vengono introdotte ulteriori variabili per avere una equazione. Data ad esempio đ?‘Žđ?‘Ľ1 + đ?‘?đ?‘Ľ2 +đ?‘?đ?‘Ľ3 +

đ?‘‘đ?‘Ľ4 ≤ − k con k ∈ đ?‘…0+ il primo step e’ costituito dal fare

in modo che il secondo membro sia non negativo, moltiplicando ambo i membri per (− 1) ed avendo la relazione đ?‘Žđ?‘Ľ1 + đ?‘?đ?‘Ľ2 +đ?‘?đ?‘Ľ3 + đ?‘‘đ?‘Ľ4 ≼ k (sicuaramente positiva per il vincolo su k).

Si condideri una variabile non negativa đ?‘Ľ5 | đ?‘Ľ5 ≼ 0. Il vincolo dato, che contiene il simbolo ≼ , con l’introduzione della variabile assegnata diviene: đ?‘Žđ?‘Ľ1 + đ?‘?đ?‘Ľ2 +đ?‘?đ?‘Ľ3 + đ?‘‘đ?‘Ľ4 − đ?‘Ľ5 = k

La variabile �5 e’ una variabile surplus.


Se il vincolo fosse stato del tipo đ?‘Žâ€˛đ?‘Ľ1 + đ?‘?′đ?‘Ľ2 +đ?‘?′đ?‘Ľ3 + đ?‘‘′đ?‘Ľ4 ≤ k’ ≼ 0 allora si rende necessario introdurre una variabile non negativa đ?‘Ľ5 detta variabile slack. L’ottimizzaizone della funzione z = f(đ?‘Ľ1 , đ?‘Ľ2 , ‌ . đ?‘Ľđ?‘– , ‌ . đ?‘Ľđ?‘› ) presuppone che gli m vincoli (generalmente con m ≠n) siano tutti del tipo â„Žđ?‘– (đ?‘Ľ1 , đ?‘Ľ2 , ‌ . đ?‘Ľđ?‘– , ‌ . đ?‘Ľđ?‘› ) = đ?‘?đ?‘– ≼ 0, all’uopo introdudendo opportune variabili surplus o slack, a seconda del caso. Il metodo per generare una soluzione iniziale ammissibile presuppone l’introduzione di una variabile artificiale ad ogni vincolo non contenente una variabile slack. Si potrebbe dare il caso di minimizzare la seguente funzione z = (đ?‘› + 1)đ?‘Ľ1 − đ?‘›đ?‘Ľ2 + (đ?‘› + 3)đ?‘Ľ3 sotto i vincoli (đ?‘› + 4)đ?‘Ľ1 +(đ?‘› + 1)đ?‘Ľ2 − (đ?‘› + 2)đ?‘Ľ3 ≼ − (n+1) e (đ?‘› + 1)đ?‘Ľ1 −(đ?‘› + 1)đ?‘Ľ2 + đ?‘›đ?‘Ľ3 ≤ n +7 Si puo’ considerare il secondo vincolo, ovvero (đ?‘› + 1)đ?‘Ľ1 −(đ?‘› + 1)đ?‘Ľ2 + đ?‘›đ?‘Ľ3 ≤ n +7, che necessita di una variabile slack, divenendo (đ?‘› + 1)đ?‘Ľ1 −(đ?‘› + 1)đ?‘Ľ2 + đ?‘›đ?‘Ľ3 +đ?‘Ľ4 = n+ 7. Il primo membro presuppone dapprima il passaggio alla condizione di non negativita’ del secondo membro avendosi che (đ?‘› + 4)đ?‘Ľ1 +(đ?‘› + 1)đ?‘Ľ2 − (đ?‘› + 2)đ?‘Ľ3 ≼ − (n+1) â&#x;ş − (đ?‘› + 4)đ?‘Ľ1 −(đ?‘› + 1)đ?‘Ľ2 + (đ?‘› + 2)đ?‘Ľ3 ≤ (n+1)

Anche in questo caso occorre introdurre una variabile slack non negativa per la quale si ha la riformulazione del vinolo come segue:


− (đ?‘› + 4)đ?‘Ľ1 −(đ?‘› + 1)đ?‘Ľ2 + (đ?‘› + 2)đ?‘Ľ3 + đ?‘Ľ5 = (n+1) Non e’ necessario introdurre variabili artificiali in quanto tutti i vincoli riformulati contengono slacks. Il problema diviene quindi il seguente: min z = (đ?‘› + 1)đ?‘Ľ1 − đ?‘›đ?‘Ľ2 + (đ?‘› + 3)đ?‘Ľ3 +0đ?‘Ľ4 +0đ?‘Ľ5

sub

(đ?‘› + 1)đ?‘Ľ1 −(đ?‘› + 1)đ?‘Ľ2 + đ?‘›đ?‘Ľ3 +đ?‘Ľ4 = n+ 7 − (đ?‘› + 4)đ?‘Ľ1 −(đ?‘› + 1)đ?‘Ľ2 + (đ?‘› + 2)đ?‘Ľ3 + đ?‘Ľ5 = (n+1)

2. Forma canonica del programma lineare Quando si ha un programma lineare esso viene posto in una rappresentazione matriciale con la seguente forma canonica. z = đ?‘Şđ?‘ť X sub AX = B X≼ đ?&#x;Ž đ?‘Şđ?‘ť indica un vettore colonna detto dei costi di penalizzazione.


Detto vettore ha la medesima dimensione del vettore X delle incognite comunque presenti nel modello. Con riferimento al caso di esempio del paragrafo procedente detto vettore e’ il seguente: đ?‘›+1 −đ?‘› đ??‚đ??“ = đ?‘› + 3 0 ( 0 ) X = (đ?‘Ľ1 , đ?‘Ľ2 , đ?‘Ľ3 , đ?‘Ľ4 , đ?‘Ľ5 ) La matrice A contiene i coefficienti dei vincoli. Con riferimento all’esempio si ha:

A=(

đ?‘›+1 − (đ?‘› + 4)

− (đ?‘› + 1) − (đ?‘› + 1)

đ?‘› 1 0 ) đ?‘›+2 0 1

3. Teoria delle soluzioni Data la matrice A come definita nel modello della forma canonica, siano đ?‘¨đ?’Šâ‰¤đ?’? i vettori colonna della matrice A.


L’equazione AX = B viene riscritta nella forma vettoriale đ?‘Ľ1 đ?‘¨đ?&#x;? + đ?‘Ľ2 đ?‘¨đ?&#x;? + â‹Ż . +đ?‘Ľđ?‘› đ?‘¨đ?’? = B I vettori considerati hanno m dimensioni. Si ipotizza che sia m ≤ n. Si ammette poi rango(A) = m, avendosi m vettori riga di A linearmente indipendenti. Si pongono m – n variabili eguali a zero. Va trovata una soluzione non negativa per le restanti variabili sotto la condizione che gli m vettori di A relative alle variabili non eguagliate a zero siano linearmente indipendenti. Le variabili non eguagliate a 0 sono dette variabili basiche. Se il vettore di esse contiene almeno una variabile basic ail cui valore ottenuto e’ zero la soluzione trovata e’ degenere. Altrimenti la soluzione e’ non degenere. Ad una soluzione basica ammissibile corrisponde l’ottimo della funzione obiettivo.


E’ essenziale ricordare come si puo’ stabilire se un vettore e’ una soluzione basica ammissibile per un modello lineare. E’ data la matrice đ??´đ?‘šĂ—đ?‘› . Una soluzione basica e’ ammissibile se contiene m −đ?‘› zeri.

In un precedente paragrafo fu impostato un programma lineare per il quale si era ottenuta la matrice A che segue.

A=(

đ?‘›+1 − (đ?‘› + 4)

− (đ?‘› + 1) − (đ?‘› + 1)

đ?‘› 1 0 ) đ?‘›+2 0 1

Con il formalismo introdotto in questo paragrafo possiamo scrivere che:

đ??´1 = (

đ?‘›+1 ) − (đ?‘› + 4)

−(đ?‘› + 1) đ??´2 = ( ) −(đ?‘› + 1)

đ??´3 = (

đ?‘› ) đ?‘›+2

1 đ??´4 = ( ) 0 0 đ??´5 = ( ) 1

Pertanto si puo’ scrivere:


−(đ?‘› + 1) đ?‘› đ?‘›+1 đ?‘›+7 1 0 đ?‘Ľ1 ( ) + đ?‘Ľ2 ( ) +đ?‘Ľ3 ( ) + đ?‘Ľ4 ( ) + đ?‘Ľ5 ( ) = ( ) đ?‘›+2 − (đ?‘› + 4) −(đ?‘› + 1) đ?‘›+1 0 1

Una soluzione basica ammissibile deve contenere 5 − 2 = 3 zeri.

Una soluzione potrebbe essere ottenuta ponendo đ?‘Ľ1 = đ?‘Ľ2 = đ?‘Ľ3 = 0. đ?‘›+7 1 0 Si avrebbe che đ?‘Ľ4 ( ) + đ?‘Ľ5 ( ) = ( ). đ?‘›+1 0 1 1 0 I vettori ( ) đ?‘’ ( ) sono linearmente indipendenti non esistendo alcuno scalare reale k per il quale 0 1 1 0 ( ) = đ?‘˜ ( ). 0 1 Il sistema vettoriale e’ immediato e formalmente ponibile come segue: 1đ?‘Ľ4 + 0đ?‘Ľ5 = đ?‘› + 7 0đ?‘Ľ4 + 1đ?‘Ľ5 = đ?‘› + 1 ovvero: đ?‘Ľ4 = đ?‘› + 7 đ?‘Ľ5 = đ?‘› + 1 Pertanto una soluzione basica ammissibile, posta sotto forma di trasposta e’ la seguente S = ⌋0, 0, 0, đ?‘› + 7 , đ?‘› + 1âŚŒđ?‘‡


4. Simplesso E’ sicuramente utile considerare il caso in cui sia necessario introdurre delle variabili artificiali. Esse vengono introdotte ad ogni membro sinistro in ogni equazione non contenente variabili slack. E’ il caso del seguente programma lineare. min 2đ?‘Ľ1 − đ?‘Ľ2 + 4đ?‘Ľ3 sotto le condizioni 5đ?‘Ľ1 + 2đ?‘Ľ2 − 3đ?‘Ľ3 ≼ 7

(a)

2đ?‘Ľ1 − 2đ?‘Ľ2 + đ?‘Ľ3 ≤ 8

(b)

e

Nella prima equazione (a) occorre introdurre una variabile surplus riportando alla seguente equazione: 5đ?‘Ľ1 + 2đ?‘Ľ2 − 3đ?‘Ľ3 − đ?‘Ľ4 = 7

(a’)


đ?‘ đ?‘’đ?‘™đ?‘™đ?‘Ž seconda equazione vincolare occorre introdurre una variabile slack avendo a seguente relazione: 2đ?‘Ľ1 − 2đ?‘Ľ2 + đ?‘Ľ3 +đ?‘Ľ5 = 8

(b’)

đ?‘€đ?‘Ž nella (a’) deve essere introdotta una variabile artificiale, ottenendo la seguente relazione vincolare: 5đ?‘Ľ1 + 2đ?‘Ľ2 − 3đ?‘Ľ3 − đ?‘Ľ4 + đ?‘Ľ6 = 7 đ??šđ?‘Žđ?‘Ąđ?‘Ąđ?‘’ tutte queste considerazioni la funzione matematica da minimizzare diviene: min 2đ?‘Ľ1 − đ?‘Ľ2 + 4đ?‘Ľ3 +0đ?‘Ľ4 +0đ?‘Ľ5 +đ?‘€đ?‘Ľ6 Si ha: X = ⌋đ?‘Ľ1 , đ?‘Ľ2 , đ?‘Ľ3 , đ?‘Ľ4 , đ?‘Ľ5 , đ?‘Ľ6 âŚŒđ?‘‡ 7 B=( ) 8 C = ⌋2, −1, 4, 0, 0, MâŚŒT Occorre calcolare đ?‘żđ?&#x;Ž Vi sono 6 variabili e due equazioni.


Quindi si possono eguagliare a zero 6 – 2 = 4 variabili. Si puo’ ad esempio porre đ?‘Ľ3 = đ?‘Ľ4 = đ?‘Ľ5 = đ?‘Ľ6 = 0. Si tratta di calcolare il seguente sistema lineare di due equazioni in due incognite. 2đ?‘Ľ1 − 2đ?‘Ľ2 = 8 5đ?‘Ľ1 + 2đ?‘Ľ2 = 7

đ?‘…đ?‘–đ?‘ đ?‘œđ?‘™đ?‘Ąđ?‘œ si ottengono i valori đ?‘Ľ1 =

15 7

13

e đ?‘Ľ2 = − 7 .

15

đ??źđ?‘™ vettore colonna đ?‘żđ?&#x;Ž e’ đ?‘żđ?&#x;Ž = [

7 13]

−

.

7

Per come sono state gestate le variabili viene introdotto un vettore đ??‚đ?&#x;Ž detto vettore dei costi associate alle variabili đ?‘Ľ1 đ?‘’ đ?‘Ľ2 . 2 Risulta che đ??‚đ?&#x;Ž = [ ] −1

Per semplificacare al massimo lo studio del simplesso e’ bene considerare il caso della massimizzaizone sotto vincoli di una funzione di sole due variaibli indipedenti.


Il procedimento e’ dato da una sequenza di istruzioni che costituiscono un algoritmo. Il problema e’ il seguente: max

z = đ?‘Ľ1 + đ?‘Ľ2

sub

�1 + 5�2 ≤ 5 , 2�1 + �2 ≤ 4

�� ≼ 0

Non e’ necessaro introdurre variabili artificiali ma solo due variabili slack e formalizzare la situazione come segue. z = đ?‘Ľ1 + đ?‘Ľ2 +0đ?‘Ľ3 + 0đ?‘Ľ4 Si hanno i seguenti nuovi vincoli. X = ⌋đ?‘Ľ1 , đ?‘Ľ2 , đ?‘Ľ3 , đ?‘Ľ4 âŚŒđ?‘‡ C = ⌋1 , 1, 0, 0 âŚŒđ?‘‡ 1 5 1 0 ) 2 1 0 1

A=(

5 B=( ) 4 đ?‘Ľ3 đ?‘żđ?&#x;Ž = (đ?‘Ľ ) 4


0 đ?‘Şđ?&#x;Ž = ( ) đ?‘‡ 0 La corrispondente tavola del simplesso diviene:

đ?‘Ľ1 đ?‘Ľ2

đ?‘Ľ3

đ?‘Ľ4

1

1

0

0

đ?‘Ľ3

0

1

5

1

0

5

đ?‘Ľ4

0

2

1

0

1

4

đ?‘§đ?‘— − đ?‘?đ?‘—

L’ultima riga contiene i coefficienti đ?‘§đ?‘— − đ?‘?đ?‘— in quanto si considera un problema di massimizzazione. Ove, per contro, si considerasse un problema di minimizzaizone allora i coefficienti dell’ultima riga sarebbero eguali a – (đ?‘§đ?‘— − đ?‘?đ?‘— ) . Gli đ?‘§đ?‘— sono identicamente nulli in quanto il prodotto scalare đ?‘§đ?‘— = đ?‘Şđ?‘‡0 đ?‘¨đ?‘–đ?‘— e’ 0 identicamente nullo in quanto đ?‘Şđ?&#x;Ž = ( ) đ?‘‡ 0


Coordinandosi con la matrice dei costi risulta: đ?‘§1 − đ?‘?1 = −1 đ?‘§2 − đ?‘?2 = −1 đ?‘§3 − đ?‘?3 = 0 đ?‘§4 − đ?‘?4 = 0 Si ha la seguente tabella:

đ?‘Ľ1 đ?‘Ľ2

đ?‘Ľ3

đ?‘Ľ4

1

1

0

0

đ?‘Ľ3

0

1

5

1

0

5

đ?‘Ľ4

0

2

1

0

1

4

0, 0

0

đ?‘§đ?‘— − đ?‘?đ?‘—

−1,

− 1,

Lo zero in rosso e’ ottnuto da đ?‘Şđ?‘‡0 đ?‘Š. Si determina min (−1,

− 1,

0, 0) = - 1.


Il primo step dell’algoritmo del simplesso presuppone che si individui il numero piu’ negativo tra quelli ottenuti nell’ultima riga salvo l’ultimo. Nel caso di specie detto minimo vale − 1 ed e’ commune a due colonne. Le colonne che lo contengono possono essere indifferentemente utilizzate come colonne di lavoro. Si stabilisce di utilizzare come colonna di lavoro la seconda. Il secondo step presuppone la determinazione dell’elmento pivot. đ?‘?

đ?‘?

Si considerano i rapporti đ?‘Ž đ?‘– e si determina min ( đ?‘Ž đ?‘– ) . đ?‘–đ?‘˜

đ?‘?

đ?‘–đ?‘˜

đ?‘?

Il valore đ?‘Žđ?‘–đ?‘˜ | đ?‘Ž đ?‘– = min ( đ?‘Ž đ?‘– ) e’ detto elemento pivot. đ?‘–đ?‘˜

đ?‘–đ?‘˜

Nel caso di specie i rapporti rilevanti sono

5 5

4

=1<1=4.

Pertanto 5 e’ l’elemento pivot. Ove si avessero rapporti eguali sene puo’ utilizzare uno qualunque. I passaggi successivi sono molto scontati.


Ottenuto il pivot si eseguono operazioni elementari sulle righe in modo che l’elemento pivot risulti eguale a 1, riducendo a 0 tutti gli altri elementi della colonna di lavoro. Si ottiene l’insieme attuale delle variabili basiche sostituendo la variabile x della riga pivot e della prima colonna con la variabile della prima riga e della colonna pivot. A questo punto si reitera il procedimento partendo dal primo step fino a quando l’ultima riga non contiene alcun numero negative, salvo, eventualmente, quello dell’ultima colonna. La soluzione ottimale si ottiene tenendo conto che: 1) A ciascuna variabile della prima colonna viene associato il valore di riga corrispodente contenuto nell’ultima colonna. 2) Si distignue il caso che si massimizzi o si minimizzi. a. Se si massimizza il valore z = đ?‘§đ?‘šđ?‘Žđ?‘Ľ e’ il valore posto all’incrocio tra l’ultima riga e l’ultima colonna. b. Se si minimizza si ha đ?‘§đ?‘šđ?‘–đ?‘› = − đ?‘§đ?‘šđ?‘Žđ?‘Ľ ,


Quando, invece, si rende necessario introdurre ulteriori variabili artificiali si ha un metodo ocn modificazioni che esula dai contenuti della presente eleborazione.

5. Duale. Duale simmetrico. Duale non simmetrico. Un problema di ottimizzazione in n variabili indipendenti ��≤� ammette un duale in m variabili ove m e’ il numero dei vincoli del problema originario e le variabili del duale sono denotate con ��≤� ≤� . Due programmi lineari si dicono uno il duale simmetrico dell’altro quando contengono entrambi variabili non negative e vincoli di diseguaglianza. Dato il programma lineare Min z = 12�1 + 26�2 + 80�3 con i vincoli 2�1 + 6�2 + 5�3 ≼ 4 4�1 + 2�2 + �3 ≼ 10 �1 + �2 + 2�3 ≼ 6 ��≤3 ≼ 0


Poiche’ i vincoli del programma originario sono 3 vi sono tre variabili ombra e la funzione da massimizzare sara max ������ = 4�1 + 10�2 + 6�3 Il duale avra’ tre vincoli. 2 6 5 E’ forse utile partire dalla matrice A del primo programma ovvero A = (4 2 1). 1 1 2 La matrice trasposta di essa risulta: 2 4 1 � = (6 2 1) 5 1 2 �

đ??żđ?‘Ž rappresentazione matriciale del duale risulta essere: đ?‘§đ?‘‘đ?‘˘đ?‘Žđ?‘™đ?‘’ = đ?‘Šđ?‘ť W đ?‘ đ?‘˘đ?‘? đ?‘¨đ?‘ť đ?‘ž ≤ đ?‘Ş đ?‘žâ‰Ľđ?&#x;Ž In particolare i vincoli possono essere scritti in forma algebrica come segue: 2đ?‘¤1 + 4đ?‘¤2 + đ?‘¤3 ≤ 12 6đ?‘¤1 + 2đ?‘¤2 + đ?‘¤3 ≤ 26 5đ?‘¤1 + đ?‘¤2 + 2đ?‘¤3 ≤ 80

Deve comunque risultare W ≼ 0.


In forma algebrica il duale del programma dato si scrive come segue: max z = 4�1 + 10�2 + 6�3 coi vincoli 2�1 + 4�2 + �3 ≤ 12 6�1 + 2�2 + �3 ≤ 26 5�1 + �2 + 2�3 ≤ 80 essendo ��≤� ≼ 0 (essendo m il numero dei vincoli del primale).

Esistono anche duali non simmetrici detti anche duali disimmetrici. Dato un programma lineare quale il seguente: min (max) z = �� X con il vincolo AX = B con X ≼ 0. Il corrispodente duale diviene max (min) z = �� � sotto il vincolo �� � ≤ (≼) C


6. Programmazione a valori interi Un programma a valori interi e’ un programma lineare che deve soddisfare la condizione di interezza degli elementi della soluzione, ovvero gli đ?‘Ľđ?‘– devono risultare interi. E’ abbastanza casuale che dato un programma da ottimizzare il vettore che definisce una soluzione sia costituito da tutti valori interi. Nelle mie letture ⌋BronsonâŚŒ mi sono imbattuto in un pregevole e semplice esempio di programma lineare che necessita degli aggiustamenti del branch and bound per avere soluzioni intere. Lo riporto con un certo orgoglio perche’ lavorando autonomamente ho evidenziato con un ragionamento personale quello che nel testo viene dato come assodato. Il programma invero e’ molto semplice ed e’ il seguente: Max z = 3đ?‘Ľ1 + 4đ?‘Ľ2 con i vincoli seguenti 2đ?‘Ľ1 + 3đ?‘Ľ2 ≤ 9


2�1 + �2 ≤ 6 Considerando i due vincoli posti a sistema e sottrando membro a membro si ottiene 3

2đ?‘Ľ2 ≤ 3 â&#x;ş đ?‘Ľ2 ≤ 2 9

Sostituendo detto vincolo si ottiene �1 ≤ 4. 3

9

Si osserva che il massimo della z si ha per �2 = 2 e per �1 = 4 cui corriponde il valore ���� = 12,75 riportato nel testo. A questo punto e’ possibile scrivere che si ha: 2 < �1 < 3 1 < �2 < 2 La manualistica ben riporta le modalita’ risolutive dell’algoritmo branch and bound e ad essa si rimanda. Nella tabella a doppia entrata si e’ calcolato il valore della funzione per valori interi delle due variabili indipendenti.


0

1

0

0

3

1

4

7

2

8

11

3

12

15

2

3

I successivi calcoli sono superflui in quanto si e’ trovata una soluzione. Quando si trova una coppia di interi per i quali sia đ?‘§đ?‘–đ?‘›đ?‘Ą = ⌋đ?‘§đ?‘šđ?‘Žđ?‘Ľ âŚŒ per (đ?‘Ľ1 , đ?‘Ľ2 ) ≠(đ?‘›1 , đ?‘›2 ) il problema deve intendersi risolto. La soluzione intera e’ unica. Limitandosi al caso di due variabili se la soluzione non intera ha portato ad una soluzione nulla per una delle variabili la soluzione intera e’ del tipo: đ?‘–đ?‘›đ?‘Ą đ?‘§đ?‘šđ?‘Žđ?‘Ľ = đ?‘?⌋đ?‘Ľ2 âŚŒ

(đ?‘žđ?‘˘đ?‘’đ?‘ đ?‘Ąđ?‘œ đ?‘?đ?‘˘đ?‘›đ?‘Ąđ?‘œ đ?‘–đ?‘› đ?‘“đ?‘œđ?‘&#x;đ?‘šđ?‘Ž đ?‘‘đ?‘˘đ?‘?đ?‘–đ?‘Ąđ?‘Žđ?‘Ąđ?‘–đ?‘Łđ?‘Ž) đ??ľđ?‘–đ?‘ đ?‘œđ?‘”đ?‘›đ?‘Ž đ?‘’đ?‘ đ?‘ đ?‘’đ?‘&#x;đ?‘’ đ?‘šđ?‘œđ?‘™đ?‘Ąđ?‘œ đ?‘?đ?‘Žđ?‘˘đ?‘Ąđ?‘– đ?‘Ž đ?‘šđ?‘Žđ?‘›đ?‘’đ?‘”đ?‘”đ?‘–đ?‘Žđ?‘&#x;đ?‘’ ⌋. âŚŒ


đ??źđ?‘› particolare dalla soluzione non intera đ?‘§đ?‘šđ?‘Žđ?‘Ľ = đ?‘Žđ?‘Ľ0,1 + đ?‘?đ?‘Ľ0,2 non discende ⌋đ?‘§đ?‘šđ?‘Žđ?‘Ľ âŚŒ = đ?‘ŽâŚ‹đ?‘Ľ0,1 âŚŒ + đ?‘?⌋đ?‘Ľ0,2âŚŒ. Il problema intero diviene per đ?‘˜đ?‘šđ?‘Žđ?‘Ľ intero assegnato trovare due interi đ?›ź đ?‘’ đ?›˝ per i quali sia đ?‘˜đ?‘šđ?‘Žđ?‘Ľ = đ?‘Žđ?›ź +đ?‘?đ?›˝. Con riferimento al caso particolare considerato sarebbe: 12 = 3đ?›ź + 4đ?›˝. Poiche’ si ragiona su interi positivi allora deve risultare: 3đ?›ź ≤ 12 4β ≤ 12 Ovvero deve essere đ?›ź ≤ 4 e đ?›˝ ≤ 3. Le soluzioni intere dell’equazione đ?‘˜đ?‘šđ?‘Žđ?‘Ľ = đ?‘Žđ?›ź +đ?‘?đ?›˝ nelle incognite intere đ?›ź đ?‘’ đ?›˝ soggiano alle condizioni đ?›ź ≤

Ma le quantita’

đ?‘˜đ?‘šđ?‘Žđ?‘Ľ

đ?‘˜đ?‘šđ?‘Žđ?‘Ľ đ?‘Ž

đ?‘Ž

e

e β≤

đ?‘˜đ?‘šđ?‘Žđ?‘Ľ đ?‘?

đ?‘˜đ?‘šđ?‘Žđ?‘Ľ đ?‘?

.

devono risultare intere.

đ?‘–đ?‘›đ?‘Ą đ?‘˜đ?‘šđ?‘Žđ?‘Ľ deve essere multiplo di a e multiplo di b.


E‘ possibile il caso che sia k int max per β = 0.

Queste osservazioni con ogni probabilita’ vanno riviste e precisate ‌ ma sembrano coerenti con l’idea di passare dal valore di max z a parte intera di esso quando le soluzioni non sono intere‌

7. Pianificazione Nel contesto della programmazione a valori interi riveste una grande importanza lo studio dei modelli di pianificazione. Nel novero dei modelli di pianificazione vanno ricordati i problemi di assegnazione trasfrormabili in problem di trasporto, come accade con il codiddetto metodo ungherese. Nel caso teorico piu’ noto il metodo ungherese contempla il caso di n lavoratori adibiti a n distinte lavorazioni cui sono applicati con un costo đ?‘?đ?‘–đ?‘— , ove il primo indice, al solito e’ un indice di riga, riferito al lavoratore, e il secondo e’ un indice di colonna riferito alla lavorazione. Si tratta di allocare lavoratori (uno ciascuno ad una distinta lavorazione) in nodo che sia minimizzato il costo totale del prodotto ottenuto. La seguente tabella esemplifica.


1

2

3

4

1 2

đ?‘?2 3

3 4

Ad esempio đ?‘?2 3 indica il costo che l’impresa sopporta applicando il lavoratore 2 alla lavorazione 3. In genere si ha a che fare con tabelle nelle quali e’ noto ogni đ?‘?đ?‘– đ?‘— . L’algoritmo ha i seguenti step. 1. Si individua il minimo di ogni riga e lo si sottrae ad ogni elemento di riga. 2. Si individua il minimo di ogni colonna e lo si sottrae ad ogni element di colonna. 3.

Si verifica se la matrice dei costi come ridefinita ha n elementi nulli in modo che ogni colonna ed ogni riga abbia solo uno zero (� condizione di ottimalita’).

4. Si coprono tutti gli zeri della matrice ottenuta con gli step 1 e 2 con il minor numero possibile di righe e di colonne. 5. Si considera la matrice dei costi i cui elementi sono quelli non coperti da linee. 6. Il minimo ottenuto al punto 5 viene sottratto ad ogni elemento non coperto e aggiunto ad ogni elemento coperto da due linee (una di riga e l’altra di colonna).


Esempio. Un produttore di semilavorati ha 3 impianti (A, B, C) che deve inviare a 4 distinti clienti (1, 2, 3, 4). La tabella seguente da conto dei costi. 1

2

3

4

A

0.11

0.13

0.09

0.19

B

0.12

0.16

0.10

0.14

C

0.14

0.13

0.12

0.15

D

0

0

0

0

La scheda di costo minimo e’ ottenibile con il metodo ungherese. Considerando i minimi di riga che sono rispettivamente 0.09, 0.10 e 0.12 e 0 rispettivamente si ottiene la seguente tabella. 1

2

3

4

A

0.02

0.04

0

0.19

B

0.02

0.06

0

0.14

C

0.02

0.01

0

0.15

D

0

0

0

0

Lavorando sulle colonne si ottiene la seguente tabella.


1

2

3

4

A

0,02

0.04

0

0.19

B

0,02

0.06

0

0.14

C

0,02

0,01

0

0,15

D

0

0

0

0

La sottomatrice non coperta e’ facilmente individuabile ed e’: 0.02 0.04 0.19 (0.02 0.04 0 .14) 0.02 0.01 0.15 L’elemento di valore minimo e’ 0.01. La matrice ottenuta applicando il passo opportuno (punto 6) dell’algoritmo e’ la seguente:

1

2

3

4

A

0,01

0.03

0

0.18

B

0,01

0.05

0

0.13

C

0.01

0

0

0.14

D

0

0

0,01

0


Neppure ora si ha una soluzione ottimale quindi si procede nuovamente con la copertura degli zeri.

Il metodo garantisce l’ottenimento di una soluzione ottimale. In genere la soluzione ottimale non e’ unica.

8. Programmazione non lineare 8.1 Ottimizzazione in una variabile I programmi non lineari sono posti nella forma: ottimizzare y = f(x) con il vincolo x ∈ A ⊆ đ?‘…. Solitamente A e’ un intervallo della retta reale. Cio’ non impedisce di ottimizzare con riferimento al continuo reale. Per ottimizzare si puo’ utilizzare quanto offre il calcolo in relazione al calcolo dei massimi e dei minimi.


Puo’ essere utile studiare la funzione y = x +đ?‘›đ?‘Ľ −1

Questo e’ un mio adattamento a partire da una funzione nota. La funzione puo’ essere riscritta come segue:

y = x +đ?‘›

1 đ?‘Ľ

Il dominio di definizione di essa e’ x ∈ đ?‘… | đ?‘Ľ ≠0.

La funzione ha un punto di discontinuita’ in x = 0.

Detto punto di discontinuita’ e’ unico. Risulta: 1

1

1

đ?‘Ľ

đ?‘Ľ

đ?‘Ľ2

đ??ˇđ?‘Ľ y = đ??ˇđ?‘Ľ ( x +đ?‘› ) = đ??ˇđ?‘Ľ ( x) + đ??ˇđ?‘Ľ ( đ?‘› ) = 1 − đ?‘›

đ??ˇđ?‘’đ?‘Łđ?‘’ risultare x ≠0.

đ?‘†đ?‘’ si considera un intervallo simmetrico di x = 0 di ampiezza đ?œ€ ovvero l’intervallo (−đ?œ€, đ?œ€ ) allora si puo’ scrivere che: 1

đ??ˇđ?‘Ľ y|0+ = 1 − đ?‘›

đ?œ€2

→ −∞

đ??ˇđ?‘Ľ y|0− = 1 − đ?‘›

(−đ?œ€)2

1

= 1 −đ?‘›

1 đ?œ€2

→ −∞

La derivata destra e la derivata sinistra sono eguali. La funzione derivata non e’ definita in 0 quindi non e’ ivi continua e quindi neppure ivi derivabile.


Uscendo dagli schemi consolidati del calcolo si puo’ osservare che:

La derivata agli estremi, ovvero in riferimento a lim 1 − đ?‘› đ?‘Ľâ†’Âąâˆž

1 đ?‘Ľ2

=1

Convinene studiare la funzione tra (−∞, 0) e in (0, +∞).

La funzione e’ monotona e lo si prova come segue. Siano �1 � �2 due elementi del suo dominio. �

đ?‘›

1

2

đ?‘Ľ1 + đ?‘Ľ = đ?‘Ľ2 + đ?‘Ľ

â&#x;ş đ?‘Ľ1 đ?‘Ľ2 + đ?‘›đ?‘Ľ2 =đ?‘Ľ1 đ?‘Ľ2 + đ?‘›đ?‘Ľ1 â&#x;ş đ?‘›đ?‘Ľ2 =đ?‘›đ?‘Ľ1 ovvero đ?‘Ľ2 =đ?‘Ľ1 .

đ?‘„đ?‘˘đ?‘–đ?‘›đ?‘‘đ?‘– a distinti x corrispondono distinti f(x). đ??żđ?‘Ž funzione e’ quindi monotona. đ?‘ đ?‘’đ?‘– punti stazionari la derivata deve essere nulla quindi deve essere: 1

1

đ??ˇđ?‘Ľ y = 1 − đ?‘› đ?‘Ľ 2 = 0 â&#x;ş 1 = đ?‘› đ?‘Ľ 2 â&#x;ş đ?‘Ľ 2 = n â&#x;ş x = Âąâˆšđ?‘› I punti (Âąâˆšđ?‘› , f(Âąâˆšđ?‘›) sono stazionari.

Un metodo solitamente utilizzato, almeno a livello elementare, per ottimizzare e’ offerto dal metodo di sostituizione che puo’ essere esemplificato a partire da un caso concreto quale e’ il seguente:


Max y = 6đ?‘Ľ2 −3đ?‘Ľ1 đ?‘Ľ2 sub đ?‘Ľ1 + đ?‘Ľ2 = 1 Al solito basta mettere una variabile in funzione di un’altra, come ad esempio nel modo seguente: Il vincolo đ?‘Ľ1 + đ?‘Ľ2 = 1 puo’ essere riscritto come: đ?‘Ľ1 = −đ?‘Ľ2 +1 Pertanto la funzione obiettivo viene riscritta come segue. y = 6đ?‘Ľ2 −3đ?‘Ľ1 đ?‘Ľ2 = 6đ?‘Ľ2 −3(−đ?‘Ľ2 +1) đ?‘Ľ2 = đ?‘Ľ2 +3đ?‘Ľ22 −3 đ?‘Ľ2 = 3đ?‘Ľ22 −2 đ?‘Ľ2 A questo punto e’ immediate avero la funzione derivata prima y’ = 6đ?‘Ľ2 −2 di dominio R Eguagliando a 0 si ha un punto stazionario per đ?‘Ľ2 = 3. La derivata seconda e’ y’’= 6 > 0. Il punto (đ?‘Ľ2 = 3, đ?‘“(3)) e’ un punto di minimo per la funzione data.


In realta’ questo esempio andava forse posto piu’ opportunamente nel paragrafo seguente ma per come si e’ operato si tratta del caso della massimizzazione di una funzione di una sola variabile. Senza pervenire alla condizione del secondo ordine dato il punto đ?‘Ľ2 = 3 per il quale sia annulla la derivata prima allora la condizione seguente designa un minimo per la funzione: ( lim− đ?‘“(đ?‘Ľ) = đ?‘“(đ?‘Ľ0 )+ , lim+ đ?‘“(đ?‘Ľ) = đ?‘“(đ?‘Ľ0 )− ) â&#x;şf(đ?‘Ľ0 ) ≤ f(x) ∀ x | x ∈ đ?‘‘đ?‘œđ?‘š đ?‘“(. ) đ?‘Ľâ†’đ?‘Ľ0

�→�0

Nel caso di una curva monotona crescente con un punto di flesso in x = x0 se la curva e’ continua in un intervallo simmetrico di detto punto si ha che risultano vere le seguenti condizioni: lim đ?‘“(đ?‘Ľ) = đ?‘“(đ?‘Ľ0 )−

đ?‘Ľâ†’đ?‘Ľ0−

lim đ?‘“(đ?‘Ľ) = đ?‘“(đ?‘Ľ0 )+

�→�0+

đ?‘Ľ0 ∉ đ?‘‘đ?‘œđ?‘š đ?‘“ ′ (. )


Tale condizione e’ verificata per funzioni nonotone con un flesso nel punto đ?‘Ľ0 sia che si tratti di un flesso orizzontale, che verticale che obliquo. Nel caso di presenza in x0 di un flesso riferito ad una funzione nonotona decrescente risultano vere le seguenti condizioni: lim đ?‘“(đ?‘Ľ) = đ?‘“(đ?‘Ľ0 )−

�→�0+

lim đ?‘“(đ?‘Ľ) = đ?‘“(đ?‘Ľ0 )+

đ?‘Ľâ†’đ?‘Ľ0−

đ?‘Ľ0 ∉ đ?‘‘đ?‘œđ?‘š đ?‘“ ′ (. ) Questa ultima condizione va intesa che se una funzione non e’ derivabile in un punto đ?‘Ľ0 đ?‘Žđ?‘™đ?‘™đ?‘œđ?‘&#x;đ?‘Ž f ‘ (đ?‘Ľ0 ) non esiste finito, ovvero đ?‘Ľ0 non e’ un punto del dominio di f ‘ (.). In termini algoritmici si possono definire i seguenti passaggi. 1. E’ fata f(x) e dom f. 2. Se f(x) e’ monotona in dom f vai al punto 3 altrimenti al punto 5. 3. Se f(x) e’ crescente allora max f(x) = f(max dom f) , min f(x) = f( min dom f) altrimenti vai a 4. 4. max f(x) = f(min dom f) , min f(x) = f( max dom f),


5. calcola f ‘ (x) e trova gli x tali che f ‘ (x) = 0 altrimenti vai a 7. 6. min f(x) = min ( f(đ?‘Ľđ?‘– ) ∀ đ?‘Ľđ?‘– | f ‘ (đ?‘Ľđ?‘– ) = 0) e max f(x) = max ( f(đ?‘Ľđ?‘– ) ∀ đ?‘Ľđ?‘– | f ‘ (đ?‘Ľđ?‘– ) = 0) 7. Individuare tutti i punti đ?‘Ľđ?‘‘ di f(x) per i quali ∄ f ‘ (x) e se non ne esistono vai al punto 6, altrimenti vai al punto 8. 8.

Stabilisci per quale valore đ?‘Ľđ?‘‘ si ha min f(đ?‘Ľđ?‘‘ ) e max f(đ?‘Ľđ?‘‘ ).

9.

Confronta min ( f(đ?‘Ľđ?‘– ) ∀ đ?‘Ľđ?‘– | f ‘ (đ?‘Ľđ?‘– ) = 0) con min f(đ?‘Ľđ?‘‘ ) e max ( f(đ?‘Ľđ?‘– ) ∀ đ?‘Ľđ?‘– | f

‘ (đ?‘Ľđ?‘– ) = 0) con max f(đ?‘Ľđ?‘‘ ).

8.2 Ottimizzazione di funzioni non lineari di piu’ variabili senza vincoli La formalizzazione del problema e’ la seguente: max z = f(X) essendo X = ⌋đ?‘Ľ1 , đ?‘Ľ2 , ‌ . . , đ?‘Ľđ?‘› âŚŒđ?‘ť Calcolare max z = f(X) equivale a minimizzare – f(X). Sono gia’ stati introdotti il vettore gradiente e la matrice hessiana.


Date quelle definizioni i valori del vettore gradiente e della matrice hessiama in un punto X = ⌋x1 , x2 , ‌ . . , xn âŚŒđ?‘ť sono indicati come segue: đ?› f|đ?‘ż e đ??ťđ?‘“|đ?‘ż Va introdotta la seguente definizione: Data una matrice quadrata di ordine n, ovvero đ??´đ?‘›,đ?‘› simmetrica, ovvero tale che A = đ??´đ?‘‡ , o anche, equivalentemente, đ?‘Žđ?‘–đ?‘— = đ?‘Žđ?‘—đ?‘– , e’ negative semidefinita se risulta đ?‘żđ?‘ť đ?‘¨đ?‘ż < 0 ∀đ?‘ż ≠0. Ricerca di masismi e minimi đ?‘żđ?&#x;Ž e’ un punto di minimo o di massimo di f(đ?‘żđ?&#x;Ž ) se ∇f esiste in un introrno di đ?‘żđ?&#x;Ž e se risulta đ?› đ??&#x;|đ?‘żđ?&#x;Ž = 0. Solitamente si ha il caso che la f(X) e’ derivabile due volte in un intorno del punto đ?‘żđ?&#x;Ž . In questo caso đ?‘żđ?&#x;Ž e’ un punto cui corrisponde il max di f(X) se sono verificate entrambe le due seguenti condizioni: đ?› đ??&#x;|đ?‘żđ?&#x;Ž = 0


Hđ??&#x;|đ?‘żđ?&#x;Ž < 0.

8.3 Ottimizzazione di funzioni non lineari di piu’ variabili con vincoli In presenza di vincoli il problema viene scritto come segue: max z = f(X) sub đ?‘”đ?‘– (X) = 0 X = ⌋đ?‘Ľ1 , đ?‘Ľ2 , ‌ . . , đ?‘Ľđ?‘› âŚŒđ?‘‡ Deve preliminarmente osservarsi che il numero i dei vincoli deve essere inferiore a quello delle variabili indipendenti, ovvero deve essere i < n. Vale anche in questo caso quello che e’ stato detto per le funzioni da ottimizzare senza la presenza di vincoli, ovvero si puo’ dire che: max đ?‘“(đ?‘ż) min − đ?‘“(đ?‘ż) ( )â&#x;ş( ) đ?‘”đ?‘– (đ?‘ż) = 0 đ?‘”đ?‘– (đ?‘ż) = 0 i<n X≼0


Vorrei ricordare che questa ultima condizione, ovvero X ≼ 0, deve intendersi che deve essere đ?‘Ľđ?‘˜â‰¤đ?‘› ≼ 0. Viene utilizzata la funzione di Lagrange, ovvero: â„’(đ?‘Ľ1 ‌ ‌ . , đ?‘Ľđ?‘› , đ?œ†1 ‌.. , đ?œ†đ?‘š ) = f(X) − ∑đ?’Ž đ?’‹=đ?&#x;? Îťđ?’‹ g j (X) Si hanno n + đ?‘š equazioni e il seguente sistema omogeneo đ?œ• đ?œ•đ?‘Ľđ?‘–

đ?œ• đ?œ•đ?œ†đ?‘—

â„’(. ) = 0

1≤� ≤�

â„’(. ) = 0

1≤� ≤�<�

Le condizioni di esistenza della soluzione sono le seguenti: f(X) e đ?‘”đ?‘— (X) hanno tutte le derivate prime continue. đ?œ•đ?‘”

La matrice di Jacobi J = [ đ?œ•đ?‘Ľđ?‘—] ha rango m quando X = đ?‘żđ?&#x;Ž . đ?‘–


9. Analisi reticolare Uno dei primi punti da considerare e’ costituito dai problema di minima estensione. E’ dato un grafo di n nodi e k archi. Occorre costruire un reticolo che contiene tutti i nodi in modo che si minimizzi la somma dei costi associate agli archi utilizzati. Il problema risolto individua un albero. Sia dato il seguente grafo con i costi relativi.

Si richiede di risolvere per detto grafo non orientato il problema dela cammino minimo.


Ho tratto questo esempio da un otitmo testo in materia ⦋Bronson⦌ che in relazione ad altri casi illlustra anche interessanti metodi di risoluzione, cui ovviamente si rimanda. Ho ipotizzato due distinti personali metodi di risoluzione. Il primo e’ il seguente, basato sulla seguente tabella. Arco

Costo minimo associato

Arco associato

A

2

D

B

2

D

C

2

E

D

1

E

E

1

D

1

H

F

2

G

H

1

E

Non si e’ inserita la sequenza G

2

F che costituirebbe un doppione.


La tabella e’ un ottimo strumento per costruire l’albero. Per essa si ha la seguente situazione.

Con questo criterio spartano resta da collegare altri due punti a formare un albero. Il collegamento corretto deve essere quello assicato al costo minimo. Il costo minimo si ha collegando D con G cui corrisponde il costo 3 minore degli altri due casi possibili, ovvero EG cui corrisponde il costo 4. La terza ipotesi possibile sarebbe l’arco DF cuon un costo ancora magigore, ovvero 5. In blu e’ evidenziata la connessione che conclude il problema. Un ulteriore approccio di risoluzione appare ancora piu’ fulmineo. Ho introdotto due definizioni naif riferite ai nodi di un grafo.


Tre nodi A, B e C di un grafo si dicono allienati se giacciono sulla medesima retta. Tre nodi A, B e C di un dato grafo si dicono triangolari se non sono allineati. Il problema del cammino minimo si risolve se per ogni terna di nodi triangolari si elimina l’arco corrispondente al costo associate massimo. Con riferimento al grafo proposto nell’esercizio si hanno le seguenti terne di nodi triangolari: ABD che impone la soppressione dell’arco AB di costo 8, BCE che implica la eliminazione dell’arco BC di costo 5, BDE che implica la soppressione dell’arco BE di costo 3, ADF che implica la soppressione dell’arco AF di costo 10, DFG che implica la soppressione dell’arco DF di costo 5, DEG che implica la soppressione dell’arco GE di costo 4, CEH che implica la sopprssione dell’arco CH di costo 8. Il complesso delle soppressioni di archi conduce ad avere il grafo soluzione, che e’ un albero.


Una questione ulteriore potrebbe essere rappresentata dal cammino di minimo costo congiungente due assegnati nodi di un grafo non orientato dato. Sempre con riferimento al grafo proposto come esercizio ci si potrebbe chiedere quale e’ il percorso che minimizza i costi partendo dal punto A per giungere al punto H. Vi e’ un evidente collegamento tra i due problemi. Il problema della minima estensione puo’ essere ricondotto al problema precedente. Ad esempio se si chiede la minima estensione a partire dal punto A per giungere in H. Essa e’ immediatamente evincibile dall’albero che ha risolto la questione precedente. In particolare il percorso che ha minima estensione risulta quello seguente: A → D → E → H. Il costo complessivo e’ 2 + 1 + 1 = 4.


La minima estensione potrebbe doversi considerare anche con riferimento ad un cammino tra due punti del grafo, quali B e C che non sono collegati nel grafo albero da un arco corrispondente. Quando si considera il grafo originario ben si evidenzia che da B a C si puo’ andare direttamente con costo 5 oppure passando per E con un costo pari a 2 + 3. L’albero ottenuto esprime una condizione di costo che minimizza in quanto il costo riferito al grafo albero e’ non maggiore rispetto ad un costo corrispondente ad un arco non elemento dell’albero. Con riferimento al grafo in studio risulta che đ?‘?đ??ľđ??ś = đ?‘?đ??ľđ??¸ + đ?‘?đ??¸đ??ś . In generale deve risultare đ?‘?đ??ľđ??ś ≼ đ?‘?đ??ľđ??¸ + đ?‘?đ??¸đ??ś . In questo caso si intende che BE e EC sono parti dell’albero mentre BC non lo e’. Tra i due problemi considerati, minima estensione e cammino di costo minimo, esistono evidenti nessi. In particolare se due nodi di un grafo non sono collegati nell’albero di minima estensione allora l’arco che li college non puo’ definire un cammino di costo minimo.


Una terza tipologia di questioni e’ costituita dai problemi di flusso massimo. In questi casi si ha un reticolo con un nodo detto sorgente (source) e un nodo di destinazione (detto anche sink) e si ragiona in termini di massimizzazione delle quantita’ trasportate lungo possibili collegamenti, rappresentati idealmente da archi. Gli archi che non sono ne’ nodo ne’ destinazione sono detti giunzioni. Si puo’ dare una rappresentazione di una situazione ipotetica come quella descritta dalla seguente figura.

I numeretti vicini a ciascun nodo hanno un preciso significato. Per esempio i numeri 2, 0 e 9 definiscono le quantita’ trasportabili dal punto A sorgente con riferimento alle tre possibil idirezioni, ovvero verso B, C e D.


Questi numeri non negativi sono dette capacita’. Il nodo A e’ la sorgente. Il nodo C e’ la destinazione. Dalla sorgente A si possono raggiungere direttamente i nodi B, C e D. L’unico nodo per il quale esiste un arco che definisce un flusso positivo e’ l’arco AD che ci consente un flusso pari a 9 − 1 = 8 . Per questo grafo abbastanza banale giunti in D si deve arrivare alla destinazione ragionando sulla capacita’ che risulta 8 −1 = 7 spiegabile piu’ correttamente come 8 + 2 − 3. Nei problemi piu’ complessi e’ ammessa l’esistenza di piu’ sorgenti. Vorrei far notare che lo stesso grafo puo’ essere scritto in termini di capacita’ risultante come segue.


Le capacita’ considerate sono puramente casuali frutto di pura astrazione… Si puo’ ritornare al grafo iniziale per individuare un cammino di flusso massimo.

Sia H la sorgente e A la destinazione. Da H si hanno flussi positivi verso i nodi G, E e C. Si ha questa prima rappresentazione.

HC, CB, BA definisce un percorso che recepisce un flusso positivo di 21 unita’.


Questo esaurisce le riflessioni per questo grafo. In realta’ la situazione puo’ complicarsi alquanto quando dati sorgente e nodo di destinazione non viene individuato un cammino che determina un flusso positivo sorgente → destinazione. Ci si limita a queste considerazioni intuitive e molto introduttive ma credo abbastanza esaustive…

10. Teoria dei processi decisionali Giova sicuramente partire dalla nozione di processo decisionale inteso come sequenza di decisioni, ado ognuna delle quale sono associati un guadagno e una perdita. Le decisioni razionali sono assunte dal “responsabile delle decisioni”. Gli stati del sistema sono eventi casuali e il responsabile delle decisioni puo’ adottare una delle strategie possibili. Si utilizza una tabella a doppia entrata contenente gli stati (possibili) del Sistema e le decisioni pure.


Questa e’ una tipica rappresentazione possibile.

S1

S2

S3

S4

D1 D2 D3 D4

4 stati possibili del sistema convivono con 4 possibili decisioni adottabili dal decisore razionale. Ad ogni possibile stato e’ associata una probabilita’ P(Sn). In generale i vari stati non sono in generale equiprobabili. Gli incroci stato – decisione definiscono una matrice, detta matrice dei guadagni, đ?‘”đ?‘–đ?‘˜ in cui il primo indice e’ riferito alla decisione e ilsecondo allo stato. Quindi la scrittura đ?‘”1,3 indica indica il guadagno corrispondente alla decisione 1 con riferimento allo stato 3 del sistema.


La perdita e’ un guadagno negative e come tale indicate con un numero reale negativo. Solitamente si parte dalla introduzione di alcuni criteri decisionali semplici. Il primo di essi e’ detto criterio del minmax. Esso consiste nell’adottare la decisione che minimizza la massima perdita possibile che il decisore astrattamente dovrebbe poter sopportare.

Un criterio ulteriore e’ detto ottimistico e consiste nello scegliere la decisione che massimizza il guadagno possibile, ovvero e’ quella per la quale đ?‘”đ?‘–,đ?‘˜ = max(đ?‘”đ?‘–đ?‘˜ ). In pratica si considera il max(đ?‘”đ?‘–đ?‘˜ ) quindi la i-esima decisione. In questi casi si ammette che gli stati siano tutti equiprobabili nel senso standard ovvero nel senso immediato che se essi sono n allora la probabilita’ di uno 1

qualunque di essi vale đ?‘›. Quando venga rimossa questa ipotesi vengono introdotti metodi basati sul teorema di Bayes.


Il primo criterio probabilistico utilizzabile e’ quello detto acriterio di Bayes a priori. In questo caso si massimizza il guadagno atteso, ovvero si prende la decisione che massimizza il guadagno atteso. Esiste anche un criterio di probabilita’ a posteriori che sara’ oggetto di una esemplificazione. Come si vedra’ in sede di esemplificazione i processi decisionali sono rappresentati da un albero orientato o di decisione. Per completezza vanno date le seguenti definizioni. Un evento casuale avente esiti alternativi A e B con probabilita’ tali che P(A) + P(B ) = 1 e’ detto lotteria. Una lotteria viene indicata con il formalismo â„’(đ??´, đ??ľ, đ?‘?) . Solitamente vengono utilizzate le utilita’ di Neumann per un numero finito di pagamenti. I pagamenti vengono posti in ordine decrescente di desiderabilita’.


Si assegnano valori numerici finiti ai vari pagamenti in modo che se đ?‘’đ?‘Ľ đ?‘’ đ?‘šđ?‘’đ?‘›đ?‘œ đ?‘‘đ?‘’đ?‘ đ?‘–đ?‘‘đ?‘’đ?‘&#x;đ?‘Žđ?‘?đ?‘–đ?‘™đ?‘’ đ?‘‘đ?‘– đ?‘’đ?‘Ś allora risulti u(đ?‘’đ?‘Ś ) > u(đ?‘’đ?‘Ľ ). Per ciascun pagamento đ?‘’â„Ž intermedio quanto a desiderabilita’ tra đ?‘’đ?‘Ľ đ?‘’ đ?‘’đ?‘Ś

si

determina la probabilita’ di equivalenza đ?‘?â„Ž tale che sia indifferente per il decisore ottenere đ?‘’â„Ž con certezza e partecipare alla lotteria â„’(đ?‘’đ?‘Ľ , đ?‘’đ?‘Ś , đ?‘?) . Tale situazione e’ altamente soggettiva. L’utilita’ del pagamento đ?‘’â„Ž e’ data dalla formula: u( đ?‘’â„Ž ) = đ?‘?â„Ž u(đ?‘’đ?‘Ś ) + (1 − đ?‘?â„Ž ) u(đ?‘’đ?‘Ľ ) Le utilita’ valgono ad personam e in un dato momento. Solitamente si normalizza e si pone u(đ?‘’đ?‘Ś )= 1 đ?‘’ u(đ?‘’đ?‘Ľ )= 0.


BIBLIOGRAFIA ESSENZIALE

Nell’elaborare queste note ho utilizzato come guida un unico testo, ovvero:

Bronson, Ricerca operativa, McGraw-Hill, 1994.

Un ottimo testo potrebbe essere quello del prof. Libermann, autorita’ indiscussa in materia, facilmente rintracciabile.

Ho consulato anche un buon testo di algebra e geometria per i licei, quale:

Russo, Algebra e geometria analitica, Cappelli Editore, 1955.

Due ottimi testi di analisi utilizzabili per implementare le proprie conoscenze sono certamente i seguenti:

Campitelli, Campodonico, Galdi, Analisi infinitesimale 2, Societa’ editrice Dante Alighieri, 2007:

Spiegel, Analisi matematica, McGraw-Hill, 1994.

Questi due testi anche se non citati nell’elaborato sono stati ampiamente consultati per impostare l’elaborato, specie per quanto attiene ai prerequisiti matematici.

E’ forse utile riferirsi anche ad un testo di Algebra lineare.


In rete, poi, esistono sempre tante risorse e ne cito due che potrebbero essere utili per approfondire la materia.

Universita` di Roma “La Sapienza” Sede di Latina (Universita’ Pontina) Corso di Laurea in Ingegneria Informatica, Appunti dalle lezioni di Ricerca Operativa, Anno Accademico 2003-2004

Wikipedia, Ricerca operativa.


PROPRIETA’ LETTERARIA

Questo saggio non ha finalita’ commerciali o lucrative. Ne e’ autorizzata la divulgazione, anche totale, a condizione che essa non abbia finalita’ commerciali o lucrative, purche’ essa avvenga con la citazione dell’autore e del soggetto diffusore dell’opera.




Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.