Statistica, 4e - Capitolo 8

Page 1

08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 175

CAPITOLO

PROBABILITÀ: CONCETTI DI BASE 8.1 INTRODUZIONE L’incertezza è una componente imprescindibile della vita quotidiana, sia negli aspetti pratici (attività operative) sia in quelli teorici (attività speculative). Sebbene ciò sia stato riconosciuto sin dai primordi della storia umana, è solo a partire dal 1500-1600 che si registrano i primi tentativi di razionalizzazione e formalizzazione matematica di alcuni aspetti dell’incertezza. Si tratta in particolare dei giochi d’azzardo. 1 Ovviamente, nei giochi d’azzardo è incerto il risultato di alcune operazioni: per esempio, il numero che apparirà sulla faccia superiore di un dado dopo un lancio. Sebbene qui non interessi l’applicazione della teoria della probabilità nell’ambito dei giochi d’azzardo, in tale contesto risulta didatticamente semplice introdurre delle esemplificazioni utili a chiarire i concetti e le proprietà che verranno via via introdotti. Molti esempi di questo capitolo faranno quindi riferimento al lancio di dadi o all’estrazione di palline da un’urna (come nel gioco del Lotto), anche se il nostro interesse nella teoria della probabilità è dovuto in realtà all’importanza che essa ha nell’ambito dell’Inferenza statistica, il cui studio lo affronteremo nei prossimi capitoli. Nel lancio di un dado possiamo considerare intuitivo il concetto di probabilità, ossia il grado di incertezza connesso al risultato (per esempio, il numero che appare sulla faccia superiore del dado) scaturito da una prova (il lancio del dado). D’altra parte, per costruire un corpo teorico coerente e rigoroso occorre procedere come nell’ambito di altre discipline matematiche, quali, per esempio, la geometria o l’aritmetica: • • •

si definiscono i concetti primitivi; si definiscono i postulati; si dimostrano proprietà e teoremi.

Tali passaggi sono illustrati con un certo dettaglio nei successivi Paragrafi 8.2-8.4. Questa impostazione permette di costruire il corpo teorico della teoria della probabilità ma non risolve il problema di come si possa calcolare effettivamente la probabilità di un particolare evento. Ciò sarà affrontato a partire dal Paragrafo 8.5.

1 ▶ Menzioniamo, per esempio, il matematico (e giocatore d’azzardo) Girolamo Cardano (1501-1576) con la sua opera “De ludo aleae”. Altri notevoli contributi allo studio della probabilità, nel contesto dei giochi d’azzardo, vengono dati da Galileo Galilei (1564-1642), Blaise Pascal (1623-1662), Pierre de Fermat (1601-1665) e Christian Huyghens (1629-1695), fisico olandese che ha fornito una trattazione sistematica della probabilità e del modo di ragionare in termini probabilistici nella sua opera “De ratiocinis in ludo aleae”. ◀

8


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 176

176 Capitolo 8

8.2 CONCETTI PRIMITIVI I concetti primitivi rappresentano le nozioni originarie e intuitive su cui viene costruita successivamente tutta la teoria. Nella geometria, per esempio, il punto e la retta sono concetti primitivi. Riconsideriamo l’esempio del lancio di un dado accennato nel paragrafo precedente. In questa situazione compaiono tre entità fondamentali che rappresentano i concetti primitivi della teoria della probabilità:

• • •

la prova; l’evento; la probabilità.

Il legame logico-formale tra queste entità è schematizzato nella seguente proposizione.

In una data prova, l’evento E si verifica con la probabilità P(E).

Per esempio: “Nel lancio di un dado (ben bilanciato) la faccia contrassegnata dal numero 5 (E = 5) si presenta con probabilità P(E = 5) = 16”. I concetti primitivi non possono essere definiti esplicitamente, ma alcune considerazioni possono essere utili a inquadrare il loro ruolo.

La prova (o esperimento aleatorio) è un esperimento che ha due o più possibili risultati e in cui c’è un certo grado di incertezza su quale di questi risultati si presenterà. La prova può essere suddivisa in diverse fasi che si definiscono sottoprove.

ESEMPIO 8.2.1

Prove e sottoprove Esempi di prove sono: 1. 2. 3. 4. 5.

il lancio di un dado; un esame universitario fissato a una certa data; la sperimentazione di un certo farmaco su una cavia; la quotazione di un titolo finanziario in un certo giorno; il lancio di due dadi.

L’ultima prova è composta da due sottoprove: il lancio di ogni singolo dado.

Si possono distinguere due tipi di eventi. Per evento elementare, indicato con wi, si intende uno dei possibili risultati della prova. Per evento non-elementare si intende un evento che può essere a sua volta scomposto in più eventi elementari.


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 177

Probabilità: concetti di base 177

Per semplificare, sia gli eventi elementari sia gli eventi non-elementari, a meno di esigenze particolari, saranno indicati con le lettere maiuscole dell’alfabeto: A, B, C ecc.

Eventi elementari e non-elementari Nella prova “lancio di un dado” i possibili eventi elementari sono {1;2;3;4;5;6}. Un esempio di evento non-elementare è “esce un numero pari”, che si verifica ogni volta che esce uno qualsiasi degli eventi elementari {2;4;6}. Nella prova “esame universitario”, un possibile evento elementare è il voto 28, un evento non-elementare è “un voto > 26”.

ESEMPIO 8.2.2

Per poter analizzare le relazioni esistenti tra gli eventi è necessario postulare un’algebra degli eventi come quella illustrata nei suoi aspetti principali nel Paragrafo 8.3. La probabilità è un numero compreso tra 0 e 1 che misura il grado di incertezza sul verificarsi di un evento.

Essendo un concetto primitivo, il precedente enunciato è molto vago. Tale enunciato diventerà più operativo una volta che saranno introdotti i postulati (si veda il Paragrafo 8.4). Introduciamo a questo punto alcuni esempi di prove che saranno utilizzati più volte nei prossimi paragrafi a scopo illustrativo.

Urna Poniamo in un’urna 100 palline di uguali dimensioni, delle quali 20 nere, 30 blu e 50 bianche. Estraiamo, dopo aver rimescolato con cura, 4 palline in sequenza, reimmettendo nell’urna ogni pallina dopo la sua estrazione (si noti che, con tale procedimento, la composizione dell’urna rimane invariata a ogni estrazione). Possiamo prendere in considerazione, per esempio, i seguenti eventi:

ESEMPIO 8.2.3

A: estrazione di 1 pallina nera, 1 blu, 2 bianche; B: nessuna presenza di palline nere (nelle 4 palline estratte); C: estrazione di 2 o più palline bianche (sempre tra le 4 estratte). In questo esempio la prova consiste nell’estrazione con reimmissione di 4 palline, senza considerare il loro ordine di estrazione; gli eventi sono definiti da condizioni riguardanti i colori delle palline estratte. Così, mentre l’evento A identifica una sola configurazione, gli eventi B e C pongono delle condizioni che sono soddisfatte da diverse configurazioni, come illustrato nella Figura 8.2.1.

Evento A

Evento B

Evento C

Figura 8.2.1 Risultati compatibili con i diversi eventi (non si considera l’ordine di estrazione).


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 178

178 Capitolo 8

Si nota subito che l’evento A, ossia (2 palline bianche, 1 nera, 1 blu) è contenuto nell’evento C (si scrive A Ã C).

ESEMPIO 8.2.4

Controllo di qualità Consideriamo il processo produttivo di blocchetti di un certo materiale. Siamo interessati al fatto che il prodotto rispetti determinate specifiche come, per esempio, una lunghezza di 5 m, una larghezza di 3 cm e uno spessore di 1 cm. Al fine di controllare il processo di produzione, si estraggono ogni giorno in modo casuale 30 unità dall’insieme dei blocchetti prodotti. Con riferimento all’“estrazione di 30 blocchetti in un certo giorno” potremmo prendere in considerazione i seguenti eventi che si riferiscono al “numero di blocchetti difettosi riscontrati nel campione” (tale numero varia, ovviamente, da 0 a 30 e richiede la specificazione preliminare di cosa si intenda per blocchetto “difettoso”): A: il campione non contiene blocchetti difettosi; B: il campione contiene 3 o più blocchetti difettosi; C: il campione contiene meno di 3 blocchetti difettosi. Si noti che, anche in questo caso, l’evento A corrisponde a un solo evento elementare (tutti i 30 blocchetti non sono difettosi), mentre l’evento C (che contiene A) è definito da un insieme di eventi elementari, ciascuno dei quali soddisfa la condizione che identifica C (ossia il contenere meno di tre blocchetti difettosi). Viceversa, l’evento B non contiene alcun evento elementare comune a C.

ESEMPIO 8.2.5

Rischio di credito

ESEMPIO 8.2.6

Sondaggio di opinione

Un istituto bancario eroga prestiti ai propri clienti. A ogni cliente, cui viene erogato un prestito, è associato un rischio (consistente nella possibilità che il cliente non restituisca, totalmente o parzialmente, il denaro prestatogli, con gli opportuni interessi, nei tempi previsti). In questo senso, l’erogazione di credito a un generico cliente costituisce una prova, il cui esito è un evento del tipo: “cliente solvibile” oppure “cliente non solvibile”.

Un’impresa esegue (o fa eseguire) un sondaggio presso i propri clienti riguardo al grado di soddisfazione rispetto al prodotto da essa fornito. Il sondaggio è svolto su un campione di 1.000 clienti, scelti in modo casuale dall’insieme di coloro che hanno acquistato il prodotto. Qui la prova è costituita dall’estrazione campionaria dei 1.000 soggetti e dalla somministrazione a ciascuno di essi di un questionario riguardante il tema oggetto di analisi. In particolare si può porre la domanda: “Lei in quale grado è soddisfatto del nostro prodotto?”; a cui sono associate le seguenti possibili risposte: “Del tutto insoddisfatto”, “Parzialmente soddisfatto”, “Abbastanza soddisfatto”, “Molto soddisfatto”. Sulla base della modalità di risposta scelta da ciascuno dei clienti campionati, si possono, per esempio, considerare i seguenti eventi: A: 20 clienti si dichiarano del tutto insoddisfatti, 50 clienti parzialmente soddisfatti, 400 clienti abbastanza soddisfatti, 530 clienti molto soddisfatti; B: più del 90% dei clienti si dichiara abbastanza o molto soddisfatto; C: meno dell’1% dei clienti è del tutto insoddisfatto.


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 179

Probabilità: concetti di base 179

In questo caso l’evento A è costituito da un’unica configurazione del campione, mentre i restanti eventi sono costituiti da più di una configurazione. In particolare, l’evento A è contenuto nell’evento B.

8.3 EVENTI E ALGEBRA DEGLI EVENTI Con riferimento a una prova si possono considerare tutti gli eventi elementari wi (i diversi possibili esiti della prova), ma è opportuno introdurre anche un altro insieme di eventi, definiti a partire da quelli elementari; l’insieme di tutti questi eventi sarà indicato con E (gli Esempi 8.3.1-8.3.3 chiariranno meglio questi concetti). In effetti, per poter effettuare operazioni sugli eventi, che siano interessanti dal punto di vista applicativo e che, nel contempo, soddisfino delle rigorose proprietà matematiche, è conveniente introdurre una collezione di eventi E = {E1, E2, ..., Ep}, tutti sottoinsiemi di  la cui struttura matematica è quella di un’algebra di Boole. Si può quindi introdurre il seguente postulato:

POSTULATO 1: gli eventi formano un’algebra di Boole. 2

L’algebra di Boole è una struttura matematica sui cui elementi sono definite tutte le operazioni e le regole necessarie per un’algebra degli eventi. Assumendo quindi il postulato 1, risultano definite tutte le operazioni e le proprietà necessarie a trattare gli eventi e che descriveremo sinteticamente in questo paragrafo. In tale struttura matematica sono innanzitutto definite tre operazioni fondamentali. 3 4 5

1. 2. 3.

La negazione di un evento A, ossia A. L’intersezione tra due eventi A e B, ossia A « B. L’unione tra due eventi A e B, ossia A » B.

2 ▶ Stiamo seguendo la proposta di Pompilj (1984) che deriva dall’impostazione originaria di Kolmogorov (1933) che dedica i primi postulati alla formalizzazione dello spazio degli eventi. Altri autori preferiscono enunciare tale formalizzazione senza introdurre uno specifico postulato. ◀ 3 ▶ Le operazioni di unione e di intersezione presentano diverse proprietà, tra le quali quella distributiva. Secondo tale proprietà, dati tre eventi A, B e C si ha per l’unione A « (B » C) = (A « B) » (A « C) e per l’intersezione A » (B « C) = (A » B) « (A » C). ◀ 4 ▶ Abbiamo introdotto tre operazioni per comodità didattica; in realtà la terza operazione si può ricavare dalle prime due: A » B ∫ A∩B

5 ▶ Affermare che una collezione di eventi E = {E1, E2, ..., Ep} è un’algebra di Boole rispetto alle operazioni di negazione, intersezione e unione ora introdotte, significa dire che tale collezione è chiusa rispetto alle operazioni in questione. Ciò, a sua volta, vuol dire che il risultato di ogni operazione di negazione, intersezione e unione, sugli elementi di  è anch’esso un evento appartenente a E. Se la collezione di eventi E è chiusa anche rispetto all’unione di un’infinità numerabile di eventi, avremo un’algebra di Boole completa detta anche s-algebra. ◀


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 180

180 Capitolo 8

• • •

ESEMPIO 8.3.1

Dato un evento A, la sua negazione A (che denomineremo anche complemento di A), è data dall’evento “A non si verifica”. Dati 2 eventi, A e B, la loro intersezione A « B è data dall’evento “tutti e due gli eventi A e B si verificano contemporaneamente”. Dati 2 eventi, A e B, la loro unione A » B è data dall’evento “almeno uno degli eventi A e B si verifica”. L’unione e l’intersezione si possono estendere a un numero finito o numerabile di eventi.

Negazione, intersezione e unione di eventi Con riferimento all’Esempio 8.2.3, la negazione di B, ossia B, è definita come l’evento “estrazione di almeno una pallina nera”. Ovviamente, ogni quaterna di palline (evento elementare) che soddisfa tale condizione appartiene a B. Viceversa, l’intersezione B « C è costituita dall’evento “estrazione di almeno due palline bianche e nessuna nera”, ossia dall’evento formato dall’insieme dei seguenti eventi elementari: (4 bianche), (3 bianche e 1 blu), (2 bianche e 2 blu). L’evento B » C è costituito da tutte le quadruple che non contengono palline nere oppure, pur contenendo palline nere, contengono almeno due palline bianche.

B Non contiene palline nere

C B∩C

Almeno 2 palline bianche

Nessuna pallina nera e almeno due bianche

L’insieme di tutti i possibili eventi elementari wi viene chiamato spazio campionario e viene indicato con il simbolo .

In base a tale definizione avremo quindi che E … , dove … è il simbolo di inclusione.

ESEMPIO 8.3.2

Spazio campionario Poniamo in un’urna 100 palline di uguali dimensioni, delle quali 30 sono nere e 70 bianche. Estraiamo 3 palline in sequenza, reimmettendo nell’urna ogni pallina dopo la sua estrazione. I possibili eventi elementari, tenendo conto dell’ordine di estrazione, sono:

Lo spazio campionario  è quindi costituito da 8 eventi elementari. Se invece consideriamo l’esperimento descritto nell’Esempio 8.2.5, abbiamo solo due possibili eventi elementari  = {“cliente solvibile”, “cliente non solvibile”}.


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 181

Probabilità: concetti di base 181

È opportuno definire due eventi particolarmente rilevanti. •

L’evento impossibile è l’evento che non può mai verificarsi e può essere definito come l’intersezione fra un qualsiasi evento e la sua negazione: A « A = B « B = ... = ∆ (simbolo dell’evento impossibile). L’evento certo, ossia l’evento che si verifica sempre in quanto comprende tutti i possibili risultati dell’esperimento. Può essere definito come la negazione dell’evento impossibile: ∆ ∫ .

Collezione di eventi e spazio campionario Consideriamo la prova consistente nel lanciare una moneta due volte. L’insieme degli eventi elementari è: Ω = {(TT ),(TC ),(CT ),(CC )} Possiamo a questo punto definire la collezione degli eventi E, data da tutti i sottoinsiemi di : ⎪⎫⎪ ⎪⎧⎪∅, {(TT )}, {(TC )}, {(CT )},{(CC )},{(TT ),(TC )},{(TT ),(CT )},{(TT ), (CC )}, ⎪ ⎪⎪  = ⎨{(TC ),(CT )}, {(TC ),(CC )}, {(CT ), (CC )}, {(TT ), (TC ), (CT )}, {(TT ), (TC ), (CC )}, ⎪⎬ ⎪⎪ ⎪⎪ ⎪⎪ ⎪⎪{(TT ),(CT ),(CC)}, {(TC),(CT),( CC)}, Ω ⎭ ⎩ In generale se  contiene K eventi elementari, allora E contiene 2K dei suoi sottoinsiemi.

Due eventi, A e B, si dicono incompatibili se si verifica che A « B = ∆, ossia i due eventi non possono verificarsi contemporaneamente. Dalla definizione dell’operazione di unione consegue che A » A = B » B = , ossia l’unione di un evento e del suo complemento costituisce l’evento certo. In base all’operazione di unione si può poi definire la relazione di inclusione (contenimento) tra eventi: A » B = A fi B Ã A dove il simbolo fi significa “implica”. In effetti, se l’unione di A e B coincide con A, è ovvio che l’evento B è totalmente contenuto in A (l’inclusione non esclude la perfetta coincidenza tra A e B). Nell’Esempio 8.2.3, si ha: A » C = C e pertanto A è contenuto in C.

8.4 I POSTULATI Come abbiamo visto nel precedente paragrafo, a una generica prova è associato uno spazio campionario  e a esso una collezione di eventi E = {E1, E2, ..., Ep} la cui struttura matematica è quella di un’algebra di Boole.

La probabilità è una funzione di insieme che associa a ogni evento Ei Œ E un numero reale. La probabilità sarà indicata con P(Ei)

ESEMPIO 8.3.3


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 182

182 Capitolo 8

Vedremo nei prossimi paragrafi come si possono assegnare effettivamente dei valori numerici a P(Ei). Quello che interessa in questo paragrafo è definire alcune proprietà assiomatiche alle quali si deve conformare la probabilità, in modo da ottenere una misura coerente del grado di incertezza di un evento. Sulla base di tali proprietà è poi possibile sviluppare un calcolo delle probabilità che rispetti i canoni della rigorosità e verificabilità. Introduciamo ora, tramite dei postulati, le suddette proprietà assiomatiche. Indicheremo con A e B degli eventi qualsiasi appartenenti a E.

POSTULATO 2: P(A) ≥ 0 POSTULATO 3: P() = 1 POSTULATO 4: A ∩ B = ∅ ⇒ P ( A ∪ B ) = P ( A ) + P (B )

6

I postulati sono degli assunti che non devono essere dimostrati o verificati; ciononostante i postulati 2, 3, 4 trovano un riferimento empirico nella nozione di frequenza relativa di un evento. Infatti, la frequenza relativa di un evento è non negativa per definizione (postulato 2); inoltre, se l’evento si presenta in tutte le n prove (e ciò si verifica necessariamente quando l’evento è certo) la rispettiva frequenza relativa è 1 (postulato 3); infine, se gli eventi A e B non si sono mai presentati contemporaneamente nelle n prove, allora la frequenza di A » B è uguale appunto alla somma delle frequenze di A e di B (postulato 4). 7 Utilizzando i postulati sinora introdotti, è possibile dimostrare il seguente teorema.

In una prova, dati 2 eventi qualsiasi A e B, si ha P ( A ∪ B ) = P ( A) + P (B ) − P ( A ∩ B )

(8.4.1)

Dal sistema di postulati in questione sono inoltre deducibili varie proprietà, tra le quali segnaliamo le seguenti:

• • •

0 £ P(A) £ 1 P(∆) = 0 B Ã A fi P(B) £ P(A)

(8.4.2)

6 ▶ Il postulato 4 si può estendere all’unione di un’infinità numerabile di eventi. Indicando con Ei gli eventi generici appartenenti a E, si ha: ⎛ ∞ ⎞⎟ ⎜ Ei ∩ E j = ∅, ∀i ≠ j ⇒ P ⎜⎜ Ei ⎟⎟⎟ = ⎜⎜ ⎝ i=1 ⎟⎟⎠

∑ P (E ) i

i=1

Tale postulato viene detto postulato della sommabilità completa. ◀ 7 ▶ È doveroso osservare che altri autori preferiscono selezionare sistemi differenti di postulati. Non muta, tuttavia, la struttura complessiva della conseguente teoria assiomatica della probabilità. ◀


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 183

Probabilità: concetti di base 183

• • •

P(A) = 1 - P(A) P(B) = 1 fi P(B « A) = P(A) P(B) = 0 fi P(B » A) = P(A)

8.5 MISURA DELLA PROBABILITÀ NELL’APPROCCIO CLASSICO A partire dai postulati definiti nel precedente paragrafo è possibile definire in maniera intuitiva una misura della probabilità che non ha applicabilità generale ma che si adatta alle situazioni in cui gli eventi elementari sono perfettamente noti, in numero finito e possono essere considerati equipossibili (questo termine verrà chiarito più avanti). Tale situazione si verifica, per esempio, nei giochi d’azzardo e non è un caso che tale definizione provenga dagli studi di Cardano.

Definizione classica di probabilità La probabilità è data dal rapporto tra il numero dei casi favorevoli all’evento e il numero dei casi possibili purché essi siano tutti ugualmente possibili.

Probabilità del verificarsi di un evento E: P(E ) =

n. di casi favorevoli n. di casi possibili

Lancio di un dado Nel caso del lancio di un dado vi sono 6 eventi elementari, tutti ugualmente possibili, corrispondenti alle 6 facce del dado. Se consideriamo come evento di interesse il presentarsi della faccia con il numero 5, la probabilità dell’evento in questione è misurata dal valore 16. P(E = 5) = 16 Se, nella medesima prova, avessimo definito l’evento E come “il presentarsi di una faccia con numero pari”, i casi favorevoli a E sarebbero stati 3 (i numeri 2, 4, 6) e la relativa probabilità sarebbe stata espressa dal rapporto 36 = 12.

Si osservi come, nella definizione classica di probabilità, sussista un “vizio” logico consistente nell’assumere che i casi possibili siano in effetti “equipossibili”, e dunque equiprobabili (supponendo così di avere già predefinito la probabilità, nel momento stesso in cui la si sta definendo). Tale “vizio” è essenzialmente legato a una nozione “primitiva” quale la simmetria associata ad aspetti (opportunamente idealizzati) del mondo fenomenico reale (nell’esempio, la simmetria delle facce del dado). Perciò, se da un lato l’uso di questa nozione primitiva può giustificare in determinati contesti la definizione classica, dall’altro lato è evidente la necessità di fornire definizioni della probabilità che abbiano un respiro teorico e pratico più ampio.

ESEMPIO 8.5.1


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 184

184 Capitolo 8

Nel prosieguo avremo modo di considerare altre proposte che si collocano in questa prospettiva di ampliamento. In effetti è possibile definire molte altre misure di probabilità che soddisfano i postulati che abbiamo enunciato nel Paragrafo 8.4. L’assegnazione della probabilità agli eventi non è quindi univoca in base ai precedenti postulati e richiede un’ulteriore specificazione, argomento che sarà approfondito nel Paragrafo 8.8.

ESEMPIO 8.5.2

Estrazione di una unità da una popolazione A un’università sono iscritti 10.000 studenti; di questi, 4.000 sono maschi. Sappiamo inoltre che 500 studenti maschi sono iscritti alla facoltà di Economia. Dalla popolazione di tutti gli studenti estraiamo a caso uno studente e definiamo i seguenti due eventi: A: lo studente è maschio; B: lo studente è iscritto alla facoltà di Economia. Ci poniamo quindi il problema di calcolare le seguenti probabilità: P(A) = probabilità di estrarre uno studente maschio; P(A « B) = probabilità di estrarre uno studente maschio iscritto a Economia. Si ha che: P(A) = 4.00010.000 = 0,4 P(A « B) = 50010.000 = 0,05 Infatti i possibili risultati dell’estrazione sono 10.000, tutti ugualmente possibili a causa del meccanismo casuale di estrazione. I casi favorevoli all’evento A (studenti maschi) sono 4.000, mentre i casi favorevoli all’evento (A « B) (studenti maschi iscritti a Economia) sono 500.

8.6 PROBABILITÀ CONDIZIONATE E INDIPENDENZA In alcune situazioni si vuole valutare la probabilità di un evento sapendo che si è già verificato un altro evento a esso collegato. Illustreremo questa situazione con un esempio.

ESEMPIO 8.6.1

Lancio di un dado Nel caso del lancio di un dado vi sono 6 eventi elementari  ∫ {1;2;3;4;5;6}. Consideriamo i seguenti eventi: A: esce il numero 2

B: esce un numero pari

Sappiamo da quanto visto nel Paragrafo 8.5 che P(A) = 16 e che P(B) = 36. Ci possiamo a questo punto porre la seguente domanda: qual è la probabilità del numero 2 (A) se siamo certi che sia uscito un numero pari (B)? Possiamo indicare tale probabilità con P(A | B). Evidentemente gli eventi elementari possibili si riducono, dopo aver dato per certo l’evento B, per cui l’insieme dei possibili eventi elementari diventa * ∫ {2;4;6}; si avrà quindi che P(A | B) = 13


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 185

Probabilità: concetti di base 185

Consideriamo ora i seguenti due eventi: A: esce un numero minore di 5;

B: esce un numero pari.

Sappiamo che P(A) = 46 poiché vi sono quattro casi favorevoli all’evento A, ossia {1;2;3;4}; d’altra parte avremo P(B) = 36 poiché vi sono tre casi favorevoli all’evento B, ossia {2;4;6}. Se vogliamo determinare P(A | B) in questa situazione, possiamo effettuare le seguenti considerazioni: • •

gli eventi possibili sono tutti e solo i casi favorevoli a B, che supponiamo evento certo, ossia {2;4;6}; i casi favorevoli ad A non sono più {1;2;3;4} in quanto sappiamo che il numero 1 e il numero 3 non possono verificarsi (dato B); piuttosto occorre considerare i casi favorevoli ad A che siano favorevoli anche a B, cioè i casi favorevoli all’evento (A « B) che sono dati dai due valori 2 e 4.

In definitiva, si ha P(A | B) = 23.

Come si può notare dall’esempio, abbiamo due eventi, A e B, tra loro collegati e supponiamo di sapere che l’evento B si sia già verificato. La domanda che ci poniamo è: qual è la probabilità di A, dato che si è verificato B? In simboli, vogliamo conoscere la probabilità di A condizionatamente al verificarsi di B: P(A | B) che si legge “probabilità condizionata di A dato B”. Nell’esempio precedente possiamo osservare che tale espressione fa sì che B venga considerato un evento certo, per cui  = B e quindi i casi possibili diventano tutti e solo i casi favorevoli a B. Viceversa, i casi favorevoli ad A diventano solo quelli inclusi in B, ossia (A « B). Applicando la definizione classica di probabilità si ha quindi che P ( A | B) =

n. dei casi favorevoli ad ( A ∩ B ) n. dei casi favorevoli a B

ossia P (A | B )=

P ( A ∩ B) P (B)

Si definisce probabilità condizionata 8 di A dato B il rapporto tra la probabilità dell’evento (A « B) e la probabilità dell’evento B: P (A | B )=

P ( A ∩ B) P (B)

con P (B )>0

(8.6.1)

8 ▶ Alcuni autori, tra cui Pompilj, preferiscono introdurre la probabilità condizionata come un ulteriore postulato. In questa trattazione abbiamo invece seguito l’impostazione più diffusa che fa discendere tale concetto dai postulati e dalle proprietà già introdotti. ◀


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 186

186 Capitolo 8

Con la stessa logica si ottiene che P (B | A)=

P ( A ∩ B) se P ( A) > 0 P ( A)

Moltiplicando ambo i membri della (8.6.1) per P(B) si ottiene: P ( A ∩ B ) = P (B ) ⋅ P ( A | B ) Dalla definizione di probabilità condizionata discende quindi una proprietà che viene anche chiamata principio delle probabilità composte.

Dati 2 eventi A e B tali che P(A) > 0 e P(B) > 0 si ha: P ( A ∩ B ) = P ( A ) ⋅ P (B | A ) = P (B ) ⋅ P ( A | B )

(8.6.2) 9

In base al principio delle probabilità composte, possiamo introdurre il concetto di indipendenza tra eventi. In effetti due eventi A e B si dicono indipendenti se il verificarsi di B non influenza la probabilità di A e il verificarsi di A non influenza la probabilità di B, ossia se P(A | B) = P(A) e P(B | A) = P(B) da cui, utilizzando la (8.6.2), si ricava P ( B | A) =

P ( B ∩ A) = P ( B ) ⇒ P ( B ∩ A ) = P ( B ) ⋅ P ( A) P ( A)

D’altra parte P(A | B) e P(B | A) sono definiti solo per P(B) > 0 e P(A) > 0, per cui risulta più comoda la seguente definizione.

Due eventi A e B si dicono indipendenti se e solo se: P(A « B) = P(A) · P(B)

(8.6.3) 10 11

9 ▶ La (8.6.2) può essere estesa a più di due eventi. Se, per esempio, consideriamo tre eventi A, B, C, la formula precedente diventa P(A « B « C) = P(A)  P(B | A)  P(C | A « B) Si osservi che cambiando l’ordine degli eventi si ottengono espressioni equivalenti. ◀ 10 ▶ La definizione di indipendenza (8.6.3), a differenza della (8.6.2), vale anche quando P(A) = 0 o P(B) = 0. ◀ 11 ▶ La (8.6.3) è una condizione necessaria e sufficiente affinché due eventi siano indipendenti. Nel caso di tre eventi la (8.6.3) si complica notevolmente: infatti per ottenere una condizione necessaria e sufficiente perché tre eventi A, B, C siano indipendenti, debbono essere soddisfatte tutte le condizioni seguenti: P(A « B) = P(A) · P(B) P(A « C) = P(A) · P(C) P(B « C) = P(B) · P(C) P(A « B « C) = P(A) · P(B) · P(C) ◀


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 187

Probabilità: concetti di base 187

Eventi indipendenti (continuazione dell’Esempio 8.6.1) Consideriamo i due eventi A: esce il numero 2;

ESEMPIO 8.6.2

B: esce un numero pari.

Abbiamo già visto nell’Esempio 8.6.1 che si ha P(A) = 16 e P(A | B) = 13, per cui i due eventi non sono indipendenti. Consideriamo ora gli eventi A: esce il numero 2 o 3;

B: esce un numero pari.

In tal caso si ha che P(A) = 13, P(B) = 12 e P(A « B) = 16, da cui P(A | B) = 13 e P(B | A) = 1/2, quindi gli eventi A e B sono indipendenti.

Si osservi che, quando la prova è composta di sottoprove e gli eventi A e B si riferiscono a 2 sottoprove diverse, il verificarsi della suddetta relazione d’indipendenza per tutte le coppie di eventi delle 2 sottoprove le caratterizza come sottoprove indipendenti. Gli eventi di sottoprove indipendenti sono necessariamente eventi indipendenti.

Sottoprove dipendenti e indipendenti Nell’Esempio 8.2.3, considerando come sottoprove le singole estrazioni, si ricava immediatamente che esse sono indipendenti in quanto, dopo ogni estrazione, reimmettiamo la pallina estratta nell’urna. Se invece consideriamo l’estrazione senza reimmissione avremo sottoprove dipendenti. Infatti, se alla prima estrazione esce una pallina bianca (probabilità = 50100), la probabilità che alla seconda estrazione esca una pallina nera verrà modificata (essa sarà pari a 2099 piuttosto che a 20100). In tal caso la probabilità congiunta di “pallina bianca alla prima estrazione e pallina nera alla seconda estrazione” è data, in base al principio delle probabilità composte, da P (bianca in prima estrazione ∩ nera in seconda estrazione) =

50 20 ⋅ = 0,101 100 99

Schema riassuntivo Considerati due eventi A e B, rispetto alla probabilità dell’unione degli eventi: P(A » B) = P(A) + P(B) se A e B sono incompatibili, ossia A « B = ∆ P(A » B) = P(A) + P(B) - P(A « B) se A e B sono compatibili, ossia A « B  ∆ rispetto alla probabilità dell’intersezione degli eventi: P(A « B) = P(A) · P(B) se A e B sono indipendenti P(A « B) = P(A | B) · P(B) = P(B | A) · P(A) se A e B non sono indipendenti

ESEMPIO 8.6.3


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 188

188 Capitolo 8

8.7 IL TEOREMA DI BAYES Iniziamo la trattazione di questo famoso teorema considerando un problema induttivo che viene utilizzato, con piccole variazioni, in molti testi didattici per illustrare il teorema di Bayes.

ESEMPIO 8.7.1

Applicazione del teorema di Bayes Supponiamo di sapere che in una data popolazione il 10% degli individui è affetto da una determinata patologia. Per diagnosticare la presenza della patologia si deve effettuare un test ematico. È noto tuttavia che il test risulta negativo anche per il 10% dei malati (falsi negativi) mentre risulta positivo nel 20% dei sani (falso positivo). A questo punto è lecito chiedersi: se un individuo risulta positivo al test, qual è la probabilità che esso sia effettivamente malato? Elenchiamo gli eventi che stiamo considerando: A1: l’individuo è malato; A2: l’individuo è sano; B1: il test è negativo; B2: il test è positivo. La risposta alla nostra domanda richiede la determinazione della seguente probabilità: P(A1 | B2) = probabilità che un individuo positivo al test sia effettivamente malato.

Nell’Esempio 8.7.1 abbiamo la necessità di calcolare delle probabilità condizionate. Il teorema di Bayes, che si basa sull’applicazione dei postulati, dei principi e delle definizioni precedentemente introdotti, ci fornisce appunto tali probabilità. Consideriamo una partizione dello spazio campionario , cioè un insieme di eventi: A1, A2, ..., AK tali che: •

Ai « Aj = ∆ i  j, ossia a due a due incompatibili; K

 A = Ω, ossia la loro unione ricostruisce lo spazio campionario . i

i=1

Sia poi B un altro evento incluso in . Le probabilità a posteriori P(Ai | B) sono calcolabili utilizzando l’espressione delle probabilità condizionate, ossia P(Ai | B) =

P ( Ai ∩ B ) i = 1, 2, ..., K P (B)

ma P(Ai « B) = P(Ai)  P(B | Ai) e inoltre, ricordando l’incompatibilità degli eventi Ai, si può scrivere: ⎛ ⎛ K ⎞⎞⎟ ⎟ ⎜ ⎜ P ( B) = P ( B ∩ Ω) = P ⎜⎜ B ∩ ⎜⎜ Ai ⎟⎟⎟⎟⎟⎟ = P (( A1 ∩ B ) ∪ ( A2 ∩ B ) ∪  ∪ ( AK ∩ B )) = ⎜⎜⎝ ⎜⎝ ⎟⎠⎟⎠ i=1 = P ( A1 ∩ B) + P ( A2 ∩ B) +  + P ( AK ∩ B) = = P ( A1 ) ⋅ P ( B | A1 ) + P ( A2 ) ⋅ P ( B | A2 ) +  + P ( AK ) ⋅ P ( B | AK )

Pertanto si ottiene il seguente risultato.


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 189

Probabilità: concetti di base 189

Teorema di Bayes 12 Dato un insieme esclusivo ed esaustivo di eventi: A1, A2, ..., AK e un evento B, si ha P( Ai | B)=

P( Ai )⋅ P (B | Ai ) P( A1 )⋅ P( B | A1 )+ P( A2 )⋅ P( B | A2 )+ ...+ P( AK )⋅ P( B | AK )

i = 1,2,...., K (8.7.1)

Nella formula precedente sono presenti le seguenti probabilità. 1. 2. 3.

Le probabilità degli eventi Ai, P(Ai), per i = 1, 2, ..., K, che vengono denominate probabilità a priori. Probabilità condizionate P(B | Ai), per i = 1, 2, ..., K, dette anche verosimiglianze degli Ai. Le probabilità condizionate P(Ai | B), per i = 1, 2, ..., K, che rappresentano l’oggetto del nostro interesse inferenziale e vengono chiamate probabilità a posteriori, in quanto si riferiscono agli eventi Ai, dopo aver osservato l’evento B.

Il teorema di Bayes presenta particolare interesse quando gli eventi Ai possono essere considerati come le possibili cause dell’evento (successivo) osservato B. In tal caso le probabilità a posteriori indicano la probabilità delle diverse cause, data l’osservazione dell’evento B.

Applicazione del teorema di Bayes (continuazione dell’Esempio 8.7.1) Consideriamo i dati dell’Esempio 8.7.1; da quanto detto emerge che sono note le seguenti probabilità: P(A1) = 0,1 P(A2) = 0,9 P(B2 | A2) = 0,2 P(B1 | A1) = 0,1

probabilità di estrarre un individuo malato dalla popolazione; probabilità di estrarre un individuo sano dalla popolazione; probabilità che il test dia un falso-positivo; probabilità che il test dia un falso-negativo.

Per rispondere all’interrogativo che ci siamo posti dobbiamo determinare: P(A1 | B2) = probabilità che un individuo positivo al test sia effettivamente malato. Applicando il teorema di Bayes si ottiene P ( A1 | B2 ) =

P ( A1 ) P ( B2 | A1 ) P ( A1 ) P ( B2 | A1 ) + P ( A2 ) P ( B2 | A2 )

considerando che P(B2 | A1) = 1 - P(B1 | A1) = 0,9 si ricava che P ( A1 | B2 ) =

0,1 ⋅ 0,9 = 0,33 0,1 ⋅ 0,9 + 0,9 ⋅ 0,2

12 ▶ Il teorema di Bayes prende il nome da Thomas Bayes che per primo l’ha introdotta nell’articolo “An essay towards solving a problem in the doctrine of chances”, in Philosophical Transactions, Londra, 1764. ◀

ESEMPIO 8.7.2


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 190

190 Capitolo 8

Quindi la probabilità che un individuo che risulti positivo al test sia effettivamente malato è solo 0,33. o ,2 itiv =0 ) Pos 2 |A o Sa n

)= P(A 2

P(B 2 P(B 1 | A

0,9

Neg

ativ

2)

o

=0 ,8

Popolazione Ma lat o

P(A

1)

=

0,1

i Posit

vo

0,9 A 1) =

| P(B 2 P (B 1 | A

Ne gat i

1)

vo

=0 ,1

P(A2 ∩ B2) = 0,9 · 0,2 = 0,18

P(A2 ∩ B1) = 0,9 · 0,8 = 0,72

P(A1 ∩ B2) = 0,1 · 0,9 = 0,09

P(A1 ∩ B1) = 0,1 · 0,1 = 0,01

Se invece assegniamo probabilità a priori uguali ai due eventi P(A1) = 0,5 e P(A2) = 0,5 si ottiene un risultato completamente diverso: P(A1 | B2) = 0,82.

È il caso di sottolineare che nel calcolo eseguito nel precedente esempio ci siamo avvalsi della conoscenza delle probabilità a priori P(Ai) e che tale conoscenza ci ha permesso di calcolare in modo corretto la probabilità P(A1 | B2) che cercavamo. In molte applicazioni concrete questa conoscenza non si possiede e quindi, per applicare la formula di Bayes, occorre fare delle assunzioni riguardo le probabilità a priori.

8.8 LE DIVERSE CONCEZIONI DELLA PROBABILITÀ Nel Paragrafo 8.5 abbiamo illustrato la concezione classica di probabilità, connessa alla nozione di simmetria ed essenzialmente fondata su argomentazioni di tipo combinatorio. Abbiamo peraltro posto in rilievo la limitatezza di tale interpretazione e la necessità di estendere il significato e le potenzialità applicative della probabilità. Vi è una concezione assai più ampia, che è in genere denominata concezione frequentista che si basa sulla ripetibilità della prova. In effetti, data una qualsiasi prova, possiamo sempre immaginare di poterla ripetere (al limite, infinite volte). In molti casi ciò è anche operativamente realizzabile: si pensi alla ripetizione dell’estrazione dall’urna di 4 palline (Esempio 8.2.3), oppure alla ripetizione giornaliera del campionamento di 30 blocchetti dalla massa di blocchetti prodotti nella giornata (Esempio 8.2.4). Naturalmente, la ripetibilità della prova implica che tutte le condizioni nelle quali viene svolta la prova si mantengano inalterate, per cui questa si può ritenere identica in ciascuna delle ripetizioni. Gli esiti della prova, ossia gli eventi elementari che di volta in volta si presentano, non saranno ovviamente sempre gli stessi. Se eseguiamo n ripetizioni della stessa prova sarà pertanto interessante osservare la frequenza con cui si presentano i singoli


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 191

Probabilità: concetti di base 191

eventi elementari. Indicando con nA il numero di prove nelle quali si è verificato A, la frequenza relativa di A è data da: fr ( A) =

nA n

Di fatto, nel momento in cui sono stati formulati i postulati del sistema assiomatico, si è fatto ricorso all’analogia tra probabilità e frequenza relativa in prove ripetute sotto le stesse condizioni. Sebbene tale analogia sia del tutto superflua ai fini della validità di un sistema di assiomi (che riguarda entità puramente teoriche e le corrispondenti regole di manipolazione), essa si rivela fruttuosa in rapporto al modo nel quale il sistema assiomatico stesso viene applicato al mondo reale. In questa prospettiva ci soccorre il seguente asserto:

Postulato empirico del caso 13 In un gruppo di prove ripetute più volte nelle stesse condizioni, ciascuno degli eventi possibili compare con una frequenza approssimativamente eguale alla sua probabilità; generalmente l’approssimazione migliora quando il numero delle prove cresce.

Come si evince dal testo del postulato, il suo fondamento risiede in una constatazione empirica effettuata nelle più diverse situazioni, dai giochi d’azzardo alla gestione assicurativa dei rischi. Il postulato in questione è facilmente verificabile, anche tramite un semplice lancio di monete o di dadi. Tuttavia, la sua rilevanza sta nel fatto che esso getta un ponte fra probabilità e frequenza. Illustriamo l’utilità di questo collegamento riferendoci all’Esempio 8.2.5 (Rischio di credito). In quell’esempio abbiamo due eventi: “cliente solvibile”, “cliente non solvibile”. In quali termini possiamo pensare di associare una probabilità a questi due eventi? La concezione frequentista ci fornisce una possibile risposta. Se pensiamo ai numerosi clienti che possiede un istituto bancario medio-grande, utilizzando lo schema delle prove ripetute possiamo immaginare che la frequenza dei clienti che nel corso del loro rapporto con l’istituto mostrano di essere insolvibili è una buona approssimazione della probabilità di insolvenza. Dunque la frequenza diventa l’aspetto concreto manifesto di una sottostante probabilità teorica che regola il meccanismo di incertezza riguardo alla solvibilità dei clienti. Se si posseggono altre informazioni oltre a quelle sulla solvibilità del cliente, come, per esempio, il suo profilo anagrafico, sociale ed economico (come in genere avviene: per esempio, età, professione, reddito ecc.), sarà possibile affinare ulteriormente la determinazione della probabilità in questione facendola dipendere dal suddetto profilo. Le frequenze relative all’insolvibilità nelle sottoprove concernenti gruppi di clienti con profili analoghi servono quindi come approssimazione delle rispettive probabilità.

13 ▶ Tale asserto viene enunciato da Pompilj (op. cit.) con questa denominazione. Altri autori parlano di “legge empirica del caso”, ma il termine “legge” non appare appropriato nel contesto teorico che stiamo esaminando. ◀


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 192

192 Capitolo 8

ESEMPIO 8.8.1

Applicazione dell’approccio frequentista (continuazione dell’Esempio 8.2.5) Con riguardo all’Esempio 8.2.5, supponiamo che la Banca abbia compiuto l’indagine statistica su 500 dei suoi clienti e che, oltre alla solvibilità e ad altre variabili socio-anagrafiche, abbia rilevato l’ammontare del prestito concesso. Suddividiamo quest’ultima variabile in tre classi: sino a 10.000 euro, da 10.000 a 50.000 euro, oltre 50.000 euro. La Tabella 8.8.1 fornisce la distribuzione di frequenza della variabile doppia (Solvibilità; Prestito) osservata sui 500 clienti della Banca. Nell’interpretazione frequentista, le frequenze osservate relativamente alle 6 combinazioni di modalità di queste variabili, divise per il totale (500), rappresentano la manifestazione concreta di una sottostante probabilità. Gli eventi elementari sono appunto le suddette 6 combinazioni: (Prestito inferiore a 10 mila euro; Cliente solvibile), (Prestito tra 10 mila e 50 mila euro; Cliente solvibile), ecc... Le frequenze (relative) osservate costituiscono una buona “stima” delle rispettive probabilità. Per gli scopi del presente capitolo possiamo pertanto affermare, per esempio, che la probabilità che la Banca in questione abbia un cliente con un prestito tra 10.000 e 50.000 euro e che, al contempo, tale cliente risulti solvibile è: P(Cliente solvibile ∩ Prestito € 10.000 − € 50.000) =

160 = 0,32 500

Tuttavia è naturale che la Banca si chieda quale sia la probabilità che un cliente al quale sia stato erogato un prestito tra 10.000 e 50.000 euro risulti solvibile. La risposta a tale quesito sta nell’uso della nozione di probabilità condizionata: P(Cliente solvibile | Prestito € 10.000 − € 50.000) In accordo con la definizione di probabilità condizionata possiamo scrivere: P(Cliente solvibile | Prestito € 10.000 − € 50.000) =

0,32 0,32 = = 0,80 200 0, 40 500

dove 0,4 = P(Prestito € 10.000 - € 50.000).

Tabella 8.8.1 Solvibilità rispetto all’ammontare del prestito Solvibilità

Ammontare del prestito < 10.000

Totale

10.000-50.000

> 50.000

Solvibile Non solvibile

140 10

160 40

145 5

445 55

Totale

150

200

150

500

Anche gli Esempi 8.2.4 e 8.2.6 costituiscono degli esperimenti, che ben si prestano all’interpretazione frequentista della probabilità. In particolare, nell’esempio del Controllo di qualità, ogni giorno effettuiamo un esperimento consistente in 30 osservazioni campionarie di altrettanti blocchetti.


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 193

Probabilità: concetti di base 193

A questo esperimento è associabile lo schema delle prove ripetute, con riferimento alle sottoprove concernenti i singoli blocchetti. Di conseguenza, la frequenza relativa ai blocchetti difettosi registrati in un dato giorno nel campione di 30 osservazioni è interpretabile come la manifestazione concreta della sottostante probabilità di difettosità che caratterizza il processo produttivo in quella determinata giornata. Ebbene, la concezione frequentista della probabilità fornisce il fondamento di un’impostazione inferenziale basata sul cosiddetto principio del campionamento ripetuto. La sostanza di tale principio consiste nella costruzione di procedure inferenziali che posseggono proprietà ottimali “a lungo andare”, ossia al ripetersi dell’operazione di campionamento. Nei successivi capitoli saranno illustrate le procedure inferenziali che si ispirano a questo principio. Esiste, tuttavia, un’altra concezione della probabilità.

Concezione soggettivista La probabilità di un evento è la misura del grado di fiducia che un individuo coerente attribuisce al verificarsi dell’evento in base alle informazioni in suo possesso.

Bruno de Finetti, tra i massimi studiosi di questa concezione, usa il paradigma della scommessa per dare una formulazione operativa della probabilità soggettiva. In base a questo paradigma si ha la seguente definizione.

Probabilità soggettiva La probabilità di un evento E, P(E), secondo l’opinione di un individuo coerente, è il prezzo p che egli stima equo attribuire a un importo unitario (per esempio, 1 euro) esigibile solo al verificarsi di E. 14

Si noti che la condizione di equità nella suddetta definizione vuol dire che l’individuo in questione è disposto indifferentemente sia a pagare il prezzo p e a ricevere 1 solo se si verifica E, sia a ricevere p e pagare 1 solo se si verifica E. Inoltre, la condizione di “coerenza” impone che egli valuti la probabilità di più eventi in modo che non sia possibile, mediante un’opportuna combinazione di tali eventi, fargli subire una perdita a prescindere dall’esito della prova. Per esempio, se l’individuo desse le seguenti valutazioni: P ( A) = P ( A) =

2 3

egli non potrebbe essere considerato “coerente”. Infatti, puntando 23 sul verificarsi di A e 23 sul suo non verificarsi, pagherebbe 43 ma riscuoterebbe 1, con una perdita certa di 13. È opportuno sottolineare che dalla condizione di “coerenza” ora illustrata discendono immediatamente i postulati 2, 3, 4 del calcolo delle probabilità che abbiamo in14 ▶ Per un approfondimento si veda il trattato di B. de Finetti Teoria delle probabilità, Einaudi, 1970. Altri famosi studiosi che hanno dato un importante contributo a questo approccio sono M.H. DeGroot, H. Jeffreys, D.V. Lindley, L.J. Savage, J.O. Berger. ◀


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 194

194 Capitolo 8

trodotto precedentemente. Aggiungendo il postulato 1, si ricava che la probabilità soggettiva qui definita soddisfa il sistema assiomatico precedente. 15 Non muta pertanto la struttura sintattica della probabilità. Piuttosto, si fornisce a tale struttura un’interpretazione concreta che può risultare assai utile nelle applicazioni operative del calcolo delle probabilità, e in particolare nell’inferenza statistica. In effetti la nozione di probabilità soggettiva ha una valenza più ampia rispetto a quella di probabilità frequentista poiché esistono dei casi nei quali all’evento non è associabile uno schema di prove ripetute e di frequenze osservabili (eventi unici, eventi astratti ecc.). Possiamo anche vedere la probabilità frequentista come caso particolare (anche se molto rilevante) della probabilità soggettiva. Ciò accade quando la valutazione soggettiva della probabilità di un evento, espressa da un dato individuo, utilizza l’informazione derivante dalle frequenze dell’evento stesso osservate in diverse prove. L’approccio inferenziale basato su di una concezione soggettivista della probabilità è detto Bayesiano. Esso costituisce un’alternativa all’approccio frequentista e in alcune situazioni porta a risultati (inferenze induttive) differenti da quest’ultimo, pur in presenza degli stessi dati statistici. Ciò è dovuto essenzialmente al fatto che esso utilizza un’informazione che l’approccio frequentista non usa: la probabilità a priori. Sebbene l’utilizzo della probabilità a priori, ove effettivamente disponibile, sia unanimemente accettato, è molto più controverso il problema dell’uso di probabilità a priori nel caso più comune in cui queste informazioni non siano disponibili o siano frutto di valutazioni soggettive.

15 ▶ Si osservi che l’unicità della misura di probabilità soggettiva è riferita al contesto di valutazione nel quale il soggetto esprime la propria opinione, date le informazioni a sua disposizione. ◀


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 195

Probabilità: concetti di base 195

Verifica Indicare se le seguenti affermazioni sono vere o false. Le risposte sono in fondo al libro. V

F

8.1 La probabilità è un concetto primitivo.

8.2 I postulati del calcolo delle probabilità sono dimostrabili.

8.3 Un evento è uno dei possibili risultati di una prova.

8.4 Il lancio di un dado è una prova con un’infinità numerabile di possibili risultati.

8.5 Un evento può essere costituito da sottoeventi.

8.6 Nell’algebra di Boole sono definite tre operazioni fondamentali: la negazione, l’intersezione e l’unione.

8.7 L’evento B « C non è sempre contenuto in C.

8.8 Lo spazio campionario contiene l’insieme dei possibili eventi elementari.

8.9 L’evento impossibile ∆ appartiene allo spazio campionario.

8.10 Due eventi A e B si dicono incompatibili se A » B = ∆.

8.11 La probabilità di un evento può essere un valore negativo.

8.12 (A « B) = ∆ fi P(A » B) = P(A) + P(B).

8.13 [P(B) = 0] fi P(B « A) = P(A).

8.14 Nella prova “lancio di un dado” vi sono 6 eventi elementari, tutti ugualmente possibili.

8.15 La probabilità condizionata di A dato B è il rapporto tra la probabilità di A e la probabilità di B.

8.16 Se due eventi A e B sono indipendenti allora P(A | B) = P(A) e P(B | A) = P(B).

8.17 Il teorema di Bayes permette di calcolare la probabilità a priori di un evento A.

8.18 La probabilità di un evento A, possibile causa di un successivo evento B non osservato, viene chiamata probabilità a posteriori di A dato B.

8.19 Nell’impostazione frequentista della probabilità, ogni prova viene ripetuta sempre con gli stessi risultati.

8.20 L’impostazione soggettivista si basa sul principio del campionamento ripetuto.


08txtI.qxp_BORRA_2013 12/01/21 16:06 Pagina 196


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.