1
PROBABILIDAD Y ESTADĂ?STICA Material para estudiantes de secundaria y universidad Desarrollado por: Lic. Marco Antonio Cubillo Murray PARTE 2
2018
LIC. MARCO ANTONIO CUBILLO MURRAY
2
Contenido INTRODUCCIÓN ................................................................................................................................... 3 Ejemplo................................................................................................................................................ 3 Forma general del teorema de Bayes ................................................................................................. 5 Revisiones de probabilidad adicionales .............................................................................................. 6
LIC. MARCO ANTONIO CUBILLO MURRAY
3
INTRODUCCIÓN El teorema de Bayes se utiliza para incorporar información adicional cuando ésta se encuentra disponible y ayuda a crear probabilidades revisadas o probabilidades posteriores, a partir de las probabilidades originales o probabilidades previas. Esto significa que es posible tomar datos nuevos o recientes y, luego, revisar y mejorar nuestras estimaciones de probabilidad antiguas para un evento.
Probabilidades previas Proceso de Bayes
Probabilidades previas
Información nueva
Ejemplo Consideremos el ejemplo de una taza que contiene dos dados idénticos en apariencia. Uno, es legal (balanceado) y el otro está cargado (sesgado). La probabilidad de obtener un 3 en el dado legal es 1⁄6, o 0.0166. La probabilidad de lanzar el mismo número en el dado cargado es 0.60. No tenemos idea de cuál es cada uno de los dados, pero seleccionamos uno al azar y lo lanzamos. El resultado es un 3. Dada la pieza adicional de información, ¿podemos encontrar la probabilidad (revisada) de que el dado lanzado haya sido el legal? ¿podemos determinar la probabilidad de que el dado lanzado haya sido el cargado? La respuesta a estas preguntas es sí, y lo hacemos mediante el uso de la fórmula de probabilidad conjunta según Bayes y la dependencia estadística.
LIC. MARCO ANTONIO CUBILLO MURRAY
4
En primer lugar, verificamos la informaciĂłn y las probabilidades disponibles. Sabemos , por ejemplo, que como el dado a lanzar se seleccionĂł al azar, la probabilidad de que sea el legal o el cargado es de 0.50: đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) = 0.50
y
đ?‘ƒ(đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) = 0.50
TambiĂŠn sabemos que: đ?‘ƒ(3 âˆŁ đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) = 0.166 y
đ?‘ƒ(3 âˆŁ đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) = 0.60
A continuaciĂłn, calculamos las probabilidades conjuntas: đ?‘ƒ(3 đ?‘Ś đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) y đ?‘ƒ(3 đ?‘Ś đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) utilizando la fĂłrmula đ?‘ƒ(đ??´đ??ľ) = đ?‘ƒ(đ??´ âˆŁ đ??ľ) Ă— đ?‘ƒ(đ??ľ): đ?‘ƒ(3 đ?‘Ś đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) = đ?‘ƒ(3 âˆŁ đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) Ă— đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) đ?‘ƒ(3 đ?‘Ś đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) = (0.166)(0.50) = 0.083 đ?‘ƒ(3 đ?‘Ś đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) = đ?‘ƒ(3 âˆŁ đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) Ă— đ?‘ƒ(đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) đ?‘ƒ(3 đ?‘Ś đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) = (0.60)(0.50) = 0.300 Un 3 puede ocurrir en combinaciĂłn con el estado “dado legalâ€? o en combinaciĂłn con el estado “dado cargadoâ€?. La suma de sus probabilidades nos proporciona la probabilidad incondicional o marginal de un 3 en el lanzamiento; a saber đ?‘ƒ(3) = 0.083 + 0.300 = 0.383. Si ocurre un 3, y si no sabemos quĂŠ dado fue lanzado, la probabilidad de que el dado utilizado haya sido el legal es: đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™ âˆŁ 3) =
đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™ đ?‘Ś 3) 0.083 = = 0.22 đ?‘ƒ(3) 0 − 383
La probabilidad de que el dado lanzado haya sido el cargado es: đ?‘ƒ(đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ âˆŁ 3) =
đ?‘ƒ(đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ đ?‘Ś 3) 0.300 = = 0.78 đ?‘ƒ(3) 0 − 383
Estas dos probabilidades condicionales se llaman probabilidades revisadas o posteriores para el prĂłximo lanzamiento del dado. Antes de que el dado fuera lanzado en el ejemplo que estamos analizando, lo mĂĄs que podĂamos decir era que habĂa una posibilidad de 50 – 50 de que fuera legal (0.50 de probabilidad) y una posibilidad de 50 – 50 de que estuviera cargado. Sin embargo, despuĂŠs de lanzar el dado estamos en condiciones de revisar nuestras estimaciones de probabilidad previa. La nueva estimaciĂłn posterior es que hay una probabilidad de 0.78 de que el dado lanzado haya estado cargado y solo un 0.22 de probabilidad de que no lo haya estado.
LIC. MARCO ANTONIO CUBILLO MURRAY
5
En algunos casos es Ăştil emplear una tabla para realizar los cĂĄlculos asociados con el teorema de Bayes, veamos su uso siguiendo el ejemplo de los dados. Tabla de los cĂĄlculos de Bayes dado que ha sucedido el evento B Estado de la Naturaleza A A'
P(BâˆŁ Estado de la Naturaleza) P(AâˆŁB) P(BâˆŁA')
Probabilidad Previa
Probabilidad Conjunta =P(B y A)
Ă—P(A) Ă—P(A')
=
đ?‘ƒ(đ??ľ đ?‘Ś đ??´) đ?‘ƒ(đ??ľ)
Probabilidad Posterior P(B y A)=P(AâˆŁB) P(B y A')=P(A'âˆŁB)
Tabla de los cĂĄlculos de Bayes dado que se ha obtenido un 3 Estado de la Naturaleza Dado legal Dado cargado
P(BâˆŁ Estado de la Naturaleza) 0.166 0.600
Probabilidad Previa
Probabilidad Conjunta
Probabilidad Posterior
Ă— 0.5
=0.083
0.083â „ 0.383 = 0.22
Ă— 0.5
=0-300 P(3)=0.383
0.300â „ 0.383 = 0.78
Forma general del teorema de Bayes Las probabilidades revisadas tambiĂŠn se pueden calcular de una manera mĂĄs directa mediante una forma general para el teorema de Bayes. đ?‘ƒ(đ??´ âˆŁ đ??ľ) =
đ?‘ƒ(đ??ľ âˆŁ đ??´)đ?‘ƒ(đ??´) đ?‘ƒ(đ??ľ âˆŁ đ??´)đ?‘ƒ(đ??´) + đ?‘ƒ(đ??ľ âˆŁ đ??´â€˛)đ?‘ƒ(đ??´â€˛)
Donde A'=el complemento del evento A; por ejemplo, si A es el evento “dado legalâ€?, entonces A' es “dado cargadoâ€? Para nuestros propĂłsitos tendrĂamos entonces:
đ?‘ƒ(đ?‘‘đ?‘Žđ?‘‘đ?‘œ đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™ âˆŁ đ?‘ đ?‘’ đ?‘œđ?‘?đ?‘Ąđ?‘˘đ?‘Łđ?‘œ đ?‘˘đ?‘› 3) đ?‘ƒ(3 âˆŁ đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™)đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) = đ?‘ƒ(3 âˆŁ đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™)đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) + đ?‘ƒ(3 âˆŁ đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ)đ?‘ƒ(đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ)
đ?‘ƒ(đ?‘‘đ?‘Žđ?‘‘đ?‘œ đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™ âˆŁ đ?‘ đ?‘’ đ?‘œđ?‘?đ?‘Ąđ?‘˘đ?‘Łđ?‘œ đ?‘˘đ?‘› 3) = LIC. MARCO ANTONIO CUBILLO MURRAY
(0.166)(0.50) (0.166)(0.50) + (0.60)(0.50)
6
đ?‘ƒ(đ?‘‘đ?‘Žđ?‘‘đ?‘œ đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™ âˆŁ đ?‘ đ?‘’ đ?‘œđ?‘?đ?‘Ąđ?‘˘đ?‘Łđ?‘œ đ?‘˘đ?‘› 3) =
0.083 = 0.22 0.383
Revisiones de probabilidad adicionales Aunque una revisiĂłn de probabilidades previas suele proporcionar estimaciones Ăştiles de probabilidades posteriores, es posible obtener informaciĂłn adicional al realizar el experimento por segunda vez. Si vale la pena financieramente, un tomador de decisiones puede incluso decidir quĂŠ harĂĄ mĂĄs revisiones. Siguiendo nuestro ejemplo, vamos a intentar obtener mĂĄs informaciĂłn sobre las probabilidades posteriores de que el dado que se acaba de lanzar sea legal o estĂŠ cargado. Para esto, lanzaremos el dado por segunda vez y de nuevo obtenemos un 3. Nos preguntamos entonces ÂżCuĂĄles son las probabilidades revisadas adicionales? Vamos a responder a esto, siguiendo el mismo proceso, pero con una Ăşnica excepciĂłn. Las probabilidades P(legal) = 0.50 y P(cargado) = 0.50 siguen siendo las mismas, pero ahora debemos calcular: P(3, 3âˆŁlegal)= (0.166)(0.166) = 0.027 P(3, 3âˆŁcargado) = (0.6)(0.6) = 0.36. Con estas probabilidades conjuntos de dos resultados de 3 en lanzamientos sucesivos, considerando dos tipos de dados, podemos revisar las probabilidades: đ?‘ƒ(3, 3 đ?‘Ś đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) = đ?‘ƒ(3, 3 âˆŁ đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) Ă— đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) đ?‘ƒ(3, 3 đ?‘Ś đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) = (0.027) Ă— (0.50) = 0.013 đ?‘ƒ(3, 3 đ?‘Ś đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) = đ?‘ƒ(3, 3 âˆŁ đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) Ă— đ?‘ƒ(đ?‘?đ?‘Žđ?‘&#x;đ?‘”đ?‘Žđ?‘‘đ?‘œ) đ?‘ƒ(3, 3 đ?‘Ś đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™) = (0.36) Ă— (0.50) = 0.18
LIC. MARCO ANTONIO CUBILLO MURRAY
7
Por lo tanto, la probabilidad de obtener dos resultados de 3, una probabilidad marginal, es 0.013 + 0.18 = 0.193, la suma de las dos probabilidades conjuntas: đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™ | 3, 3) =
đ?‘ƒ(3, 3 y legal) đ?‘ƒ(3, 3)
đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™ | 3, 3) =
0.013 = 0.067 0.193
đ?‘ƒ(cargado | 3, 3) = đ?‘ƒ(đ?‘™đ?‘’đ?‘”đ?‘Žđ?‘™ | 3, 3) =
đ?‘ƒ(3, 3 y cargado) đ?‘ƒ(3, 3) 0.18 = 0.933 0.193
ÂżQuĂŠ ha logrado este segundo lanzamiento? Antes de lanzar el dado por primera vez, sĂłlo sabĂamos que habĂa una probabilidad de 0.50 de que fuera legal, o bien estuviera cargado. Al lanzar el dado la primera vez en el ejemplo que estamos estudiando, fuimos capaces de revisar estas probabilidades: probabilidad de que el dado sea legal = 0.22 probabilidad de que el dado estĂŠ cargado = 0.78 Ahora, despuĂŠs del segundo lanzamiento en este ejemplo, nuestras revisiones refinadas nos indican que: probabilidad de que el dado sea legal = 0.067 probabilidad de que el dado estĂŠ cargado = 0.933 Este tipo de informaciĂłn puede ser muy valiosa en la toma de decisiones empresariales.
LIC. MARCO ANTONIO CUBILLO MURRAY