Ciencias Exactas, Ingeniería y Tecnología
Licenciatura en Enseñanza de las matemáticas 2° Semestre Módulo 4. Probabilidad y Estadística Unidad 3. Inferencia estadística
Módulo 4 Unidad 3. Inferencia estadística
IMPORTANTE
Excepto donde el contenido así lo especifique, esta obra está bajo una Licencia de Creative Commons
Material recopilado y desarrollado por académicos externos contratados Ex profeso para los Programas educativos de la DCEIT de la Universidad Abierta y a Distancia de México, para fines educativos. (UnADM), 2016.
UNADM | DCEIT | EM | EMPE
2
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
Semana 8 Las siguientes dos desigualdades nos proporcionan estimaciones para el cĂĄlculo de probabilidades. NĂłtese que para la primera conocemos el valor esperado E đ?‘‹ = đ?œ‡ y para la segunda conocemos E(X)=Âľ y đ?‘‰đ?‘Žđ?‘&#x; đ?‘‹ = đ?œŽ - . Chebyshev y Markov fueron dos personajes que hicieron contribuciones al desarrollo de la probabilidad. A continuaciĂłn se propone una actividad complementaria, para ubicarnos en el contexto histĂłrico en el que tuvieron lugar tales desarrollos
Puedes revisar brevemente algunos acontecimientos históricos contemporåneos de Chebyshev y Markov al igual que algunos datos biogråficos de ambos. Haciendo uso de la historia para enseùar cålculo de‌ [Archivo PDF] Disponible en: https://www.alammi.info/revista/numero2/sal_0014.pdf
Desigualdad de Markov. La probabilidad de que una variable aleatoria � , la cual no toma valores negativos, tome valores mayores o iguales a un valor �, (� > 0), viene dada por E � P �≼� ≤ � En la desigualdad anterior no se especifica la función de distribución de �.
Ejemplo 1 Cierta lĂnea de camiones asegura que el valor esperado del viaje en autobĂşs de la Ciudad de MĂŠxico a Veracruz es de 5 horas. ÂżCuĂĄl es la probabilidad de que el viaje sea de 6 horas o mĂĄs? Esto es 5 P đ?‘‹â‰Ľ6 ≤ . 6
UNADM | DCEIT | EM | EMPE
3
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
Hacemos ĂŠnfasis en la restricciĂłn de la desigualdad de Markov, la variable tiene que tomar valores positivos. Para aplicar dicha desigualdad no necesitamos conocer la distribuciĂłn de la variable pero si el valor esperado. No necesitamos conocer la desviaciĂłn estĂĄndar. A continuaciĂłn se enuncia el teorema de Chebyshev, para poderlo aplicar necesitamos conocer el valor de la media y la desviaciĂłn estĂĄndar. En ningĂşn momento se especifica la distribuciĂłn de la variable.
Teorema de Chebyshev. La probabilidad de que una variable aleatoria đ?&#x2018;&#x2039; tome un valor dentro de k desviaciones estĂĄndares respecto a la media es por lo menos 1 â&#x2C6;&#x2019; 1/đ?&#x2018;&#x2DC; - . Esto es, 1 P đ?&#x153;&#x2021; â&#x2C6;&#x2019; đ?&#x2018;&#x2DC;đ?&#x153;&#x17D; < đ?&#x2018;&#x2039; < đ?&#x153;&#x2021; + đ?&#x2018;&#x2DC;đ?&#x153;&#x17D; â&#x2030;Ľ 1 â&#x2C6;&#x2019; - . đ?&#x2018;&#x2DC;
Ejemplo 1 Una variable aleatoria đ?&#x2018;&#x2039; tiene una media đ?&#x153;&#x2021; = 10, y una varianza đ?&#x153;&#x17D; - = 4 y una distribuciĂłn de probabilidad desconocida. Encuentre a) P(4 < đ?&#x2018;&#x2039; < 16), b) P( đ?&#x2018;&#x2039; â&#x2C6;&#x2019; 10 < 4) y c) P( đ?&#x2018;&#x2039; â&#x2C6;&#x2019; 10 > 6). P 4 < đ?&#x2018;&#x2039; < 16 = P 10 â&#x2C6;&#x2019; 3 2 < đ?&#x2018;&#x2039; < 10 + 3 2
â&#x2030;Ľ1â&#x2C6;&#x2019;
1 7 = . @ 2 8
P đ?&#x2018;&#x2039; â&#x2C6;&#x2019; 10 â&#x2030;¤ 4 = P(10-4< X < 10+4)=P 10 â&#x2C6;&#x2019; 2 2 < đ?&#x2018;&#x2039; < 10 + 2 2
>1â&#x2C6;&#x2019;
1 3 = . 2 4
P đ?&#x2018;&#x2039; â&#x2C6;&#x2019; 10 > 8 = 1 â&#x2C6;&#x2019; P 10 â&#x2C6;&#x2019; 8 < đ?&#x2018;&#x2039; < 10 + 8 = 1 â&#x2C6;&#x2019; P 10 â&#x2C6;&#x2019; 4 2 < đ?&#x2018;&#x2039; < 10 + 4 2 =
â&#x2030;¤
1 . 16
1 2E
Ejercicios 1. Una variable aleatoria đ?&#x2018;&#x2039; solamente toma valores no negativos, tiene distribuciĂłn desconocida con media đ?&#x153;&#x2021; = 5 y varianza desconocida. Utilice el teorema de Markov para estimar las siguientes: a. P(đ?&#x2018;&#x2039; > 4) b. P(đ?&#x2018;&#x2039; < 6) c. P(3 < đ?&#x2018;&#x2039; < 8)
UNADM | DCEIT | EM | EMPE
4
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
2. Una variable aleatoria đ?&#x2018;&#x2039;, tiene una distribuciĂłn desconocida con media đ?&#x153;&#x2021; = 5 y desviaciĂłn estĂĄndar đ?&#x153;&#x17D; = 1.2. Utilice la desigualdad de Chebyshev para estimar las siguientes probabilidades: a. P(3.5 < đ?&#x2018;&#x2039; < 8) b. P(1 < đ?&#x2018;&#x2039; < 6) c. P( â&#x2C6;&#x2019; 1 < đ?&#x2018;&#x2039; < 6) El siguiente enlace corresponde a un video en el cual se desarrollan ejercicios respecto a la desigualdad de Markov y Teorema de Chebyshev.
Zonaudearroba Facultad de IngenierĂa (2015) Probabilidad y EstadĂstica Clase 28 [Archivo de video] Disponible en: https://www.youtube.com/watch?v=Wr0cVwVW8yE
Teorema del lĂmite central Dada una variable aleatoria đ?&#x2018;&#x2039; sucede que en la mayorĂa de ocasiones no conocemos su funciĂłn de distribuciĂłn y tampoco conocemos su media đ?&#x153;&#x2021; y varianza đ?&#x153;&#x17D; - . Se utilizan la media muestral đ?&#x2018;&#x2039; y la varianza muestral đ?&#x2018;&#x2020; - para estimar los anteriores. A partir de este momento comenzamos con distribuciones muestrales. En la presentaciĂłn adjunta en formato pdf se habla acerca del teorema del lĂmite central.
http://www.calidad.com.mx/docs/art_64_1.pdf Revisa de la pĂĄgina 16 a la 18.
UNADM | DCEIT | EM | EMPE
5
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
Primeramente consideramos una poblaciĂłn que tiene distribuciĂłn normal con media đ?&#x153;&#x2021; y varianza đ?&#x153;&#x17D; - , ya sea que estĂĄn sean conocidas o desconocidas. Una pregunta que aparece de manera natural es ÂżcuĂĄl es la funciĂłn de distribuciĂłn del estadĂstico đ?&#x2018;&#x2039;? Si đ?&#x2018;&#x2039;G , đ?&#x2018;&#x2039;- , â&#x20AC;Ś đ?&#x2018;&#x2039;I es una muestra aleatoria de tamaĂąo đ?&#x2018;&#x203A; de una distribuciĂłn normal con media đ?&#x153;&#x2021; y varianza đ?&#x153;&#x17D; - , entonces 1 đ?&#x2018;&#x2039;= đ?&#x2018;&#x203A;
I
đ?&#x2018;&#x2039;K KLG
tiene una distribuciĂłn normal con media đ?&#x153;&#x2021;M = đ?&#x153;&#x2021; y varianza đ?&#x153;&#x17D;M- = đ?&#x153;&#x17D; - /đ?&#x2018;&#x203A;. Ejemplo 1 Supongamos que una poblaciĂłn se distribuye normalmente con media đ?&#x153;&#x2021; = 8 y varianza đ?&#x153;&#x17D; - = 4. Se toma una muestra de tamaĂąo 9. ÂżCuĂĄl es la probabilidad de que la media muestral diste de la media poblacional en no mĂĄs de 1? La pregunta anterior se traduce en calcular la siguiente probabilidad P( đ?&#x2018;&#x2039; â&#x2C6;&#x2019; đ?&#x153;&#x2021; < 1). Esto es P đ?&#x2018;&#x2039;â&#x2C6;&#x2019;đ?&#x153;&#x2021; <1 =P
đ?&#x2018;&#x2039;â&#x2C6;&#x2019;đ?&#x153;&#x2021; đ?&#x153;&#x17D;/ đ?&#x2018;&#x203A;
<
1 đ?&#x153;&#x17D;/ đ?&#x2018;&#x203A;
= P đ?&#x2018;? < 2 = 0.9544.
Si se toma una muestra aleatoria de tamaĂąo al menos 30 de una poblaciĂłn que tiene una distribuciĂłn arbitraria con media đ?&#x153;&#x2021; y varianza đ?&#x153;&#x17D; - entonces la distribuciĂłn del estadĂstico đ?&#x2018;&#x2039; serĂĄ normal. La diferencia importante ahora es que la distribuciĂłn es arbitraria y por lo tanto la aplicaciĂłn importante es que a pesar que dicha distribuciĂłn sea desconocida podemos calcular la distribuciĂłn de la media muestral đ?&#x2018;&#x2039;. Esto se conoce como el teorema del lĂmite central. Teorema del lĂmite central. Si đ?&#x2018;&#x2039; es la media de una muestra aleatoria de tamaĂąo đ?&#x2018;&#x203A; tomado de una poblaciĂłn con media đ?&#x153;&#x2021; y varianza finita đ?&#x153;&#x17D; - , entonces la forma lĂmite de la distribuciĂłn de đ?&#x2018;&#x2039;â&#x2C6;&#x2019;đ?&#x153;&#x2021; đ?&#x2018;?= , đ?&#x153;&#x17D;/ đ?&#x2018;&#x203A; cuando đ?&#x2018;&#x203A; â&#x2020;&#x2019; â&#x2C6;&#x17E;, es la distribuciĂłn normal estĂĄndar.
Ejemplo 1 Cierto tipo de diodo tiene una duraciĂłn distribuida en forma aproximadamente normal, con media igual a 15 000 horas y desviaciĂłn estĂĄndar de 300 horas. Obtenga la probabilidad de que una muestra aleatoria de 25 diodos tenga una vida media de menos de 14 900 horas.
UNADM | DCEIT | EM | EMPE
6
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
La distribuciĂłn muestral de đ?&#x2018;&#x2039; serĂĄ aproximadamente normal, con đ?&#x153;&#x2021;M = 15 000 y đ?&#x153;&#x17D;M = Para đ?&#x2018;&#x2039; =
GE TRRUGS RRR VR
@RR
= 60.
-S
= â&#x2C6;&#x2019;1.67. De esta forma P đ?&#x2018;&#x2039; < 14 900 = P(đ?&#x2018;? < â&#x2C6;&#x2019;1.67) = 0.0475.
Este valor representa el 4.75% de la poblaciĂłn lo cual es muy pequeĂąa. En el enlace se expone una introducciĂłn al teorema del lĂmite central y la distribuciĂłn muestral de la media.
Khanacademy. Teorema del lĂmite central. [Archivo de video] Disponible en: https://es.khanacademy.org/math/probability/statisticsinferential/sampling_distribution/v/central-limit-theorem?v=EC1bTDBz46k
UNADM | DCEIT | EM | EMPE
7