Teorema límite central Curso Probabilidad y Estadística Marco Alvarado Peña
Sesión 8
Objetivos de Aprendizaje Que el estudiante sea capaz de:
1. Conocer los principales conceptos de Distribuciones Continuas. 2. Seleccionar la distribución que mejor se ajuste el análisis que se requiera para determinada situación. 3. Entender la relación del Teorema del Límite central y la Distribución Normal. 4. Aplicar los conceptos relacionados al Teorema del Límite central y la Distribución Normal en situaciones cuyos datos presenten un comportamiento normal.
2
Ă?ndice Teorema lĂmite central‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌1 Objetivos de Aprendizaje‌‌‌‌‌‌‌‌‌‌‌‌‌.................2 A considerar‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌..4 ÂżQuĂŠ es una DistribuciĂłn Muestral de đ?‘ż? ‌‌‌‌‌‌‌‌‌‌5 Teorema LĂmite Central‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌..6 Consecuencias del Teorema de LĂmite Central‌‌‌‌‌‌‌‌7 Ejemplo 8.1 (Walpole)‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌..‌‌.9 Ejemplo‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌.11 Ejemplo Walpole 2‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌.13 Ejemplo 8.14‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌.13 Referencias‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌.19
3
A considerar Como parte de su formación en Probabilidad y Estadística I, es importante que recuerde algunas consideraciones particulares tales como: - Inferencia estadística trata de generalizaciones y predicciones. - Se pueden muestrear poblaciones pequeñas y grandes para inferir por una población infinita. - Se calcula un estadístico a partir de una muestra que se selecciona de la población el cual tendrá un comportamiento similar al de lapoblación de la cual se extrae. - Estadístico es una variable aleatoria que depende solo de la muestra por tanto debe tener una distribución de probabilidad asociado para calcular el apropiado. - Análisis estadístico versus estadística ¿qué es?. - La distribución de probabilidad de un estadístico se llama distribución muestral. - La distribución muestral depende de la distribución de la población, del tamaño de muestra y el método de selección de estas.
4
̅? ¿Qué es una Distribución Muestral de 𝑿 - Una Distribución muestral es una distribución que describe la variablidad de los promedios muestrales alrededor de la población µ. Este mismo concepto aplica para hablar de la dispersión que presentes éstos promedios alrededor de la población y cuyos valores están representados por la varianza muestral s2 alrededor de σ2 o mejor dicho alrededor de la varianza poblacional.
- La primera distribución muestral que se estudia es la de la media
̅. 𝑿
5
Teorema LĂmite Central Si una poblaciĂłn tiene media Îź y desviaciĂłn tĂpica Ďƒ, y tomamos muestras de tamaĂąo n (n>30, Ăł cualquier tamaĂąo si la poblaciĂłn es "normal"), las medias de estas muestras siguen aproximadamente la distribuciĂłn:
Ě… es la media de una muestra aleatoria de tamaĂąo n, tomada de una Si đ?‘ż poblaciĂłn con media Îź y varianza finita Ďƒ2, entonces la forma lĂmite de la distribuciĂłn de: đ?‘?=
đ?‘‹Ě… − đ?œ‡ đ?œŽ / √đ?‘›
A medida que đ?&#x2018;&#x203A; â&#x2020;&#x2019; â&#x2C6;&#x17E;, es la distribuciĂłn normal estĂĄndar n(z; 0,1). La aproximaciĂłn norma para đ?&#x2018;&#x2039; â&#x2C6;&#x2019; por lo general serĂĄ buena si n â&#x2030;Ľ 30, siempre y cuando la distribuciĂłn de la poblaciĂłn no sea muy asimĂŠtrica. Si n < 30, la aproximaciĂłn serĂĄ buena sĂłlo si la poblaciĂłn no es muy diferente de una distribuciĂłn normal y, como antes se estableciĂł, si se sabe que la poblaciĂłn es normal, la distribuciĂłn muestral de Xbarra seguirĂĄ siendo una distribuciĂłn normal exacta, sin importar quĂŠ tan pequeĂąo sea el tamaĂąo de las muestras. 6
El tamaĂąo de la muestra n = 30 es un lineamiento para el teorema del lĂmite central, sin embargo, como indica el planteamiento del teorema, la suposiciĂłn de normalidad en la distribuciĂłn de Xbarra se vuelve mĂĄs precisa a medida que n se hace mĂĄs grande. Es decir, si tomamos muestras de una poblaciĂłn con distribuciĂłn
Ě&#x2026; aĂşn desconocida, ya sea finita o infinita, la distribuciĂłn muestral de đ?&#x2018;ż serĂĄ aproximadamente normal con media Îź y varianza Ď&#x192;2/n, siempre que el tamaĂąo de la muestra sea grande. Este asombroso resultado es una consecuencia inmediata del siguiente teorema, que se conoce como teorema del lĂmite central.
Consecuencias del Teorema de LĂmite Central 1- Permite averiguar la probabilidad de que la media de una muestra concreta estĂŠ en un cierto intervalo. 2- Permite calcular la probabilidad de que la suma de los elementos de una muestra estĂŠ, a priori, en un cierto intervalo:
â&#x2C6;&#x2018;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013;= 1 đ?&#x2018;Ľđ?&#x2018;&#x2013; â&#x2020;&#x2019; đ?&#x2018; (đ?&#x2018;&#x203A;đ?&#x153;&#x2021;, đ?&#x153;&#x17D;â&#x2C6;&#x161;đ?&#x2018;&#x203A;) 7
3- Inferir la media de la poblaci贸n a partir de una muestra.
Para visualizar concretamente 茅ste teorema, revisemos este ejemplo del libro de Walpole, preste atenci贸n:
8
Ejemplo 8.1 (Walpole) Una empresa elĂŠctrica fabrica focos que tienen una duraciĂłn que se distribuye aproximadamente en forma normal, con media de 800 horas y desviaciĂłn estĂĄndar de 40 horas. Encuentre la posibilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. SoluciĂłn
Ě&#x2026; serĂĄ aproximadamente normal, n = 16, La distribuciĂłn muestral de đ?&#x2018;ż desviaciĂłn estĂĄndar 40 horas con đ?&#x153;&#x2021;đ?&#x2018;ĽĚ&#x2026; = 800 y đ?&#x153;&#x17D;đ?&#x2018;ĽĚ&#x2026; =
40 â&#x2C6;&#x161;16
= 10. La
probabilidad que se desea estĂĄ dada por el ĂĄrea de la regiĂłn sombreada de la figura 1.
Fig 1. Ă rea para el ejemplo 8.13
đ?&#x2018;ĽĚ&#x2026; = đ?&#x2018;&#x17D; đ?&#x2018;&#x2122;đ?&#x2018;&#x17D; đ?&#x2018;&#x2013;đ?&#x2018;&#x203A;đ?&#x2018;?Ăłđ?&#x2018;&#x201D;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013;đ?&#x2018;Ąđ?&#x2018;&#x17D;, đ?&#x2018;&#x2019;đ?&#x2018;&#x2122; đ?&#x2018;Łđ?&#x2018;&#x17D;đ?&#x2018;&#x2122;đ?&#x2018;&#x153;đ?&#x2018;&#x; đ?&#x2018;?đ?&#x2018;&#x153;đ?&#x2018;&#x; đ?&#x2018;&#x2019;đ?&#x2018;&#x2122; đ?&#x2018;&#x17E;đ?&#x2018;˘đ?&#x2018;&#x2019; đ?&#x2018;&#x203A;đ?&#x2018;&#x153;đ?&#x2018; đ?&#x2018;&#x2019;đ?&#x2018; đ?&#x2018;ĄĂĄđ?&#x2018;&#x203A; đ?&#x2018;?đ?&#x2018;&#x;đ?&#x2018;&#x2019;đ?&#x2018;&#x201D;đ?&#x2018;˘đ?&#x2018;&#x203A;đ?&#x2018;Ąđ?&#x2018;&#x17D;đ?&#x2018;&#x203A;đ?&#x2018;&#x2018;đ?&#x2018;&#x153;
9
Es correspondencia con đ?&#x2018;ĽĚ&#x2026; = 775, encontramos que
đ?&#x2018;§=
775 â&#x2C6;&#x2019; 800 = â&#x2C6;&#x2019;2.5 10
Lo anterior al aplicar la distribuciĂłn normal estĂĄndar y con el estadĂstico Z. Y por tanto, đ?&#x2018;&#x192; (đ?&#x2018;&#x2039;Ě&#x2026; < â&#x2C6;&#x2019;775) = đ?&#x2018;&#x192; (đ?&#x2018;? < â&#x2C6;&#x2019;2.5) = 0.0062
10
R/ La probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas es apenas un 0,62%, lo cual es muy baja y habrĂa que revisar el proceso del Âżpor quĂŠ de ĂŠste resultado?. Para reafirmar el concepto de TLC (Teorema de LĂmite Central) revise este otro ejemplo que se le muestra a continuaciĂłn: Ejemplo Las bolsas de sal envasadas por una mĂĄquina tienen Îź = 500 g y Ď&#x192; = 35 g. Las bolsas se empaquetaron en cajas de 100 unidades. Se pide: 1. Calcular la probabilidad de que la medida de los pesos de las bolas de un paquete sea menor que 495 g. Con los valores que se proporcionan se tiene que:
đ?&#x2018; (500,
35 â&#x2C6;&#x161;100
)
đ?&#x2018;?(đ?&#x2018;ĽĚ&#x2026; < 495) = đ?&#x2018;? (đ?&#x2018;§ <
đ?&#x2018; (500,3.5) 495 â&#x2C6;&#x2019; 500 ) = đ?&#x2018;?(đ?&#x2018;§ < â&#x2C6;&#x2019;1.43) 3.5
= đ?&#x2018;?(đ?&#x2018;§ > 1.43)
11
Lo que es igual a 1 â&#x20AC;&#x201C; đ?&#x2018;?(đ?&#x2018;§ < 1.43) = 0.0764 R/ la probabilidad de que los pesos de las bolsas sea menor a 495 g = 7,64%
2. Calcular la probabilidad de que una caja 100 de bolsas pese mĂĄs de 51kg. Aplicando la misma tĂŠcnica que para el punto 1, se tiene que:
đ?&#x2018; (500 â&#x2C6;&#x2014; 100,35â&#x2C6;&#x161;100) đ?&#x2018;? (â&#x2C6;&#x2018; đ?&#x2018;ĽĚ&#x2026; > 51 000) = đ?&#x2018;? (đ?&#x2018;§ >
đ?&#x2018; (50000,350) 51 000 â&#x2C6;&#x2019; 50 000 ) = đ?&#x2018;?(đ?&#x2018;? > 2.86) 350
= 1 â&#x2C6;&#x2019; đ?&#x2018;?(đ?&#x2018;? < 2.86) = 0.0021 R/ La probabilidad de que una caja de 100 bolsas pese mĂĄs de 51 kg es apenas un 0,21%
Otro ejemplo del TLC es el que se le muestra a continuaciĂłn:
12
Ejemplo Walpole 2 Ejemplo 8.14 Un importante proceso de fabricación produce partes de componentes cilíndricos para la industria automotriz. Es importante que el proceso produzca partes que tengan una media de 5 milímetros. El ingeniero involucrado hace la conjetura de que la media de la población es de 5,0 milímetros. Se lleva a cabo un experimento en el que 100 partes elaboradas por el proceso se seleccionan al azar y se mide el diámetro de cada una de ellas. Se sabe que la desviación estándar de la población es σ = 0.1. El experimento indica un diámetro promedio de la muestra 𝑥̅ = 5.027 milímetros. ¿Esta información de la muestra parece apoyar o refutar la conjetura del ingeniero?
Solución Este ejemplo refleja la clase de problema que se plantea a menudo y que resuelve con la maquinaria de prueba de hipótesis que se introduce en los capítulos posteriores. No utilizaremos aquí el formalismo asociado con la prueba de hipótesis pero ilustraremos los principios y la lógica que se utilizan. 13
Si los datos apoyan o rechazan la conjetura depende de la probabilidad de que datos similares a los que se obtuvieron en este experimento (đ?&#x2018;ĽĚ&#x2026; = 5.027) pueden ocurrir con facilidad cuando de hecho Îź = 5.0 (Ver figura 2). En otras palabras. ÂżQuĂŠ tan probable es que se pueda obtener đ?&#x2018;ĽĚ&#x2026; â&#x2030;Ľ 5.027 con n = 100 si la media de la poblaciĂłn ÂżEs Îź = 5.0?.
Fig 2. Esquema de la SoluciĂłn planteada
Si esta probabilidad sugiere que đ?&#x2018;ĽĚ&#x2026; = 5.027 no es poco razonable, la jefatura no se rechaza. Si la probabilidad es bastante baja, se puede argumentar con certidumbre que los datos no poyan la conjetura de Îź = 5.0. La probabilidad que elijamos calcular estĂĄ dada por: đ?&#x2018;&#x192;đ?&#x2018;&#x;[|đ?&#x2018;&#x2039;Ě&#x2026; â&#x2C6;&#x2019; 5| â&#x2030;Ľ 0.027] 14
En otras palabras, si la medida Îź = 5. ÂżCuĂĄl es la probabilidad de que đ?&#x2018;&#x2039;Ě&#x2026; se desvie a la mĂĄs en 0.027 milĂmetros? El planteamiento de los cĂĄlculos es: đ?&#x2018;&#x192;[|(đ?&#x2018;&#x2039;Ě&#x2026; â&#x2C6;&#x2019; 5)| â&#x2030;Ľ 0.027] = đ?&#x2018;&#x192;[(đ?&#x2018;&#x2039;Ě&#x2026; â&#x2C6;&#x2019; 5) â&#x2030;Ľ 0.027] + đ?&#x2018;&#x192;[(đ?&#x2018;&#x2039;Ě&#x2026; â&#x2C6;&#x2019; đ?&#x153;&#x2021;) â&#x2030;¤ â&#x2C6;&#x2019;0.027] đ?&#x2018;&#x2039;Ě&#x2026; â&#x2C6;&#x2019; 5 = 2đ?&#x2018;&#x192; ( ) â&#x2030;Ľ 2.7 0.1â &#x201E;â&#x2C6;&#x161;100 AquĂ simplemente estandarizamos đ?&#x2018;&#x2039;Ě&#x2026; de acuerdo con el teorema del lĂmite central. Si la conjetura Îź = 5.0 es cierta,
2đ?&#x2018;&#x192; [
đ?&#x2018;&#x2039;Ě&#x2026; â&#x2C6;&#x2019; 5.0 0.1â &#x201E;â&#x2C6;&#x161;100
đ?&#x2018;&#x2039;Ě&#x2026;â&#x2C6;&#x2019;5.0 0.1 / â&#x2C6;&#x161;100
đ?&#x2018;&#x2019;đ?&#x2018; đ?&#x2018; (0,1) . AsĂ:
â&#x2030;Ľ 2.7] = 2đ?&#x2018;&#x192;[đ?&#x2018;? â&#x2030;Ľ 2.7] = 2(0.0035) = 0.007
De esta manera se experimenta por casualidad una đ?&#x2018;ĽĚ&#x2026; que estĂĄ a 0.027 milĂmetros de la media en solo siete de 1000 experimentos. Como resultado, este experimento con đ?&#x2018;ĽĚ&#x2026; = 5.027 ciertamente no proporciona evidencia que apoye la conjetura de que Îź = 5.0.
15
Ejemplo La cantidad de tiempo que le toma al cajero del banco atender a un cliente es una variavle aleatoria con una media de Âľ= 3.2 minutos y una desviaciĂłn Ď&#x192; =1.6 minutos. SĂ se observa una muestra aleatoria de 64 clientes, calcule la probabilidad de que el tiempo medio que el cliente en la ventanilla del cajero, sea de: A lo sumo 2.7 minutos Es correspondencia con đ?&#x2018;ĽĚ&#x2026; = 2.7, encontramos que z= (
2.7â&#x2C6;&#x2019;3.2 1.6/â&#x2C6;&#x161;64
)
= -2.5
Lo anterior al aplicar la distribuciĂłn normal estĂĄndar y con el estadĂstico Z. Y por tanto, đ?&#x2018;&#x192; (đ?&#x2018;&#x2039;Ě&#x2026; < â&#x2C6;&#x2019;2.7) = đ?&#x2018;&#x192; (đ?&#x2018;? < â&#x2C6;&#x2019;2.5) = 0.0062
16
MĂĄs de 3.5 minutos Es correspondencia con đ?&#x2018;ĽĚ&#x2026; = 3.5, encontramos que z= (
3.5â&#x2C6;&#x2019;3.2 1.6/â&#x2C6;&#x161;64
)
= 1.5
Lo anterior al aplicar la distribuciĂłn normal estĂĄndar y con el estadĂstico Z. Y por tanto, đ?&#x2018;&#x192; (3.5 < đ?&#x2018;&#x2039;Ě&#x2026; ) = 1 â&#x2C6;&#x2019; đ?&#x2018;&#x192; (3.5 < 1.5) = 1 â&#x2C6;&#x2019; .9332 = 0.068
17
Ejemplo El viaje en autobus especial para ir a un campus de una universidad al campus de otra, en una ciudad toma en promedio 28 minutos, con Ď&#x192;= 5 minutos. En cierta semana un autobus hizo el recorrido 40 veces. ÂżCuĂĄl es la probabildad de que el tiempo đ?&#x2018;ĽĚ&#x2026; sea mayo a 30 minutos, suponga que el tiempo promedo se redondea al mĂĄs cercano? Es correspondencia con đ?&#x2018;ĽĚ&#x2026; = 30.5, encontramos que z= (
30.5â&#x2C6;&#x2019;28 5/â&#x2C6;&#x161;40
)
= 3.16
Lo anterior al aplicar la distribuciĂłn normal estĂĄndar y con el estadĂstico Z. Y por tanto, đ?&#x2018;&#x192; (30.5 < đ?&#x2018;&#x2039;Ě&#x2026; ) = 1 â&#x2C6;&#x2019; đ?&#x2018;&#x192; (3.5 < 1.5) = 1 â&#x2C6;&#x2019; .9992 = 0.0008
18
Referencias Moya, M. y Robles,N. (2010). Probabilidad y Estad铆stica: Un Enfoque te贸rico y pr谩ctico. Cartago: Tecnol贸gico de Costa Rica.
19