Ciencias Exactas, Ingeniería y Tecnología
Licenciatura en Enseñanza de las matemáticas 2° Semestre Módulo 4. Probabilidad y Estadística Unidad 3. Inferencia estadística
Módulo 4 Unidad 3. Inferencia estadística
IMPORTANTE
Excepto donde el contenido así lo especifique, esta obra está bajo una Licencia de Creative Commons
Material recopilado y desarrollado por académicos externos contratados Ex profeso para los Programas educativos de la DCEIT de la Universidad Abierta y a Distancia de México, para fines educativos. (UnADM), 2016.
UNADM | DCEIT | EM | EMPE
2
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
Semana 10 Las siguientes dos distribuciones se encuentran relacionadas con la varianza muestral đ?‘† " . La distribuciĂłn đ?œ’ " se utiliza para estimar la varianza poblacional đ?œŽ " ; asĂ que en esta secciĂłn hablamos acerca de la distribuciĂłn del estadĂstico
đ?‘› − 1 đ?‘†"
đ?œŽ"
en vez de solamente considerar
đ?‘† ". DistribuciĂłn đ??Œđ?&#x;? “chi-cuadradaâ€? Si đ?‘† " es la varianza de una muestra aleatoria de tamaĂąo đ?‘› que se toma de una poblaciĂłn normal que tiene la varianza đ?œŽ " , entonces el estadĂstico đ?‘› − 1 đ?‘†" đ?œ’ = = đ?œŽ"
-
"
,./
đ?‘‹, − đ?‘‹ đ?œŽ"
"
tiene una distribuciĂłn chi cuadrada con đ?&#x153;&#x2C6; = đ?&#x2018;&#x203A; â&#x2C6;&#x2019; 1 grados de libertad. Ejemplo 1 Supongamos que tomamos una muestra de tamaĂąo 10 para una poblaciĂłn normal. Calcular el valor đ?&#x153;&#x2019;1" tal que P đ?&#x153;&#x2019;1" < đ?&#x153;&#x2019; " = 0.95. Podemos utilizar el software GeoGebra para el cĂĄlculo de probabilidades. En GeoGebra 4 primero seleccionamos Probability Calculator (CĂĄlculos de Probabilidad).
UNADM | DCEIT | EM | EMPE
3
Módulo 4 Unidad 3. Inferencia estadística
En GeoGebra 5 cambiamos la vista a Cálculo de Probabilidades.
Para la ventana emergente, seleccionamos la ditribución Chi Cuadrado (Chi-Squared) y en grados de libertad df (degrees of freedom) seleccionamos 9 porque la muestra es de tamaño 10.
UNADM | DCEIT | EM | EMPE
4
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
Seleccionamos calcular la probabilidad por el lado derecho e introducimos la probabilidad dada que es 0.95 para obtener 3.3251. Ejemplo 2 Se toma una muestra de tamaĂąo 10 para una poblaciĂłn normal. Calcular P đ?&#x153;&#x2019; " < 5 . Ocupando nuevamente el software GeoGebra obtenemos lo siguiente
UNADM | DCEIT | EM | EMPE
5
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
Es decir la probabilidad buscada es 0.1657. Ejemplo 3 Un fabricante de lĂĄmparas asegura que su producto durarĂĄ 4 aĂąos con desviaciĂłn estĂĄndar de 1 aĂąo. Se toman 4 lĂĄmparas y tienen las siguientes duraciones: 2.3, 3, 4,2 y 4.5 aĂąos. ÂżCĂłmo podremos comprobar que la desviaciĂłn estĂĄndar es de un aĂąo? Primero se calcula la varianza đ?&#x2018;&#x2039; = 3.5 đ?&#x2018;&#x2020; " = 1.03 Y por lo tanto đ?&#x153;&#x2019;" = 3 â&#x2C6;&#x2014;
/.;< /
= 3.09.
La variable aleatoria tiene una distribuciĂłn Chi-cuadrada con 4 grados de libertad y lo que vamos hacer es identificar si el valor 3.09 es atĂpico o no. Decidimos que si el valor no pertenece al 95% de la poblaciĂłn entonces el valor es atĂpico. La elecciĂłn del 95% es comĂşn. Deseamos escoger un intervalo que precisamente contenga el 95% de los valores y si el valor 3.09 cae fuera de este intervalo entonces serĂĄ un valor atĂpico, esto es, pertenece al 5%. UNADM | DCEIT | EM | EMPE
6
Módulo 4 Unidad 3. Inferencia estadística
A continuación se agrega la imagen del cálculo correspondiente al 2.5% de la población a la derecha de la media que es 4.
A continuación se agrega la imagen del cálculo correspondiente al 2.5% de la población a la izquierda de la media que es 4.
A continuación se agrega la imagen del cálculo correspondiente al intervalo que contiene el 95% de la población
UNADM | DCEIT | EM | EMPE
7
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
Como el 95% de los datos se encuentran entre 0.4844 y 11.1433, y 3.09 se encuentra en ese intervalo el resultado se considera razonable. Cuando no se conoce đ?&#x153;&#x2021; y se considera la distribuciĂłn de -
,./
đ?&#x2018;&#x2039;, â&#x2C6;&#x2019; đ?&#x2018;&#x2039; đ?&#x153;&#x17D;"
"
Hay 1 grado menos de libertad. En la muestra aleatoria de la distribuciĂłn normal hay n grados de libertad o partes de informaciĂłn independiente. Cuando los datos se utilizan para calcular la media, hay un grado menos de libertad en la informaciĂłn que se utiliza para estimar đ?&#x153;&#x17D; " . A menudo una estimaciĂłn de đ?&#x153;&#x17D; debe ser proporcionada por la misma informaciĂłn muestral que produce el promedio muestral đ?&#x2018;Ľ. En este enlace se muestra la distribuciĂłn chi cuadrada, asĂ como sus aplicaciones.
KhanAcademyEspanol (2015) DistribuciĂłn chi cuadrado[Archivo de video] Disponible en: https://www.youtube.com/watch?v=9Gg_hieE2w8
UNADM | DCEIT | EM | EMPE
8
MĂłdulo 4 Unidad 3. Inferencia estadĂstica
DistribuciĂłn đ?&#x2018;. Finalmente mostramos como se usa la distribuciĂłn đ??š para comparar las varianzas muestrales; esto es, dada una muestra 1 de tamaĂąo đ?&#x2018;&#x203A;/ con varianza đ?&#x2018;&#x2020;/" y dada una muestra 2 de tamaĂąo đ?&#x2018;&#x203A;" con varianza đ?&#x2018;&#x2020;" una forma de comparar las dos varianza muestrales es considerando el cociente đ?&#x2018;&#x2020;/"
ABC
, đ?&#x2018;&#x2020;""
pero mejor aĂşn se considera el estadĂstico
DBC
ACC
.
DCC
Sean đ?&#x2018;&#x2C6; y đ?&#x2018;&#x2030; dos variables aleatorias independientes que tienen distribuciones chi cuadrada con đ?&#x153;&#x2C6;/ y đ?&#x153;&#x2C6;" grados de libertad, respectivamente. Entonces, la distribuciĂłn de la variable aleatoria đ??š = G/IB J/IC
esta dada por la funciĂłn de densidad Î&#x201C; â&#x201E;&#x17D; đ?&#x2018;&#x201C; =
đ?&#x153;&#x2C6;/ + đ?&#x153;&#x2C6;" đ?&#x153;&#x2C6;/ IB /" IB đ?&#x2018;&#x201C; " 2 đ?&#x153;&#x2C6;" đ?&#x153;&#x2C6; đ?&#x153;&#x2C6; đ?&#x153;&#x2C6; đ?&#x2018;&#x201C; Î&#x201C; / Î&#x201C;( " ) 1+ / 2 2 đ?&#x153;&#x2C6;
Q/
(IB SIC)/C
, đ?&#x2018;&#x201C; > 0
"
0. đ?&#x2018;&#x201C; â&#x2030;¤ 0. Ă&#x2030;sta se conoce como la distribuciĂłn F con đ?&#x153;&#x2C6;/ y đ?&#x153;&#x2C6;" grados de libertad. Ejemplo 1 Se tiene una poblaciĂłn A y una poblaciĂłn B, se toma una muestra de cada una de las poblaciones y se obtienen los siguientes resultados: PoblaciĂłn A PoblaciĂłn B
17.1
18.2
15.0
13.9
14.5
14.6
18.3
19.1
12.3
12.4
13.6
11.9
12.1
11.8
11.3
11.4
12.2
13.4
Vamos a utilizar los datos anteriores para comparar las varianzas poblacionales asumiendo en primer lugar que estas son iguales. Calculemos un valor đ?&#x2018;&#x201C;1 tal que P đ?&#x2018;&#x201C; > đ?&#x2018;&#x201C;1 = 0.01. Se escribe tambiĂŠn como P đ?&#x2018;&#x201C; > đ?&#x2018;&#x201C;;.;/ = 0.01. Por medio de GeoGebra obtenemos que đ?&#x2018;&#x201C;;.;/ = 6.72. Tenemos entonces para nuestro caso đ?&#x2018;&#x203A;/ = 8 con đ?&#x2018;&#x2020;/" = 4.24 y đ?&#x2018;&#x203A;" = 10 con đ?&#x2018;&#x2020;"" = 0.58, y ademĂĄs đ?&#x153;&#x17D;" = đ?&#x153;&#x17D;/ . Chequemos que con estos datos, el cociente que se describe a continuaciĂłn satisface que es mayor que 6.72 đ?&#x2018;&#x2020;/" đ?&#x153;&#x17D;/" P > 6.72 = 0.01. đ?&#x2018;&#x2020;"" đ?&#x153;&#x17D;""
UNADM | DCEIT | EM | EMPE
9
Módulo 4 Unidad 3. Inferencia estadística
Se cumple que 7.31 > 6.72, es decir 𝑆/" 𝑆""
𝜎/"
=
4.24 = 7.31. 0.58
𝜎"" Por lo tanto la suposición de que las varianzas poblacionales son iguales es aceptable. Ejemplo 2 Para dos poblaciones diferentes, ambas con distribución normal, se toma una muestra de cada una de tamaño 25. ABC
Calcular un valor 𝑓1 tal que P
ACC
DBC
> 𝑓1
= 0.05.
DCC
Esto es, consideramos la distribución 𝐹 con 𝜈/ = 24 grados de libertad y 𝜈" = 24 grados de libertad. Checamos con la tabla o software y se obtiene 𝑓1 = 1.98. ABC
Calcular un valor 𝑓1 tal que P ABC
Utilizamos la relación P ABC
P
ACC
DBC
ACC
ACC
DBC
DBC
< 𝑓1
= 0.05.
DCC ABC
< 𝑓1
=1−P
DCC
ACC
DBC
> 𝑓1 . Quiere decir que necesitamos
DCC
> 𝑓1 =0.95.
DCC
Después utilizamos la relación 𝑓/Q;.;[ 19,19 =
/ \].]^ (/_,/_)
=
/ /._`
= 0.51.
Vamos a asumir que las varianzas poblacionales son iguales 𝜎/" = 𝜎"" . La varianza muestral de la primera muestra es 𝑆/" = 3.42 y para la segunda se tiene 𝑆"" = 4.75. Si el valor 𝐹 cae dentro del intervalo encontrado, una persona no contaría con pruebas que refuten tal afirmación: que efectivamente las varianzas poblacionales son iguales. En caso contrario contaría con pruebas que refuten tal afirmación. Para el valor concreto 𝐹=
3.42 = 0.72, 4.75
no contamos con información suficiente que refute dicha afirmación. Intuitivamente estamos indicando que la probabilidad de que 𝐹 caiga en este intervalo es 0.1.
UNADM | DCEIT | EM | EMPE
10
Módulo 4 Unidad 3. Inferencia estadística
El enlace que aparece a continuación describe algunas deducciones de las propiedades de la distribución 𝐹 así como algunos cálculos explícitos con esta distribución.
Luis Rincón (2015) 0625 Distribución 𝐹[Archivo de video] Disponible en: https://www.youtube.com/watch?v=jThY_l7AlnI
UNADM | DCEIT | EM | EMPE
11