Estadística Inferencial Parte III Prueba de Hipótesis para Media, Proporción y Varianza de una Población
Enrique Israel Martínez Gordillo
Prueba de Hipรณtesis media, proporciรณn y varianza de una poblaciรณn
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población
Prueba de Hipótesis sobre una población Presentación En secciones anteriores se estudió la estimación como la primera parte de la inferencia, donde a partir de los estadísticos de una muestra se obtiene un intervalo donde se tiene cierta certeza de que se encuentre el parámetro de interés. En esta parte de la Inferencia se estudiará la forma de comprobar la validez de supuestos sobre el valor de un parámetro lo cual ayuda a tomar decisiones sobre la población de estudio. En las pruebas de hipótesis se comienza haciendo un supuesto tentativo acerca de un parámetro poblacional basado en la experiencia, en información previa, en información sobre una población similar, etc. a partir de esta información se establece una hipótesis, y con el supuesto contrario se establece una segunda que contradice completamente a la primera, y mediante la información de una muestra se define qué hipótesis se acepta.
Estimación Inferencia
Prueba de Hipótesis
Suponga que es usted el encargado de la ferretería “El Martillo” con más de 10 años en el mercado. En los últimos 8 meses a implementado una nueva estrategia de promociones para lograr ser más competitivo y ha llegado el momento de evaluar si realmente está funcionando; para lo cual le interesa comprobar que el ingreso por ventas mensuales haya umentado y que la varianza de las ventas entre mes y mes se mantiene igual. Además quiere comprobar que el porcentaje de clientes satisfechos con su atención sea por lo menos la misma que tenía antes de implementar la estrategia.
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población La información que ha obtenido en los últimos meses (datos muestrales) debe compararla con la de los 10 años anteriores (datos poblacionales) y en base a las conclusiones tomar la decisión si la estrategia funciona o debe desecharla. Pero ¿Cuál es la forma correcta de hacer dicha comparación?¿Qué tanta diferencia debe existir entre los datos muestrales y los datos poblacionales supuestos para definir que ha cambiado el comportamiento? La Prueba de Hipótesis es la herramienta de la estadística Inferencial que nos apoya a verificar la validez de un supuesto como podría ser : “Las ventas mensuales promedio no han aumentado con la nueva estrategia” . Este proceso siempre conlleva a la formulación de dos hipótesis: •
Hipótesis nula (H0): Representa la afirmación a comprobar, siempre se refiere a un valor especificado del parámetro poblacional. El planteamiento de H 0 siempre contiene el signo de igualdad con respecto al valor especificado ( hipotetizado) del parámetro.
•
Hipótesis Alternativa (H1): Representa la afirmación contraria a la hipótesis nula y representa la conclusión a la que se llegaría si la hipótesis nula fuera rechazada. El planteamiento de H 1 nunca contiene el signo de igualdad con respecto al valor especificado del parámetro poblacional.
Es importante reforzar que H0 y H1 son mutuamente excluyentes y colectivamente exhaustivas. También si concluimos que no se rechaza H 0, no significa necesariamente que la hipótesis nula es verdadera, sólo sugiere que no hay suficiente evidencia para rechazarla; rechazar la hipótesis nula sugiere que la hipótesis alternativa puede ser verdadera. Con base a ésto existen tres tipos de juegos de hipótesis, tomando como ejemplo la prueba de hipótesis sobre la media de una población:
Prueba de Hipótesis Bilateral
Prueba de Hipótesis Unilateral
Prueba de Hipótesis Unilateral
H0 : μ = μ0 H1: μ ≠ μ0
H 0 : μ ≥ μ0 H1: μ < μ0
H 0 : μ ≤ μ0 H1: μ > μ0
La prueba de Hipótesis siempre llevará un riesgo pues podría estarse rechazando H 0 cuando esta realmente es verdadera. La probabilidad de cometer este error, que se conoce como error de tipo I, se determina por α (alfa) el cual se llama nivel de significancia.
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población Existen dos métodos para realizar la prueba de hipótesis: •
Método de Valor Crítico
•
Método de Valor P
Método de valor crítico El método del valor crítico consta de 5 pasos :
•
PRIMER PASO: Establecer el objetivo a comprobar. Valor supuesto del parámetro de población antes de comenzar a tomar la muestra, el cual se desea probar.
•
SEGUNDO PASO: Formular la hipótesis a comprobar con base en el objetivo de interés y con esto establecer el juego de hipótesis.
•
TERCER PASO: Determinar del nivel de riesgo , el tipo de distribución, regiones de rechazo y de no rechazo en función al riesgo
α
(alfa) para finalmente dar un valor crítico. Para realizar
este tercer paso es necesario establecer el tipo de distribución de acuerdo al parámetro y la información de la muestra y determinar si es de una o dos colas (unilateral o bilateral) dependiendo del juego de hipótesis.
•
CUARTO PASO: Cálculo del estadístico de prueba o valor estadístico según la distribución y a partir de los datos de la muestra.
•
QUINTO PASO: Toma de decisión, dar respuesta al objetivo planteado. Para tomar la decisión es necesario comparar el estadístico de prueba (Ve) contra el valor crítico (Vc). Para esto es necesario tener en cuenta el juego de hipótesis utilizado y el tipo de distribución, puesto que cada uno de ellos tiene diferentes valores críticos según sea el nivel de significancia y el tipo de distribución.
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población Tabla 1. Toma de decisiones según el juego de hipótesis Tipo de Juego de Hipótesis
Rechazo H0 si:
1
H0 : P =P0 H1: P≠ P0
|Ze| ≥ |Zc|
2
H0 : P≥ P0 H1: P< P0
Ze ≤ -Zc
3
H0 : P≤ P0 H1: P > P0
Ze ≥ Zc
Es importante que una vez tomada la decisión se concluya en función del contexto que se está planteando. Para comprender mejor los conceptos de la prueba de hipótesis puedes visitar:
De Yovany Martin Quijano Rojas , TPrueba de Hipótesis para la media recuperado de https://www.youtube.com/watch?v=AJcy4eZMwWM Consultado 22/08/2016
Prueba de Hipótesis para la media de una población sigma conocida La prueba de hipótesis para la media de una población es la herramienta que nos apoya a comprobar un supuesto que se tiene sobre el valor de la media de una población en específico, al ser la sigma conocida (desviación estándar poblacional) la distribución que se utilizará será la distribución normal estándar (z). Ejemplo; Un productor de azúcar empaca su producto en bolsas de papel, cada una de las cuales supuestamente contiene 2.5 kg de azúcar, sabiendo que desviación estándar de los pesos de las bolsas es de 0.15 kg. De modo periódico se toma una muestra aleatoria de 45 bolsas para determinar si contienen la cantidad correcta. Si la media muestral
x
difiere significativamente de los 2.50 kg se
considera que el proceso de empaque está funcionando en forma inadecuada. Supóngase que la muestra
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población proporciona una media de 2.45 kg ¿Con un nivel de significancia del 5% (α =0.05) se puede determinar que el proceso de empaque está funcionando de forma inadecuada? Solución mediante el método de valor crítico: 1. Objetivo: Comprobar que el proceso está funcionando de forma inadecuada, es decir la media poblacional del llenado de las bolsas de azucar no es de 2.5 kg.
µ ≠ 2.5 2. Hipótesis: Sabemos que una de las dos hipótesis debe incluir el objetivo pues sólo así podremos dar respuesta a éste; también se sabe que la hipótesis nula (H 0) SIEMPRE debe contener la igualdad y la hipótesis alternativa (H1) NUNCA contendrá la igualdad. Por lo tanto:
H0 : μ = 2.5 H1 : μ ≠ 2.5 3. Valor crítico: Para determinar el valor crítico hemos definir el tipo de distribución que se maneja y si es de una o dos colas. En el caso de la prueba de hipótesis para la media de una población conociendo la desviación estándar poblacional la distribución que se maneja es la distribución normal estándar (z) y el juego de hipótesis que se plantea nos dá una prueba de dos colas por lo tanto con un nivel de significancia de α
= 0.05 el valor crítico es: Zc= 1.96.
4. Valor estadístico: El valor estadístico se calcula a partir de los datos de la muestra basado en el teorema de límite central:
x−μ z e= σ 0 x donde:
Ze es el valor estadístico x es la media de la muestra µ0 es el valor de la media supuesto
σx es el error estándar de la media muestral
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población
Para poblaciones Infinitas :
Para poblaciones Finitas:
σ x= σ √n
√
N−n σ x= σ ⋅ √ n N −1
cuando n > 0.05N
donde N es el tamaño de la población. En éste caso para el cálculo del valor estadístico
x=2.45 kg µ0 =2.50 kg n= 45
σ=0.15 kg
x−μ0 2.45−2.5 z e= σ = =−2.24 x 0.15/ √ 45 Ze= -2.24 5. Toma de decisión: se comparan los valores de Ze contra ZC tomando la decisión según el juego de hipótesis. En este caso tenemos el primer juego de hipótesis donde se rechazará la H0 si el valor absoluto de Ze es mayor al valor absoluto de Zc . Siendo
Ze= -2.24 y |Ze|=2.24 Zc= 1.96 y |Zc|= 1.96 se observa que
Ze > Zc por lo tanto según la regla se rechaza la H0 y se Acepta H1 Conclusión: Con un nivel de significancia del 5% se comprueba que el proceso de empaque está funcionando de forma inadecuada dando un promedio de llenado distinto a los 2.5 kg por lo que deben hacerse los ajustes convenientes.
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población Prueba de Hipótesis para la media de una población sigma desconocida En la mayoría de los casos al tomar una muestra para realizar una prueba para comprobar un supuesto sobre la media de la población se desconoce la desviación estándar poblacional y se trabaja con la muestral. En este tipo de situaciones la distribución que debe utilizarse para la prueba de hipótesis es la distribución t-Student con n-1 grados de libertad. La teoría dice que cuando la muestra es grande (mayor a 30) puede usarse la distribución normal estándar z a pesar de que no se conozca sigma. Ejemplo; Un productor de azúcar empaca su producto en bolsas de papel, cada una de las cuales supuestamente contiene 2.5 kg de azúcar. De modo periódico se toma una muestra aleatoria de 20 bolsas para determinar si contienen la cantidad correcta. Si la media muestral
x
difiere
significativamente de los 2.50 kg se considera que el proceso de empaque está funcionando en forma inadecuada. Supóngase que se toma la siguiente muestra: 2.5
2.8
2.4
2.6
2.4
2.6
2.2
2.5
2.5
2.4
2.4
2.7
2.5
2.2
2.5
2.3
2.6
2.3
2.6
2.3
¿Con un nivel de significancia del 5% (α =0.05) se puede determinar que el proceso de empaque está funcionando de forma inadecuada? Solución: 1. Objetivo: Comprobar que el proceso está funcionando de forma inadecuada, es decir la media poblacional del llenado de las bolsas de azucar no es de 2.5 kg.
µ ≠ 2.5 2. Hipótesis: Sabemos que una de las dos hipótesis debe incluir el objetivo pues sólo así podremos dar respuesta a éste; también se sabe que la hipótesis nula (H 0) SIEMPRE debe contener la igualdad y la hipótesis alternativa (H1) NUNCA contendrá la igualdad. Por lo tanto:
H0 : μ = 2.5 H1 : μ ≠ 2.5 3. Valor crítico: Para determinar el valor crítico hemos definir el tipo de distribución que se maneja y si es de una o dos colas.
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población En el caso de la prueba de hipótesis para la media de una población con desviación estándar poblacional desconocida la distribución es t-Student (t) y el juego de hipótesis que se plantea nos dá una prueba de dos colas por lo tanto con un nivel de significancia de
α = 0.05 y con n-1= 20-1= 19
grados de libertad el valor crítico es:
tc=2.093
4. Valor estadístico: El valor estadístico se calcula a partir de los datos de la muestra basado en la fórmula:
x−μ t e= σ 0 x donde:
te es el valor estadístico x es la media de la muestra µ0 es el valor de la media supuesto
σx es el error estándar de la media muestral calculado por:
σ x=
s √n
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población De la muestra:
x=2.465 kg s=0.1598 n= 20 Del valor supuesto
µ0 =2.50 kg
x−μ 2.465−2.5 t e= σ 0 = =−0.979 x 0.1598/ √ 20 te= -0.979 5. Toma de decisión: se comparan los valores de
te contra tC tomando la decisión según el juego de
hipótesis: En este caso tenemos el primer juego de hipótesis, por lo tanto se rechazará la H 0 si el valor absoluto de te es mayor al valor absoluto de tc . Siendo
te= -0.979 y |te|=0.979 tc= 2.093 y |tc|= 2.093 se observa que
te < tc no se cumple la condición de rechazo, por lo tanto no se rechaza la H0 Conclusión: Con un nivel de significancia del 5% No hay evidencia suficiente para comprobar que el proceso de empaque esté funcionando de forma inadecuada.
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población Prueba de Hipótesis para la proporción de una población Cuando lo que nos interesa es comprobar un supuesto sobre la proporción poblacional de elementos que cumplen una característica específica la distribución que se utiliza para la prueba de hipótesis es la Distribución normal estándar (z). Ejemplo; La administración de Bancomer quiere introducir un nuevo paquete de servicios para clientes cuyo ingreso familiar sea superior a los $200,000 al año, el cual es conveniente sólo si más del 60% cumple con dicha característica. En una encuesta realizada a 350 clientes mostró que 230 de éstos tenían un ingreso superior a los $200,000 al año. ¿Se puede determinar que le conviene a Bancomer introducir el nuevo paquete de servicios? Solución: 1.Objetivo: Comprobar que la proporción de clientes con ingreso familiar superior a los $200,000 es mayor del 60%.
P > 0.6 2. Hipótesis: Sabemos que una de las dos hipótesis debe incluir el objetivo pues sólo así podremos dar respuesta a éste; también se sabe que la hipótesis nula (H 0) SIEMPRE debe contener la igualdad y la hipótesis alternativa (H1) NUNCA contendrá la igualdad. Por lo tanto:
H0 : P ≤ 0.6 H1 : P > 0.6 3. Valor crítico: Para determinar el valor crítico hemos definir el tipo de distribución que se maneja y si es de una o dos colas. En el caso de la prueba de hipótesis para la proporción de una población la distribución que se maneja es la distribución normal estándar (z) y el juego de hipótesis que se plantea nos da una prueba unilateral o de una cola donde el nivel de significancia se concentra en uno solo de los extremos (por lo que no es necesario dividirlo entre dos) por lo tanto con un nivel de significancia de α
= 0.05 el
valor crítico es:
Zc= 1.64.
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población 4. Valor estadístico: El valor estadístico se calcula a partir de los datos de la muestra basado en el teorema de límite central:
p−P0 z e= σ p donde:
Ze es el valor estadístico p es la proporción de la muestra P0 es el valor de la proporción poblacional supuesta
σp es el error estándar de la proporción muestral
σ p=
Para poblaciones Infinitas : En éste caso para el cálculo del valor estadístico
√
P 0 (1−P0 ) n
n= 350 a = 230 p= 23/35=0.6571 P0 =0.6
σ p=
√
√
P 0 (1−P0 ) 0.6(1−0.6) = =0.0262 n 350
p−P0 0.6571−0.6 z e= σ = =2.18 p 0.0262 Ze= 2.18 5. Toma de decisión: se comparan los valores de
Ze contra ZC tomando la decisión según el juego de
hipótesis: En este caso tenemos el tercer juego de hipótesis, por lo tanto se rechazará la H 0 si el valor de Ze es mayor al valor de Zc . Siendo
Ze=2.18
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población
Zc= 1.64 se observa que
Ze > Zc por lo tanto según la regla se rechaza la H0 Conclusión: Con un nivel de significancia del 5% se comprueba que la proporción de clientes con un ingreso familiar mayor a los $200,000 es mayor al 60%. Prueba de Hipótesis para la varianza de una población A la hora de analizar variables cuantitativas es de suma importancia considerar el comportamiento de la varianza pues ésta nos arroja información sobre la dispersión de la variable y qué tan estándar se puede considerar un proceso. Para la comprobación de una varianza supuesta el tipo de distribución que se utiliza es la Chi Cuadrada con n-1 grados de libertad. Dada la distribución de este tipo de prueba de hipótesis es importante hacer una aclaración sobre la regla de rechazo para la H0 quedando:
De Anderson, Sweeney, Williams. (2012). Estadística para negocios y economía. México D.F: Cengage Learning, pp 457 Tabla 11.2
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población
Ejemplo; Un productor de azúcar empaca su producto en bolsas de papel, cada una de las cuales supuestamente contiene 2.5 kg de azúcar. De modo periódico se toma una muestra aleatoria de 20 bolsas para determinar si el proceso funciona correctamente. Si la varianza se encuentra por encima de 0.0225 se detiene la producción pues se considera ésto como una falla a la calidad y se hacen los ajustes pertinentes en la empacadora. Supóngase que se toma la siguiente muestra: 2.5
2.8
2.4
2.6
2.4
2.6
2.2
2.5
2.5
2.4
2.4
2.7
2.5
2.2
2.5
2.3
2.6
2.3
2.6
2.3
¿Con un nivel de significancia del 5% (α =0.05) se debe detener el proceso para hacer los ajustes necesarios? Solución: Objetivo: Comprobar si es necesario detener el proceso, es decir, probar que la varianza está por encima de 0.0225.
σ2 > 0.0225 2. Hipótesis: Sabemos que una de las dos hipótesis debe incluir el objetivo pues sólo así podremos dar respuesta a éste; también se sabe que la hipótesis nula (H 0) SIEMPRE debe contener la igualdad y la hipótesis alternativa (H1) NUNCA contendrá la igualdad. Por lo tanto:
H0 : σ2 ≤ 0.0225 H1 : σ2 > 0.0225 3. Valor crítico: Para determinar el valor crítico hemos definir el tipo de distribución que se maneja y si es de una o dos colas. En el caso de la prueba de hipótesis para la varianza de una población la distribución que se 2
maneja es la distribución chi cuadrada ( χ
) con n-1 grados de libertad y el juego de hipótesis que
se plantea nos da una prueba unilateral de una cola superior donde el nivel de significancia se concentra en uno solo de los extremos (por lo que no es necesario dividirlo entre dos) por lo tanto con
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población
un nivel de significancia de
α = 0.05
y con n-1=20-1=19 grados de libertad el valor crítico tomado
de la tabla de Chi cuadrado es:
χ2C=30.1435 4. Valor estadístico: El valor estadístico se calcula a partir de los datos de la muestra basado en la fórmula de Chi Cuadrada:
(n−1) s2 χ= σ20 2 e
donde:
χ2e es el valor estadístico n s el tamaño de la muestra s2 es el valor de la varianza muestral
σ20 es el valor de la varianza supuesta De la muestra:
n= 20
s2= 0.0255
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población Del supuesto:
σ20=0.0225 (n−1) s2 (20−1)0.0255 χ= = =21.5333 2 0.0225 σ0 2 e
χ2e = 21.5333 5. Toma de decisión: se comparan los valores de
χ2e contra χ2C tomando la decisión según el juego
de hipótesis: En este caso tenemos el tercer juego de hipótesis, por lo tanto se rechazará la H 0 si el valor de χ2e es mayor al valor de χ2C . Siendo
χ2e = 21.5333 χ2C=30.1435 se observa que
χ2e < χ2C por lo tanto según la regla no se rechaza la H0 Conclusión: Con un nivel de significancia del 5% No hay evidencia suficiente para comprobar que la varianza del proceso de empaque de azúcar tenga una varianza mayor a 0.0225 en los pesos, por lo tanto no es necesario detener el proceso. Como resumen de lo visto en Prueba de Hipótesis para una población puedes visitar: Prueba de Hipótesis de una población https://prezi.com/ia0h-cdvfow0/prueba-de-hipotesis-una-poblacion/ Consultado 02/09/2016
https://buhodigital.wixsite.com/bdv1
Prueba de Hipótesis media, proporción y varianza de una población
Conclusión La prueba de hipótesis es de suma importancia para verificar un valor supuesto sobre algún parámetro de interés, con esto podemos comprobar cambios de comportamiento en alguna variable, calidad en algún proceso, cumplimiento de una meta etc. lo cual nos lleva a una acertada toma de decisiones. Referencias •
Anderson, Sweeney, Williams. (2012). Estadística para negocios y economía. México D.F: Cengage Learning
•
William Anthony Granville. (1980). CALCULO DIFERENCIAL E INTEGRAL. México: Limusa.
•
Walpole Ronald E , Myers Raymond H , Myers Sharon L. (2012). Probabilidad y estadística para ingeniería y ciencias. Ciudad de México: Pearson.
https://buhodigital.wixsite.com/bdv1
Prueba de Hipรณtesis media, proporciรณn y varianza de una poblaciรณn
https://buhodigital.wixsite.com/bdv1
Prueba de Hipรณtesis media, proporciรณn y varianza de una poblaciรณn
Enrique Israel, 2017 enrique.israel.martinez@gmail.com https://about.me/enriqueisrael
https://buhodigital.wixsite.com/bdv1