Estadística Inferencial
Prueba de Hipótesis sobre la diferencia de dos poblaciones Presentación Hay situaciones donde es importante comparar el comportamiento de un parámetro en una población respecto al del mismo parámetro en una segunda población, es decir, nos interesa la diferencia o la no diferencia que pueda existir entre ellos; por ejemplo si queremos comprobar que un proveedor nos da menor tiempo de entrega que otro o si la varianza en los pesos de un producto son menores con un proveedor que con otro o si los hombres son igual de propensos que las mujeres a reprobar una materia en particular, etc. Para estos casos la comparación se hace a través de obtener inferencias de la diferencia de las poblaciones basados en los datos muestrales de cada población.
Población B
Población A
Muestra A
Inferencia de comparación poblacional Comparación muestral
Enrique Israel, 2016
Muestra B
Estadística Inferencial
Competencia A través de este módulo desarrollarás las siguientes competencias específicas: ● Comprende los procedimientos para realizar la Prueba de hipótesis para la diferencia de proporciones de dos poblaciones. ● Comprende los procedimientos para realizar la Prueba de hipótesis para la diferencia de varianza de dos poblaciones. ● Identifica, analiza y resuelve problemas que requieran la prueba de hipótesis de la diferencia de un parámetro en dos poblaciones así como dar conclusiones acertadas para la correcta toma de decisiones.
Propósitos ● Identificar las características, conceptos y variables para la prueba de hipótesis de la diferencia de proporciones y varianzas de dos poblaciones ● Identificar correctamente el parámetro a comprobar y utilizar la herramienta estadística que mejor se adapta para dar la solución. ● Analizar el resultado que se obtiene para dar conclusiones acertadas a los problemas.
Desarrollo Suponga que una tienda de productos orgánicos plantea la estrategia de vender sus productos tanto en un local físico ubicado en una plaza comercial como en una tienda virtual manejando una publicidad particular para cada modalidad. Para el local físico se promociona por medio de folletos y en revistas locales y para la tienda virtual lo hace mediante redes sociales. Al cabo de 1 año quiere evaluar el impacto de una y otra modalidad para lo cual toma como muestra las ventas de 6 meses de forma aleatoria donde Enrique Israel, 2016
Estadística Inferencial le interesa comparar si la variación en los montos de ventas es el mismo en ambas modalidades y si la proporción de clientes menores de 25 años es mayor en la tienda virtual que en la tienda física. De los estadísticos que obtenga de cada una de las muestras podrá hacer comparaciones muestrales y por medio de la estadística realizar las inferencia necesaria para tomar la decisión de si alguna modalidad es mejor que la otra o si son iguales. En el caso de la diferencia de parámetros de dos poblaciones la metodología sigue siendo la misma que las pruebas de hipótesis de una población: •
Método de valor crítico
•
Método de valor P
Los juegos de hipótesis tomando como ejemplo la diferencia de Proporciones de dos poblaciones quedarían: Prueba de Hipótesis Bilateral Prueba de Hipótesis Unilateral Prueba de Hipótesis Unilateral (Las proporciones en la (La proporción de la población 1 (La proporción de la población 1 población 1 y la población 2 es menor a la proporción de la es mayor a la proporción de la son diferentes) población 2 ) población 2 )
H0 : P1-P2 = 0 H1: P1-P2 ≠ 0
H0 : P1-P2 ≥ 0 H1: P1-P2< 0
H0 : P1-P2 ≤ 0 H1: P1-P2 > 0
Y la toma de decisiones para el rechazo de H0 es : Tipo de Juego de Hipótesis
Rechazo H0 si:
1
H0 : P1-P2 = 0 H1: P1-P2 ≠ 0
|Ze| ≥ |Zc|
2
H0 : P1-P2 ≥ 0 H1: P1-P2< 0
Ze ≤ -Zc
3
H0 : P1-P2 ≤ 0 H1: P1-P2 > 0
Ze ≥ Zc
Es importante que una vez tomada la decisión se concluya en función del contexto que se está planteando.
Enrique Israel, 2016
Estadística Inferencial Prueba de Hipótesis para la diferencia de proporciones de dos poblaciones La prueba de hipótesis para la diferencia de proporciones de dos poblaciones es la herramienta que nos ayuda a comparar el comportamiento de una característica cualitativa en dos poblaciones distintas y la distribución indicada es la distribución normal estándar (z). Ejemplo,Una muestra de 50 familias de una comunidad A muestra que 10 de ellas están viendo una programa especial sobre economía nacional. En una segunda comunidad B 15 familias de una muestra aleatoria de 50 están viendo el programa especial de televisión. ¿Se puede comprobar con un nivel de significancia de 1% que la proporción de televidentes que ven el programa especial es la misma en ambas comunidades? Solución mediante el método de valor crítico: 1. Objetivo: Comprobar que la proporción de televidentes que ven el programa especial sobre economía nacional es la misma en la comunidad A que en la comunidad B.
PA=PB despejando para expresarlo como diferencia de proporciones: PA-PB = 0 2. Hipótesis: Sabemos que una de las dos hipótesis debe incluir el objetivo pues sólo así podremos dar respuesta a éste; también se sabe que la hipótesis nula (H 0) SIEMPRE debe contener la igualdad y la hipótesis alternativa (H 1) NUNCA contendrá la igualdad. Por lo tanto:
H0 : P1-P2 = 0 H1: P1-P2 ≠ 0
Enrique Israel, 2016
Estadística Inferencial 3. Valor crítico: Para determinar el valor crítico hemos definir el tipo de distribución que se maneja y si es de una o dos colas. En el caso de la prueba de hipótesis para la diferencia de proporción de dos poblaciones la distribución que se maneja es la distribución normal estándar (z) y el juego de hipótesis que se plantea nos dá una prueba de dos colas por lo tanto con un nivel de significancia de α
= 0.01 donde α/2=0.005 el valor crítico es: Zc= 2.58
4. Valor estadístico: El valor estadístico se calcula a partir de los datos de la muestra basado en la fórmula:
( p − pB) z e= σA p −p A
B
donde:
Ze es el valor estadístico pA es la proporción muestral de la población A pB es la proporción muestral de la población B
σp -p A
B
es el error estándar de la diferencia de proporciones
σp
A
√
− p = p(1− p)⋅( B
1 1 + ) n A nB
donde:
n A p A +n B p B p= n A +nB Enrique Israel, 2016
Estadística Inferencial de las muestras de la comunidad A y B:
pA =10/50=0.2 nA=50 pB =15/50=0.3 nB=50 primero se calcula el valor de p
p=
n A p A +n B p B 50⋅0.2+50⋅0.3 = =0.25 n A +nB 50+50
ahora se calcula el error estándar
σp
A− pB
√
= p(1− p)⋅(
√
1 1 1 1 + )= 0.25(1−0.25)⋅( + )=0.06123 n A nB 50 50
se puede ya calcular el valor de Ze :
( p A − p B ) 0.2−0.3 z e= σ = =−1.6331 p −p 0.06123 A
B
Ze= -1.63
5. Toma de decisión: se comparan los valores de Ze contra ZC tomando la decisión según el juego de hipótesis. En este caso tenemos el primer juego de hipótesis donde se rechazará la H0 si el valor absoluto de Ze es mayor al valor absoluto de Zc .
Enrique Israel, 2016
Estadística Inferencial Siendo
Ze= -1.63 y |Ze|=1.63 Zc= 2.58 y |Zc|= 2.58 se observa que
Ze < Zc por lo tanto según la regla no se rechaza la H0
Conclusión: Con un nivel de significancia del 1% no hay evidencia suficiente para comprobar que exista diferencia entre las proporciones de televidentes que observan el programa especial en la comunidad A respecto a la comunidad B.
Enrique Israel, 2016
Estadística Inferencial Prueba de Hipótesis para la diferencia de varianzas de dos poblaciónes En algunas aplicaciones estadísticas interesa compara las varianzas en la calidad de dos procesos distintos o la variabilidad en los salarios en dos regiones. Para comprobar ñas varianzas de dos poblaciones se emplean datos obtenidas de dos muestras aleatorias independientes: una de la población 1 y otra de la población 2. Para hacer las inferencias acerca de las dos varianzas poblacionales
s21 y s22 .
ơ21
y
ơ22 se usan las dos varianzas muestrales
La distribución que se utiliza para esta herramienta es la distribución Fisher, la
cual dependerá del nivel de significancia α , de los grados de libertan en el numerador ( n1-
1) y los grados de libertan en el denominador ( n2-1). Es importante aclarar que en la preuba de hipótesis para la diferencia de varianzas de dos poblaciones la población 1 será aquella que tenga la varianza muestral mayor. Ejemplo, extraído de Anderson, Sweeney, Williams. (2012). Estadística para negocios y economía. México D.F: Cengage Learning, pp 465 ej. 17: La mayoría de los conductores saben que el gasto anual promedio en reparaciones de un automóvil depende de la antigüedad del mismo. Un investigador desea saber si la varianza de los gastos anuales que se aplican en reparación también aumenta con la antigüedad del vehículo. En una muestra de 25 vehículos de 2 años de antigüedad la varianza fue de $100, mientras que en una muestra de 26 automóviles de 4 años de antigüedad fue de $170. Empleando un nivel de significancia del 0.01 ¿se puede comprobar el supuesto del investigador?. Solución; Primer se determina la población 1 y la población 2; al ser la varianza de la muestra de los vehículos de 4 años de antigüedad mayor que la de los de 2 años de antigüedad entonces la de 4 años será la población 1.
Enrique Israel, 2016
Estadística Inferencial 1. Objetivo: Comprobar que la varianza en gastos de mantenimiento de los vehículos más antiguos es mayor que la de los más nuevos.
ơ21 > ơ22 2. Hipótesis: Sabemos que una de las dos hipótesis debe incluir el objetivo pues sólo así podremos dar respuesta a éste; también se sabe que la hipótesis nula (H 0) SIEMPRE debe contener la igualdad y la hipótesis alternativa (H 1) NUNCA contendrá la igualdad. Por lo tanto:
H0 : ơ21 ≤ ơ22 H1: ơ21 > ơ22 3. Valor crítico: Para determinar el valor crítico hemos definir el tipo de distribución que se maneja y si es de una o dos colas. En el caso de la prueba de hipótesis para la diferencia de varianza de dos poblaciones la distribución que se maneja es la distribución Fisher (F) con n 1-1 grados de libertad en el numerador y n2-1 grados de libertad en el denominador y el juego de hipótesis que se plantea nos da una prueba de una cola.
α=0.01 grados de libertan en el numerador n1-1= 26 - 1 =25 grados de libertan en el denominador n2-1= 25 - 1 =24
Enrique Israel, 2016
Estadística Inferencial
Fc=2.64 4. Valor estadístico: El valor estadístico se calcula a partir de los datos de la muestra bajo la siguiente fórmula:
Fe= donde:
Fe es el valor estadístico
s21 = 170 s22 = 100
Enrique Israel, 2016
s s
2 1 2 2
Estadística Inferencial
Fe=
s
2 1
s22
=
170 =1.7 100
Fe = 1.7 5. Toma de decisión: se comparan los valores de F e contra FC tomando la decisión según el juego de hipótesis. En este caso tenemos el tercer juego de hipótesis donde se rechazará la H0 si el valor de Fe es mayor al valor Fc . Siendo
Fe= 1.7 Fc= 2.64 se observa que
Fe < Fc por lo tanto según la regla no se rechaza la H0 Conclusión: Con un nivel de significancia de 0.01 no hay evidencia suficiente para comprobar que la varianza en gastos de mantenimiento sea mayor en los autos más antiguos.
Enrique Israel, 2016
Estadística Inferencial
Conclusión La prueba de hipótesis para la diferencia de dos poblaciones es de suma importancia para comparar el comportamiento de un parámetro y así tomar decisiones sobre una de las dos poblaciones.
Enrique Israel, 2016