Clases 01 (prueba de hipótesis de una media, distribución z)

Page 1

CAPÍTULO I: TEORÍA DEL MUESTREO - PRUEBAS DE HIPÓTESIS

- INTERVALO DE CONFIANZA - TAMAÑO DE MUESTRA Econ. Alex Rengifo Rojas.


Motivación… El objetivo es exponer los métodos estadísticos básicos que se aplican para tomar decisiones sobre la conjetura que se hace acerca de valor numérico del parámetro de una población en estudio y que es sometida a comprobación experimental con el propósito de determinar si los resultados de una muestra aleatoria extraída de esa población contradicen o no en forma significativa tal afirmación.


El proceso de la prueba de hipótesis nos conduce a tomar la decisión de rechazar o no rechazar la afirmación o conjetura acerca del valor numérico del parámetro de la población en estudio: Tal suposición tiene el nombre genérico de hipótesis estadística y puede ser verdadera o no.


Aclaraciones previas…!!! - HIPÓTESIS ESTADÍSTICAS Afirmación o conjetura que se hace acerca de la distribución de una o más poblaciones. O valor (es) de uno o más parámetros de la distribución, conocida su forma. Algunos ejemplos - El área media de los predios en la ciudad de Tingo María es 100 m2. - La proporción de fotocopias defectuosas producidas por las máquinas marca Epson es superior a 10%.


- La varianza de los salarios de los trabajadores de la Cooperativa Agraria Naranjillo es de S/. 250 soles2. - Son iguales las medias en el gasto en consumo de alimentos entre los hogares de la ciudad de Tingo María y Aucayacu que se distribuyen normalmente con varianzas desconocidas supuestas iguales a δ2. Y LA HIPÓTESIS DE INVESTIGACIÓN, ¿SERÁ IGUAL? Existe una pequeña diferencia, estás hipótesis se plantea no en términos estadísticos. Algunos ejemplos


- El tamaño de los predios en la ciudad de Tingo María es aceptable por sus propietarios. - Las fotocopias defectuosas producidas por las máquinas marca Epson están en el estándar normal. - Los salarios de los trabajadores de la Cooperativa Agraria Naranjillo son iguales para todos. - El gasto en consumo de alimentos entre los hogares de la ciudad de Tingo María y Aucayacu son similares.


- HIPÓTESIS SIMPLE E HIPÓTESIS COMPUESTA La hipótesis simple a cualquier hipótesis estadística que especifique un valor del parámetro. Por ejemplo: afirmar que µ0=100. La hipótesis compuesta no indica un valor específico del parámetro. Por ejemplo: afirmar que µ0>100 o µ0<100. Si µ0≠100, ¿Será simple o compuesta?

Es compuesta


- HIPÓTESIS NULA E HIPÓTESIS ALTERNATIVA La hipótesis nula (H0) se denomina a la hipótesis que es aceptada provisionalmente como verdadera y cuya validez será sometida a comprobación experimental, siendo la hipótesis principal a probar. La hipótesis alternativa o alternante (Ha o H1) se acepta en caso de que la hipótesis nula sea rechazada.


1.1. PRUEBA DE HIPÓTESIS DE UNA MEDIA (µ0) 1.1.1. VARIANZA DESCONOCIDA O VARIANZA CONOCIDA (δ2) Y MUESTRA GRANDE (n≥30), Y VARIANZA CONOCIDA Y MUESTRA PEQUEÑA (n<30) Caso 01: H0: µ= µ0 Ha: µ≠ µ0

Caso 02: H0: µ≤ µ0 o µ= µ0 Ha: µ> µ0

Caso 03: H0: µ≥ µ0 o µ= µ0 Ha: µ< µ0

Método 01: punto critico y método 02: pvalue.


VARIANZA DESCONOCIDA O VARIANZA CONOCIDA (δ2) Y MUESTRA GRANDE (n≥30): Si la población X no es normal, entonces, siempre que el tamaño n sea suficientemente grande (n≥30), por el teorema del límite central (TLC), la distribución de X es aproximadamente normal N   ,    n VARIANZA CONOCIDA (δ2) Y MUESTRA PEQUEÑA (n<30): Si la población X es normal N  ,  , entonces, por la propiedad reproductiva normal (PRN) la distribución de probabilidades de la media de la muestra X , es normal    para cualquier tamaño de la muestra (n≥2). N  ,  

n


Caso 01: mÊtodo 01: punto crítico 1. Planteamiento de hipótesis: H0: ¾= ¾0 Ha: ¾≠¾0 2. Nivel de significación de la prueba ι= 1%, 5%, 10%, etc. 3. Puntos críticos: distribución normal eståndar teórico RAH0

RRH0

RRH0

1-Îą Îą/2

-∞

−đ?‘? − đ?›ź/2

Îą/2 0

đ?‘? + đ?›ź /2

+∞


4. Cálculo del estadístico: distribución normal estándar empírico: ZC 

X  0

X

donde X 

 n

S X  n

Varianza conocida (δ2) y muestra pequeña (n<30) o N n  muestra grande (n≥30). N 1

Y

n  0.05 N

Varianza desconocida y muestra grande (n≥30). N n  n N 1  0.05 Y N


X 

 n

S X   n

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). Y

n  0.05  N   N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05  N   N

5. Conclusiones: , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%.   Si:  Z / 2  Z C  Z / 2

Z C  Z  / 2  Z C   Z  / 2 ,

se rechaza la hipótesis nula (RH0); es decir, µ≠µ0. A un nivel de confianza de (1-α)%.


Caso 01: método 02: p-value. 1. Planteamiento de hipótesis: H0: µ= µ0 Ha: µ≠ µ0 2. Nivel de significación de la prueba α= 1%, 5%, 10%, etc. 3. Región crítica: distribución normal estándar teórico RAH0

RRH0

RRH0

1-α α/2

-∞

α/2 0

α ProbZ  Zc    2ProbZ  Zc   α 2

+∞


RAH0

RRH0

RRH0

1-α

α/2

-∞

α/2 0

4. Cálculo del estadístico: α  2ProbZ  Zc   α 2 α ProbZ  Zc    2ProbZ  Zc   α 2 ProbZ  Zc  

+∞

α ProbZ  Zc    2ProbZ  Zc   α 2


5. Conclusiones: Si 2ProbZ  Zc   2ProbZ  Zc    , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. Si 2ProbZ  Zc   2ProbZ  Zc    , se rechaza la hipótesis nula (RH0); es decir, µ≠µ0. A un nivel de confianza de (1-α)%.


RAH0

RRH0

RRH0

1-Îą Îą/2

-∞

Îą/2

−đ?‘? − đ?›ź/2

+∞

đ?‘? + đ?›ź /2

0

ďƒŠ ďƒš X  ď ­0 P ďƒŞ- Zď Ą/2 ď‚Ł ď‚Ł Zď Ą/2 ďƒş  1  ď Ą ďƒž Pď ›X - Zď Ą/2ď ł X ď‚Ł ď ­ 0 ď‚Ł X  Zď Ą/2ď ł X ď ?  1  ď Ą ď ł X ďƒŤ ďƒť IC ď€¨ď ­ 0 1ď€­ď Ą 

IC ď€¨ď ­ 0 1ď€­ď Ą  X - Zď Ą/2ď ł X 

IC ď€¨ď ­ 0 1ď€­ď Ą  X  Zď Ą/2ď ł X 

donde

IC ď€¨ď ­ 0 1ď€­ď Ą 

Intervalo de confianza inferior. Intervalo de confianza superior.


X 

X 

X 

 n

S n

 n

Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30).  N 1

Y

N n  N 1

S X   n

n  0.05 N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05 N

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). n  0.05  N   Y N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05  N   N


IC 0 1 

-∞

IC 0 1 

µ0 X

+∞ Muestra 1

X

Muestra 2

X

Muestra 3 Muestra 4

X X

Muestra 5 Muestra 6

X X X

Muestra 7 Muestra 8

Gráfico 01.a: Interpretación de los intervalos de confianza

La muestra 3 y la muestra 7, el valor promedio no se encuentra en el intervalo de confianza rechazando la hipótesis nula; mientras, que las muestras restantes si están en el intervalo aceptando la hipótesis nula.


-∞  IC 0 1

0  IC 0 1

1° caso

+∞

IC 0 1

IC 0 1

IC 0 1

2° caso

IC 0 1

3° caso

Gráfico 01.b: Interpretación de los intervalos de confianza

Para el caso 1° y 2°: se rechaza la hipótesis nula; si y solo si, el intervalo de confianza inferior y superior son valores muy distintos. Para el caso 3°: se acepta la hipótesis nula, por que pasa por el origen el intervalo de confianza; tanto, inferior como superior.


¿A qué se le denomina e? Se le denomina error de la estimación. Al estimar  por X es el valor numérico e  X   El valor mínimo del error de estimación es igual a cero, esto ocurre, cuando X estima exactamente a  . El valor máximo del error de estimación es igual a Z / 2 X , ya que aplicando propiedades del valor absoluto al intervalo de  estimación de  , resulta que: e  X    e  Z / 2 X X e

X e

X e

e

Si X estima a  , entonces, se tiene una confianza del (1-α)% de que el error de está estimación no será superior al valor numérico Z / 2 X .


DECISIÓN

NATURALEZA Rechazo la H0 Acepto la H0

H0 verdadera H0 falsa DECISIÓN = CORRECTA

Error tipo I α Potencia de la prueba 1-β

β≤10% 1-β>90%

Nivel de confianza 1-α Error tipo II β

DECISIÓN = INCORRECTA

Tenemos que aumentar el tamaño de muestra.

¿Cómo se logra aumentar el tamaño de muestra? Con la siguiente fórmula

β>10% 1-β≤90%


Algunas aclaraciones…inicio.   X  0 P - Z/2   Z/2   1    X   - Z/2 

X  0

X

2

 Z / 2 2

 X  0    Z2 / 2 X2   X   0 2  Z2 / 2    X 

  2  N  n  2      X  0   n  N  1 

Despejando el tamaño de muestra (n): Z2 / 2 2 N Z2 / 2 2 N n n 2 2 2 N  1e 2  Z2 / 2 2 N  1 X  0   Z / 2

X 

 n

Varianza conocida (δ2) y muestra pequeña (n<30) o N n  muestra grande (n≥30). N 1

Z2 / 2 S 2 N n N  1e 2  Z2 / 2 S 2

X 

S n

, donde:

, donde:

N n  Varianza desconocida y muestra grande (n≥30). N 1


Si N es infinita o es desconocida, el tamaño de muestra (n), Z  N será: Z  N 2

Límn   Lím N 

N 

2

 /2

N  1e

2

 /2

2

 Z / 2 2

2

 Límn   N 

2

N

 N  1  2 Z / 2  e  N  N  2

2

Z2 / 2 2 Z2 / 2 2 Límn   Lím  Límn   2 2 N  N   N  1  2 Z / 2 e2 1  e  N  N

Z2 / 2 2 N n e2

, donde:

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X   grande (n≥30) y N   n Z2 / 2 S 2 N n e2

, donde:

S X   Varianza desconocida y muestra grande (n≥30) y N   n

Algunas aclaraciones…final.


¿Cómo saber si se está en la decisión correcta o incorrecta? y el valor de α/2 está en la cola derecha

1-α/2

-∞

µ0

1-β β α/2

k

µ1

+∞

 k - 0  k - 0 ProbError tipo I   2  Prob  Z    2   Z 2      1  X  X   k - 1  k - 1 ProbError tipo II    Prob  Z      Z       2   X  X 

De la ecuación (1) y (2), se despeja la variable k y se iguala ambas ecuaciones:


k   0  Z 2 X

 0  Z 2 X  1  Z   X  Z 2 X  Z   X  1   0

k  1  Z   X

N n Asumiendo que  X  n N  1   N n  X Z 2  Z    1   0    Z 2  Z    1   0  n N 1 

Elevando al cuadrado toda la ecuación y despejando el valor de n, se tiene la ecuación:  N Z  Z   , donde: n N  1      Z  Z   2

2

2

2

1

X 

 n

2

2

0

2

Varianza conocida (δ2) y muestra pequeña (n<30) o N n  muestra grande (n≥30). N 1

S 2 N Z 2  Z  

2

n

N  11  0 

S X  n

2

 S Z 2  Z   2

2

, donde:

N n  Varianza desconocida y muestra grande (n≥30). N 1


Si N es infinita o es desconocida, el tamaño de muestra (n), será:  N Z  Z 

 2 N Z 2  Z  2 Límn   Lím n   Límn   2 2 2 N  N  N  11  0    Z 2  Z   N   N 1 

 N Z 2  Z   Límn   N 

N

 2 Z 2  Z   1  2 1  1   0   N  N

2

 2 Z 2  Z  2 n 1  0 2

2

 2

N

 1   0    N 

2

2

2

2

 2 Z 2  Z  2 N

 2 Z 2  Z  2  Límn   N  1  0 2

, donde:

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X   grande (n≥30) y N   n S 2 Z 2  Z  

2

n

X 

1  0 

2

, donde:

S  Varianza desconocida y muestra grande (n≥30) y N   n


¿Cómo saber si se está en la decisión correcta o incorrecta? y el valor de α/2 está en la cola izquierda

1-α/2

1-β

-∞

µ1

α/2 β

k

µ0

+∞

 k - 0  k - 0 ProbError tipo I   2  Prob  Z    2   Z 2      3  X  X 

 k - 1  k - 1 ProbError tipo II    Prob  Z   Z       4    X  X 

De la ecuación (3) y (4), se despeja la variable k y se iguala ambas ecuaciones:


k   0  Z 2 X

 0  Z 2 X  1  Z   X  Z   X  Z 2 X   0  1

k  1  Z   X

N n Asumiendo que  X  n N  1   N n  X Z   Z 2    0  1    Z   Z 2    0  1  n N 1 

Elevando al cuadrado toda la ecuación y despejando el valor de n, se tiene la ecuación:  N Z   Z  , donde: n N  1      Z   Z  2

2

2

2

0

X 

 n

2

2

1

2

Varianza conocida (δ2) y muestra pequeña (n<30) o N n  muestra grande (n≥30). N 1

S 2 N Z   Z 2 

2

n

N  10  1 

X 

2

S n

 S Z   Z 2  2

2

, donde:

N n  Varianza desconocida y muestra grande (n≥30). N 1


Si N es infinita o es desconocida, el tamaño de muestra (n), será:  2 N Z   Z 2 2 Límn   Lím n   Límn   N  N  N  10  1 2   2 Z   Z 2 2 N   N 1 

N 

N

 2 Z   Z 2  1  2 1   0  1   N  N

2

 2 Z   Z 2 2 n 0  1 2

N

  0  1    N 

 2 N Z   Z 2 2 Límn  

 2 N Z   Z 2 2 2

 2 Z   Z 2 2 N

 2 Z   Z 2 2  Límn   N  0  1 2

, donde:

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X   grande (n≥30) y N   n S 2 Z   Z 2 

2

n

X 

0  1 

2

, donde:

S  Varianza desconocida y muestra grande (n≥30) y N   n


Ejemplo 01: Un fabricante produce anillos para los pistones de un motor de automóvil. Un vendedor de una tienda concesionaria afirma que el promedio del diámetro es de 74 mm. Se sabe que el diámetro del anillo esta distribuido aproximadamente de manera normal, y que tiene una desviación estándar = 0.75 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de 74.036 mm. Se pide: a. Pruebe la hipótesis de que la media del diámetro de los anillos es de 74 mm. Utilice un nivel de significancia del 5%. b. Realice la prueba de la potencia para el inciso (a), considerando que la media real del diámetro de anillos es de 74.10 mm. c. Determine cual podría ser la muestra ideal, considerando los datos y resultados del inciso (b) y error tipo II no mayor del 10%.


Ejemplo 02: Un productor de cápsulas de uña de gato afirma que la demanda promedio de su producto en el mercado es de 1,000 cápsulas diarias. Sin embargo, un estudio de la demanda de su producto en 36 días aleatorios en todo el año da una media y una desviación estándar de 850 y 360 cápsulas diarias respectivamente. Se pide: a. Realice la prueba de hipótesis, ¿es esto suficiente evidencia para contradecir la afirmación de este productor? Utilice el nivel de significación a 1.5%. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 10% y determine el intervalo de confianza.


Ejemplo 03: Las cajas de cierto tipo de cereal procesadas por una fábrica deben tener un contenido promedio de 160 gramos y una desviación típica de 2 gramos. Por una queja ante el defensor del consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos: 157, 157, 163, 158, 161, 159, 162, 159, 158 y 156. Se pide: a. Realice la prueba de hipótesis ¿Es razonable que el inspector multe al fabricante? Utilice un nivel de significación del 5% y suponga que los contenidos tienen distribución normal. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 10% y determine el intervalo de confianza.


Caso 02: mĂŠtodo 01: punto crĂ­tico 1. Planteamiento de hipĂłtesis: H0: Âľ= Âľ0 Ha: Âľ> Âľ0 2. Nivel de significaciĂłn de la prueba Îą= 1%, 5%, 10%, etc. 3. Puntos crĂ­ticos: distribuciĂłn normal estĂĄndar teĂłrico RAH0

RRH0

1-Îą

-∞

Îą 0

đ?‘? + đ?›ź /2

+∞


4. Cálculo del estadístico: distribución normal estándar empírico: ZC 

X  0

X

donde X 

 n

Varianza conocida (δ2) y muestra pequeña (n<30) o N n  muestra grande (n≥30). N 1

Y

S X  n

n  0.05 N

Varianza desconocida y muestra grande (n≥30). N n  n N 1  0.05 Y N


X 

 n

S X   n

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). Y

n  0.05  N   N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05  N   N

5. Conclusiones: Si: Z  Z , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. 

C

Si: Z  Z , se rechaza la hipótesis nula (RH0); es decir, µ>µ0. A un nivel de confianza de (1-α)%. 

C


Caso 02: método 02: p-value. 1. Planteamiento de hipótesis: H0: µ= µ0 Ha: µ> µ0 2. Nivel de significación de la prueba α= 1%, 5%, 10%, etc. 3. Región crítica: distribución normal estándar teórico RAH0

1-α

-∞

0

RRH0 α

+∞ ProbZ  Z   α c


4. Cálculo del estadístico: ProbZ  Zc   α

5. Conclusiones: Si ProbZ  Zc    , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. Si ProbZ  Zc    , se rechaza la hipótesis nula (RH0); es decir, µ>µ0. A un nivel de confianza de (1-α)%.


RAH0

RRH0

1-α

-∞

α 0

𝑍 + 𝛼 /2

+∞

 X  0  P  Z    1    P 0  X  Z  X   1   X   IC  0 1 

IC  0 1  X - Z/2 X 

donde

Intervalo de confianza inferior.


X 

X 

X 

 n

S n

 n

Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30).  N 1

Y

N n  N 1

S X   n

n  0.05 N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05 N

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). n  0.05  N   Y N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05  N   N


DECISIÓN

NATURALEZA Rechazo la H0 Acepto la H0

H0 verdadera H0 falsa DECISIÓN = CORRECTA

Error tipo I α Potencia de la prueba 1-β

β≤10% 1-β>90%

Nivel de confianza 1-α Error tipo II β

DECISIÓN = INCORRECTA

Tenemos que aumentar el tamaño de muestra.

¿Cómo se logra aumentar el tamaño de muestra? Con la siguiente fórmula

β>10% 1-β≤90%


¿Cómo saber si se está en la decisión correcta o incorrecta?

1-α

-∞

µ0

1-β β

α

k

µ1

+∞

 k - 0  k - 0 ProbError tipo I    Prob  Z      Z      5  X  X   k - 1  k - 1 ProbError tipo II    Prob  Z      Z       6     X  X 

De la ecuación (5) y (6), se despeja la variable k y se iguala ambas ecuaciones:


k   0  Z  X

 0  Z  X  1  Z   X  Z  X  Z   X  1   0

k  1  Z   X

Asumiendo que

X 

  X Z  Z    1   0   

N n N 1 N n  Z  Z    1   0 N 1 

n  n

Elevando al cuadrado toda la ecuación y despejando el valor de n, se tiene la ecuación:  N Z  Z   , donde: n N  1      Z  Z   2

2

2

1

X 

 n

2

2

0

N n Varianza conocida (δ2) y muestra pequeña (n<30) o  muestra grande (n≥30). N 1

S 2 N Z  Z  

2

n

N  11  0 

X 

2

S n

 S Z  Z   2

2

, donde:

N n  Varianza desconocida y muestra grande (n≥30). N 1


Si N es infinita o es desconocida, el tamaño de muestra (n), será:  N Z  Z  Límn   Lím n  N 

N 

 N Z  Z    Límn   2 2 2 N  11  0    Z  Z   N   N 1  2

2

 2 N Z  Z   N 

N

 2 Z  Z   1  2 1  1   0   N  N

2

 2 Z  Z  2 n 1  0 2

2

N

 1   0   N  

2

Límn  

2

2

 2 Z  Z  2 N

 2 Z  Z  2  Límn   N  1  0 2

, donde:

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X   grande (n≥30) y N   n S 2 Z  Z  

2

n

1  0 

2

, donde:

S X   Varianza desconocida y muestra grande (n≥30) y N   n


Ejemplo 04: Un fabricante produce anillos para los pistones de un motor de automóvil. Un vendedor de una tienda concesionaria afirma que el promedio del diámetro es mayor de 74 mm. Se sabe que el diámetro del anillo esta distribuido aproximadamente de manera normal, y que tiene una desviación estándar = 0.75 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de 74.036 mm. Se pide: a. Pruebe la hipótesis de que la media del diámetro de los anillos es mayor de 74 mm. Utilice un nivel de significancia del 1%. b. Realice la prueba de la potencia para el inciso (a), considerando que la media real del diámetro de anillos es de 74.10 mm. c. Determine cual podría ser la muestra ideal, considerando los datos y resultados del inciso (b) y error tipo II no mayor del 5%.


Ejemplo 05: Un productor de cápsulas de uña de gato afirma que la demanda promedio de su producto en el mercado es mayor de 850 cápsulas diarias. Sin embargo, un estudio de la demanda de su producto en 36 días aleatorios en todo el año da una media y una desviación estándar de 1,000 y 360 cápsulas diarias respectivamente. Se pide: a. Realice la prueba de hipótesis, ¿es esto suficiente evidencia para contradecir la afirmación de este productor? Utilice el nivel de significación a 2%. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 15% y determine el intervalo de confianza.


Ejemplo 06: Las cajas de cierto tipo de cereal procesadas por una fábrica deben tener un contenido por encima de 160 gramos y una desviación típica de 2 gramos. Por una queja ante el defensor del consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos: 161, 163, 164, 165, 162, 164, 163, 164, 158 y 156. Se pide: a. Realice la prueba de hipótesis ¿Es razonable que el inspector multe al fabricante? Utilice un nivel de significación del 8% y suponga que los contenidos tienen distribución normal. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 20% y determine el intervalo de confianza.


Caso 03: mĂŠtodo 01: punto crĂ­tico 1. Planteamiento de hipĂłtesis: H0: Âľ= Âľ0 Ha: Âľ< Âľ0 2. Nivel de significaciĂłn de la prueba Îą= 1%, 5%, 10%, etc. 3. Puntos crĂ­ticos: distribuciĂłn normal estĂĄndar teĂłrico RAH0

RRH0 Îą

-∞

−đ?‘? − đ?›ź/2

1-Îą 0

+∞


4. Cálculo del estadístico: distribución normal estándar empírico: ZC 

X  0

X

donde X 

 n

Varianza conocida (δ2) y muestra pequeña (n<30) o N n  muestra grande (n≥30). N 1

Y

S X  n

n  0.05 N

Varianza desconocida y muestra grande (n≥30). N n  n N 1  0.05 Y N


X 

n

S X   n

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). Y

n  0.05  N   N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05  N   N

5. Conclusiones:

Si: Z   Z , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. 

C

Si:  Z   Z , se rechaza la hipótesis nula (RH0); es decir, µ<µ0. A un nivel de confianza de (1-α)%. 

C


Caso 03: método 02: p-value. 1. Planteamiento de hipótesis: H0: µ= µ0 Ha: µ< µ0 2. Nivel de significación de la prueba α= 1%, 5%, 10%, etc. 3. Región crítica: distribución normal estándar teórico RAH0

RRH0

1-α

α

-∞ ProbZ  Z   α c

0

+∞


4. Cálculo del estadístico: ProbZ  Zc   α

5. Conclusiones: Si ProbZ  Zc    , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. Si ProbZ  Zc    , se rechaza la hipótesis nula (RH0); es decir, µ>µ0. A un nivel de confianza de (1-α)%.


RAH0

RRH0

α

-∞

−𝑍 − 𝛼/2

1-α

+∞

0

 X  0  P - Z    1    P 0  X  Z  X   1   X   IC  0 1 

IC  0 1  X  Z/2 X 

donde

Intervalo de confianza superior.


X 

X 

X 

 n

S n

 n

Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30).  N 1

Y

N n  N 1

S X   n

n  0.05 N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05 N

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). n  0.05  N   Y N

Varianza desconocida y muestra grande (n≥30). Y

n  0.05  N   N


DECISIÓN

NATURALEZA Rechazo la H0 Acepto la H0

H0 verdadera H0 falsa DECISIÓN = CORRECTA

Error tipo I α Potencia de la prueba 1-β

β≤10% 1-β>90%

Nivel de confianza 1-α Error tipo II β

DECISIÓN = INCORRECTA

Tenemos que aumentar el tamaño de muestra.

¿Cómo se logra aumentar el tamaño de muestra? Con la siguiente fórmula

β>10% 1-β≤90%


¿Cómo saber si se está en la decisión correcta o incorrecta?

1-β

1-α α

-∞

µ1

β

k

µ0

+∞

 k - 0  k - 0 ProbError tipo I    Prob  Z      Z      7   X  X   k - 1  k - 1 ProbError tipo II    Prob  Z      Z       8    X  X 

De la ecuación (7) y (8), se despeja la variable k y se iguala ambas ecuaciones:


k   0  Z  X

 0  Z  X k  1  Z   X    Asumiendo que X n   X Z   Z    0  1    n

 1  Z   X  Z   X  Z  X   0  1

N n N 1 N n  Z   Z    0  1 N 1 

Elevando al cuadrado toda la ecuación y despejando el valor de n, se tiene la ecuación:  N Z   Z  , donde: n N  1      Z   Z  2

2

2

0

X 

 n

2

2

1

Varianza conocida (δ2) y muestra pequeña (n<30) o N n  muestra grande (n≥30). N 1

S 2 N Z   Z 

2

n

N  10  1 

X 

2

S n

 S Z   Z  2

2

, donde:

N n  Varianza desconocida y muestra grande (n≥30). N 1


Si N es infinita o es desconocida, el tamaño de muestra (n), será:  N Z  Z   2 N Z   Z 2 Límn   Lím n   Límn   2 2 2 N  N  N  10  1    Z   Z  N   N 1 

 2 N Z   Z  N 

N

 2 Z   Z  1  2 1   0  1   N  N

2

 2 Z   Z 2 n 0  1 2

2

N

  0  1   N  

2

Límn  

2

2

 2 Z   Z 2 N

 2 Z   Z 2  Límn   N  0  1 2

, donde:

Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X   grande (n≥30) y N   n S 2 Z   Z 

2

n

X 

0  1 

2

, donde:

S  Varianza desconocida y muestra grande (n≥30) y N   n


Ejemplo 07: Un fabricante produce anillos para los pistones de un motor de automóvil. Un vendedor de una tienda concesionaria afirma que el promedio del diámetro es menor de 75 mm. Se sabe que el diámetro del anillo esta distribuido aproximadamente de manera normal, y que tiene una desviación estándar = 0.75 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de 74.036 mm. Se pide: a. Pruebe la hipótesis de que la media del diámetro de los anillos es menor de 75 mm. Utilice un nivel de significancia del 2%. b. Realice la prueba de la potencia para el inciso (a), considerando que la media real del diámetro de anillos es de 74.10 mm. c. Determine cual podría ser la muestra ideal, considerando los datos y resultados del inciso (b) y error tipo II no mayor del 15%.


Ejemplo 08: Un productor de cápsulas de uña de gato afirma que la demanda promedio de su producto en el mercado es menor de 1,000 cápsulas diarias. Sin embargo, un estudio de la demanda de su producto en 36 días aleatorios en todo el año da una media y una desviación estándar de 850 y 360 cápsulas diarias respectivamente. Se pide: a. Realice la prueba de hipótesis, ¿es esto suficiente evidencia para contradecir la afirmación de este productor? Utilice el nivel de significación a 4%. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 10% y determine el intervalo de confianza.


Ejemplo 09: Las cajas de cierto tipo de cereal procesadas por una fábrica deben tener un contenido por debajo de 164 gramos y una desviación típica de 2 gramos. Por una queja ante el defensor del consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos: 161, 163, 164, 165, 162, 164, 163, 164, 158 y 156. Se pide: a. Realice la prueba de hipótesis ¿Es razonable que el inspector multe al fabricante? Utilice un nivel de significación del 6% y suponga que los contenidos tienen distribución normal. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 15% y determine el intervalo de confianza.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.