CAPÍTULO I: TEORÍA DEL MUESTREO - PRUEBAS DE HIPÓTESIS
- INTERVALO DE CONFIANZA - TAMAÑO DE MUESTRA Econ. Alex Rengifo Rojas.
Motivación… El objetivo es exponer los métodos estadísticos básicos que se aplican para tomar decisiones sobre la conjetura que se hace acerca de valor numérico del parámetro de una población en estudio y que es sometida a comprobación experimental con el propósito de determinar si los resultados de una muestra aleatoria extraída de esa población contradicen o no en forma significativa tal afirmación.
El proceso de la prueba de hipótesis nos conduce a tomar la decisión de rechazar o no rechazar la afirmación o conjetura acerca del valor numérico del parámetro de la población en estudio: Tal suposición tiene el nombre genérico de hipótesis estadística y puede ser verdadera o no.
Aclaraciones previas…!!! - HIPÓTESIS ESTADÍSTICAS Afirmación o conjetura que se hace acerca de la distribución de una o más poblaciones. O valor (es) de uno o más parámetros de la distribución, conocida su forma. Algunos ejemplos - El área media de los predios en la ciudad de Tingo María es 100 m2. - La proporción de fotocopias defectuosas producidas por las máquinas marca Epson es superior a 10%.
- La varianza de los salarios de los trabajadores de la Cooperativa Agraria Naranjillo es de S/. 250 soles2. - Son iguales las medias en el gasto en consumo de alimentos entre los hogares de la ciudad de Tingo María y Aucayacu que se distribuyen normalmente con varianzas desconocidas supuestas iguales a δ2. Y LA HIPÓTESIS DE INVESTIGACIÓN, ¿SERÁ IGUAL? Existe una pequeña diferencia, estás hipótesis se plantea no en términos estadísticos. Algunos ejemplos
- El tamaño de los predios en la ciudad de Tingo María es aceptable por sus propietarios. - Las fotocopias defectuosas producidas por las máquinas marca Epson están en el estándar normal. - Los salarios de los trabajadores de la Cooperativa Agraria Naranjillo son iguales para todos. - El gasto en consumo de alimentos entre los hogares de la ciudad de Tingo María y Aucayacu son similares.
- HIPÓTESIS SIMPLE E HIPÓTESIS COMPUESTA La hipótesis simple a cualquier hipótesis estadística que especifique un valor del parámetro. Por ejemplo: afirmar que µ0=100. La hipótesis compuesta no indica un valor específico del parámetro. Por ejemplo: afirmar que µ0>100 o µ0<100. Si µ0≠100, ¿Será simple o compuesta?
Es compuesta
- HIPÓTESIS NULA E HIPÓTESIS ALTERNATIVA La hipótesis nula (H0) se denomina a la hipótesis que es aceptada provisionalmente como verdadera y cuya validez será sometida a comprobación experimental, siendo la hipótesis principal a probar. La hipótesis alternativa o alternante (Ha o H1) se acepta en caso de que la hipótesis nula sea rechazada.
1.1. PRUEBA DE HIPÓTESIS DE UNA MEDIA (µ0) 1.1.1. VARIANZA DESCONOCIDA O VARIANZA CONOCIDA (δ2) Y MUESTRA GRANDE (n≥30), Y VARIANZA CONOCIDA Y MUESTRA PEQUEÑA (n<30) Caso 01: H0: µ= µ0 Ha: µ≠ µ0
Caso 02: H0: µ≤ µ0 o µ= µ0 Ha: µ> µ0
Caso 03: H0: µ≥ µ0 o µ= µ0 Ha: µ< µ0
Método 01: punto critico y método 02: pvalue.
VARIANZA DESCONOCIDA O VARIANZA CONOCIDA (δ2) Y MUESTRA GRANDE (n≥30): Si la población X no es normal, entonces, siempre que el tamaño n sea suficientemente grande (n≥30), por el teorema del límite central (TLC), la distribución de X es aproximadamente normal N , n VARIANZA CONOCIDA (δ2) Y MUESTRA PEQUEÑA (n<30): Si la población X es normal N , , entonces, por la propiedad reproductiva normal (PRN) la distribución de probabilidades de la media de la muestra X , es normal para cualquier tamaño de la muestra (n≥2). N ,
n
Caso 01: mĂŠtodo 01: punto crĂtico 1. Planteamiento de hipĂłtesis: H0: Âľ= Âľ0 Ha: Âľâ&#x2030; Âľ0 2. Nivel de significaciĂłn de la prueba Îą= 1%, 5%, 10%, etc. 3. Puntos crĂticos: distribuciĂłn normal estĂĄndar teĂłrico RAH0
RRH0
RRH0
1-Îą Îą/2
-â&#x2C6;&#x17E;
â&#x2C6;&#x2019;đ?&#x2018;? â&#x2C6;&#x2019; đ?&#x203A;ź/2
Îą/2 0
đ?&#x2018;? + đ?&#x203A;ź /2
+â&#x2C6;&#x17E;
4. Cálculo del estadístico: distribución normal estándar empírico: ZC
X 0
X
donde X
n
S X n
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
Y
n 0.05 N
Varianza desconocida y muestra grande (n≥30). N n n N 1 0.05 Y N
X
n
S X n
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). Y
n 0.05 N N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N N
5. Conclusiones: , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. Si: Z / 2 Z C Z / 2
Z C Z / 2 Z C Z / 2 ,
se rechaza la hipótesis nula (RH0); es decir, µ≠µ0. A un nivel de confianza de (1-α)%.
Caso 01: método 02: p-value. 1. Planteamiento de hipótesis: H0: µ= µ0 Ha: µ≠ µ0 2. Nivel de significación de la prueba α= 1%, 5%, 10%, etc. 3. Región crítica: distribución normal estándar teórico RAH0
RRH0
RRH0
1-α α/2
-∞
α/2 0
α ProbZ Zc 2ProbZ Zc α 2
+∞
RAH0
RRH0
RRH0
1-α
α/2
-∞
α/2 0
4. Cálculo del estadístico: α 2ProbZ Zc α 2 α ProbZ Zc 2ProbZ Zc α 2 ProbZ Zc
+∞
α ProbZ Zc 2ProbZ Zc α 2
5. Conclusiones: Si 2ProbZ Zc 2ProbZ Zc , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. Si 2ProbZ Zc 2ProbZ Zc , se rechaza la hipótesis nula (RH0); es decir, µ≠µ0. A un nivel de confianza de (1-α)%.
RAH0
RRH0
RRH0
1-Îą Îą/2
-â&#x2C6;&#x17E;
Îą/2
â&#x2C6;&#x2019;đ?&#x2018;? â&#x2C6;&#x2019; đ?&#x203A;ź/2
+â&#x2C6;&#x17E;
đ?&#x2018;? + đ?&#x203A;ź /2
0
ď&#x192;Š ď&#x192;š X ď&#x20AC; ď 0 P ď&#x192;Ş- Zď Ą/2 ď&#x201A;Ł ď&#x201A;Ł Zď Ą/2 ď&#x192;ş ď&#x20AC;˝ 1 ď&#x20AC; ď Ą ď&#x192;&#x17E; Pď &#x203A;X - Zď Ą/2ď ł X ď&#x201A;Ł ď 0 ď&#x201A;Ł X ď&#x20AC;Ť Zď Ą/2ď ł X ď ? ď&#x20AC;˝ 1 ď&#x20AC; ď Ą ď ł X ď&#x192;Ť ď&#x192;ť IC ď&#x20AC;¨ď 0 ď&#x20AC;Š1ď&#x20AC;ď Ą ď&#x20AC;
IC ď&#x20AC;¨ď 0 ď&#x20AC;Š1ď&#x20AC;ď Ą ď&#x20AC;˝ X - Zď Ą/2ď ł X ď&#x20AC;
IC ď&#x20AC;¨ď 0 ď&#x20AC;Š1ď&#x20AC;ď Ą ď&#x20AC;˝ X ď&#x20AC;Ť Zď Ą/2ď ł X ď&#x20AC;Ť
donde
IC ď&#x20AC;¨ď 0 ď&#x20AC;Š1ď&#x20AC;ď Ą ď&#x20AC;Ť
Intervalo de confianza inferior. Intervalo de confianza superior.
X
X
X
n
S n
n
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
Y
N n N 1
S X n
n 0.05 N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). n 0.05 N Y N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N N
IC 0 1
-∞
IC 0 1
µ0 X
+∞ Muestra 1
X
Muestra 2
X
Muestra 3 Muestra 4
X X
Muestra 5 Muestra 6
X X X
Muestra 7 Muestra 8
Gráfico 01.a: Interpretación de los intervalos de confianza
La muestra 3 y la muestra 7, el valor promedio no se encuentra en el intervalo de confianza rechazando la hipótesis nula; mientras, que las muestras restantes si están en el intervalo aceptando la hipótesis nula.
-∞ IC 0 1
0 IC 0 1
1° caso
+∞
IC 0 1
IC 0 1
IC 0 1
2° caso
IC 0 1
3° caso
Gráfico 01.b: Interpretación de los intervalos de confianza
Para el caso 1° y 2°: se rechaza la hipótesis nula; si y solo si, el intervalo de confianza inferior y superior son valores muy distintos. Para el caso 3°: se acepta la hipótesis nula, por que pasa por el origen el intervalo de confianza; tanto, inferior como superior.
¿A qué se le denomina e? Se le denomina error de la estimación. Al estimar por X es el valor numérico e X El valor mínimo del error de estimación es igual a cero, esto ocurre, cuando X estima exactamente a . El valor máximo del error de estimación es igual a Z / 2 X , ya que aplicando propiedades del valor absoluto al intervalo de estimación de , resulta que: e X e Z / 2 X X e
X e
X e
e
Si X estima a , entonces, se tiene una confianza del (1-α)% de que el error de está estimación no será superior al valor numérico Z / 2 X .
DECISIÓN
NATURALEZA Rechazo la H0 Acepto la H0
H0 verdadera H0 falsa DECISIÓN = CORRECTA
Error tipo I α Potencia de la prueba 1-β
β≤10% 1-β>90%
Nivel de confianza 1-α Error tipo II β
DECISIÓN = INCORRECTA
Tenemos que aumentar el tamaño de muestra.
¿Cómo se logra aumentar el tamaño de muestra? Con la siguiente fórmula
β>10% 1-β≤90%
Algunas aclaraciones…inicio. X 0 P - Z/2 Z/2 1 X - Z/2
X 0
X
2
Z / 2 2
X 0 Z2 / 2 X2 X 0 2 Z2 / 2 X
2 N n 2 X 0 n N 1
Despejando el tamaño de muestra (n): Z2 / 2 2 N Z2 / 2 2 N n n 2 2 2 N 1e 2 Z2 / 2 2 N 1 X 0 Z / 2
X
n
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
Z2 / 2 S 2 N n N 1e 2 Z2 / 2 S 2
X
S n
, donde:
, donde:
N n Varianza desconocida y muestra grande (n≥30). N 1
Si N es infinita o es desconocida, el tamaño de muestra (n), Z N será: Z N 2
Límn Lím N
N
2
/2
N 1e
2
/2
2
Z / 2 2
2
Límn N
2
N
N 1 2 Z / 2 e N N 2
2
Z2 / 2 2 Z2 / 2 2 Límn Lím Límn 2 2 N N N 1 2 Z / 2 e2 1 e N N
Z2 / 2 2 N n e2
, donde:
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X grande (n≥30) y N n Z2 / 2 S 2 N n e2
, donde:
S X Varianza desconocida y muestra grande (n≥30) y N n
Algunas aclaraciones…final.
¿Cómo saber si se está en la decisión correcta o incorrecta? y el valor de α/2 está en la cola derecha
1-α/2
-∞
µ0
1-β β α/2
k
µ1
+∞
k - 0 k - 0 ProbError tipo I 2 Prob Z 2 Z 2 1 X X k - 1 k - 1 ProbError tipo II Prob Z Z 2 X X
De la ecuación (1) y (2), se despeja la variable k y se iguala ambas ecuaciones:
k 0 Z 2 X
0 Z 2 X 1 Z X Z 2 X Z X 1 0
k 1 Z X
N n Asumiendo que X n N 1 N n X Z 2 Z 1 0 Z 2 Z 1 0 n N 1
Elevando al cuadrado toda la ecuación y despejando el valor de n, se tiene la ecuación: N Z Z , donde: n N 1 Z Z 2
2
2
2
1
X
n
2
2
0
2
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
S 2 N Z 2 Z
2
n
N 11 0
S X n
2
S Z 2 Z 2
2
, donde:
N n Varianza desconocida y muestra grande (n≥30). N 1
Si N es infinita o es desconocida, el tamaño de muestra (n), será: N Z Z
2 N Z 2 Z 2 Límn Lím n Límn 2 2 2 N N N 11 0 Z 2 Z N N 1
N Z 2 Z Límn N
N
2 Z 2 Z 1 2 1 1 0 N N
2
2 Z 2 Z 2 n 1 0 2
2
2
N
1 0 N
2
2
2
2
2 Z 2 Z 2 N
2 Z 2 Z 2 Límn N 1 0 2
, donde:
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X grande (n≥30) y N n S 2 Z 2 Z
2
n
X
1 0
2
, donde:
S Varianza desconocida y muestra grande (n≥30) y N n
¿Cómo saber si se está en la decisión correcta o incorrecta? y el valor de α/2 está en la cola izquierda
1-α/2
1-β
-∞
µ1
α/2 β
k
µ0
+∞
k - 0 k - 0 ProbError tipo I 2 Prob Z 2 Z 2 3 X X
k - 1 k - 1 ProbError tipo II Prob Z Z 4 X X
De la ecuación (3) y (4), se despeja la variable k y se iguala ambas ecuaciones:
k 0 Z 2 X
0 Z 2 X 1 Z X Z X Z 2 X 0 1
k 1 Z X
N n Asumiendo que X n N 1 N n X Z Z 2 0 1 Z Z 2 0 1 n N 1
Elevando al cuadrado toda la ecuación y despejando el valor de n, se tiene la ecuación: N Z Z , donde: n N 1 Z Z 2
2
2
2
0
X
n
2
2
1
2
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
S 2 N Z Z 2
2
n
N 10 1
X
2
S n
S Z Z 2 2
2
, donde:
N n Varianza desconocida y muestra grande (n≥30). N 1
Si N es infinita o es desconocida, el tamaño de muestra (n), será: 2 N Z Z 2 2 Límn Lím n Límn N N N 10 1 2 2 Z Z 2 2 N N 1
N
N
2 Z Z 2 1 2 1 0 1 N N
2
2 Z Z 2 2 n 0 1 2
N
0 1 N
2 N Z Z 2 2 Límn
2 N Z Z 2 2 2
2 Z Z 2 2 N
2 Z Z 2 2 Límn N 0 1 2
, donde:
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X grande (n≥30) y N n S 2 Z Z 2
2
n
X
0 1
2
, donde:
S Varianza desconocida y muestra grande (n≥30) y N n
Ejemplo 01: Un fabricante produce anillos para los pistones de un motor de automóvil. Un vendedor de una tienda concesionaria afirma que el promedio del diámetro es de 74 mm. Se sabe que el diámetro del anillo esta distribuido aproximadamente de manera normal, y que tiene una desviación estándar = 0.75 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de 74.036 mm. Se pide: a. Pruebe la hipótesis de que la media del diámetro de los anillos es de 74 mm. Utilice un nivel de significancia del 5%. b. Realice la prueba de la potencia para el inciso (a), considerando que la media real del diámetro de anillos es de 74.10 mm. c. Determine cual podría ser la muestra ideal, considerando los datos y resultados del inciso (b) y error tipo II no mayor del 10%.
Ejemplo 02: Un productor de cápsulas de uña de gato afirma que la demanda promedio de su producto en el mercado es de 1,000 cápsulas diarias. Sin embargo, un estudio de la demanda de su producto en 36 días aleatorios en todo el año da una media y una desviación estándar de 850 y 360 cápsulas diarias respectivamente. Se pide: a. Realice la prueba de hipótesis, ¿es esto suficiente evidencia para contradecir la afirmación de este productor? Utilice el nivel de significación a 1.5%. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 10% y determine el intervalo de confianza.
Ejemplo 03: Las cajas de cierto tipo de cereal procesadas por una fábrica deben tener un contenido promedio de 160 gramos y una desviación típica de 2 gramos. Por una queja ante el defensor del consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos: 157, 157, 163, 158, 161, 159, 162, 159, 158 y 156. Se pide: a. Realice la prueba de hipótesis ¿Es razonable que el inspector multe al fabricante? Utilice un nivel de significación del 5% y suponga que los contenidos tienen distribución normal. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 10% y determine el intervalo de confianza.
Caso 02: mĂŠtodo 01: punto crĂtico 1. Planteamiento de hipĂłtesis: H0: Âľ= Âľ0 Ha: Âľ> Âľ0 2. Nivel de significaciĂłn de la prueba Îą= 1%, 5%, 10%, etc. 3. Puntos crĂticos: distribuciĂłn normal estĂĄndar teĂłrico RAH0
RRH0
1-Îą
-â&#x2C6;&#x17E;
Îą 0
đ?&#x2018;? + đ?&#x203A;ź /2
+â&#x2C6;&#x17E;
4. Cálculo del estadístico: distribución normal estándar empírico: ZC
X 0
X
donde X
n
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
Y
S X n
n 0.05 N
Varianza desconocida y muestra grande (n≥30). N n n N 1 0.05 Y N
X
n
S X n
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). Y
n 0.05 N N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N N
5. Conclusiones: Si: Z Z , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%.
C
Si: Z Z , se rechaza la hipótesis nula (RH0); es decir, µ>µ0. A un nivel de confianza de (1-α)%.
C
Caso 02: método 02: p-value. 1. Planteamiento de hipótesis: H0: µ= µ0 Ha: µ> µ0 2. Nivel de significación de la prueba α= 1%, 5%, 10%, etc. 3. Región crítica: distribución normal estándar teórico RAH0
1-α
-∞
0
RRH0 α
+∞ ProbZ Z α c
4. Cálculo del estadístico: ProbZ Zc α
5. Conclusiones: Si ProbZ Zc , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. Si ProbZ Zc , se rechaza la hipótesis nula (RH0); es decir, µ>µ0. A un nivel de confianza de (1-α)%.
RAH0
RRH0
1-α
-∞
α 0
𝑍 + 𝛼 /2
+∞
X 0 P Z 1 P 0 X Z X 1 X IC 0 1
IC 0 1 X - Z/2 X
donde
Intervalo de confianza inferior.
X
X
X
n
S n
n
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
Y
N n N 1
S X n
n 0.05 N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). n 0.05 N Y N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N N
DECISIÓN
NATURALEZA Rechazo la H0 Acepto la H0
H0 verdadera H0 falsa DECISIÓN = CORRECTA
Error tipo I α Potencia de la prueba 1-β
β≤10% 1-β>90%
Nivel de confianza 1-α Error tipo II β
DECISIÓN = INCORRECTA
Tenemos que aumentar el tamaño de muestra.
¿Cómo se logra aumentar el tamaño de muestra? Con la siguiente fórmula
β>10% 1-β≤90%
¿Cómo saber si se está en la decisión correcta o incorrecta?
1-α
-∞
µ0
1-β β
α
k
µ1
+∞
k - 0 k - 0 ProbError tipo I Prob Z Z 5 X X k - 1 k - 1 ProbError tipo II Prob Z Z 6 X X
De la ecuación (5) y (6), se despeja la variable k y se iguala ambas ecuaciones:
k 0 Z X
0 Z X 1 Z X Z X Z X 1 0
k 1 Z X
Asumiendo que
X
X Z Z 1 0
N n N 1 N n Z Z 1 0 N 1
n n
Elevando al cuadrado toda la ecuación y despejando el valor de n, se tiene la ecuación: N Z Z , donde: n N 1 Z Z 2
2
2
1
X
n
2
2
0
N n Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). N 1
S 2 N Z Z
2
n
N 11 0
X
2
S n
S Z Z 2
2
, donde:
N n Varianza desconocida y muestra grande (n≥30). N 1
Si N es infinita o es desconocida, el tamaño de muestra (n), será: N Z Z Límn Lím n N
N
N Z Z Límn 2 2 2 N 11 0 Z Z N N 1 2
2
2 N Z Z N
N
2 Z Z 1 2 1 1 0 N N
2
2 Z Z 2 n 1 0 2
2
N
1 0 N
2
Límn
2
2
2 Z Z 2 N
2 Z Z 2 Límn N 1 0 2
, donde:
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X grande (n≥30) y N n S 2 Z Z
2
n
1 0
2
, donde:
S X Varianza desconocida y muestra grande (n≥30) y N n
Ejemplo 04: Un fabricante produce anillos para los pistones de un motor de automóvil. Un vendedor de una tienda concesionaria afirma que el promedio del diámetro es mayor de 74 mm. Se sabe que el diámetro del anillo esta distribuido aproximadamente de manera normal, y que tiene una desviación estándar = 0.75 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de 74.036 mm. Se pide: a. Pruebe la hipótesis de que la media del diámetro de los anillos es mayor de 74 mm. Utilice un nivel de significancia del 1%. b. Realice la prueba de la potencia para el inciso (a), considerando que la media real del diámetro de anillos es de 74.10 mm. c. Determine cual podría ser la muestra ideal, considerando los datos y resultados del inciso (b) y error tipo II no mayor del 5%.
Ejemplo 05: Un productor de cápsulas de uña de gato afirma que la demanda promedio de su producto en el mercado es mayor de 850 cápsulas diarias. Sin embargo, un estudio de la demanda de su producto en 36 días aleatorios en todo el año da una media y una desviación estándar de 1,000 y 360 cápsulas diarias respectivamente. Se pide: a. Realice la prueba de hipótesis, ¿es esto suficiente evidencia para contradecir la afirmación de este productor? Utilice el nivel de significación a 2%. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 15% y determine el intervalo de confianza.
Ejemplo 06: Las cajas de cierto tipo de cereal procesadas por una fábrica deben tener un contenido por encima de 160 gramos y una desviación típica de 2 gramos. Por una queja ante el defensor del consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos: 161, 163, 164, 165, 162, 164, 163, 164, 158 y 156. Se pide: a. Realice la prueba de hipótesis ¿Es razonable que el inspector multe al fabricante? Utilice un nivel de significación del 8% y suponga que los contenidos tienen distribución normal. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 20% y determine el intervalo de confianza.
Caso 03: mĂŠtodo 01: punto crĂtico 1. Planteamiento de hipĂłtesis: H0: Âľ= Âľ0 Ha: Âľ< Âľ0 2. Nivel de significaciĂłn de la prueba Îą= 1%, 5%, 10%, etc. 3. Puntos crĂticos: distribuciĂłn normal estĂĄndar teĂłrico RAH0
RRH0 Îą
-â&#x2C6;&#x17E;
â&#x2C6;&#x2019;đ?&#x2018;? â&#x2C6;&#x2019; đ?&#x203A;ź/2
1-Îą 0
+â&#x2C6;&#x17E;
4. Cálculo del estadístico: distribución normal estándar empírico: ZC
X 0
X
donde X
n
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
Y
S X n
n 0.05 N
Varianza desconocida y muestra grande (n≥30). N n n N 1 0.05 Y N
X
n
S X n
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). Y
n 0.05 N N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N N
5. Conclusiones:
Si: Z Z , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%.
C
Si: Z Z , se rechaza la hipótesis nula (RH0); es decir, µ<µ0. A un nivel de confianza de (1-α)%.
C
Caso 03: método 02: p-value. 1. Planteamiento de hipótesis: H0: µ= µ0 Ha: µ< µ0 2. Nivel de significación de la prueba α= 1%, 5%, 10%, etc. 3. Región crítica: distribución normal estándar teórico RAH0
RRH0
1-α
α
-∞ ProbZ Z α c
0
+∞
4. Cálculo del estadístico: ProbZ Zc α
5. Conclusiones: Si ProbZ Zc , se acepta la hipótesis nula (AH0); es decir, µ=µ0. A un nivel de confianza de (1-α)%. Si ProbZ Zc , se rechaza la hipótesis nula (RH0); es decir, µ>µ0. A un nivel de confianza de (1-α)%.
RAH0
RRH0
α
-∞
−𝑍 − 𝛼/2
1-α
+∞
0
X 0 P - Z 1 P 0 X Z X 1 X IC 0 1
IC 0 1 X Z/2 X
donde
Intervalo de confianza superior.
X
X
X
n
S n
n
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
Y
N n N 1
S X n
n 0.05 N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra grande (n≥30). n 0.05 N Y N
Varianza desconocida y muestra grande (n≥30). Y
n 0.05 N N
DECISIÓN
NATURALEZA Rechazo la H0 Acepto la H0
H0 verdadera H0 falsa DECISIÓN = CORRECTA
Error tipo I α Potencia de la prueba 1-β
β≤10% 1-β>90%
Nivel de confianza 1-α Error tipo II β
DECISIÓN = INCORRECTA
Tenemos que aumentar el tamaño de muestra.
¿Cómo se logra aumentar el tamaño de muestra? Con la siguiente fórmula
β>10% 1-β≤90%
¿Cómo saber si se está en la decisión correcta o incorrecta?
1-β
1-α α
-∞
µ1
β
k
µ0
+∞
k - 0 k - 0 ProbError tipo I Prob Z Z 7 X X k - 1 k - 1 ProbError tipo II Prob Z Z 8 X X
De la ecuación (7) y (8), se despeja la variable k y se iguala ambas ecuaciones:
k 0 Z X
0 Z X k 1 Z X Asumiendo que X n X Z Z 0 1 n
1 Z X Z X Z X 0 1
N n N 1 N n Z Z 0 1 N 1
Elevando al cuadrado toda la ecuación y despejando el valor de n, se tiene la ecuación: N Z Z , donde: n N 1 Z Z 2
2
2
0
X
n
2
2
1
Varianza conocida (δ2) y muestra pequeña (n<30) o N n muestra grande (n≥30). N 1
S 2 N Z Z
2
n
N 10 1
X
2
S n
S Z Z 2
2
, donde:
N n Varianza desconocida y muestra grande (n≥30). N 1
Si N es infinita o es desconocida, el tamaño de muestra (n), será: N Z Z 2 N Z Z 2 Límn Lím n Límn 2 2 2 N N N 10 1 Z Z N N 1
2 N Z Z N
N
2 Z Z 1 2 1 0 1 N N
2
2 Z Z 2 n 0 1 2
2
N
0 1 N
2
Límn
2
2
2 Z Z 2 N
2 Z Z 2 Límn N 0 1 2
, donde:
Varianza conocida (δ2) y muestra pequeña (n<30) o muestra X grande (n≥30) y N n S 2 Z Z
2
n
X
0 1
2
, donde:
S Varianza desconocida y muestra grande (n≥30) y N n
Ejemplo 07: Un fabricante produce anillos para los pistones de un motor de automóvil. Un vendedor de una tienda concesionaria afirma que el promedio del diámetro es menor de 75 mm. Se sabe que el diámetro del anillo esta distribuido aproximadamente de manera normal, y que tiene una desviación estándar = 0.75 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de 74.036 mm. Se pide: a. Pruebe la hipótesis de que la media del diámetro de los anillos es menor de 75 mm. Utilice un nivel de significancia del 2%. b. Realice la prueba de la potencia para el inciso (a), considerando que la media real del diámetro de anillos es de 74.10 mm. c. Determine cual podría ser la muestra ideal, considerando los datos y resultados del inciso (b) y error tipo II no mayor del 15%.
Ejemplo 08: Un productor de cápsulas de uña de gato afirma que la demanda promedio de su producto en el mercado es menor de 1,000 cápsulas diarias. Sin embargo, un estudio de la demanda de su producto en 36 días aleatorios en todo el año da una media y una desviación estándar de 850 y 360 cápsulas diarias respectivamente. Se pide: a. Realice la prueba de hipótesis, ¿es esto suficiente evidencia para contradecir la afirmación de este productor? Utilice el nivel de significación a 4%. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 10% y determine el intervalo de confianza.
Ejemplo 09: Las cajas de cierto tipo de cereal procesadas por una fábrica deben tener un contenido por debajo de 164 gramos y una desviación típica de 2 gramos. Por una queja ante el defensor del consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos: 161, 163, 164, 165, 162, 164, 163, 164, 158 y 156. Se pide: a. Realice la prueba de hipótesis ¿Es razonable que el inspector multe al fabricante? Utilice un nivel de significación del 6% y suponga que los contenidos tienen distribución normal. b. Determine el error tipo II. Considere la media real como el valor de la media muestral. c. ¿Cuál será la muestra óptima? Si se quiere cometer un error tipo II del 15% y determine el intervalo de confianza.