Sesión11

Page 1

Distribuciones de Probabilidad Muestrales (Parte II) Curso Probabilidad y Estadística I Marco Alvarado Peña

Sesión 11


Objetivos de Aprendizaje 1. Aplicar los conceptos de distribución de probabilidad muestrales para estudiar el comportamiento de los fenómenos físicos que ocurren aleatoriamente. 2. Aplicar los distribución muestral según aplique el análisis para pruebas de medias, varianza o varianzas.

2


Índice Distribuciones de Probabilidad Muestrales.............................1 Objetivos de Aprendizaje....................................................... 2 Teorema central del límite (TLC)........................................... 8 Distribución Chi Cuadrado.................................................... 9 Procedimiento basado en la suposición de normalidad........ 9 Procedimiento de prueba de una muestra grande................ 10 Solución................................................................................ 18 Probabilidades de la Distribución-t...................................... 22 Grados de libertad.................................................................. 25 Diferencia entre dos promedios............................................ 28 Comparar una muestra con un valor meta o target............ 31 ¿Tiene datos continuos o datos sobre atributos?.............. 32 Datos continuos.................................................................... 32 Datos sobre atributos............................................................ 33 Comparación de Una Muestra (1 Muestra t-Test) Varianza Desconocida............................................................34 Propósito............................................................................... 34 Pasos de la Prueba de Hipótesis.......................................... 35 ¿Qué está comparando?........................................................36 3


Media vs. objetivo............................................................... 36 Recordar............................................................................... 38 Definir la Hipótesis................................................................. 38 Definir el problema................................................................ 38 Calcular Estadísticos Muestrales......................................... 42 Decisión de la Prueba & Riesgo del Error Tipo I................. 43 Intervalo de Confianza para ............................................... 44 Prueba t................................................................................... 46 Prueba t de muestra 1.......................................................... 46 Cuándo utilizar una prueba t de 1 muestra........................... 47 Por qué utilizar una prueba t de 1 muestra........................... 47 Prueba de la hipótesis nula................................................... 48 Hipótesis estadísticas........................................................... 48 Interpretación de sus resultados.......................................... 50 Lógica de las pruebas de hipótesis....................................... 50 Intervalos de confianza.......................................................... 52 ¿Qué es un intervalo de confianza?..................................... 52 Uso del intervalo de confianza.............................................. 53 Interpretación de sus resultados.......................................... 54

4


Intervalo de confianza........................................................... 54 Interpretación de sus resultados.......................................... 56 Prueba de hipótesis.............................................................. 56 Potencia y tamaño de la muestra.......................................... 58 Ejemplo: Evaluación de la potencia...................................... 58 Análisis de potencia............................................................... 59 ¿Qué es un análisis de potencia?......................................... 59 Determinación del parámetro de diferencia......................... 62 Determinación de la potencia................................................ 64 Valores.................................................................................. 64 Desviación estándar............................................................. 64 Prueba t de 1 muestra............................................................ 72 Prueba de la hipótesis nula................................................... 74 Interpretación de sus resultados.......................................... 75 Conclusiones.........................................................................75 Interpretación de sus resultados.......................................... 76 Prueba de normalidad de Anderson-Darling......................... 77 Conclusiones.........................................................................79 Consideraciones finales........................................................ 79

5


Resumen y conclusiones...................................................... 79 Consideraciones adicionales................................................ 80 Potencia y tamaño de la muestra para la prueba t de 2 muestras....................................................................... 81 Tamaño de la muestra para la comparación de proveedores.......................................................................... 81 Potencia y tamaño de la muestra para una prueba t de 2 muestras....................................................................... 82 ¿Qué es la potencia y el tamaño de la muestra para una prueba t de 2 muestras?................................................ 82 Determinación del tamaño de muestra para pruebas t de 2 muestras..........................................................................84 Tamaños de muestras.......................................................... 84 Valores de diferencia y desviación estándar........................ 84 Valores de potencia.............................................................. 84 Interpretación de sus resultados........................................... 86 Prueba t de 2 muestras.......................................................... 88 Conjunto de datos................................................................. 89 Prueba t de 2 muestras independientes.............................. 89 Qué es una prueba t de dos muestras independientes........ 89 6


Realizaci贸n de la prueba t de 2 muestras............................ 92 Valor T y valor p.................................................................... 98 Prueba del supuesto de normalidad .....................................99 Prueba de normalidad de Anderson-Dariling........................ 102 Conclusiones.........................................................................102 Comparaci贸n de varianzas.................................................... 103 Interpretaci贸n de sus resultados........................................... 105 Consideraciones finales........................................................ 108 Resumen y conclusiones...................................................... 108 Consideraciones adicionales................................................ 109 Referencias............................................................................. 110

7


Teorema central del lĂ­mite (TLC) Una de las razones por las que la distribuciĂłn normal es tan importante es debido al TLC que en un caso particular afirma: Sea x1, x2, ..., xn una muestra aleatoria de cualquier poblaciĂłn, y sea đ?‘ĽĚ… la media muestral; entonces independientemente de cĂłmo sea la distribuciĂłn de la poblaciĂłn de donde se extrajo la muestra, la distribuciĂłn de đ?‘ĽĚ… se aproxima a la normal N (đ?œ‡, đ?œŽ 2 ) conforme n crece. La forma lĂ­mite de la distribuciĂłn de:

đ?’›=

Ě…âˆ’đ?? đ?‘ż đ??ˆ / √đ?’?

Conforme đ?‘› → ∞, es la distribuciĂłn normal estĂĄndar N (0,1). - En algunos casos la aproximaciĂłn puede ser buena para n pequeĂąa n < 10. - En otros casos se necesita un n grande, n > 100. - En el caso en que las x tengan la misma distribuciĂłn y no sea radiacalmente diferente a la normal, entonces un n ≼ 4 es suficiente. 8


DistribuciĂłn Chi Cuadrado En ocasiones se necesitan pruebas relativas a la varianza o la desviaciĂłn estĂĄndar de una poblaciĂłn. Procedimiento basado en la suposiciĂłn de normalidad a. Suponga que se desea probar la hipĂłtesis de que la varianza de una distribuciĂłn normal ď ł2 es igual a un valor especĂ­fico ď ł0. b. Para probar la hipĂłtesis H0: ď ł2 = ď ł20 vs H1: ď ł2 = ď ł20 c. empleamos la estadĂ­stica de prueba i. đ?œ’02 =

(đ?‘›âˆ’1)đ?‘ 2 đ?œŽ02

d. Donde s2 es la varianza de la muestra. Si Ho es cierta, la estadĂ­stica de prueba ď Ł20 sigue la distribuciĂłn chi-cuadrado con n-1 grados de libertad. e. En consecuencia, H0: ď ł2 = ď ł20 se rechazarĂ­a si i. đ?œ’02 > đ?œ’đ?›ź2â „

2, đ?‘›âˆ’1

Ăł si Valor P  ď Ą

9


Procedimiento de prueba de una muestra grande - Cuando la poblaciĂłn base no es necesariamente normal, pero n es grande (n ď‚ł 35 Ăł 40) - Entonces se puede utilizar la distribuciĂłn normal estĂĄndar de đ?‘?0 =

đ?‘ −đ?œŽ đ?œŽ ⠄√2đ?‘›

Ejemplo Considere una mĂĄquina que se utiliza para llenar latas de refresco. Si la varianza del volumen de llenado excede 0.02 onzas2, un gran porcentaje de latas se llenarĂĄn por debajo del nivel aceptable. El embotellador estĂĄ interesado en probar la hipĂłtesis: H0: ď ł2 = 0,02 H1: ď ł2 > 0,02

Una muestra aleatoria de n= 20 latas produce una varianza muestral de s2 = 0,0225. Por lo tanto, la estadĂ­stica de prueba es đ?œ’02

(đ?‘› − 1)đ?‘ 2 (19)0,0225 = = = 21.38 0,02 đ?œŽ02

10


Encontramos el valor tabular ď Ł20,05, 19= 30,14 y se concluye que no hay suficiente evidencia de que la varianza de llenado excede 0.02 onzas de liquido2.

Tests Method

Chi-Square

DF

P-Value

Standard

21,38

19

0,316

Fig 1. Ejemplo de DistribuciĂłn Chi Cuadrado

11


Hecho en Minitab

Fig 2. Variance - Minitab

12


Method Null hypothesis

Sigma-squared=0.02

Alternative hypotesis

Sigma-squared>0.02

The chi-square method is only for the normal distribution. The Bonett method cannot be calculated with summarized data.

Statistics N

StDev

Variance

20

0.150

0.0225

95% One-Sided Confidence Intervals

Lower Bound

Lower Bound

Method

for StDev

for Variance

Chi-Square

0.119

0.0142

Test Test Method

Statistic

DF

P-Value

Chi-Square

21.38

19

0.316

13


Otra forma en Minitab

Fig 3. Pesta帽a: Distribuci贸n - Minitab

14


Fig 4. PestaĂąa: Ă rea sombreada - Minitab

15


Fig 5. Gr谩fica de distribuci贸n

16


Hipótesis nula

Sigma-cuadrado=0.02

Hipótesis alterna

Sigma-cuadrado>0.02

El método de chi-cuadrada sólo se utiliza para la distribución normal. El método de Bonett no se puede calcular con datos resumidos.

Estadísticas N

Desv.Est.

Varianza

20

0.150

0.0225

95% Intervalos de confianza unilaterales

Límite Inferior

Límite Inferior

Método

Para Desv.Est.

Para Varianza

Chi-Cuadrado

0.119

0.0142

Estadística de prueba 21.38

GL

Valor P

19

0.316

Pruebas Método Chi-Cuadrado

17


Ejemplo Chi-Cuadrado Un fabricante de baterĂ­as para auto garantiza que sus baterĂ­as durarĂĄn en promedio, tres aĂąos con una desviaciĂłn estĂĄndar de un aĂąo. Si cinco de estas baterĂ­as tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 aĂąos, Âżel fabricante aĂşn estĂĄ convencido de que sus baterĂ­as tienen una desviaciĂłn estĂĄndar de un aĂąo? Suponga que la duraciĂłn de la baterĂ­a sigue una distribuciĂłn normal.

SoluciĂłn Encontramos primero la varianza de la muestra: (5)(48.26) − (15)2 đ?‘ = = 0.815 (5)(4) 2

Entonces, đ?œ’2 =

(4)(0.815) = 3.26 1

es una valor de una distribuciĂłn ji cuadrada con 4 grados de libertad. Como 95% de los valores đ?œ’ 2 con 4 grados de libertad caen entre 0.484 y 11.143, el valor calculado con đ?œŽ 2 = 1 es razonable y por tanto el fabricante no tiene razĂł para sospechar que la desviaciĂłn estĂĄndar es diferente a un aĂąo. 18


Resuelto por Minitab

Fig 6. Variance - Minitab

19


Test and CI for One Variance Method Null hypothesis

Sigma = 1

Alternative hypotesis

Sigma < 1

The chi-square method is only for the normal distribution. The Bonett method cannot be calculated with summarized data.

Statistics N

StDev

Variance

5

0.903

0.915

95% One-Sided Confidence Intervals

Lower Bound

Lower Bound

Method

for StDev

for Variance

Chi-Square

2.142

4.587

Test Test Method

Statistic

DF

P-Value

Chi-Square

3.26

4

0.485

20


Fig 7. Gr谩fica de Distribuci贸n

21


Probabilidades de la DistribuciĂłn-t Caso 2: Media poblacional y desviaciĂłn estĂĄndar Desconocidas. a. En muchos casos, la desviaciĂłn estĂĄndar es desconocida. Considere una muestra de 16 costarricenses. b. Estimar la desviaciĂłn estĂĄndar poblacional ď ł basada en la desviaciĂłn estĂĄndar muestral s. c. Los valores estandarizados ya no son normales. Siguen una distribuciĂłn-t con n-1 grados de libertad (df) para compensar por la variabilidad extra introducida al estimar ď ł : đ?‘‹Ě… − đ?œ‡ đ?‘Ą= đ?‘ â „ đ?‘› √

22


Distribuci贸n-t La forma de la distribuci贸n-t depende de los grados de libertad.

df = 1

Fig 8. Distribuci贸n-t df=1

23


df = 30

Fig 9. Distribuci贸n-t df=30

24


Grados de libertad La desviaci贸n est谩ndar de la muestra es de hecho una medida de variabilidad. Una variabilidad grande en un conjunto de datos produce valores relativamente grandes de (x-x)2 y por ello una varianza de la muestra grande. La cantidad n-1 a menudo se denomina grados de libertad asociados a la varianza estimada y representan el n煤mero de piezas de informaci贸n independientes disponibles para calcular la variabilidad.

25


Probabilidades de la Distribución-t: Ejemplo Usar Minitab para encontrar la P(t>1.2) para 15 grados de libertad

Fig 10. Pestaña: Distribución - Minitab

Fig 11. Pestaña: Área sombreada - Minitab

26


Fig 12. Gr谩fico de Distribuci贸n

Conclusi贸n

27


Diferencia entre dos promedios Se llevan a cabo dos experimentos independientes en los que se comparan dos tipos diferentes de pintura. Se pintan 18 especĂ­menes con el tipo A y en cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el tipo B. Se sabe que ambas desviaciones estĂĄndar de la poblaciĂłn tienen un valor de 1.0.

Suponga que el tiempo medio de secado es igual para los dos tipos de pintura, encuentre Pr(đ?‘‹Ě…đ??´ − đ?‘‹Ě…đ??ľ > 1.0), donde đ?‘‹Ě…đ??´ y đ?‘‹Ě…đ??ľ son los tiempos promedio de secado para muestras de tamaĂąo đ?‘›đ??´ = đ?‘›đ??ľ = 18.

28


SoluciĂłn đ?œ‡đ?‘‹Ě…đ??´ −đ?‘‹Ě…đ??ľ = đ?œ‡đ??´ − đ?œ‡đ??ľ = 0 y varianza đ?œŽđ?‘‹2Ě…đ??´ −đ?‘‹Ě…đ??ľ

đ?œŽđ??´2 đ?œŽđ??ľ2 1 1 1 = + = + = đ?‘›đ??´ đ?‘›đ??ľ 18 18 9

Fig 13. Ă rea para el ejemplo

29


La probabilidad que se desea estĂĄ dada por la regiĂłn sombreada en la figura 13. En correspondencia con el valor đ?‘‹Ě…đ??´ − đ?‘‹Ě…đ??ľ = 1.0, tenemos đ?‘?=

1 − (đ?œ‡đ??´ − đ?œ‡đ??ľ ) √1â „9

=

1−0 √1⠄9

= 3.0

por lo que Pr(đ?‘§ > 3.0) = 1 − Pr(đ?‘§ < 3.0) = 1 − 0.9987 = 0.0013

Fig 14. GrĂĄfico de DistribuciĂłn

30


Comparar una muestra con un valor meta o target

Fig 15. Comparaci贸n de una muestra con un valor meta o target

31


ÂżTiene datos continuos o datos sobre atributos?

Datos continuos Mide una caracterĂ­stica de una parte o proceso, como por ejemplo la longitud, el peso o la temperatura. Los datos suelen incluir valores fraccionarios (o decimales).

Ejemplo Un ingeniero de calidad desea determinar si el peso medio difiere del valor indicado en la etiqueta del paquete (500 g). El ingeniero toma una muestra de cajas de cereal y registra el peso de las cajas.

Fig 16. Datos continuos

32


Datos sobre atributos Cuenta la presencia de una característica o condición, como un rasgo físico, un tipo de defecto o una calificación, como por ejemplo pasa / no pasa. Los datos de conteos son números enteros.

Ejemplo Los gerentes de un banco desean saber si la proporción de clientes que están interesados en préstamos estudiantiles es lo suficientemente alta (por lo menos 5%) para justificar el ofrecimiento del servicio. Encuestan a 3500 clientes y cuentan cuántos de ellos están interesados en préstamos estudiantiles. Fig 17. Datos sobre atributos

33


Comparación de Una Muestra (1 Muestra t-Test) Varianza Desconocida Propósito Comparar la media de un proceso con un valor objetivo, nominal (target).

Ejemplo Después de realizar un mantenimiento preventivo, una máquina necesita ser evaluada para determinar si todavía está en su valor meta (1.2 mil). Se considera que el proceso esta en el valor nominal si la media verdadera esta dentro de ±0.1 mils del valor nominal (target).

34


Pasos de la Prueba de Hip贸tesis 1. Definir la hip贸tesis 2. Calcular los estad铆sticos muestrales 3. Determinar las probabilidades 4. Tomar la decisi贸n

35


¿Qué está comparando?

Media vs. objetivo Compare la media de un proceso con un valor objetivo, como por ejemplo una meta ideal, para determinar si difieren. Suele utilizarse para evaluar si un proceso está descentrado.

Ejemplo Un inspector mide un lote de rines recibidos y registra los diámetros. El inspector quiere determinar si el diámetro medio de los rines es igual al diámetro objetivo de 16 pulgadas.

Fig 18. Ejemplo de media vs. Objetivo

36


Desviación estándar vs. objetivo Compare la desviación estándar de un proceso con un valor objetivo, como por ejemplo un valor de referencia, para determinar si difieren. Suele utilizarse para evaluar qué tan consistente es un proceso.

Ejemplo Un distribuidor de madera desea analizar qué tan consistentemente un aserradero produce vigas de una longitud particular. El distribuidor mide una muestra de vigas para determinar si la desviación estándar de las longitudes es menor que el valor máximo permisible de 0,5cm.

Fig 19. Ejemplo de desviación estándar vs. objetivo

37


Definir la Hipótesis Definir el problema ¿Está la máquina corriendo en el valor nominal de 1.2mils?

Hipótesis Nula H0:  = 1.2 (máquina está en valor nominal)

Hipótesis Alternativa H1:   1.2 (máquina no está en valor nominal)

Recordar

38


Ejemplo Los cinescopios para televisión del fabricante A tienen una duración media de 6.5 años y una desviación estándar de 0.9 años, mientras que los del fabricante B tienen una duración media de 6.0 años y una desviación estándar de 0.8 años. ¿Cuál es la probabilidad de que una muestra aleatoria de 36 cinescopios del fabricante A tengan una duración media que sea al menos de un año más que la duración media de una muestra de 49 cinescopios del fabricante B?

Solución Se nos da la siguiente información:

Población 1

Población 2

𝜇1 = 6.5

𝜇2 = 6.0

𝜎1 = 0.9

𝜎2 = 0.8

𝑛1 = 36

𝑛2 = 49

39


Si utilizamos el teorema 8.3, la distribuciĂłn muestral de đ?‘‹Ě…1 − đ?‘‹Ě…2 serĂĄ aproximadamente normal y tendrĂĄ una media y una desviaciĂłn estĂĄndar de đ?œ‡đ?‘‹Ě…1 −đ?‘‹Ě…2 = 6.5 − 6.0 = 0.5

y

đ?œŽđ?‘‹Ě…1−đ?‘‹Ě…2 = √

0.81 36

+

0.64 49

= 0.189

La probabilidad de qua la media de 36 cinescopios del fabricante A sea al menos un aĂąo mayor que la media de 49 cinescopios del fabricante B estĂĄ dada por el ĂĄrea de la regiĂłn sombreada de la figura 20. Con respecto al valor đ?‘‹Ě…1 − đ?‘‹Ě…2 = 1.0, encontramos que đ?‘§=

1.0 − 0.5 = 2.65 0.189

Fig 20. Ă rea para el ejemplo

40


Fig 21. 2-Sample t

Two-Sample T-Test and CI * NOTE * Graphs cannot be made with summarized data.

Sample

N

Mean

StDev

SE MEan

1

36

6.500

0.900

0.15

2

49

6.000

0.800

0.11

Difference = mu (1) – mu (2) Estimate for difference: 0.500 95% lower bound for difference: 0.186 T-Test od difference = 0 (vs >): T-Value = 2.65 P-Value = 0.005 DF = 70

41


Calcular Estadísticos Muestrales - Se recolectaron 16 mediciones de la máquina nueva. Los datos están en archivo máquina.mtw. - Se calcularon los siguientes estadísticos: 

Tamaño muestra: n = 16

̅ = 1.193 Media muestral: X

Desviación estándar muestral: s = 0.103

a. ¿Qué tan cerca debe estar la media muestral a 1.2 mils para concluir que la máquina está en el valor nominal? b. ¿Se toma en cuenta la incertidumbre introducida por el muestreo?

Una mejor manera de pensar sobre esta pregunta…

42


Decisión de la Prueba & Riesgo del Error Tipo I a. Se determina probabilidad “baja” al definir , el riesgo de cometer un error tipo I - Error Tipo I: Rechazar la hipótesis nula cuando esta es verdadera b. Típicamente se define  en 0.05 ó 5% c. Especificar  determina el área de la cola o “región de rechazo” para el estadístico de prueba

43


Intervalo de Confianza para ď ­ - La incertidumbre asociada con los datos muestrales puede ser cuantificada usando un intervalo de confianza. - La fĂłrmula de (1-ď Ą)% para un Intervalo de Confianza para ď ­ es đ?‘ĽĚ… Âą đ?‘Ąđ?›źâ „2,đ?‘›âˆ’1 đ?‘ â „ √đ?‘› - Se puede tener un 100(1-ď Ą)% de confianza que el intervalo incluye la media verdadera, ď ­, o sea, que el intervalo de confianza representa un rango de valores posibles de la media ď ­ - Otra perspectiva: Si ď Ą = 0.05, tenemos đ?‘Ąđ?›źâ „2,đ?‘›âˆ’1 ď € 2. Para n>30, esta cantidad es +/- 2 desviaciones estĂĄndar en ambos lados de la media muestral lo cual debe contener un 95% de los datos

44


Ejemplo Máquina: Intervalo de Confianza De los datos muestrales: - Tamaño muestra: n = 16 ̅ = 1.193 - Media muestral: X - Desviación estándar muestral: s = 0.103

Usando Minitab, t 0.025, 15 = 2.1314

El intervalo de confianza del 95% para la verdadera media del proceso de la máquina es 1.193 ± (2.1314)

0.103 √16

= (1.138, 1.248)

45


Prueba t Prueba t de muestra 1 ÂżQuĂŠ es una prueba t de 1 muestra? Utilice una prueba t de una muestra para determinar si đ?œ‡ (la media de la poblaciĂłn) es igual a un valor hipotĂŠtico (la media hipotĂŠtica). La prueba utiliza la desviaciĂłn estĂĄndar de la muestra para estimar đ?œŽ (la desviaciĂłn estĂĄndar de la poblaciĂłn). Si la diferencia entre la media de la muestra y la media hipotĂŠtica es grande en relaciĂłn con la variabilidad de la media de la muestra, entonces no es probable que đ?œ‡ sea igual a la media hipotĂŠtica.

46


Cuándo utilizar una prueba t de 1 muestra Utilice una prueba t de 1 muestra con datos continuos de una sola muestra aleatoria. La parte del supuesto de que la población está distribuida normalmente. Sin embargo, la prueba es robusta a violaciones de este supuesto, siempre y cuando las observaciones se recolecten aleatoriamente y los datos sean continuos, unimodales y razonablemente simétricos (véase [1]).

Por qué utilizar una prueba t de 1 muestra Una prueba t de 1 muestra responde a preguntas como: - ¿Se encuentra un proceso en su valor objetivo? - ¿Posee una característica clave del material suministrado por un proveedor el valor medio deseado?

Por ejemplo, - ¿Es el valor ancho medio de hojas para rasurar más alto o más bajo que el valor objetivo?

47


- ¿Es la resistencia media de los pernos de un proveedor más baja que el valor mínimo requerido?

Prueba de la hipótesis nula El fabricante necesita determinar si el peso medio del proceso de empaquetamiento difiere significativamente del peso objetivo de 365 gramos. En términos estadísticos, la media del proceso es la media de la población, o 𝜇 (mu)

Hipótesis estadísticas O bien 𝜇 es igual a 365 o no lo es. Puede expresar estas alternativas como dos hipótesis: - La hipótesis nula (H0): 𝜇 es igual a 365 gramos - La hipótesis alternativa (H1): 𝜇 no es igual a 365 gramos

Debido a que no es factible para los ingenieros medir cada una de las cajas en la población, nunca pueden saber con seguridad cuál de las hipótesis es la correcta. 48


Sin embargo, una prueba de hip贸tesis apropiada puede ayudarles a tomar una decisi贸n fundamentada. Para los datos sobre el peso de las cajas, la prueba apropiada es una prueba t de 1 muestra.

Fig 22. t de 1 muestra

49


Interpretaciรณn de sus resultados Lรณgica de las pruebas de hipรณtesis En todas las pruebas de hipรณtesis se realizan los mismos pasos: 1. Presuponga que H0 es verdadera 2. Determine cuรกn diferente es la muestra con respecto lo que usted esperaba partiendo del presupuesto anterior 3. Si la muestra es suficientemente improbable partiendo del supuesto de que H0 es verdadera, entonces, rechace H0

50


 Por ejemplo, los resultados de la prueba t indican que la media de la muestra es 366.705 gramos. La prueba responde a la pregunta, “Si đ?œ‡ es igual a 365 gramos, ÂżquĂŠ probabilidades hay de ver una media de muestra tan diferente de 365 gramos como ĂŠsta (o aĂşn mĂĄs diferente)?â€? La respuesta se presenta como un valor de probabilidad (P) el cual, para esta prueba, es igual a 0.143

T de una muestra: PesoCaja Prueba de mu = 365 vs. no = 365

Variable

N

Media

Desv.Est.

Error estĂĄndar de la media

PesoCaja

6

366.705

2.403

0.981

IC de 95%

T

P

(365.183, 369.226)

1.74

0.143

Recuerde la prueba de normalidad!!!

51


Intervalos de confianza ÂżQuĂŠ es un intervalo de confianza? Un intervalo de confianza es un rango de valores posibles para un parĂĄmetro de la poblaciĂłn (como, por ejemplo, đ?œ‡) basado en los datos de la muestra. Por ejemplo, con un intervalo de confianza de 95% para đ?œ‡, usted puede estar 95% seguro de que el intervalo contiene đ?œ‡.

ÂżCuĂĄndo utilizar un intervalo de confianza? Utilice intervalos de confianza para: - Hacer inferencias acerca de una o mĂĄs poblaciones basĂĄndose en datos de muestra. - Cuantificar la precisiĂłn del estimado.

ÂżPor quĂŠ utilizar un intervalo de confianza? A menudo, un intervalo de confianza responde a las mismas preguntas que responde una prueba de hipĂłtesis: - ÂżEstĂĄ đ?œ‡ en el valor objetivo? - ÂżQuĂŠ tan preciso es el estimado de đ?œ‡?+ - ÂżCuĂĄn baja o alta podrĂ­a ser đ?œ‡? 52


Uso del intervalo de confianza En los análisis previos, usted utilizó una prueba de hipótesis para determinar si la media del proceso de llenado de las cajas de cereal era diferente del valor objetivo. También puede utilizar un intervalo de confianza para evaluar esta diferencia. Los resultados de la ventana Sesión para la prueba t de 1 muestra incluyen valores para los límites superior e inferior del intervalo de confianza de 95%. Para obtener una representación gráfica del intervalo, seleccione Gráfica de valores individuales en el cuadro secundario Gráficas.

53


Fig 23. t de 1 muestra

InterpretaciĂłn de sus resultados Intervalo de confianza El intervalo de confianza es un rango de valores probables para đ?œ‡. Minitab muestra el intervalo grĂĄficamente como una lĂ­nea azul en la grĂĄfica de valores individuales.

54


Al realizar muestreos repetidos de la misma poblaciĂłn, los intervalos de confianza de aproximadamente el 95% de las muestras incluirĂ­a đ?œ‡. De esta manera, para cualquier muestra, usted puede estar 95% seguro de que đ?œ‡, se encuentra dentro del intervalo de confianza.

Fig 24. GrĂĄfica de valores individuales de PesoCaja

55


Interpretación de sus resultados Prueba de hipótesis La marca del medio, con la etiqueta 𝑋̅, representa la media de la muestra, y el círculo gris con la etiqueta H0, representa la media hipotética (365). Utilice el intervalo de confianza para probar la hipótesis nula: - Si H0 se encuentra fuera del intervalo, el valor p para la prueba de hipótesis será menor que 0.05. Puede rechazar la hipótesis nula en el nivel 𝛼 de 0.05

56


- Si H0 se encuentra dentro del intervalo , el valor p serĂĄ mayor que 0.05. No puede rechazar la hipĂłtesis nula en el nivel đ?›ź − de 0.05

Fig 25. GrĂĄfica de valores individuales de PesoCaja

Debido a que H0 se ubica dentro del intervalo de confianza, no puede rechazar la hipĂłtesis nula. No hay evidencia suficiente para concluir que đ?œ‡ no es 365 gramos en el nivel de significancia de 0.05. 57


Potencia y tamaño de la muestra Ejemplo: Evaluación de la potencia Problema Los ingenieros están preocupados por los resultados del análisis del peso de llenado (página 1-17) debido al reducido tamaño de su muestra. Deciden efectuar un análisis de potencia para determinar si recolectaron suficientes datos de muestra para detectar una diferencia. Desean asegurarse de que el peso de llenado de la media del proceso no difiera del peso objetivo de 365 gramos en más de 2.5 gramos.

Recolección de datos Los ingenieros basan el análisis de potencia en los resultados de la prueba t de Ejemplo 1 Herramientas - Potencia y tamaño de la muestra – t de 1 muestra.

Conjunto de datos Ninguno

58


AnĂĄlisis de potencia ÂżQuĂŠ es un anĂĄlisis de potencia? La potencia es la capacidad de una prueba para detectar una diferencia si existe alguna. Una prueba de hipĂłtesis genera los siguientes resultados posibles:

HipĂłtesis nula DecisiĂłn

Verdadera

Falsa

No rechazar

DecisiĂłn correcta

DecisiĂłn correcta

đ?‘? =1−đ?›ź

đ?‘?=đ?›˝

Error de tipo I

DecisiĂłn correcta

đ?‘?=đ?›ź

đ?‘? =1−đ?›˝

Rechazar

(Potencia)

La potencia de prueba es la probabilidad de que usted rechace correctamente la hipĂłtesis nula, en caso de que la hipĂłtesis nula sea falsa. Utilice un anĂĄlisis de potencia para determinar cuĂĄnta potencia tiene una prueba o para diseĂąar una nueva prueba con la potencia adecuada. 59


¿Cuándo utilizar el análisis de potencia? Utilice un análisis de potencia: - Antes de recolectar los datos, para determinar el tamaño de la muestra - Después de recolectar los datos, para evaluar la potencia para detectar una diferencia

¿Por qué utilizar el análisis de potencia? Un análisis de potencia responde a preguntas como: - ¿Cuántas muestras debo recolectar para el análisis? - ¿Es el tamaño de la muestra suficientemente grande? - ¿De qué magnitud es la diferencia que la prueba puede detectar? - ¿Son confiables los resultados de una prueba?

Por ejemplo, - ¿Cuántas muestras se necesitan para determinar si el espesor medio del papel de un proveedor es 0.04mm mayor que el de otro?

60


- ¿De qué magnitud será la diferencia detectable entre la resistencia media de barras de acero nuevas y una media histórica, utilizando ocho muestras?

- ¿Puede confiar en la conclusión de una prueba t que indica que las resistencias de dos fórmulas de pegamento no son diferentes?

61


Determinación del parámetro de diferencia Valores

Diferencias

Para estimar la potencia, usted debe especificar valores para cualquiera de los dos parámetros siguientes de la prueba; Minitab calcula el parámetro restante.

Para elegir una cantidad de diferencia significativa, usted debe determinar un desplazamiento que conduzca un aumento inaceptable en la tasa de defectos.
 En este ejemplo, presuponga lo siguiente:

 Tamaños de las muestras – Número de observaciones en la muestra  Diferencias – desplazamiento significativo con respecto al valor objetivo que a usted le interesa detectar con alta probabilidad

 Los datos provienen de una población normalmente distribuida  Los límites de especificación son 360 y 370

 Valores de potencia – potencia (probabilidad de rechazar H0 cuando sea falsa) que usted desea que tenga la prueba

62


Fig 26. Cambio de 2.5 gramos en la media.

La gráfica muestra un desplazamiento de 2.5 gramos hacia el lado derecho del objetivo. Si se produjera un desplazamiento como éste, el número de defectos por encima del límite de especificación superior de 370 sería inaceptable.

63


DeterminaciĂłn de la potencia Utilizando anĂĄlisis de potencia, evalĂşe es quĂŠ medida puede confiar en los resultados del anĂĄlisis del peso de llenado de cajas de cereal (pĂĄgina 1-17). Valores Si ingresa mĂĄs de un valor para un parĂĄmetro, Minitab realiza los cĂĄlculos por separado para cada valor. DesviaciĂłn estĂĄndar Debido a que la variabilidad en los datos determina parcialmente la potencia de una prueba, usted debe proporcionar un estimado de đ?œŽ. Utilice un estimado histĂłrico o la desviaciĂłn estĂĄndar de la muestra. Para los datos sobre cereal, la desviaciĂłn estĂĄndar (2.403) proviene de los resultados de la prueba t.

64


Fig 27. Potencia y tama単o de la muestra para t de 1 muestra.

65


InterpretaciĂłn de sus resultados Con 6 observaciones, una desviaciĂłn estĂĄndar de 2.403 y un valor đ?›ź de 0.05, la potencia es de tan sĂłlo 0.537662. Por lo tanto, si đ?œ‡ estĂĄ alejada del objetivo por 2.5 gramos, la probabilidad de detectarla con una muestra cuyo tamaĂąo sea 6 es de 53.77% Dicho en otras palabras, la probabilidad de que usted no rechace H0 y suponga de manera incorrecta que el proceso se encuentra en el objetivo es de 46.23%

Potencia y tamaĂąo de la muestra Prueba t de 1 muestra

Probando la media = nula (no vs. = nula) Calculando la potencia para la media = nulo + diferencia Alfa = 0.05 DesviaciĂłn estĂĄndar asumida = 2.403

Diferencia

TamaĂąo de la muestra

Potencia

-2.5

6

0.537662

2.5

6

0.537662

66


Interpretación de sus resultados La curva de potencia permite ver la probabilidad de detectar una diferencia (potencia) para varias diferencias y opcionalmente para varios tamaños de muestra. Las diferencias específicas ingresadas en el cuadro de diálogo se indican en la gráfica de puntos verdes.

En este ejemplo, la diferencia representa un desplazamiento en la media del proceso con respecto al objetivo, en gramos. Una diferencia negativa corresponde a una media de proceso por debajo del objetivo, una diferencia positiva corresponde a una media de proceso por encima del objetivo. Cuando la media del proceso se encuentra un gramo por encima o por debajo del objetivo, la potencia para detectar una diferencia con una muestra cuyo tamaño sea 6 es muy baja. Cuando la media del proceso está dos gramos por encima o por debajo del objetivo, la potencia para detectar una diferencia con una muestra cuyo tamaño sea 6 estará cerca de 0.40, un valor que aún es demasiado bajo. Incluso la potencia a tres gramos por encima, o por debajo, es inaceptable para la mayoría de los estándares. Una manera de aumentar la potencia consiste en aumentar el tamaño de la muestra. 67


1. Determinar el tamaño de muestra requerido para alcanzar una potencia adecuada. ¿Cuántas observaciones necesita usted para tener un 80% de probabilidades de detectar un desplazamiento de al menos 2.5 gramos con respecto al objetivo? 2. ¿Cuántas observaciones necesita para tener una probabilidad de 85%, 90% ó 95% de detectar esta diferencia?

Fig 28. Curva de la potencia para Prueba t de 1 muestra

68


Determinación de la potencia Con 6 observaciones, la potencia de la prueba era de tan sólo 0.5377. Para tener mayores probabilidades de detectar una diferencia, aumente la potencia de la prueba a un valor de al menor 0.80 incrementando el tamaño de la muestra.

Calcule los tamaños de muestra requeridos para alcanzar niveles de potencia de 0.80, 0.85, 0.90 y 0.95.

Fig 29. Potencia y tamaño de la muestra para t de 1 muestra

69


Interpretación de los resultados Para tener una potencia de al menos 0.80 (Potencia objetivo) – para detectar una diferencia de 2.5 gramos en el nivel de � de 0.05 – se requiere un tamaùo de muestra de 10.

Debido a que el tamaĂąo de la muestra debe ser entero, la Potencia real de la prueba con 10 observaciones (0.832695) es ligeramente mayor que la Potencia objetivo.

Al incorporar observaciones adicionales, se obtiene mayor potencia: - Con 11 observaciones, la potencia es 0.873928 - Con 12 observaciones, la potencia es 0.905836 - Con 15 observaciones, la potencia es 0.962487

Al duplicar el tamaĂąo de la muestra de 6 a 12 cajas, la probabilidad de detectar una diferencia de 2.5 gramos aumento de 53.77% a 90.58%. A medida que se aumenta el nĂşmero de observaciones, aumenta la potencia de la prueba y ĂŠsta puede detectar desplazamientos mĂĄs pequeĂąos en la media.

70


Si la potencia es demasiado alta (por ejemplo, superior al 99%), es posible que la prueba detecte desplazamientos más pequeños que no tendrían ninguna importancia práctica. Potencia y tamaño de la muestra Prueba t de 1 muestra

Probando la media = nula (no vs. = nula) Calculando la potencia para la media = nulo + diferencia Alfa = 0.05 Desviación estándar asumida = 2.403

Diferencia

Potencia del objetivo

Potencia real

-2.5

Tamaño de la muestra 10

0.80

0.832695

-2.5

11

0.85

0.873928

-2.5

12

0.90

0.905836

-2.5

15

0.95

0.962487

2.5

10

0.80

0.832695

2.5

11

0.85

0.873928

2.5

12

0.90

0.905836

2.5

15

0.95

0.962487

71


Prueba t de 1 muestra Ejemplo: Aumento de la potencia

Problema Los resultados del primer análisis de potencia sugieren que una muestra más grande sería útil para evaluar el proceso. Al utilizar seis observaciones no se obtuvo suficiente potencia para detectar una diferencia de 2.5 gramos.

Recolección de datos Los ingenieros seleccionan aleatoriamente 12 cajas de cereal y las pesan.

Herramientas - t de 1 muestra - Prueba de normalidad

72


Conjunto de datos CajaCereal.MPJ

Variable

Descripci贸n

M谩sObs

Pesos de las cajas de cereal (g).

73


Prueba de la hip贸tesis nula Analice la nueva muestra para determinar si la media del proceso es diferente de 365 gramos.

Fig 30. t de 1 muestra.

74


Interpretación de sus resultados La gråfica de caja ilustra los hallazgos de la prueba: - El valor objetivo (H0) se encuentra fuera del intervalo de confianza - La media de la muestra (�̅) es mayor que el valor objetivo Conclusiones La diferencia entre la media del proceso y el valor objetivo de 365 gramos es significativa en el nivel de � de 0.05

Fig 31. GrĂĄfica de caja de MĂĄsObs

75


InterpretaciĂłn de sus resultados T

P

La estadĂ­stica t (.275) es:

La prueba t indica que la diferencia entre la media

t=(media de la muestra – media hipotÊtica) /

del proceso y el valor objetivo de 365 gramos es

Media del error estĂĄndar

significativo en el nivel � de 0.05:

donde Media del error estĂĄndar es una medida de

- El valor p (0.019) es menor que � (0.05).

la variabilidad. Para un tamaĂąo de muestra dado,

- El intervalo de confianza de 95% no incluye el

a medida que se incrementa el valor de t, el valor

valor objetivo.

de p disminuye

Paso siguiente Verificar el supuesto de normalidad.

T de una muestra: MĂĄsObs Prueba de mu = 365 vs. no = 365 Variable

N

Media

Desv.Est

Error estĂĄndar de la media

IC de 95%

T

P

MĂĄsObs

12

366.636

2.060

0.595

(365.327, 367.945)

2.75

0.019

76


Interpretación de sus resultados Utilice la gráfica de probabilidad normal para verificar que los datos no se desvíen sustancialmente de lo esperado cuando se tome la muestra de una distribución normal. - Si los datos provienen de una distribución normal, los puntos deben seguir aproximadamente la línea ajustada - Si los datos no provienen de una distribución normal, probablemente los puntos no seguirán la línea

Prueba de normalidad de Anderson-Darling Las hipótesis de la prueba de normalidad de Anderson-Darling son: - H0: Los datos provienen de una población normalmente distribuida - H1: Los datos no provienen de una población normalmente distribuida

77


El valor p de la prueba de Anderson-Darling (0.545) evalúa la probabilidad de que los datos provengan de una población normalmente distribuida. En un nivel � de 0.05, existe suficiente evidencia para sugerir que los datos no provienen de una población normal.

Fig 32. GrĂĄfica de probabilidad de MĂĄsObs

78


Conclusiones BasĂĄndose en la grĂĄfica y en la prueba, usted puede suponer que los pesos de llenado estĂĄn normalmente distribuidos y que una prueba t es apropiada para realizar las pruebas de la media.

Consideraciones finales Resumen y conclusiones Basåndose en el tamaùo de muestra de 12, � = 0.05, y un valor p de 0.019, rechace H0 y concluya que la media del proceso no es igual al valor objetivo de 365 gramos.

El tamaùo de la muestra desempeùó un papel importante para evaluar la media de este proceso:

- Cuando el tamaĂąo de la muestra fue 6, la prueba no encontrĂł una diferencia estadĂ­sticamente significativa. - Cuando el tamaĂąo de la muestra fue 12, la prueba encontrĂł una diferencia estadĂ­sticamente significativa.

79


Consideraciones adicionales Cada vez que sea posible, investigue la potencia y el tamaño de la muestra antes de recolectar los datos. Si no toma esta previsión, y posteriormente se percata de que la potencia es inadecuada, podría ser difícil obtener muestras adicionales que reflejan las mismas condiciones de las muestras originales. Una prueba de 1 cola provee mayor potencia para detectar la diferencia específica que una prueba de 2 colas. Sin embargo, una prueba de 1 cola no puede detectar una diferencia en la dirección opuesta especificada por la hipótesis alternativa.

80


Potencia y tamaño de la

“Partiendo del supuesto de

La potencia para detectar esta

muestra para la prueba t

variabilidad y costos similares, si

diferencia debe ser de al menos

las medias de las resistencias

80%.

de 2 muestras

se alejan más de una desviación estándar entre sí, tal valor se

Herramientas

considerará una diferencia

-Potencia y tamaño de la

importante”.

muestra – t de 2 muestras

Determine el tamaño de muestra

Conjunto de datos

Problema

necesario para detectar una

Ninguno.

Un fabricante de calculadoras

diferencia de una desviación

está seleccionando un

estándar entre dos proveedores

proveedor de plásticos. El

con similar variabilidad. (Minitab

equipo de calidad tiene una

presupone igual variabilidad en

política que establece medidas

el cálculo del tamaño de la

de calidad críticas y específica

muestra).

Ejemplo: Tamaño de la muestra para la comparación de proveedores

que:

81


Potencia y tamaño de la muestra para una prueba t de 2 muestras ¿Qué es la potencia y el tamaño de la muestra para una prueba t de 2 muestras? En una prueba t de dos muestras: - La potencia es la probabilidad de que usted detecte una diferencia entre dos medias cuando tales medias realmente difieran entre sí - El tamaño de la muestra es el número de muestras por grupo que usted necesita para alcanzar una potencia especificada

¿Cuándo utilizar potencias y tamaño de las muestra para una prueba t de dos muestras? Utilice el análisis: - Antes de recolectar los datos, para determinar el tamaño de la muestra - Después de recolectar los datos, para evaluar la potencia para detectar una diferencia entre las medias

82


¿Por qué utilizar potencia y tamaño de la muestra para una prueba t de 2 muestras? La potencia y el tamaño de la muestra pueden determinar: - El tamaño de la muestra por grupo que usted necesita para detectar una diferencia entre medias con una potencia especificada. - La potencia de una prueba para detectar una diferencia entre medias basándose en el tamaño de muestra especificado. - El tamaño de una diferencia detectable con una potencia y tamaño de muestra especificados.

83


Determinación del tamaño de muestra para pruebas t de 2 muestras

Tamaños de muestras No ingrese un tamaño de muestra cuando desee determinar el tamaño de la muestra. Valores de diferencia y desviación estándar La potencia de una prueba depende de la diferencia que usted desee detectar con respecto a la desviación estándar. Para detectar una diferencia de 1 desviación estándar (o 1-sigma), ingrese una diferencia de 1 y -1, y una desviación estándar de 1. Valores de potencia Ingrese el o los valores de potencia deseados. Por lo general, los valores de potencia más altos que 0.80 se consideran aceptables.

84


Fig 33. Potencia y tama単o de la muestra para t de 2 muestras

85


Interpretación de sus resultados Tamaño de muestra Una tamaño de muestra de 17 muestras de plástico por proveedor da una potencia de 0.807037. Un tamaño de muestra de 23 muestras de plástico por proveedor da una potencia de 0.912498.

Potencia objetivo versus potencial real La potencia objetivo es el o los valores de potencia que usted especificó en el cuadro de diálogo. Debido a que el tamaño de muestra debe ser un entero, rara vez obtendrá la potencia de objetivo exacta. La potencia real corresponde al tamaño de muestra más pequeño que genere una potencia tal que, como mínimo, sea tan grande como la potencia objetivo.

86


Potencia y tamaño de la muestra Potencia t de 2 muestras

Probando la media 1 = media 2 (no vs. =) Calculando la potencia para la media 1 = media 2 + diferencia Alfa = 0.05 Desviación estándar asumida = 1

Tamaño de la

Potencia del

muestra

objetivo

-1

17

0.8

0.807037

-1

23

0.9

0.912498

1

17

0.8

0.807037

1

23

0.9

0.912498

Diferencia

Potencia Real

El tamaño de la muestra es para cada grupo.

87


Prueba t de 2 muestras Ejemplo: Resistencia del plástico Problema Un fabricante de calculadoras está seleccionando un proveedor de plásticos. Utilizando un tamaño de muestra de 20 perdigones de plástico de cada proveedor, el fabricante debe comparar muestras de los dos proveedores para determinar su resistencia.

Recolección de datos Una máquina comprime perdigones de lotes de plástico aleatoriamente seleccionados para conformar placas de color uniforme. Los técnicos registran la resistencia a fracturas (en Newtons) de cada placa.

Herramientas - t de 2 muestras - Prueba de normalidad - 2 varianzas

88


Conjunto de datos PlĂĄstico.MPJ

Variable

DescripciĂłn

Proveedor A

Resistencia a fracturas de las placas preparadas con el plĂĄstico del proveedor A (Newtons)

Proveedor B

Resistencia a fracturas de las placas preparadas con el plĂĄstico del proveedor B (Newtons)

Prueba t de 2 muestras independientes QuĂŠ es una prueba t de dos muestras independientes Una prueba t de 2 muestras independientes ayuda a determinar si las medias de dos poblaciones son diferentes. La prueba utiliza las desviaciones estĂĄndar de las muestras para estimar đ?œŽ para cada una de las poblaciones. Si la diferencia entre las medias de las muestras es grande en relaciĂłn con la variabilidad estimada de las medias de las muestras, entonces no es probable que las medias de las poblaciones sean iguales. 89


También se puede utilizar una prueba t de 2 muestras independientes para determinar si las medias de dos poblaciones difieren en una cantidad específica.

¿Cuándo utilizar una prueba t de 2 muestras independientes? Utilice una prueba t de dos muestras independientes con datos continuos obtenidos a partir de dos muestras aleatorias independientes. Las muestras son independientes si las observaciones de una muestra no están relacionadas con las observaciones de la otra muestra. En este ejemplo, las resistencias de los perdigones del proceso del proveedor A no son influenciadas por las resistencias de los perdigones del proveedor B, de modo que las muestras son independientes.

La prueba también presupone que los datos provienen de poblaciones normalmente distribuidas. Sin embargo, la prueba es robusta a violaciones de este presupuesto, siempre y cuando las observaciones se recolecten aleatoriamente y los datos sean continuos, unimodales y razonablemente simétricos (véase [1]). 90


¿Por qué utilizar una prueba t de 2 muestras independientes? Una prueba t de 2 muestras independientes responde a preguntas como: - ¿Son las medias de una característica de un producto fabricado por dos proveedores comparables? - ¿Es una fórmula de un producto mejor en promedio que otra?

Por ejemplo, - ¿Es similar la viscosidad media del aceite de dos proveedores diferentes? - ¿Es una fórmula de tinta más brillante en promedio que otra?

91


RealizaciĂłn de la prueba t de 2 muestras Una muestra t de 2 muestras indicarĂĄ si hay diferencias entre las resistencias medias de los plĂĄsticos de dos proveedores. La hipĂłtesis para estĂĄ prueba son: đ??ť0 : đ?œ‡đ??´ − đ?œ‡đ??ľ = 0 đ??ť0 : đ?œ‡đ??´ − đ?œ‡đ??ľ ≠0 Muestre las grĂĄficas de valores individuales y las grĂĄficas de caja para visualizar los datos.

Presuponga que las varianzas son desiguales La prueba t serĂĄ mĂĄs potente si usted parte del supuesto de que las varianzas de dos poblaciones con iguales. Sin embargo, al presuponer que las varianzas son iguales cuando en realidad no lo son, se podrĂ­an obtener resultados engaĂąosos. De modo que, si tiene dudas, no presuponga que existe igualdad.

92


Fig 34. t de 2 muestras

93


Interpretación de sus resultados La gráfica de caja ilustra que: - El plástico del proveedor A es más resistente que el plástico del proveedor B - El plástico del proveedor A tiene más variabilidad en resistencia que el plástico del proveedor B

Fig 35. Gráfica de caja de Proveedor A, Proveedor B

94


Interpretación de sus resultados Además, la gráfica de valores individuales muestra que: - El plástico del proveedor A parece ser más fuerte que el plástico del proveedor B - El plástico del proveedor A tiene más variabilidad en resistencia que el plástico del proveedor B Prueba T e IC de dos muestras: Proveedor A, Proveedor B T de dos muestras para Proveedor A vs. Proveedor B N

Media

Desv. Est.

Proveedor A

20

163.82

5.66

Error estándar de la media 1.3

Proveedor B

20

160.01

3.23

0.72

Diferencia = mu (Proveedor A) – mu (Proveedor B) Estimado de la diferencia: 3.80 IC de 95% para la diferencia: (0.82, 6.78) Prueba T de diferencia = 0 (vs. no =): Valor T = 2.61 Valor P = 0.014 GL = 30

95


Fig 36. Grรกfica de valores individuales de Proveedor A, Proveedor B

96


Minitab muestra el promedio de la resistencia a facturas (Media) así como dos medias de variabilidad – la desviación estándar (Desv.Est.) y el Error estándar de la media para cada proveedor

Intervalos de confianza La diferencia entra las medias de las muestras (3.80) es un estimado de la diferencia entre las medias de las poblaciones (mu Proveedor A – mu Proveedor B). El intervalo de confianza para la diferencia se basa en el estimado y en la variabilidad dentro de las muestras.

Usted puede estar 95% seguro de que la media del Proveedor A es mayor que la media del Proveedor B en un valor que se encuentra entre 0.82 y 6.78 Newtons.

97


Valor T y valor p El valor t para la prueba es 2.61 y el valor p- asociado es 0.014. El valor p (0.014) es la probabilidad de hallar un valor t con una magnitud de 2.21 mayor, si es verdadera la hipótesis nula de que no hay diferencias. Por lo tanto, rechace la hipótesis nula en el nivel 𝛼 de 0.05, y concluya que las resistencias medias son diferentes.

Paso siguiente Verificar el supuesto de normalidad.

98


Prueba del supuesto de normalidad La prueba t de 2 muestras presupone que los datos pertenecen a muestras de poblaciones distribuidas normalmente. Utilice una prueba de normalidad para determinar si el supuesto de normalidad es vรกlido.

Fig 37. Prueba de normalidad

99


Interpretación de sus resultados Utilice la gráfica de probabilidad normal para verificar que los datos no se desvíen sustancialmente de los esperados cuando se tome la muestra de una distribución normal.

- Si los datos provienen de una distribución normal, los puntos deben seguir aproximadamente la línea ajustada - Si los datos no provienen de una distribución normal, es probable que los puntos no sigan la línea

100


Las gráficas indican que las distribuciones son razonablemente normales; todos los puntos se ubican bastante cerca de la línea.

Fig 38. Gráfica de probabilidad de Proveedor A

Fig 39. Gráfica de probabilidad de Proveedor B

101


Prueba de normalidad de Anderson-Dariling Ambos valores p (0.718 para Proveedor A y 0.193 para proveedor B) son mayores que el nivel de significancia � = 0.05.

Conclusiones BasĂĄndose en las grĂĄficas y en las pruebas, puede presuponer que los datos provienen de poblaciones distribuidas normalmente.

102


ComparaciĂłn de varianzas La prueba de t de 2 muestras compara las medias de dos poblaciones. A menudo, interesa saber si las varianzas (o desviaciones estĂĄndar) de dos grupos son diferentes. En este ejemplo, convendrĂ­a saber si la resistencia del producto de un proveedor varĂ­a mĂĄs que la resistencia del otro, porque pudiera ser deseable elegir el proveedor que ofrezca la variaciĂłn menor. La hipĂłtesis para la prueba de dos varianzas son: đ??ť0 : đ?œŽđ??´ â „đ?œŽđ??ľ = 1 đ??ť0 : đ?œŽđ??´ â „đ?œŽđ??ľ ≠1 Usted ya creĂł grĂĄficas de valores individuales y grĂĄficas de caja que sugieren que la variabilidad en la resistencia de los plĂĄsticos es diferente. (VĂŠanse pĂĄgina 1-47 y pĂĄgina 1-48).

103


Fig 40. 2 varianzas.

104


Interpretación de sus resultados Intervalos de confianza Utilice los intervalos de confianza para comparar las desviaciones estándar. Si el intervalo de confianza no contiene 1, entonces rechace la hipótesis nula de que la relación entre las desviaciones estándar es igual a 1.

Pruebas de varianza Los resultados incluyen dos pruebas de varianza separadas.

a. Si los datos son continuos y están distribuidos normalmente, utilice la Prueba F. b. Si los datos son continuos pero no están normalmente distribuidos, utilice la Prueba de Levene.

Los datos sobre el plástico parecen estar distribuidos normalmente, de modo que conviene utilizar la prueba F-.

105


El valor de p para la prueba F (0.018) es menor que � (0.05), así que rechace la hipótesis nula e que la relación de desviaciones eståndar es igual a 1. Los resultados sugieren que las desviaciones eståndar no son iguales. El cålculo del tamaùo de la muestra parte del supuesto de que las varianzas son iguales. Debido a que las varianzas no son iguales, el cålculo del tamaùo de la muestra no es exacto. Si no se encuentra una diferencia entre las medias de los proveedores, considere la posibilidad de aumentar el tamaùo de la muestra para el grupo con mås variación (proveedor A), a fin de garantizar que la potencia sea, como mínimo, de 80%.

106


Prueba de IC para dos varianzas: Proveedor A, Proveedor B Método Hipótesis nula

Sigma (Proveedor A) / Sigma (Proveedor B) =1

Hipótesis alterna

Sigma (Proveedor A) / Sigma (Proveedor B) not =1

Nivel de significancia

Alfa =0.05

Estadíticas Variable

N

Desv. Est.

Varianza

Proveedor A

20

5.661

32.041

Proveedor B

20

3.227

10.411

Relación de desviaciones estándar = 1.754 Relación de varianzas = 3.078

Intervalos de confianza de 95% IC para relación de

IC para relación de

Desv.Est.

varianza

Normal

(1.104, 2.788)

(1.218, 7.776)

Continuo

(0.957, 2.989)

(0.916, 8.936)

Distribución de los datos

107


Pruebas Método Prueba F (normal) Prueba de Leveme (cualquiera continua)

GL1

GL2

Valor P

19

Estadística de prueba 3.08

19 1

38

3.56

0.067

0.018

Consideraciones finales Resumen y conclusiones El plástico del proveedor A es significativamente más fuerte en promedio, pero es más variable que el plástico del proveedor B. Si la media y la varianza tienen igual importancia, considere la posibilidad de comparar las estadísticas Cpk para los dos proveedores. La estadística Cpk es un sistema de medición de calidad que toma en cuenta tanto la media como la varianza, junto con los límites de especificación.

108


Si las estadísticas Cpk están cercanas, la compañía debería elegir el proveedor basándose en el costo.

Consideraciones adicionales Cuando utilice una prueba t de 2 muestras: - Las muestras deben ser independientes y aleatorias - Los datos de la muestra deben ser continuos - Los datos de muestra provienen de poblaciones distribuidas normalmente

El procedimiento de la prueba t es robusto a violaciones del supuesto de normalidad, siempre y cuando las observaciones se recolecten aleatoriamente y los datos sean continuos, unimodales y razonablemente simétricos (véase [1]).

109


Referencias

Moya, M. y Robles,N. (2010). Probabilidad y Estad铆stica: Un Enfoque te贸rico y pr谩ctico. Cartago: Tecnol贸gico de Costa Rica.

110


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.