12Ander(457-489).qxd 1/31/08 8:13 PM Page 471
12.2
471
Prueba de independencia
Use la prueba de independencia chi-cuadrada y 0.05 como nivel de significancia para analizar estos datos. ¿Cuál es la conclusión? ¿Qué aerolínea elegiría para volar en semejantes condiciones de tormentas de nieve? Explique. 16. En los negocios cada vez se hacen más pedidos en línea. Una asociación recabó datos sobre la proporción de órdenes electrónicas llenadas correctamente de acuerdo con el tipo de industria (Investor’s Business Daily, 8 de mayo de 2000). En una muestra de 700 órdenes electrónicas se obtuvieron los resultados siguientes.
Industria Orden
Farmacéutica
Correcta Incorrecta
a. b.
De consumo Computadoras
207 3
136 4
Telecomunicación
151 9
178 12
Haga una prueba de hipótesis para determinar si el llenado correcto de las órdenes es independiente de la industria. Use α 0.05. ¿Cuál es la conclusión? ¿Qué industria tiene el porcentaje más alto de órdenes llenadas correctamente?
17. La National Sleep Foundation realiza encuestas para determinar si las horas de sueño por noche son independientes de la edad (Newsweek, 19 de enero de 2004). Las siguientes son las horas de sueño entre semana en una muestra de personas de 49 años o menos y en otra muestra de personas de 50 años o más.
Horas de sueño Edad 49 o menos 50 o más
a. b.
Menos de 6
6 a 6.9
7 a 7.9
8 o más
Total
38 36
60 57
77 75
65 92
240 260
Realice una prueba de independencia para determinar si las horas de sueño entre semana son independientes de la edad. Use α 0.05. ¿Cuál es el valor-p y cuál es la conclusión? Dé una estimación del porcentaje de personas que duermen menos de 6 horas, de 6 a 6.9 horas, de 7 a 7.9 horas y 8 horas o más.
18. Muestras tomadas en tres ciudades, Anchorage, Atlanta y Miniápolis, se usaron para obtener información acerca del porcentaje de parejas casadas en las que los dos cónyuges trabajan (USA Today, 15 de enero de 2006). Analice los datos siguientes para ver si el hecho de que los dos cónyuges trabajen es independiente del lugar donde viven. Use 0.05 como nivel de significancia. ¿Cuál es su conclusión? Dé la estimación general del porcentaje de parejas casadas en las que ambos cónyuges trabajan.
Ubicación Trabajan
Anchorage
Atlanta
Minneapolis
Ambos Sólo uno
57 33
70 50
63 90
19. En un programa de televisión los dos presentadores suelen dar la impresión de no estar en absoluto de acuerdo al evaluar películas. En la evaluación de una película pueden estar a favor (“pul-
12Ander(457-489).qxd 1/31/08 8:13 PM Page 472
472
Capítulo 12
Pruebas de bondad de ajuste e independencia
gar hacia arriba”), en contra (“pulgar hacia abajo”) o indiferente. Se presentan las evaluaciones de 160 películas hechas por los dos presentadores.
Presentador B Presentador A A favor Indiferente En contra
A favor
Indiferente
En contra
24 8 10
8 13 9
13 11 64
Para analizar estos datos use la prueba chi-cuadrada de independencia con 0.01 como nivel de significancia. ¿Cuál es la conclusión?
12.3
Prueba de bondad de ajuste: distribuciones de Poisson y normal En la sección 12.1 se introdujo la prueba de bondad de ajuste para poblaciones multinomiales. En general, la prueba de bondad de ajuste puede usarse con cualquier distribución de probabilidad hipotética. En esta sección se ilustra el uso de la prueba de bondad de ajuste para el caso en que se tiene la hipótesis de que la población tiene una distribución de Poisson o una distribución normal. Como verá, en la prueba de bondad de ajuste y en el uso de la distribución chi-cuadrada se sigue el mismo procedimiento general aplicado para la prueba de bondad de ajuste de la sección 12.1.
Distribución de Poisson El uso de la prueba de bondad de ajuste se ilustra en el caso de una distribución poblacional que hipotéticamente tiene una distribución de Poisson. Considere, por ejemplo, las llegadas de los clientes al Dubek’s Food Market en Tallase, Florida. Dado que recién ha habido algunos problemas de personal, los gerentes solicitan los servicios de una empresa de consultoría para que les ayude en la programación de los empleados de cajas. Después de revisar el avance de las filas en las cajas, la empresa de consultoría sugerirá un procedimiento para la programación de los empleados de cajas. Este procedimiento se basa en un análisis matemático de las filas y sólo es aplicable si el número de llegadas de clientes durante un determinado lapso de tiempo sigue una distribución de Poisson. Por tanto, antes de poner en marcha el procedimiento de programación, habrá que recolectar datos sobre las llegadas de los clientes y realizar una prueba estadística para ver si es razonable suponer que las llegadas de los clientes siguen una distribución de Poisson. Las llegadas de los clientes a la tienda se definen en términos de cantidad de clientes que entran en la tienda durante intervalos de 5 minutos. Por tanto las hipótesis nula y alternativa en este estudio son las siguientes: H0: La cantidad de clientes que entran en la tienda durante intervalos de 5 minutos tiene una distribución de probabilidad de Poisson Ha: La cantidad de clientes que entran en la tienda durante intervalos de 5 minutos no tienen una distribución de probabilidad de Poisson Si una muestra de llegadas de clientes indica que no se puede rechazar H0, Dubeck’s procederá a poner en marcha el proceso de programación de la empresa de consultoría. Pero, si la muestra lleva a rechazar H0, no se podrá suponer que las llegadas siguen una distribución de Poisson y habrá que considerar otro procedimiento de programación. Para probar la suposición de que las llegadas de los clientes en las mañanas de los días entre semana siguen una distribución de Poisson, un empleado de la tienda toma una muestra aleatoria de 128 intervalos de 5 minutos, en las mañanas de tres semanas consecutivas. Durante cada uno de los intervalos de 5 minutos que forman la muestra, el empleado registra el número de lle-
12Ander(457-489).qxd 1/31/08 8:13 PM Page 473
12.3
TABLA 12.6
Frecuencias observadas en las llegadas de los clientes de Dubek’s en una muestra de 128 intervalos de 5 minutos Número de llegadas de clientes
Frecuencia observada
0 1 2 3 4 5 6 7 8 9
2 8 10 12 18 22 22 16 12 6 Total
128
473
Prueba de bondad de ajuste: distribuciones de Poisson y normal
gadas de clientes. Para resumir los datos, el empleado determina el número de intervalos de 5 minutos en los que no hubo ninguna llegada, el número de intervalos de 5 minutos en los que hubo una llegada, el número de intervalos de 5 minutos en los que hubo dos llegadas, etc. Estos datos se presentan en la tabla 12.6 La tabla 12.6 da las frecuencias observadas en las 10 categorías. Ahora se usa la prueba de bondad de ajuste para determinar si la muestra de los 128 lapsos de tiempo favorecen la hipótesis de que las llegadas tienen una distribución de Poisson. Para usar la prueba de bondad de ajuste, se necesitan considerar, las frecuencias esperadas para cada una de las 10 categorías, bajo la suposición de que la distribución de las llegadas siga una distribución de Poisson. Es decir, si en realidad las llegadas de los clientes siguen una distribución de Poisson, se necesita calcular el número esperado de lapsos de tiempo en los que llegarán cero clientes, un cliente, dos clientes, etcétera. La función de probabilidad de Poisson, que ya se presentó en el capítulo 5, es f(x)
μxe μ x!
(12.4)
En esta función, μ representa la media o número esperado de llegadas de clientes en lapsos de 5 minutos, x representa la variable aleatoria del número de llegadas de clientes en un lapso de 5 minutos y f(x) es la probabilidad de x llegadas de clientes en un lapso de 5 minutos. Antes de usar la ecuación (12.4) para calcular las probabilidades de Poisson se necesita una estimación de μ, el número medio de llegadas de clientes en un lapso de 5 minutos. La media muestral de los datos de la tabla 12.6 proporciona dicha estimación. Como se tienen dos lapsos de 5 minutos en los que no llegó ningún cliente, ocho lapsos de 5 minutos en los que llegó un cliente, etc., el número total de llegadas de clientes en los 128 lapsos de 5 minutos es 0(2) 1(8) 2(10) … 9(6) 640. Las 640 llegadas de clientes en los 128 lapsos de tiempo de la muestra dan una media de llegadas μ 640/128 5 llegadas de clientes por lapso de 5 minutos. Con este valor como media para la distribución de Poisson, una estimación de la función de probabilidad de Poisson en el caso de Dubek’s es f(x)
5xe 5 x!
(12.5)
Esta función de probabilidad puede evaluarse para distintos valores de x y determinar así la probabilidad que corresponde a las diferentes categorías de llegadas. En la tabla 12.7 se presentan tales probabilidades, las cuales pueden encontrarse también en la tabla 7 del apéndice B. Por TABLA 12.7
FRECUENCIAS ESPERADAS EN LAS LLEGADAS DE LOS CLIENTES A DUBEK’S SUPONIENDO QUE SIGAN UNA DISTRIBUCIÓN DE POISSON CON μ 5
Número de llegadas de clientes (x)
Probabilidad de Poisson f (x)
Número esperado de lapsos de 5 minutos con x llegadas, 128 f (x)
0 1 2 3 4 5 6 7 8 9 10 o más
0.0067 0.0337 0.0842 0.1404 0.1755 0.1755 0.1462 0.1044 0.0653 0.0363 0.0318
0.86 4.31 10.78 17.97 22.46 22.46 18.71 13.36 8.36 4.65 4.07 Total
128.00
12Ander(457-489).qxd 1/31/08 8:13 PM Page 474
474
Cuando en alguna categoría el número esperado es menor que cinco, no se satisfacen las condiciones para la prueba χ 2. Cuando esto ocurre, se pueden combinar categorías adyacentes para que el número esperado sea cinco o más.
Capítulo 12
Pruebas de bondad de ajuste e independencia
ejemplo, la probabilidad de que lleguen cero clientes en un lapso de cinco minutos es f(0) 0.0067, la probabilidad de que llegue un cliente en un lapso de 5 minutos es f(1) 0.0337, etc. Como se vio en la sección 12.1, la frecuencia esperada en cada una de las categorías se encuentra multiplicando su probabilidad por el tamaño de la muestra. Por ejemplo, el número de lapsos de tiempo con cero llegadas es (0.0067)(128) 0.86, el número esperado de lapsos de tiempo con una llegada es (0.0337)(128) 4.31, etcétera. Antes de hacer los cálculos habituales para comparar las frecuencias observadas y esperadas, hay que observar que en la tabla 12.7, hay cuatro categorías que tienen una frecuencia esperada menor que cinco. Esto viola los requerimientos para el uso de la distribución chi-cuadrada. Sin embargo, no es una dificultad, ya que se pueden combinar categorías menores que cinco para satisfacer la condición de que la frecuencia esperada sea “por lo menos cinco”. Aquí, se combinan 0 y 1 en una sola categoría y también se combinan 9 y “10 o más” en una sola categoría. De esta manera se satisface la regla de un mínimo de cinco como frecuencia esperada en cada categoría. En la tabla 12.8 se presentan las frecuencias observadas y las esperadas después de combinar estas categorías. Como en la sección 12.1, la prueba de bondad de ajuste se centra en las diferencias entre frecuencias observadas y esperadas, fi ei. Por tanto, para calcular el estadístico de prueba chi-cuadrada se usarán las frecuencias observadas y las esperadas de la tabla 12.8. χ2
( fi ei )2 ei i 1 k
兺
En la tabla 12.9 se muestran los cálculos necesarios para obtener el valor del estadístico de prueba chi-cuadrada. El valor del estadístico de prueba es χ 2 10.96. En general, en una prueba de bondad de ajuste la distribución chi-cuadrada tiene k p 1 grados de libertad, donde k es el número de categorías y p es el número de parámetros poblacionales estimados a partir de los datos muestrales. En este caso, como se ve en la tabla 12.9, k 9 categorías. Como los datos muestrales se usaron para estimar la media de la distribución de Poisson, p 1. Por ende, se tiene k p k 2 grados de libertad. Como k 9, se tienen 9 2 7 grados de libertad. Suponga que en la prueba de la hipótesis nula de que la distribución de probabilidad de las llegadas de los clientes es una distribución de Poisson se usa 0.05 como nivel de significancia. Para probar esta hipótesis, se necesita determinar el valor-p correspondiente al valor del estadístico de prueba χ 2 10.96 hallando el área en la cola superior de la distribución chi-cuadrada con 7 grados de libertad. En la tabla 3 del apéndice B se encuentra que χ 2 10.96 corresponde a un área, en la cola superior, mayor que 0.10. Por tanto se sabe que el valor-p es mayor que 0.10. Con los procedimientos de Minitab y de Excel que se describen en el apéndice F se obtiene que vaTABLA 12.8
FRECUENCIAS OBSERVADAS Y ESPERADAS EN LAS LLEGADAS DE LOS CLIENTES A DUBEK´S, DESPUÉS DE COMBINAR CATEGORÍAS
Número de llegadas de clientes (x)
Frecuencia observada ( fi )
Frecuencia esperada (ei )
0 or 1 2 3 4 5 6 7 8 9 o más
10 10 12 18 22 22 16 12 6
5.17 10.78 17.97 22.46 22.46 18.72 13.37 8.36 8.72
128
128.00
Total
12Ander(457-489).qxd 1/31/08 8:13 PM Page 475
12.3
475
Prueba de bondad de ajuste: distribuciones de Poisson y normal
TABLA 12.9
CÁLCULO DEL ESTADÍSTICO DE PRUEBA CHI-CUADRADA PARA EL ESTUDIO DE DUBEK’S FOOD MARKET
Número de llegadas de clientes (x)
Frecuencia observada ( fi )
Frecuencia esperada (ei )
Diferencia ( fi ⴚ ei )
0o1 2 3 4 5 6 7 8 9 o más
10 10 12 18 22 22 16 12 6
5.17 10.78 17.97 22.46 22.46 18.72 13.37 8.36 8.72
4.83 0.78 5.97 4.46 0.46 3.28 2.63 3.64 2.72
128
128.00
Total
Cuadrado de la diferencia dividido entre Cuadrado de la frecuencia la diferencia esperada ( fi ⴚ ei )2 ( fi ⴚ ei )2/ei 23.28 0.61 35.62 19.89 0.21 10.78 6.92 13.28 7.38
4.50 0.06 1.98 0.89 0.01 0.58 0.52 1.59 0.85 χ 2 10.96
lor-p 0.1404. Como el valor-p α 0.05, no se puede rechazar H0. De manera que no se puede rechazar la suposición de que la distribución de probabilidad de las llegadas de los clientes, en las mañanas entre semana, siga una distribución de probabilidad de Poisson. De esta manera, los administradores de Dubek’s pueden continuar con el procedimiento de programación para las mañanas de los días entre semana. PRUEBA DE BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN DE POISSON: RESUMEN
1. Establecer las hipótesis nula y alternativa. H0: La población tiene una distribución de Poisson Ha: La población no tiene una distribución de Poisson 2. Tomar una muestra aleatoria y a. Para cada valor de la variable aleatoria de Poisson anotar la frecuencia observada fi. b. Calcular el número medio μ de las ocurrencias. 3. Calcular, para cada valor de la variable aleatoria de Poisson, la frecuencia esperada ei de ocurrencias. Multiplicar el tamaño de la muestra por la probabilidad de su ocurrencia de cada valor de la variable aleatoria de Poisson. Si para algún valor hay menos de cinco ocurrencias esperadas, combinar valores adyacentes y reducir el número de categorías cuanto sea necesario. 4. Calcular el valor del estadístico de prueba. χ2
( fi ei )2 ei i 1 k
兺
5. Regla de rechazo: Método del valor-p: Rechazar H0 si el valor-p Método del valor crítico: Rechazar H0 si χ 2 χ 2α
α
donde α es el nivel de significancia y los grados de libertad son k – 2.
12Ander(457-489).qxd 1/31/08 8:13 PM Page 476
476
Capítulo 12
Pruebas de bondad de ajuste e independencia
Distribución normal
TABLA 12.10
PUNTUACIONES OBTENIDAS POR LOS INTEGRANTES DE UNA MUESTRA ALEATORIA DE 50 SOLICITANTES DE EMPLEO EN LA PRUEBA DE APTITUDES DE CHEMLINE 71 60 55 82 85 65 77 61 79
66 86 63 79 80 62 54 56 84
61 70 56 76 56 90 64 63
65 70 62 68 61 69 74 80
54 73 76 53 61 76 65 56
93 73 54 58 64 79 65 71
archivo CD en Chemline
La prueba de bondad de ajuste para la distribución normal también se basa en el uso de la distribución chi-cuadrada. Se sigue un procedimiento similar al aplicado para la distribución de Poisson. Las frecuencias observadas en las diversas categorías de los datos muestrales se comparan con las frecuencias esperadas, cuando se supone que la población tiene una distribución normal. Como la distribución normal es continua, es necesario modificar la manera en que se definen las categorías y la forma en que se calculan las frecuencias esperadas. La prueba de bondad de ajuste para una distribución normal se va a ilustrar empleando los datos de los exámenes presentados por las personas que solicitan empleo en la empresa Chemline, Inc.; estos datos se presentan en la tabla 12.10. Cada año Chemline contrata cerca de 400 empleados nuevos para sus cuatro fábricas en Estados Unidos. El director de personal se pregunta si la población de las puntuaciones en los exámenes de los solicitantes tendrá una distribución normal. Si es así, esta distribución podría servir para evaluar las puntuaciones; es decir, podrían identificarse fácilmente las puntuaciones en 20% superior, en 40% inferior, etc. Por tanto, se desea probar la hipótesis nula de que la población de las puntuaciones de estos exámenes tiene una distribución normal. Para empezar, se obtendrán estimaciones de la media y de la desviación estándar de la distribución normal que se considera en la hipótesis nula, usando los datos de la tabla 12.10. La media muestral x̄ y la desviación estándar muestral se usan como estimadores puntuales de la media y de la desviación estándar de la distribución normal. Los cálculos son los siguientes. x̄ s
兺 xi 3421 68.42 n 50
冑
兺(xi x̄)2 n 1
冑
5310.0369 10.41 49
Con estos datos se establecen las hipótesis siguientes acerca de la distribución de las puntuaciones de examen. H0: La población de las puntuaciones de examen tiene una distribución normal, con una media de 68.42 y desviación estándar de 10.41. Ha: La población de las puntuaciones de examen no tiene una distribución normal, con media de 68.42 y desviación estándar de 10.41. En la figura 12.2 se muestra esta distribución normal hipotética.
FIGURA 12.2
DISTRIBUCIÓN NORMAL HIPOTÉTICA DE PUNTUACIONES EN LA PRUEBA DE APTITUDES DE CHEMLINE
σ = 10.41
Media 68.42
12Ander(457-489).qxd 1/31/08 8:13 PM Page 477
12.3
Prueba de bondad de ajuste: distribuciones de Poisson y normal
FIGURA 12.3
477
DISTRIBUCIÓN NORMAL EN EL EJEMPLO DE CHEMLINE CON 10 INTERVALOS DE PROBABILIDAD IGUAL
Como se trata de una distribución de probabilidad continua, se establecen intervalos de manera que en cada uno la frecuencia esperada sea cinco o más.
81.74
77.16
73.83
65.82 68.42 71.02
63.01
59.68
55.10
Nota : Cada intervalo tiene una probabilidad de 0.10
Ahora se verá cómo definir las categorías para una prueba de bondad de ajuste para una distribución normal. En el caso de la distribución de probabilidad discreta en la prueba para la distribución de Poisson, fue fácil definir las categorías en términos del número de llegadas de los clientes, 0, 1, 2, etc. Sin embargo, en el caso de la distribución de probabilidad normal que es continua, es necesario emplear un procedimiento diferente para definir las categorías. Se necesita definir las categorías en términos de intervalos de puntuaciones de examen. Recuerde la regla de que en cada intervalo o categoría, la frecuencia esperada debe ser por lo menos cinco. Las categorías para las puntuaciones de examen se definen de manera que la frecuencia esperada en cada categoría sea por lo menos cinco. Como el tamaño de la muestra es 50, una manera de establecer las categorías es dividir la distribución normal en 10 intervalos con una misma probabilidad (véase la figura 12.3). Como el tamaño de la muestra es 50, se espera tener cinco resultados en cada intervalo o categoría, con lo que se satisface la regla de las cinco frecuencias esperadas. El procedimiento para calcular los límites de las categorías es el siguiente. Como se trata de una distribución de probabilidad normal, para determinar estos límites se emplean las tablas de la distribución de probabilidad normal estándar. Primero se determina la puntuación de examen que separa el 10% inferior de las puntuaciones. En la tabla 1 del apéndice B se encuentra que el valor z correspondiente a esta puntuación de examen es 1.28. Por tanto, la puntuación de examen x 68.42 1.28(10.41) 55.10 es el valor que separa el 10% inferior de las puntuaciones de examen. Para el 20% inferior se tiene z 0.84 y, por tanto, x 68.42 0.84(10.41) 59.68. Continuando de esta manera se obtienen los valores siguientes para las puntuaciones de examen. Porcentaje 10% 20% 30% 40% 50% 60% 70% 80% 90%
z 1.28 0.84 0.52 0.25 0.00 0.25 0.52 0.84 1.28
Puntuación de examen 68.42 1.28(10.41) 55.10 68.42 0.84(10.41) 59.68 68.42 0.52(10.41) 63.01 68.42 0.25(10.41) 65.82 68.42 0(10.41) 68.42 68.42 0.25(10.41) 71.02 68.42 0.52(10.41) 73.83 68.42 0.84(10.41) 77.16 68.42 1.28(10.41) 81.74
En la gráfica 12.3 se observan estos puntos de separación o límites de los intervalos.
12Ander(457-489).qxd 1/31/08 8:13 PM Page 478
478
Capítulo 12
TABLA 12.11
Pruebas de bondad de ajuste e independencia
FRECUENCIAS ESPERADAS Y OBSERVADAS DE LAS PUNTUACIONES DE EXAMEN DE LOS SOLICITANTES DE EMPLEO EN CHEMLINE
Intervalo de puntuaciones de examen
Frecuencia observada ( fi )
Frecuencia esperada (ei )
5 5 9 6 2 5 2 5 5 6
5 5 5 5 5 5 5 5 5 5
50
50
Menores que 55.10 55.10 a 59.68 59.68 a 63.01 63.01 a 65.82 65.82 a 68.42 68.42 a 71.02 71.02 a 73.83 73.83 a 77.16 77.16 a 81.74 81.74 o más Total
Una vez definidas las categorías o intervalos de las puntuaciones de examen y siendo que la frecuencia esperada en cada categoría es cinco, se usan los datos muestrales de la tabla 12.10 y se determinan las frecuencias observadas en estas categorías. Con esto se obtienen los resultados que aparecen en la tabla 12.11. Una vez que se tienen los resultados de la tabla 12.11, la prueba de bondad de ajuste procede exactamente como antes. Es decir, se comparan los resultados observados y esperados calculando el valor de χ 2. En la tabla 12.12 se muestran los cálculos necesarios para obtener el estadístico de prueba chi-cuadrada. Como se ve, el valor del estadístico de prueba es χ 2 7.2. Para determinar si este valor de 7.2 obtenido para χ 2 es suficientemente grande para rechazar H0 se necesita consultar las tablas de la distribución chi-cuadrada. Al aplicar la regla para el cálculo del número de grados de libertad en la prueba de bondad de ajuste, se tiene, k p 1 10 2 1 7 grados de libertad, ya que se tienen 10 categorías y p 2 parámetros (media y desviación estándar) estimados mediante los datos muestrales. TABLA 12.12
CÁLCULO DEL ESTADÍSTICO DE PRUEBA CHI-CUADRADA EN EL EJEMPLO DE LAS PUNTUACIONES DE EXAMEN DE LOS SOLICITANTES DE EMPLEO EN CHEMLINE
Intervalos de puntuaciones de examen Menores que 55.10 55.10 a 59.68 59.68 a 63.01 63.01 a 65.82 65.82 a 68.42 68.42 a 71.02 71.02 a 73.83 73.83 a 77.16 77.16 a 81.74 81.74 y más Total
Frecuencia observada ( fi )
Frecuencia esperada (ei )
Diferencia ( fi ⴚ ei )
5 5 9 6 2 5 2 5 5 6
5 5 5 5 5 5 5 5 5 5
0 0 4 1 3 0 3 0 0 1
50
50
Cuadrado de la diferencia dividido entre Cuadrado de la frecuencia la diferencia esperada ( fi ⴚ ei )2 ( fi ⴚ ei )2/ei 0 0 16 1 9 0 9 0 0 1
0.0 0.0 3.2 0.2 1.8 0.0 1.8 0.0 0.0 0.2 χ 2 7.2
12Ander(457-489).qxd 1/31/08 8:13 PM Page 479
12.3 Como se estiman dos parámetros de la distribución normal, se pierden dos grados de libertad para la prueba χ 2.
479
Prueba de bondad de ajuste: distribuciones de Poisson y normal
Suponga que se prueba la hipótesis nula de que la distribución de las puntuaciones de examen es una distribución normal usando 0.10 como nivel de significancia. Para probar esta hipótesis se necesita determinar el valor-p para el estadístico de prueba χ 2 7.2 determinando el área en la cola superior correspondiente en la distribución chi-cuadrada con 7 grados de libertad. Consultando la tabla 3 del apéndice B, se encuentra que el área en la cola superior correspondiente a χ 2 7.2 es mayor que 0.10. Por consiguiente, se sabe que el valor-p es mayor que 0.10. Con los procedimientos de Minitab y Excel presentados en el apéndice F al final del libro, se encuentra que χ 2 7.2 da un valor-p 0.4084. Como el valor-p α 0.10 no se puede rechazar la hipótesis nula de que las puntuaciones de examen de los solicitantes de empleo en Chemline sea una distribución normal. La distribución normal se puede usar como ayuda en la interpretación de las puntuaciones de examen. A continuación se presenta un resumen de la prueba de bondad de ajuste para una distribución normal. PRUEBA DE BONDAD DE AJUSTE PARA UNA DISTRIBUCIÓN NORMAL: RESUMEN
1. Establecer las hipótesis nula y alternativa. H0: La población tiene una distribución normal Ha: La población no tiene una distribución normal 2. Tomar una muestra aleatoria y a. Calcular la media muestral y la desviación estándar muestral. b. Definir intervalos de valores de manera que la frecuencia esperada en cada intervalo sea por lo menos cinco. Usar intervalos de igual probabilidad es un buen enfoque. c. En cada uno de los intervalos definidos anotar la frecuencia observada fi en los datos. 3. Calcular el número esperado de ocurrencias ei en cada uno de los intervalos de valores definidos en el paso 2 b. Multiplicar el tamaño de la muestra por la probabilidad de que una variable aleatoria normal pertenezca al intervalo. 4. Calcular el valor del estadístico de prueba χ2
( fi ei )2 ei i 1 k
兺
5. Regla de rechazo: Método del valor-p: Método del valor crítico:
Rechazar H0 si valor-p α Rechazar H0 si χ 2 χ 2α
donde α es el nivel de significancia y los grados de libertad son k – 3.
Ejercicios
Métodos
Auto examen
20. A continuación se presenta el número de ocurrencias por lapso de tiempo y su frecuencia observada. Use α 0.05 y la prueba de bondad de ajuste para ver si estos datos se ajustan a una distribución de Poisson. Número de ocurrencias
Frecuencia observada
0 1 2 3 4
39 30 30 18 3
12Ander(457-489).qxd 1/31/08 8:13 PM Page 480
480
Capítulo 12
Auto examen
21. Los datos siguientes provienen de una distribución normal. Use la prueba de bondad de ajuste con α 0.05 para probar tal suposición. 17 21
Pruebas de bondad de ajuste e independencia
23 18
22 15
24 24
19 23
23 23
18 43
22 29
20 27
13 26
11 30
21 28
18 33
20 23
21 29
Aplicaciones 22. Al parecer el número de accidentes automovilísticos por día en una determinada ciudad tiene una distribución de Poisson. A continuación se presentan los datos de una muestra de 80 días del año anterior. ¿Estos datos apoyan la creencia de que el número de accidentes por día tiene una distribución de Poisson? Use α 0.05.
Número de accidentes
Frecuencia observada (días)
0 1 2 3 4
34 25 11 7 3
23. El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tiene una distribución de Poisson. Use α 0.10 y los datos siguientes para probar esta suposición.
Número de llamadas telefónicas que llegan por minuto
Frecuencia observada
0 1 2 3 4 5 6
15 31 20 15 13 4 2 100
Total
24. La demanda semanal de un producto tiene una distribución normal. Aplique una prueba de bondad de ajuste y los datos siguientes para probar esta suposición. Use a 0.10. La media muestral es 24.5 y la desviación estándar es 3. 18 25 26 27 26 25
20 22 23 25 25 28
22 27 20 19 31 26
27 25 24 21 29 28
22 24 26 25 25 24
25. Use α 0.01 y realice una prueba de bondad de ajuste para ver si los datos siguientes parecen haber sido tomados de una distribución normal. 55 55
86 57
94 98
58 58
55 79
95 92
55 62
52 59
69 88
95 65
90
65
87
50
56
Una vez terminada la prueba de bondad de ajuste, elabore un histograma con estos datos. ¿El histograma respalda la conclusión a la que se llegó con la prueba de bondad de ajuste? (Nota: x̄ 71 y s 17.)
12Ander(457-489).qxd 1/31/08 8:13 PM Page 481
481
Fórmulas clave
Resumen En este capítulo se presentó la prueba de bondad de ajuste y la prueba de independencia, las cuales se basan en el uso de la distribución chi-cuadrada. El objeto de la prueba de bondad de ajuste es determinar si una distribución de probabilidad hipotética sirve como modelo para una determinada población de interés. Al hacer los cálculos en una prueba de bondad de ajuste se comparan las frecuencias observadas en una muestra con las frecuencias esperadas suponiendo que la distribución de probabilidad hipotética sea verdadera. Para determinar si las diferencias entre frecuencias observadas y esperadas son suficientemente grandes para rechazar la distribución de probabilidad hipotética se usa la distribución chi-cuadrada. También se ilustró la prueba de bondad de ajuste para las distribuciones multinomial, de Poisson y normal. Una prueba de independencia entre dos variables es una extensión de la metodología empleada en la prueba de bondad de ajuste para una población multinomial. Para determinar las frecuencias observadas y esperadas se emplea una tabla de contingencia. Después se calcula el valor de chi-cuadrada. Valores grandes de chi-cuadrada, debidos a diferencias grandes entre frecuencias observadas y esperadas, llevan al rechazo de la hipótesis nula de independencia.
Glosario Población multinomial Población en la que cada elemento corresponde a una y sólo a una de varias categorías. Una distribución multinomial es una extensión de la distribución binomial a tres o más resultados. Prueba de bondad de ajuste Prueba estadística que se realiza para determinar si se rechaza una distribución de probabilidad hipotética como distribución de una población. Tabla de contingencia Tabla que se emplea para presentar las frecuencias observadas y esperadas en una prueba de independencia.
Fórmulas clave Estadístico de prueba para la bondad de ajuste χ2
( fi ei )2 ei i 1 k
兺
(12.1)
Frecuencias esperadas para tablas de contingencia bajo la suposición de independencia eij
(Total del renglón i) (Total de la columna j) Tamaño de la muestra
(12.2)
Estadístico de prueba para independencia χ 2
兺兺 i
j
( fij eij)2 eij
(12.3)
12Ander(457-489).qxd 1/31/08 8:13 PM Page 482
482
Capítulo 12
Pruebas de bondad de ajuste e independencia
Ejercicios complementarios 26. Para establecer cuotas de venta, el gerente de marketing supone que en los cuatro territorios de ventas el potencial de ventas es el mismo. A continuación se presenta una muestra de 200 ventas. ¿Debe rechazarse la suposición del gerente? Use α 0.05.
Territorios de venta I
II
III
IV
60
45
59
36
27. Siete por ciento de quienes invierten en fondos mutualistas consideran que las acciones corporativas son “muy seguras”, 58% las considera “relativamente seguras”, 24% las considera “no muy seguras”, 4% las considera “no seguras” y 7% “no están seguros”. Business/Week/Harris preguntó a 529 inversionistas de fondos mutualistas cómo calificarían ellos los bonos corporativos respecto de su seguridad. Las respuestas fueron las siguientes
Seguridad Muy seguros Relativamente seguros No muy seguros Nada seguros No están seguros Total
Frecuencia 48 323 79 16 63 529
¿La actitud de los inversionistas en fondos mutualistas difiere respecto a los bonos corporativos de su actitud frente a las acciones corporativas? Apoye su conclusión dando una prueba estadística. Use α 0.01 28. Desde el año 2000, Toyota Camry, Honda Accord y Ford Taurus han sido los tres automóviles de pasajeros en Estados Unidos mejor vendidas. Los datos de ventas de 2003 indican que las participaciones en el mercado de estos tres automóviles son las siguientes: Toyota Camry 37%, Honda Accord 34% y Ford Taurus 29%. Suponga que en una muestra de 1 200 ventas de automóviles de pasajeros durante el primer trimestre de 2004 se encuentran los datos siguientes.
Automóviles de pasajeros Toyota Camry Honda Accord Ford Taurus
Unidades vendidas 480 390 330
¿Estos datos sirven para concluir que las participaciones en el mercado de estos tres automóviles de pasajeros cambiaron en el primer trimestre de 2004? ¿Cuál es el valor-p? Use 0.05 como nivel de significancia. ¿Cuál es su conclusión? 29. Una autoridad regional de tránsito está preocupada por el número de pasajeros en una de las rutas de autobús. Al establecer la ruta se supuso que el número de pasajeros era la misma todos los días de la semana, de lunes a viernes. Con los datos siguientes y usando a 0.05 determine si la suposición de la autoridad de transito es correcta.
12Ander(457-489).qxd 1/31/08 8:13 PM Page 483
483
Ejercicios complementarios
Números de pasajeros
Día Lunes Martes Miércoles Jueves Viernes
13 16 28 17 16
30. Computerworld’s Annual Job Satisfaction Survey encontró que 28% de los administradores de sistemas de información (SI) estaban muy satisfechos con su trabajo, 46% estaban moderadamente satisfechos con su trabajo, 12% no estaban ni satisfechos ni insatisfechos, 10% estaban ligeramente insatisfechos y 4% estaban muy insatisfechos. Suponga que en una muestra de 500 programadores se encontraron los resultados siguientes.
Número de entrevistados
Categoría Muy satisfechos Moderadamente satisfechos Ni satisfechos ni insatisfechos Ligeramente insatisfechos Muy insatisfechos
105 235 55 90 15
Use α 0.05 y realice una prueba para determinar si la satisfacción con el trabajo entre los programadores de computadoras es diferente de la satisfacción con el trabajo de los administradores de SI. 31. De una muestra de piezas se obtiene la tabla de contingencia siguiente sobre la calidad, de acuerdo con el turno de producción.
Turno Primero Segundo Tercero
Números de piezas
Números de defectuosos
368 285 176
32 15 24
Use α 0.05 para probar la hipótesis de que la calidad es independiente del turno de producción. ¿Cuál es la conclusión? 32. The Wall Street Journal hizo un estudio sobre el tipo de empleo de sus suscriptores. Los siguientes datos muestrales corresponden a las ediciones del este y del oeste. Región Tipo de empleo Tiempo completo Medio tiempo Autoempleo/consultor No empleado
Edición del este
Edición del oeste
1105 31 229 485
574 15 186 344
Use α 0.05 para probar la hipótesis de que el tipo de empleo es independiente de la región. ¿Cuál es su conclusión?
12Ander(457-489).qxd 1/31/08 8:13 PM Page 484
484
Capítulo 12
Pruebas de bondad de ajuste e independencia
33. Una institución de préstamo muestra los datos siguientes sobre los préstamos aprobados por cuatro de sus agentes. Use α 0.05 y realice una prueba para determinar si la aprobación de las decisiones de préstamo es independiente del agente que recibe la solicitud de préstamo.
Decisión de aprobar el préstamo Agente de préstamo Miller McMahon Games Runk
Aprobada
Rechazada
24 17 35 11
16 13 15 9
34. Como parte de un estudio nacional se obtuvieron datos sobre el estado civil de hombres y mujeres de 20 a 29 años. Los resultados en una muestra de 350 hombre y 400 mujeres son los siguientes.
Estado civil
a. b.
Género
Soltero
Casado
Divorciado
Hombre Mujer
234 216
106 168
10 16
Use α 0.01 para probar la independencia entre el estado civil y el género. ¿Cuál es su conclusión? Dé el porcentaje en cada una de las categorías de estado civil de hombres y mujeres.
35. Barna Research Group presenta datos obtenidos sobre la asistencia a la iglesia de acuerdo con las edades (USA Today, 20 de noviembre de 2003). Use los datos muestrales para determinar si la asistencia a la iglesia es independiente de la edad. Use 0.05 como nivel de significancia. ¿Cuál es su conclusión? ¿Qué conclusión se puede sacar acerca de la asistencia a la iglesia a medida que las personas envejecen?
Asistencia a la iglesia Edad
Sí
No
Total
20 a 29 30 a 39 40 a 49 50 a 59
31 63 94 72
69 87 106 78
100 150 200 150
36. Los siguientes son datos sobre el número de llamadas solicitando una ambulancia de emergencia en una zona rural y en una zona urbana de Virginia.
Día de la semana Domingo Lunes Martes Miércoles Jueves Zona
Viernes Sábado
Total
Urbana Rural
61 7
48 9
50 16
55 13
63 9
73 14
43 10
393 78
Total
68
57
66
68
72
87
53
471
Realice una prueba de independencia usando α 0.05. ¿Cuál es su conclusión?
12Ander(457-489).qxd 1/31/08 8:13 PM Page 485
Caso problema
485
Una agenda bipartidista para el cambio
37. Las siguientes son las calificaciones en los exámenes finales en un curso universitario. 55 82 76
85 90 81
72 71 78
99 83 65
48 60 75
71 95 87
88 77 86
70 84 70
59 73 80
98 63 64
80 72
74 95
93 79
85 51
74 85
Use α 0.05 y realice una prueba para determinar si se debe rechazar que una distribución normal sea representativa de la distribución poblacional de estas calificaciones. 38. Los datos siguientes dan el índice de ocupación de las oficinas en cuatro zonas metropolitanas de California. ¿Los datos indican que la cantidad de oficinas libres es independiente de la zona metropolitana? Use 0.05 como nivel de significancia. ¿Cuál es su conclusión?
Situación
Los Angeles
San Diego
San Francisco
San Jose
Ocupadas Libres
160 40
116 34
192 33
174 26
39. Un vendedor hace cuatro llamadas por día. En una muestra de 100 días los volúmenes de
venta son los siguientes.
Número de ventas
Frecuencia observada (días)
0 1 2 3 4
30 32 25 10 3
Total
100
Por experiencia se sabe que 30% de las llamadas llevan a una venta. Si las llamadas de ventas son independientes, el número de ventas por día deberá seguir una distribución binomial. La función de probabilidad binomial, presentada en el capítulo 5 es f (x)
n! px(1 p)n x x!(n x)!
En este ejercicio suponga que la población tiene una distribución binomial con n 4, p 0.30 y x 0, 1, 2, 3 y 4. a. Mediante la distribución de probabilidad binomial, calcule las frecuencias esperadas para x 0, 1, 2, 3 y 4. Si es necesario combine categorías para satisfacer el requerimiento de que la frecuencia esperada en cada categoría debe ser cinco o más. b. Use la prueba de bondad de ajuste para determinar si se debe rechazar la suposición de una distribución binomial. Use α 0.05. Como no hubo necesidad de estimar ninguno de los parámetros de la distribución binomial a partir de los datos muestrales, los grados de libertad son k 1, donde k es el número de categorías.
Caso problema
Una agenda bipartidista para el cambio En un estudio realizado por Zogby International para Democrat and Chronicle, se entrevistaron más de 700 neoyorquinos para determinar si el gobierno del estado de Nueva York funcionaba. Entre los asuntos sobre los que se interrogaba a los entrevistados estaban reducciones de salario
12Ander(457-489).qxd 1/31/08 8:13 PM Page 486
486
Capítulo 12
Pruebas de bondad de ajuste e independencia
a los legisladores, restricciones a los grupos de presión, límites de mandato para los legisladores y si los ciudadanos podrían incluir sus temas en las consultas ciudadanas (Democrat and Chronicle, 7 de diciembre de 1997). Los resultados mostraron un amplio apoyo a varias reformas, en niveles políticos y demográficos. Suponga que en un estudio subsiguiente se entrevistan 100 individuos que viven en la región oeste de Nueva York. De cada entrevistado se registra su afiliación partidaria (demócrata, independiente o republicano), así como sus respuestas a estas tres preguntas. 1. ¿Se les debe reducir el sueldo a los legisladores por cada día que se retrasa el presupuesto para el estado? Sí___ No___ 2. ¿Debe haber más restricciones para los grupos de presión? Sí___ No___ 3. ¿Debe haber límites para que el mandato de los legisladores sea de un número determinado de años? Sí___ No___
archivo CD en NYReform
Las respuestas fueron codificadas usando 1 para Sí y 2 para No. Los datos obtenidos se encuentran en el archivo titulado NYReform del disco compacto.
Informe administrativo 1. Use estadísticos descriptivos para resumir los datos de este estudio. ¿Cuáles son, respecto de cada pregunta, las conclusiones preliminares acerca de la independencia entre repuesta (Sí, No) y afiliación política? 2. Respecto de la pregunta 1, pruebe la independencia entre la respuesta (Sí, No) y afiliación política. Use α 0.05. 3. Respecto de la pregunta 2, pruebe la independencia entre la respuesta (Sí, No) y afiliación política. Use α 0.05. 4. Respecto de la pregunta 3, pruebe la independencia entre la respuesta (Sí, No) y afiliación política. Use α 0.05. 5. ¿Parece haber un amplio apoyo para los cambios en todos los estratos políticos? Explique.
Apéndice 12.1
Pruebas de bondad de ajuste e independencia mediante Minitab Prueba de bondad de ajuste Este procedimiento de Minitab se usa para pruebas de bondad de ajuste para la distribución multinomial de la sección 12.1 y las distribuciones de Poisson y normal de la sección 12.3. El usuario tendrá que obtener las frecuencias observadas, calcular las frecuencias esperadas e ingresar tanto frecuencias observadas como esperadas en la hoja de cálculo de Minitab. La columna C1 se rotula como Observada y contiene las frecuencias observadas. La columna C2 se rotula como Esperadas y contiene las frecuencias esperadas. Use el ejemplo de Scott Marketing Research de la sección 12.1, abra una hoja de cálculo de Minitab e ingrese las frecuencias observadas 48, 98 y 54 en la columna C1 y las frecuencias esperadas 60, 100 y 40 en la columna C2. Los pasos para la prueba de bondad de ajuste usando Minitab son los siguientes. Paso 1. Seleccionar el menú Calc Paso 2. Elegir Calculator
12Ander(457-489).qxd 1/31/08 8:13 PM Page 487
Apéndice 12.2
Pruebas de bondad de ajuste e independencia mediante Excel
487
Paso 3. Cuando aparezca el cuadro de diálogo Calculator: Ingresar ChiSquare en el cuadro Store result in variable Ingresar Sum((C1-C2)**2/C2) en el cuadro Expression Clic en OK Paso 4. Seleccionar el menú Calc Paso 5. Elegir Probability Distributions Paso 6. Elegir Chi-Square Paso 7. Cuando aparezca el cuadro de diálogo Chi-Square Distribution: Seleccionar Cumulative probability Ingresar 2 en el cuadro Degree of freedom Seleccionar Input column e ingresar ChiSquare en el cuadro Clic en OK En los resultados que da Minitab presenta la probabilidad acumulada 0.9745, que es el área bajo la curva a la izquierda de χ 2 7.34. El área restante en la cola superior es el valor-p. Por tanto, valor-p 1 0.9745 0.0255.
Prueba de independencia Con el ejemplo de la Albert’s Brewery de la sección 12.2, se empieza con una nueva hoja de cálculo de Minitab y se ingresan los datos de las frecuencias observadas en las columnas 1, 2 y 3, respectivamente. Es decir, las frecuencias observadas que corresponden a las preferencias por la cerveza ligera (20 y 30) se ingresan en la columna C1, las frecuencias observadas que corresponden a las preferencias por la cerveza clara (40 y 30) se ingresan en la columna C2 y las frecuencias observadas que corresponden a las preferencias por la cerveza oscura (20 y 10) se ingresan en la columna C3. Los pasos para la prueba de independencia usando Minitab son los siguientes. Paso 1. Paso 2. Paso 3. Paso 4.
Apéndice 12.2
Seleccionar el menú Stat Seleccionar Tables Elegir Chi-Square Test (Table in Worksheet) Cuando aparezca el cuadro de diálogo Chi-Square Test Ingresar C1-C3 en el cuadro Columns containing the table Clic en OK
Pruebas de bondad de ajuste e independencia mediante Excel Prueba de bondad de ajuste
archivo CD en FitTest
Este procedimiento de Excel se usa para pruebas de bondad de ajuste para la distribución multinomial de la sección 12.1 y las distribuciones de Poisson y normal de la sección 12.3. El usuario tendrá que obtener las frecuencias observadas, calcular las frecuencias esperadas e ingresar tanto frecuencias observadas como esperadas en la hoja de cálculo de Excel. Las frecuencias observadas y las esperadas en el ejemplo de Scott Market Research de la sección 12.1 se ingresan en las columnas A y B, como se muestra en la figura 12.4. El estadístico de prueba χ 2 7.34 se calcula en la columna D. Como hay k 3 categorías, el usuario ingresa los grados de libertad k 1 3 1 2 en la celda D11. La función CHIDISTR.CHI. proporciona el valor-p en la celda D13. En la hoja de cálculo que aparece en segundo plano se presentan las fórmulas correspondientes a cada celda.
12Ander(457-489).qxd 1/31/08 8:13 PM Page 488
488
Capítulo 12
FIGURA 12.4
Pruebas de bondad de ajuste e independencia
HOJA DE CÁLCULO DE EXCEL PARA LA PRUEBA DE BONDAD DE AJUSTE EN EL EJEMPLO DE SCOTT MARKET RESEARCH A B C D E 1 Goodness of Fit Test 2 3 Observed Expected 4 Frequency Frequency Calculations 5 48 60 =(A5-B5)^2/B5 6 98 100 =(A6-B6)^2/B6 7 54 40 =(A7-B7)^2/B7 8 9 Test Statistic =SUM(D5:D7) 10 11 Degrees of Freedom 2 12 13 p-Value =CHIDIST(D9,D11) 14 A B C D 1 Goodness of Fit Test 2 3 Observed Expected 4 Frequency Frequency Calculations 5 48 60 2.40 6 98 100 0.04 7 54 40 4.90 8 9 Test Statistic 7.34 10 11 Degrees of Freedom 2 12 13 p-Value 0.0255 14
E
Prueba de independencia
archivo CD en Independence
En el procedimiento de Excel para pruebas de independencia se requiere que el usuario obtenga las frecuencias observadas y las ingrese en una hoja de cálculo. En el ejemplo de la Alber’s Brewery presentado en la sección 12.2 se dan las frecuencias observadas, las cuales se ingresan en las celdas B7 a D8, como se muestra en la hoja de cálculo de la figura 12.5. Las fórmulas que aparecen en las celdas de la hoja de cálculo en segundo plano muestran el procedimiento empleado para calcular las frecuencias esperadas. En la celda E22, se ingresan los grados de libertad, que como se tienen dos renglones y tres columnas, serán (2 1)(3 1) 2. La función PRUEBA.CHI proporciona en la celda E24 el valor-p.
12Ander(457-489).qxd 1/31/08 8:13 PM Page 489
Apéndice 12.2 FIGURA 12.5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
489
Pruebas de bondad de ajuste e independencia mediante Excel
HOJA DE CÁLCULO DE EXCEL PARA LA PRUEBA DE INDEPENDENCIA DE LA ALBER’S BREWERY
A B Test of Independence
C
D
E
F
Observed Frequencies
Gender Light Male 20 Female 30 Total =SUM(B7:B8)
Beer Peference Regular Dark 40 20 30 10 =SUM(C7:C8) =SUM(D7:D8)
Total =SUM(B7:D7) =SUM(B8:D8) =SUM(E7:E8)
Expected Frequencies Beer Peference Gender Light Regular Dark Total Male =E7*B$9/$E$9 =E7*C$9/$E$9 =E7*D$9/$E$9 =SUM(B16:D16) Female =E8*B$9/$E$9 =E8*C$9/$E$9 =E8*D$9/$E$9 =SUM(B17:D17) Total =SUM(B16:B17) =SUM(C16:C17) =SUM(D16:D17) =SUM(E16:E17)
1 2 3 Test Statistic =CHIINV(E24,E22) 4 5 Degrees of Freedom 2 6 7 p-value =CHITEST(B7:D8,B16:D17) 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
A B C Test of Independence
D
E
F
Observed Frequencies Beer Peference Gender Light Regular Dark Male 20 40 20 Female 30 30 10 Total 50 70 30
Total 80 70 150
Expected Frequencies Beer Peference Gender Light Regular Dark Male 26.67 37.33 16 Female 23.33 32.67 14 Total 50 70 30
Total 80 70 150
Test Statistic
6.12
Degrees of Freedom
2
p-value 0.0468
13Ander(490-542).qxd 2/11/08 7:25 PM Page 490
CAPÍTULO
13
Diseño de experimentos y análisis de varianza CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: BURKE MARKETING SERVICES, INC. 13.1 INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS Y AL ANÁLISIS DE VARIANZA Obtención de datos Suposiciones para el análisis de varianza Análisis de varianza: una visión conceptual general 13.2 ANÁLISIS DE VARIANZA Y EL DISEÑO COMPLETAMENTE ALEATORIZADO Estimación de la varianza poblacional entre tratamientos Estimación de la varianza poblacional dentro de los tratamientos Comparación de las estimaciones de las varianzas: la prueba F
Tabla de ANOVA Resultados de computadora para el análisis de varianza Prueba para la igualdad de k medias poblacionales: un estudio observacional 13.3 PROCEDIMIENTO DE COMPARACIÓN MÚLTIPLE LSD de Fisher Tasas de error tipo I 13.4 DISEÑO DE BLOQUES ALEATORIZADO Prueba de estrés para los controladores del tráfico aéreo Procedimiento ANOVA Cálculos y conclusiones 13.5 EXPERIMENTOS FACTORIALES Procedimiento ANOVA Cálculos y conclusiones
13Ander(490-542).qxd 2/11/08 7:25 PM Page 491
491
La estadística en la práctica
LA ESTADÍSTICA
en LA PRÁCTICA
BURKE MARKETING SERVICES, INC.* CINCINNATI, OHIO
Burke Marketing Services, Inc., es una de las empresas de investigación de mercado con más experiencia. Cada día Burke presenta más propuestas, sobre más proyectos, que cualquier otra empresa de investigación de mercado en el mundo. Apoyada con la última tecnología, Burke ofrece una amplia variedad de posibilidades de investigación, con lo que da solución a casi cualquier problema de marketing. En un estudio reciente una empresa solicitó los servicios de Burke para evaluar una nueva versión de un cereal para niños. Por razones de confidencialidad aquí se nombrará a ésta como empresa Anon. La empresa Anon consideraba que los cuatro factores principales que intervenían en el sabor del cereal eran 1. La proporción entre trigo y maíz en el cereal. 2. El tipo de edulcorante: azúcar, miel o edulcorante artificial. 3. La presencia o ausencia de trocitos con sabor a fruta. 4. El tiempo de cocción, largo o corto. Burke diseñó un experimento para determinar el efecto de estos cuatro factores en el sabor del cereal. Por ejemplo, hizo una prueba con una determinada proporción de trigo y maíz, con azúcar como edulcorante, trocitos de sabor a fruta y tiempo corto de cocción; hizo otra prueba en la cual varió únicamente la proporción de trigo y maíz y dejó igual todos los demás factores, y así sucesivamente. Después un grupo de niños probó los cereales y dio su opinión acerca del sabor de cada uno. El método estadístico empleado para estudiar los datos obtenidos de las pruebas de degustación fue el análisis de *Los autores agradecen a doctor Ronald Tatham de Burke Marketing Services por proporcionar este artículo para La estadística en la práctica.
Burke emplea pruebas de degustación para obtener información de lo que los clientes esperan de un producto. ©JLP/Sylvia Torres/CORBIS.
varianza. De los resultados de los análisis se concluyó lo siguiente: •
• •
La relación entre trigo y maíz y el tipo de edulcorante influyeron de manera importante en la evaluación del sabor. Los trocitos con sabor a fruta, en realidad tuvieron un efecto negativo sobre el sabor del cereal. El tiempo de cocción no tuvo ninguna influencia sobre el sabor.
Con esta información Anon pudo identificar los factores que intervenían en la obtención del sabor del cereal. El diseño experimental empleado por Burke y el posterior análisis de varianza sirvieron para hacer una recomendación en el diseño del producto. En este capítulo se verá cómo se realizan estos procedimientos.
En el capítulo 1 se dijo que los estudios estadísticos se clasifican como experimentales u observacionales. En un estudio estadístico experimental se realiza un experimento para obtener los datos. Un experimento empieza por la identificación de la variable de interés. Después se identifican y controlan una o más variables que se consideran relacionadas con la variable de interés, para después recoger datos de la influencia de estas variables sobre la variable de interés. En un estudio observacional, los datos suelen obtenerse mediante inspección de una muestra y no mediante un experimento controlado. En estos estudios, aunque también se emplean los principios para un buen estudio, no es posible tener el control riguroso que se tiene en un estudio experimental. Por ejemplo, en un estudio para entender la relación entre fumar y el cáncer de pulmón, el investigador no puede asignarle a un sujeto el hábito de fumar. El investigador sólo puede observar los efectos de fumar en las personas que ya tienen este hábito y los efectos de no fumar en las personas que no lo tienen.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 492
492
Capítulo 13
A sir Ronald Alymer Fisher (1890-1962) se le atribuye la invención de la rama de la estadística conocida como diseño de experimentos. Además de sus aportaciones a la estadística, fue un científico sobresaliente en el campo de la genética.
En este capítulo se presentan tres tipos de diseños de experimentos: un diseño completamente aleatorizado, un diseño de bloques aleatorizado y un experimento factorial. Para cada tipo de diseño se indica cómo usar el procedimiento estadístico conocido como análisis de varianza (ANOVA, por sus siglas en inglés) para analizar los datos de una variable. El ANOVA también se usa para analizar los datos obtenidos mediante un estudio observacional. Por ejemplo, se verá que el ANOVA también se usa en los diseños completamente aleatorizados para probar la igualdad de tres o más medias poblacionales de datos obtenidos mediante un estudio observacional. En los capítulos siguientes se verá que, además, el ANOVA tiene gran importancia en el análisis de los resultados de estudios de regresión, tanto de datos experimentales como observacionales. En la primera sección de este capítulo se presentan los principios de un estudio experimental y cómo emplearlos en un diseño completamente aleatorizado. En la segunda sección se muestra cómo usar el ANOVA para analizar los datos de un diseño de experimentos completamente aleatorizado. En la última sección se estudian métodos de comparación múltiple y otros dos diseños de experimentos muy usados, el diseño de bloques aleatorizado y el experimento factorial.
13.1
Las relaciones de causa y efecto son difíciles de establecer en estudios observacionales, pero fáciles de establecer en estudios experimentales.
Aleatorización es el procedimiento por el cual se asignan al azar los tratamientos a las unidades experimentales. Antes del trabajo de sir R. A. Fisher, los tratamientos se asignaban de manera sistemática o subjetiva.
Diseño de experimentos y análisis de varianza
Introducción al diseño de experimentos y al análisis de varianza Un ejemplo de un estudio estadístico experimental es el problema que se le presentó a la empresa Chemitech, Inc.; dicha empresa elaboró un sistema de filtración para los suministros de aguas municipales. Los componentes del sistema de filtración se comprarían a varios proveedores y Chemitech armaría el sistema de filtración en su fábrica en Columbia, Carolina del Sur. El grupo de ingenieros industriales era el encargado de determinar el mejor método para armar el sistema de filtración. Después de considerar varios métodos, quedaron sólo tres alternativas: el método A, el método B y el método C. La diferencia entre estos métodos era el orden en los pasos para armar el sistema. Los administradores de Chemitech, querían saber con qué método se podían producir más sistemas en una semana. En el experimento de Chemitech, el método para armar el sistema es la variable independiente o factor. Como a este factor le corresponden tres métodos para armar el sistema, se dice que en este experimento hay tres tratamientos; cada tratamiento corresponde a uno de los tres métodos para armar el sistema. El problema de Chemitech es un ejemplo de un experimento de un solo factor; interviene sólo un factor cualitativo (el método para armar el sistema). En experimentos más complejos caben múltiples factores; los factores pueden ser cualitativos o cuantitativos. Los tres tratamientos o métodos para armar el sistema constituyen las tres poblaciones de interés del experimento de Chemitech. Una población está formada por todos los trabajadores que emplean el método A, otra población es la de todos los trabajadores que emplean el método B y otra población es la de todos los trabajadores que emplean el método C. Observe que en cada población la variable dependiente o variable de respuesta es el número de sistemas de filtración que se arman por semana, y el objetivo estadístico del experimento es determinar si el número medio producido por semana es el mismo en las tres poblaciones (con los tres métodos). Suponga una muestra aleatoria de tres trabajadores de la empresa Chemitech. En el lenguaje del diseño de experimentos, estos tres trabajadores son las unidades experimentales. Al diseño de experimentos que se usará para el problema de Chemitech se le llama diseño completamente aleatorizado. En este tipo de diseño se requiere que cada uno de los tratamientos o métodos para armar el sistema se asigne de manera aleatoria a cada una de las unidades experimentales o trabajadores. Así, el método A le puede ser asignado aleatoriamente al segundo trabajador, el método B al primer trabajador y el método C al tercer trabajador. El concepto de aleatorización, como se ha ilustrado en este ejemplo, es importante en el diseño de experimentos.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 493
13.1
493
Introducción al diseño de experimentos y al análisis de varianza
FIGURA 13.1
DISEÑO COMPLETAMENTE ALEATORIZADO PARA EVALUAR EL MÉTODO EXPERIMENTAL DE ARMAR EL SISTEMA DE CHEMITECH
Todos los empleados en la fabrica de Columbia, Carolina del Sur
Muestra aleatoria de 15 empleados tomada para el experimento
Cada uno de los métodos para armar el sistema de filtración se asigna a 5 empleados.
Método A n1 = 5
Método B n2 = 5
Método C n3 = 5
Observe que en este experimento sólo se obtendrá una medición (un dato) para cada método de armar el sistema de filtración. Para obtener más datos para cada método, se necesita repetir o replicar el proceso experimental básico. Considere que en lugar de tomar al azar sólo a tres trabajadores, se toman 15 trabajadores, y a cada cinco trabajadores se les asigna en forma aleatoria uno de los métodos para armar el sistema de filtración. Como cada uno de estos métodos es asignado a cinco trabajadores, se dice que se obtienen cinco réplicas. El proceso de replicación es otro principio importante en el diseño de experimentos. En la figura 13.1 se presenta el diseño completamente aleatorizado para el experimento de Chemitech.
Obtención de datos Una vez satisfechos con el diseño del experimento, se procede a obtener y analizar los datos. En el caso de Chemitech, se les explicará a los trabajadores cómo emplear el método que les ha sido asignado y empezarán a armar los sistemas de filtración con ese método. En la tabla 13.1 se presenta el número de unidades armadas por cada empleado en una semana. En esta tabla se dan también la media muestral, la varianza muestral y la desviación estándar muestral obtenidas con cada método de ensamblado. Así, la media muestral del número de unidades producidas con el método A es 62; la media muestral con el método B es 66 y la media muestral usando el método C es 52. De acuerdo con estos datos, parece que con el método B se obtienen más unidades por semana que con los otros dos métodos. Lo que importa es si las tres medias muestrales observadas difieren lo suficiente para poder concluir que las medias de las poblaciones correspondientes a estos tres métodos son diferentes. Para expresar esto en términos estadísticos se introduce la notación siguiente. μ 1 número promedio de unidades producidas por semana con el método A μ 2 número promedio de unidades producidas por semana con el método B μ 3 número promedio de unidades producidas por semana con el método C
13Ander(490-542).qxd 2/11/08 7:25 PM Page 494
494
Capítulo 13
TABLA 13.1
Diseño de experimentos y análisis de varianza
NÚMERO DE UNIDADES PRODUCIDA POR 15 TRABAJADORES
archivo CD en
A
Chemitech
Media muestral Varianza muestral Desviación estándar muestral
Método B
C
58 64 55 66 67
58 69 71 64 68
48 57 59 47 49
62 27.5 5.244
66 26.5 5.148
52 31.0 5.568
Aunque nunca se podrá saber cuáles son los verdaderos valores de μ1, μ2 y μ3, se van a usar las medias muestrales para probar las hipótesis siguientes. Si se rechaza H0, no se puede concluir que todas las medias poblacionales sean diferentes. Rechazar H0 significa que por lo menos dos de las medias poblacionales tienen un valor diferente.
H0: μ 1 μ 2 μ 3 Ha: No todas las medias poblacionales son iguales Como se demostrará más adelante, el análisis de varianza (ANOVA) es el procedimiento estadístico que se emplea para determinar si las diferencias observadas entre las tres medias muestrales son lo suficientemente grandes para rechazar H0.
Suposiciones para el análisis de varianza Si los tamaños de las muestras son iguales, el análisis de varianza no es sensible a desviaciones de la suposición de que las poblaciones están distribuidas de manera normal.
Son tres las suposiciones para emplear el análisis de varianza. 1. En cada población, la variable de respuesta tiene una distribución normal. Por tanto: en el experimento de Chemitech el número de unidades producida por semana (variable de respuesta) con cada uno de los métodos debe estar distribuida en forma normal. 2. La varianza de la variable de respuesta, que se denota σ 2, es la misma en todas las poblaciones. Por tanto: en el experimento de Chemitech, con los tres métodos, la varianza en el número de unidades producida por semana debe ser la misma. 3. Las observaciones deben ser independientes. Por tanto: en el experimento de Chemitech la cantidad de unidades producida por semana por un empleado debe ser independiente el número de unidades producidas por semana por cualquier otro empleado.
Análisis de varianza: una visión conceptual general Si las medias de las tres poblaciones son iguales, se esperaría que las tres medias muestrales fueran muy parecidas. En efecto, entre más parecidas sean las medias muestrales, mayor será la evidencia para concluir que las medias poblacionales son iguales, o entre mayor sea la diferencia entre las medias muestrales, mayor será la evidencia para concluir que las medias poblacionales no son iguales. En otras palabras, si la variabilidad entre las medias muestrales es “pequeña”, esto favorece a H0; si la variabilidad entre las medias muestrales es “grande”, esto favorece a Ha. Si la hipótesis nula es verdadera, H0: μ1 μ 2 μ3, se usa la variabilidad entre las medias muestrales para estimar σ 2. Primero, observe que si se satisfacen las suposiciones para el análi-
13Ander(490-542).qxd 2/11/08 7:25 PM Page 495
13.1
Introducción al diseño de experimentos y al análisis de varianza
FIGURA 13.2
495
DISTRIBUCIÓN MUESTRAL DE x̄ SI H0 ES VERDADERA
σ x2 = σ
2
n
x3
μ
x2
x1
Las medias muestrales se encuentran todas “muy cerca” porque sólo existe una distribución muestral cuando H0 es verdadera.
sis de varianza, cada una de las muestras provendrá de la misma distribución normal con media μ y varianza σ 2. Recuerde que en el capítulo 7 se vio que la distribución muestral de la media muestral x̄ de una muestra aleatoria simple de tamaño n tomada de una población normal tendrá una distribución normal con media μ y desviación estándar σ 2/n. En la figura 13.2 se ilustra una distribución muestral así. Por tanto, si la hipótesis nula es verdadera, se considera cada una de las tres medias muestrales, x̄1 62, x̄ 2 66 y x̄3 = 52 como valores obtenidos aleatoriamente de la distribución muestral que aparece en la figura 13.2. En este caso la media y la varianza de los tres valores x̄ se usa para estimar la media y la varianza de la distribución muestral. Si los tamaños de las muestras son iguales, como en el caso de Chemitech, la mejor estimación de la media de la distribución muestral de x̄ es la media o el promedio de las medias muestrales. Por tanto, en el experimento de Chemitech, una estimación de la media de la distribución muestral de x̄ es (62 + 66 + 52)/3 = 60. A esta estimación se le conoce como media muestral general. Una estimación de la varianza de la distribución muestral de x̄, σ 2x̄ , se obtiene de la varianza de las tres medias muestrales. s 2x̄
(62 60)2 (66 60)2 (52 60)2 104 52 3 1 2
Como σ 2x̄ σ 2/n, despejando σ 2 se obtiene σ 2 nσ 2x̄ Por tanto, Estimación de σ 2 n (Estimación de σ 2x̄ ) ns 2x̄ 5(52) 260 A ns 2x̄ = 260, se le conoce como estimación de σ 2 entre tratamientos. La estimación de σ 2 entre tratamientos se basa en la suposición de que la hipótesis nula sea verdadera. En este caso cada una de las muestras proviene de la misma población y sólo hay una
13Ander(490-542).qxd 2/11/08 7:25 PM Page 496
496
Capítulo 13
FIGURA 13.3
Diseño de experimentos y análisis de varianza
DISTRIBUCIONES MUESTRALES DE x̄ SI H0 ES FALSA
x3
μ3
μ1
x2 μ 2
x1
Las medias muestrales provienen de distribuciones muestrales diferentes y no son semejantes cuando H0 es falsa.
distribución muestral de x̄. Para ilustrar lo que ocurre cuando H0 es falsa, suponga que las medias poblacionales son diferentes. Observe que como las tres muestras provienen de poblaciones normales con medias diferentes, darán tres distribuciones muestrales diferentes. En la figura 13.3 se muestra que en este caso las medias muestrales no están tan cerca unas de otras, como cuando la H0 es verdadera. Entonces, s 2x̄ será mayor, haciendo que la estimación de σ 2 sea mayor. En general, cuando las medias poblacionales no son iguales, la estimación entre tratamientos sobreestimará la varianza poblacional σ 2. La variación dentro de cada una de las muestras también tiene efecto sobre la conclusión a la que se arriba con el análisis de varianza. Cuando se toma una muestra aleatoria simple de cada población, cada una de las varianzas muestrales proporciona un estimador insesgado de σ 2. Por tanto, se combinan o juntan las estimaciones individuales de σ 2 en una estimación general. A la estimación de σ 2 obtenida de esta manera se le conoce como estimación conjunta o dentro de los tratamientos de σ 2. Como cada varianza muestral proporciona una estimación de σ 2 que se basa sólo en la variación dentro de cada muestra, a la estimación de σ 2 dentro de los tratamientos no le afecta que las medias poblacionales sean o no iguales. Si los tamaños de las muestras son iguales, la estimación dentro de los tratamientos de σ 2 se obtiene del promedio de las varianzas muestrales. En el experimento de Chemitech se obtiene Estimación de σ2 dentro de los tratamientos
27.5 26.5 31.0 85 28.33 3 3
En el experimento de Chemitech, la estimación de σ 2 entre los tratamientos (260) es mucho mayor que la estimación de σ 2 dentro de los tratamientos (28.33). El cociente entre estas dos estimaciones es 260/28.33 9.18. Pero debe recordarse que el método entre tratamientos sólo proporciona una buena estimación de σ 2 si la hipótesis nula es verdadera. Si la hipótesis nula es falsa, el método entre tratamientos sobreestima σ 2. El método dentro de los tratamientos proporciona una buena estimación de σ 2 en cualquiera de los casos. Por tanto si la hipótesis nula es verdadera, las dos estimaciones serán semejantes y su cociente será cercano a 1. Si la hipótesis nula es falsa, la estimación entre tratamientos será mayor que la estimación dentro de los tratamientos y su cociente será grande. En la sección siguiente se muestra cuán grande debe ser este cociente para que se rechace H0.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 497
13.2
Análisis de varianza y el diseño completamente aleatorizado
497
En resumen, la idea detrás del ANOVA se basa en la obtención de dos estimaciones independientes de la varianza poblacional común σ 2. Una estimación de σ 2 se basa en la variabilidad entre las medias muestrales mismas y la otra estimación de σ 2 se basa en la variabilidad entre los datos dentro de cada muestra. Al comparar estas dos estimaciones de σ 2, se determina si las medias poblacionales son iguales.
NOTAS Y COMENTARIOS 1. 2.
3.
13.2
En el diseño de experimentos, la aleatorización es el análogo al muestreo probabilístico en un estudio observacional. En muchos experimentos médicos los sesgos potenciales se eliminan con el empleo de un diseño de experimento doble ciego. En este diseño, ni el médico ni el paciente saben qué tratamiento se está aplicando. Este tipo de diseño también es útil en muchos otros tipos de experimentos. En esta sección se presentó una visión conceptual del uso del análisis de varianza para probar la igualdad de k medias poblacionales
4.
en un diseño experimental completamente aleatorizado. Se verá que este mismo procedimiento también se usa para probar la igualdad de k medias poblacionales en un estudio observacional o no experimental. En las secciones 10.1 y 10.2 se presentaron métodos estadísticos para probar las hipótesis de igualdad de dos medias poblacionales El ANOVA también puede usarse para probar las hipótesis de que las medias de dos poblaciones son iguales. Sin embargo, en la práctica el análisis de varianza se usa cuando se tienen tres o más medias poblacionales
Análisis de varianza y el diseño completamente aleatorizado En esta sección se muestra el uso del análisis de varianza para probar la igualdad de k medias poblacionales en un diseño completamente aleatorizado. La forma general de esta prueba de hipótesis es H0: μ1 μ2 . . . μk Ha: No todas las medias poblacionales son iguales donde μj media de la j-ésima población Se supone que de cada una de las k poblaciones o tratamientos se toma una muestra aleatoria simple de tamaño nj. Para los datos muestrales, sean x ij nj x̄j s 2j sj
valor de la observación i del tratamiento j número de observaciones en el tratamiento j media muestral del tratamiento j varianza muestral del tratamiento j desviación estándar muestral del tratamiento j
13Ander(490-542).qxd 2/11/08 7:25 PM Page 498
498
Capítulo 13
Diseño de experimentos y análisis de varianza
Las fórmulas para la media muestral y la varianza muestral del tratamiento j son las siguientes: nj
兺x
ij
i 1
x̄j
(13.1)
nj
nj
s 2j
兺(x
ij
x̄ j)2
i 1
(13.2)
nj 1
La media muestral general que se denota x̄¯, es la suma de todas las observaciones dividida entre la cantidad total de todas las observaciones. Es decir, nj
k
x̄¯
兺兺x
ij
j 1 i 1
(13.3)
nT
donde nT n1 n2 . . . nk
(13.4)
Si todas las muestras son de tamaño n, n T kn; en este caso, la ecuación 13.3 se reduce a k
x̄¯
nj
兺兺x
j 1 i 1
kn
k
ij
nj
k
兺 兺 x 兾n 兺 x̄ ij
j 1 i 1
k
j 1
k
j
(13.5)
En otras palabras, si todas las muestras son del mismo tamaño, la media muestral general es el promedio de las k medias muestrales. En el experimento de Chemitech, como todas las muestras constaban de n 5 observaciones, la media muestral general se puede calcular empleando la fórmula 13.5. De acuerdo con los datos de la tabla 13.1 se tiene lo siguiente. x̄¯
62 66 52 60 3
Si la hipótesis nula es verdadera (μ1 μ 2 μ3 μ), la media muestral general, 60, es la mejor estimación de la media poblacional μ.
Estimación de la varianza poblacional entre tratamientos En la sección anterior se presentó el concepto de estimación de σ 2 entre tratamientos y se mostró cómo calcular esta estimación cuando todas las muestras eran del mismo tamaño. A esta estimación de σ 2 se le llama cuadrado medio debido a los tratamientos y se denota CMTR. La fórmula general para calcular el CMTR es k
兺 n (x̄ j
CMTR
j
x̄¯ )2
j 1
k 1
(13.6)
13Ander(490-542).qxd 2/11/08 7:25 PM Page 499
13.2
499
Análisis de varianza y el diseño completamente aleatorizado
Al numerador de la ecuación (13.6) se le llama suma de cuadrados debido a los tratamientos y se denota (SCTR). El denominador, k 1, representa los grados de libertad que corresponden a la SCTR. Por tanto, el cuadrado medio debido a los tratamientos se calcula mediante las fórmulas siguientes. CUADRADO MEDIO DEBIDO A LOS TRATAMIENTOS (13.7)
SCTR k 1
CMTR donde k
SCTR
兺 n (x̄ j
j
(13.8)
x̄¯ )2
j 1
Si H0 es verdadera, el CMTR proporciona una estimación insesgada de σ 2. Pero, si las medias de las k poblaciones no son iguales, el CMTR no es un estimador insesgado de σ 2; en este caso el CMTR sobreestima σ 2. En el caso de Chemitech, de acuerdo con los datos de la tabla 13.1, se tiene: k
SCTR
兺 n (x̄ j
j
x̄¯ )2 5(62 60)2 5(66 60)2 5(52 60)2 520
j 1
CMTR
SCTR 520 260 k 1 2
Estimación de la varianza poblacional dentro de los tratamientos En párrafos anteriores ya se presentó el concepto de estimación de σ 2 dentro de los tratamientos y se mostró cómo calcular esta estimación cuando todas las muestras son del mismo tamaño. A esta estimación de σ 2 se le llama cuadrado medio debido al error y se denota CME. La fórmula general para calcular el CME es k
(nj CME
j
1)s 2j
1
nT
(13.9)
k
Al numerador de la ecuación (13.9) se le llama suma de cuadrados debido al error y se denota SCE. El denominador del CME son los grados de libertad correspondientes a SCE. Por tanto, la fórmula para el CME también se expresa como sigue. CUADRADO MEDIO DEBIDO AL ERROR
CME
SCE nT k
(13.10)
donde k
SCE
兺(n 1)s j
2 j
(13.11)
j 1
Observe que el CME está basado en la variación dentro de cada tratamiento; el que la hipótesis nula sea o no verdadera no tiene ninguna influencia. Por tanto, el CME siempre proporciona una estimación insesgada de σ 2.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 500
500
Capítulo 13
Diseño de experimentos y análisis de varianza
De acuerdo con los datos de la tabla 13.1 para el caso de Chemitech, se obtienen los resultados siguientes. k
SCE
兺(n 1)s j
2 j
(5 1)27.5 (5 1)26.5 (5 1)31 340
j 1
CME
SCE 340 340 28.33 nT k 15 3 12
Comparación de las estimaciones de las varianzas: la prueba F En la sección 11.2 se hizo una introducción a la distribución F y al uso de las tablas de la distribución F.
Si la hipótesis nula es verdadera, el CMTR y el CME proporcionan dos estimaciones insesgadas e independientes de σ 2. De acuerdo con lo visto en el capítulo 11, cuando se tienen poblaciones normales, la distribución muestral del cociente de dos estimaciones independientes de σ 2 sigue una distribución F. Por tanto, si la hipótesis nula es verdadera y si se satisfacen las suposiciones del ANOVA, la distribución muestral de CMTR/CME será una distribución F con k 1 grados de libertad en el numerador y n T k grados de libertad en el denominador. En otras palabras, si la hipótesis nula es verdadera, el valor de CMTR/CME parecerá ser un valor tomado de esta distribución F. Pero, si la hipótesis nula es falsa, el valor de CMTR/CME será muy grande debido a que CMTR sobreestima σ 2. Por tanto, si el valor de CMTR/CME resulta ser demasiado grande para haber sido tomado de la distribución F con k 1 grados de libertad en el numerador y n T k grados de libertad en el denominador, se rechazará H0. Como la decisión de rechazar H0 está basada en el valor de CMTR/CME, el estadístico de prueba que se usa para probar la igualdad de k poblaciones es el siguiente.
ESTADÍSTICO DE PRUEBA PARA LA IGUALDAD DE k MEDIAS POBLACIONALES
F
CMTR CME
(13.12)
Este estadístico de prueba sigue una distribución F con k 1 grados de libertad en el numerador y nT k grados de libertad en el denominador. Ahora recuerde el experimento de Chemitech, se usará α = 0.05 para realizar la prueba de hipótesis. El valor del estadístico de prueba es F
CMTR 260 9.18 CME 28.33
Los grados de libertad para el numerador son k 1 3 1 2 y los grados de libertad para el denominador son nT k 15 3 12. Como la hipótesis nula sólo se rechazará si se obtiene un valor grande para el estadístico de prueba, el valor-p será el área en la cola superior de la distribución F a la derecha del estadístico de prueba F = 9.18. En la figura 13.4 se muestra la distribución muestral de F = CMTR/CME, el valor del estadístico de prueba y el área en la cola superior que es el valor-p de esta prueba de hipótesis. Área en la cola superior
0.10
0.05 0.025 0.01
Valor F (gl1 = 2, gl2 = 12)
2.81
3.89
5.10
6.93 F 9.18
13Ander(490-542).qxd 2/11/08 7:25 PM Page 501
13.2
501
Análisis de varianza y el diseño completamente aleatorizado
FIGURA 13.4
CÁLCULO DEL VALOR-p A PARTIR DE LA DISTRIBUCIÓN MUESTRAL DE CMTR/CME
Distribución muestral de CMTR/CME
Valor-p CMTR/CME
F = 9.18
En el apéndice F se muestra cómo calcular el valor-p empleando Excel o Minitab.
En la tabla 4 del apéndice B se encuentran las áreas siguientes en la cola superior de la distribución F con 2 grados de libertad en el numerador y 12 grados de libertad en el denominador. Como F 9.18 es mayor que 6.93, el área en la cola superior, correspondiente a F 9.18 es menor que 0.01. Por tanto, el valor-p es menor que 0.01. Para obtener el valor-p exacto, que es 0.004, se puede usar Minitab o Excel. Como el valor-p α .05, se rechaza H0. La prueba proporciona evidencias suficientes para concluir que las medias de las tres poblaciones no son iguales. En otras palabras, el análisis de varianza favorece la conclusión de que las medias poblacionales del número de unidades producidas por semana, con cada uno de los tres métodos para armar los sistemas de filtración, no son iguales. Como se hace en otras pruebas de hipótesis, también puede emplearse aquí el método del valor crítico. Como α 0.05, el valor crítico de F es el que deja un área de 0.05 en la cola superior de la distribución F con 2 y 12 grados de libertad. En las tablas de la distribución F se encuentra F0.05 = 3.89. Por tanto, la regla de rechazo en el caso del experimento de Chemitech es Rechazar H0 si F
3.89
Como F 9.18, se rechaza H0 y se concluye que las medias de las tres poblaciones no son iguales. A continuación se presenta un resumen del procedimiento para probar la igualdad de k medias poblacionales.
PRUEBA DE LA IGUALDAD DE k MEDIAS POBLACIONALES
H0: μ1 μ2 . . . μk Ha: No todas las medias poblacionales son iguales ESTADÍSTICO DE PRUEBA
F
CMTR CME
REGLA DE RECHAZO
Método del valor-p : Rechazar H0 si el valor-p Método del valor crítico : Rechazar H0 si F Fα
α
donde el valor de Fα está basado en una distribución F con k 1 grados de libertad en el numerador y nT k grados de libertad en el denominador.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 502
502
Capítulo 13
Diseño de experimentos y análisis de varianza
Tabla de ANOVA Para presentar de manera adecuada los cálculos anteriores se usa una tabla conocida como tabla para el análisis de varianza o tabla ANOVA. En la tabla 13.2 se muestra la forma general de una tabla ANOVA para un diseño completamente aleatorizado. En la tabla 13.3 se presenta la tabla ANOVA correspondiente al experimento de Chemitech. A la suma de los cuadrados de la fuente de variación que se indica como “Total” se le conoce como suma de cuadrados del total (STC). Observe que los resultados del experimento de Chemitech indican que STC SCTR SCE y que los grados de libertad que corresponden a esta suma total de cuadrados es la suma de los grados de libertad correspondientes a la suma de cuadrados debidos a los tratamientos más la suma de cuadrados debidas al error. Cabe hacer notar que la STC dividida entre los grados de libertad nT 1 no es otra cosa que la varianza muestral general que se obtendría si se considerara la muestra de las 15 observaciones como un solo conjunto de datos. Si se considera todo el conjunto de datos como una sola muestra, la fórmula para calcular la suma de cuadrados del total, STC, es STC SST
nj
k
兺 兺(x
ij
x̄¯ )2
(13.13)
j 1 i 1
Se puede demostrar que estos resultados observados para el análisis de varianza en el caso del experimento de Chemitech aplican también a otros problemas. Es decir, STC SCTR SCE El análisis de varianza puede entenderse como un procedimiento estadístico de partición de la suma total de los cuadrados en componentes separados.
(13.14)
En otras palabras, STC se parte en dos sumas de cuadrados: la suma de cuadrados debidas a los tratamientos y la suma de cuadrados debidas al error. Observe, además, que los grados de libertad que corresponden a la STC, nT 1, se pueden partir en grados de libertad correspondientes a SCTR, k 1 y en grados de libertad correspondientes a SCE, nT k. El análisis de varianza se puede ver como el proceso de partición de la suma total de cuadrados y los grados de libertad en sus fuentes correspondientes: tratamiento y error. Al dividir las sumas de cuadrados entre los correspondientes grados de libertad, se obtienen las estimaciones de la varianza, el valor de F y el valor-p empleados en la prueba de hipótesis de igualdad entre las medias poblacionales. TABLA 13.2
TABLA ANOVA PARA UN DISEÑO COMPLETAMENTE ALEATORIZADO
Fuente de variación
Suma de cuadrados
Grados de libertad
Tratamientos
SCTR
k 1
Error
SCE
nT k
Total
STC
nT 1
TABLA 13.3
Cuadrado medio SCTR CMTR k 1
CME
F
Valor-p
CMTR CME
SCE nT k
TABLA DE ANÁLISIS DE VARIANZA PARA EL EXPERIMENTO DE CHEMITECH
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrado medio
Tratamientos Error
520 340
2 12
260.00 28.33
Total
860
14
F
Valor-p
9.18
0.004
13Ander(490-542).qxd 2/11/08 7:25 PM Page 503
13.2
FIGURA 13.5
503
Análisis de varianza y el diseño completamente aleatorizado
SALIDA DE MINITAB PARA EL ANÁLISIS DE VARIANZA DEL EXPERIMENTO DE CHEMITECH
Source Factor Error Total
DF 2 12 14
S 5.323
Level A B C
SS 520.0 340.0 860.0
MS 260.0 28.3
R-Sq 60.47%
N 5 5 5
Mean 62.000 66.000 52.000
Pooled StDev 5.323
F 9.18
P 0.004
R-Sq(adj) 53.88%
StDev 5.244 4.148 5.568
Individual 95% CIs For Mean Based on Pooled StDev ---+---------+---------+---------+-----(-------*-------) (------*-------) (------*-------) ---+---------+---------+---------+-----49.0 56.0 63.0 70.0
Resultados de computadora para el análisis de varianza Cuando se tienen muestras grandes o una cantidad grande de poblaciones, los cálculos del análisis de varianza se realizan con más facilidad mediante paquetes de software para estadística. En los apéndices 13.1 y 13.2 se indican los pasos necesarios para los cálculos del análisis de varianza con Minitab o Excel. En la figura 13.5, aplicado al experimento de Chemitech, se presenta la pantalla de resultados de Minitab. En la primera parte de la pantalla se observa el formato ya conocido de la tabla de ANOVA. Si se compara la figura 13.5 con la tabla 13.3, se ve que la información es la misma, aunque algunos de los encabezados son ligeramente diferentes. Source se usa como encabezado de la columna correspondiente a Fuentes de variación; Factor corresponde al renglón Tratamientos, y las columnas correspondientes a grados de libertad y a las sumas de cuadrados están intercambiadas. Observe que abajo de la tabla de ANOVA Minitab proporciona los respectivos tamaños de las muestras, las medias muestrales y las desviaciones estándar muestrales. Además proporciona una figura con la estimación por intervalos de 95% de confianza para cada una de las medias poblacionales. Para obtener la estimación de estos intervalos, Minitab emplea el CME como estimación de σ2. Por tanto, la raíz cuadrada del CME proporciona la mejor estimación de la desviación estándar poblacional σ. En la pantalla de los resultados de Minitab, esta estimación de σ es la Pooled StDev; su valor es 5.323. Para mostrar cómo se calcula la estimación por intervalos se hará aquí la estimación por intervalo de 95% de confianza para la media poblacional del método A. De acuerdo con lo visto en el estudio de intervalos de confianza en el capítulo 8, se sabe que la forma general de una estimación por intervalo para una media poblacional es x̄ tα/2
s 兹n
(13.15)
donde s es la estimación de la desviación estándar poblacional σ. Como la mejor estimación de σ es la dada por la Pooled StDev, se usa 5.323 en la expresión (13.15) como valor de s. Los grados de libertad para el valor de t son 12, los grados de libertad correspondientes a la suma de los cuadrados del error. Por tanto, como t0.025 = 2.179 se obtiene 62 2.179
5.323
兹5
62 5.19
13Ander(490-542).qxd 2/11/08 7:25 PM Page 504
504
Capítulo 13
Diseño de experimentos y análisis de varianza
Así, el intervalo de 95% de confianza para el método A va de 62 5.19 56.81 a 62 5.19 67.19. Como en el experimento de Chemitech los tamaños muestrales son iguales, también los intervalos de confianza para los métodos B y C se obtienen al sumar y restar 5.19 de la respectiva media muestral. En la salida de Minitab se aprecia que los anchos de los intervalos de confianza son los mismos.
Prueba para la igualdad de k medias poblacionales: un estudio observacional Se ha visto el uso del análisis de varianza para probar la igualdad de k medias poblacionales cuando se emplea un diseño experimental completamente aleatorizado. Es importante notar que el ANOVA también se puede usar para probar la igualdad de tres o más medias poblacionales usando datos de un estudio observacional. Para dar un ejemplo, se considerará el caso de National Computer Products, Inc. (NCP.) NCP fabrica, en sus tres fábricas situadas en Atlanta, Dallas y Seattle, impresoras y faxes. Con el fin de medir los conocimientos que tienen los empleados de estas tres plantas acerca de la administración de la calidad, se toma una muestra aleatoria de seis empleados de cada fábrica y se les aplica un examen acerca de su conocimiento de la calidad. En la tabla 13.4 se presentan las puntuaciones obtenidas en los exámenes por los 18 empleados. En esta tabla se dan también la media, la varianza y la desviación estándar muestrales de cada grupo. Los administradores de la empresa quieren usar estos datos para probar la hipótesis de que la media de las puntuaciones de los exámenes es la misma en las tres fábricas. Como población 1 se define a los empleados de Atlanta, como población 2 a los de Dallas y como población 3 a los de Seattle. Sean 1 media de las puntuaciones de la población 1 2 media de las puntuaciones de la población 2 3 media de las puntuaciones de la población 3 Aunque los verdaderos valores de 1, 2 y 3, nunca puedan conocerse, se usarán los resultados muestrales para probar las hipótesis siguientes. H0: 1 2 3 Ha: No todas las medias poblacionales son iguales Observe que la prueba de hipótesis para el estudio observacional de NCP es exactamente igual a la prueba de hipótesis para el experimento de Chemitech. También, para analizar los datos del esTABLA 13.4
PUNTUACIONES EN LOS EXÁMENES DE 18 EMPLEADOS
archivo CD en NCP
Media muestral Varianza muestral Desviación estándar muestral
Fábrica 1 Atlanta
Fábrica 2 Dallas
Fábrica 3 Seattle
85 75 82 76 71 85
71 75 73 74 69 82
59 64 62 69 75 67
79 34 5.83
74 20 4.47
66 32 5.66
13Ander(490-542).qxd 2/11/08 7:25 PM Page 505
13.2 En el ejercicio 8 se le pide al lector que use el análisis de varianza para analizar los datos de NCP.
505
Análisis de varianza y el diseño completamente aleatorizado
tudio observacional se emplea la misma metodología de análisis de varianza usada para analizar el experimento de Chemitech. Aun cuando en ambos casos se usa la misma metodología del ANOVA, vale la pena observar la diferencia entre el estudio estadístico observacional de NCP y el estudio estadístico experimental de Chemitech. Las personas que realizaron el estudio de NCP no tuvieron control sobre la asignación de las fábricas a cada uno de los empleados. Las plantas ya funcionaban y cada uno de los empleados trabajaba en una de las tres fábricas. Lo único que se pudo hacer en este caso, fue tomar una muestra aleatoria de seis empleados de cada una de las fábricas y aplicarles el examen sobre conocimiento de la calidad. Para poder clasificarlo como un estudio experimental, NPC tendría que haber tomado al azar 18 empleados y después, de manera aleatoria, asignar las fábricas a cada empleado. NOTAS Y COMENTARIOS 1. La media muestral general también se calcula como media ponderada de las k medias muestrales. n x̄ n2 x̄2 . . . nk x̄k x̄¯ 1 1 nT En los problemas en que se proporcionan las medias muestrales, para calcular la media general, es más sencillo usar esta fórmula que la expresión (13.3). 2. Si todas las muestras constan de n observaciones, la ecuación (13.6) se escribe como k
n CMTR MSTR
兺
j 1
(x̄ j x̄¯ )2
k 1
n
ns 2x̄
冤
k
兺 (x̄
j 1
j
x̄¯ )2
k 1
冥
Observe que este resultado es el mismo que el presentado en la sección 13.1 cuando se presen-
tó el concepto de estimación de σ 2 entre tratamientos. La ecuación (13.6) sólo es una generalización de este resultado para el caso de los tamaños muestrales distintos. 3. Si cada muestra tiene n observaciones, n T kn; por tanto, nT k k(n 1), y la
ecuación (13.9) se expresa como k
CME MSE
兺(n 1)s
j 1
k(n 1)
(n 1)
2 j
k
2 j
兺s
j 1
2 j
k
En otras palabras, si los tamaños muestrales son iguales, el CME es simplemente el promedio de las k varianzas muestrales. Observe que éste es el mismo resultado que se usó en la sección 13.1 cuando se presentó el concepto de estimación de σ2 dentro de los tratamientos.
Métodos 1. Los datos siguientes se obtuvieron de un diseño completamente aleatorizado.
Auto examen Tratamiento
a. b.
j 1
k(n 1)
Ejercicios
Media muestral Varianza muestral
k
兺s
A
B
C
162 142 165 145 148 174
142 156 124 142 136 152
126 122 138 140 150 128
156 164.4
142 131.2
134 110.4
Calcule la suma de cuadrados entre tratamientos. Calcule el cuadrado medio entre tratamientos.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 506
506
Capítulo 13
c. d. e. f.
Diseño de experimentos y análisis de varianza
Calcule la suma de cuadrados debida al error. Calcule el cuadrado medio debido al error. Dé la tabla de ANOVA para este problema. Con α 0.05 pruebe si las medias de los tres tratamientos son iguales.
2. En un diseño completamente aleatorizado, para cada uno de los cinco niveles del factor se usaron siete unidades experimentales. Complete la tabla ANOVA siguiente. Fuente de variación
Suma de cuadrados
Tratamientos Error Total
Grados de libertad
Cuadrado medio
F
Valor-p
300 460
3. Vuelva al ejercicio 2. a. ¿Cuáles son las hipótesis en este problema? b. Utilice el nivel de significancia α 0.05, ¿ la hipótesis nula del inciso a se puede rechazar? Explique. 4. En un experimento diseñado para probar los niveles de tres tratamientos diferentes, se obtuvieron los resultados siguientes: STC 400, SCTR 150, nT 19. Dé la tabla ANOVA y pruebe si hay alguna diferencia significativa entre las medias de los resultados de los tres tratamientos. Use α 0.05. 5. En un diseño completamente aleatorizado se usaron 12 unidades experimentales para el primer tratamiento, 15 para el segundo y 20 para el tercero. Complete el análisis de varianza siguiente. Emplee 0.05 como nivel de significancia, ¿hay diferencia significativa entre los tres tratamientos?
Fuente de variación
Suma de cuadrados
Tratamientos Error Total
Grados de libertad
Cuadrado medio
F
Valor-p
1200 1800
6. Realice los cálculos del análisis de varianza para el siguiente diseño completamente aleatorizado. Con α 0.05, ¿ la diferencia entre las medias de tratamiento es significativa?
Tratamiento
archivo CD en Exer6
x̄ j s 2j
A
B
C
136 120 113 107 131 114 129 102
107 114 125 104 107 109 97 114 104 89
92 82 85 101 89 117 110 120 98 106
119 146.86
107 96.44
100 173.78
13Ander(490-542).qxd 2/11/08 7:25 PM Page 507
13.2
507
Análisis de varianza y el diseño completamente aleatorizado
Aplicaciones 7. Un ingeniero propone tres métodos distintos para fabricar un producto. Para determinar el número de unidades producidas correctamente con cada método, se seleccionan al azar 30 empleados y se asignan de manera aleatoria a los tres métodos propuestos, de manera que cada método sea empleado por 10 trabajadores. Se anota el número de unidades producidas correctamente y a estos datos se aplica el análisis de varianza. Los resultados son los siguientes: STC 10 800; SCTR 4 560. a. Dé la tabla ANOVA de este problema. b. Use α 0.05 para determinar si existen diferencias significativas entre las medias de los tres métodos de fabricación 8. Vaya a la tabla 13.4 que presenta los datos de la NCP. Dé la tabla ANOVA y pruebe si existe diferencia significativa entre las medias de las puntuaciones de examen de las tres fábricas. Use α 0.05. 9. Para estudiar el efecto de la temperatura en el rendimiento de un proceso químico, se produjeron cinco lotes con cada uno de los tres tratamientos. Los resultados se presentan a continuación. Dé la tabla para el análisis de varianza. Use α 0.05 para probar si la temperatura afecta el rendimiento medio del proceso.
Temperatura 50°C
60°C
70°C
34 24 36 39 32
30 31 34 23 27
23 28 28 30 31
10. En una auditoría los auditores tienen que dar opiniones acerca de diversos aspectos con base en sus propias experiencias directas, indirectas o en una combinación de ambas. En un estudio se pidió a auditores que dieran su opinión acerca de la frecuencia con que se presentan errores en una auditoría. Suponga que se obtuvieron los resultados que se presentan a continuación; valores bajos indican opiniones más acertadas.
archivo CD en AudJudg
Directa
Indirecta
Combinación
17.0 18.5 15.8 18.2 20.2 16.0 13.3
16.6 22.2 20.5 18.3 24.2 19.8 21.2
25.2 24.0 21.5 26.8 27.5 25.8 24.2
Use α 0.05 para determinar si el tipo de experiencia en que se basa la opinión afecta la calidad de la misma. 11. En la publicidad de tres pinturas se dice que tienen el mismo tiempo de secado. Para verificar esto, se prueban cinco muestras de cada una de las pinturas. Se registra el tiempo en minutos necesario para que el secado sea suficiente para la aplicación de una segunda mano. Los datos obtenidos son los siguientes.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 508
508
Capítulo 13
archivo CD en Paint
Diseño de experimentos y análisis de varianza
Pintura 1
Pintura 2
Pintura 3
Pintura 4
128 137 135 124 141
144 133 142 146 130
133 143 137 136 131
150 142 135 140 153
Con α 0.05 como nivel de significancia, realice una prueba para determinar si la media de los tiempos de secado es la misma en todas las pinturas. 12. Una conocida revista de automovilismo tomó tres de los mejores automóviles medianos fabricados en Estados Unidos, los probó y los comparó en relación con varios criterios. En una prueba sobre rendimiento de la gasolina, se probaron cinco automóviles de cada marca en un recorrido de 500 millas, los datos de rendimiento, en millas por galón de gasolina, se presentan a continuación. Use α 0.05 para probar si la diferencia en el rendimiento medio, en millas por galón, entre los tres automóviles es significativa.
Automóviles
13.3
A
B
C
19 21 20 19 21
19 20 22 21 23
24 26 23 25 27
Procedimiento de comparación múltiple Cuando se emplea el análisis de varianza para probar si las medias de k poblaciones son iguales, rechazar la hipótesis nula sólo permite concluir que las medias poblacionales no son iguales. En algunos casos se necesita dar un paso más y determinar dónde están las diferencias. El propósito de esta sección es mostrar el uso de procedimientos de comparación múltiple para hacer comparaciones entre pares de medias poblacionales.
LSD de Fisher Suponga que en un análisis de varianza se encuentran evidencias estadísticas para rechazar la hipótesis nula que plantea la igualdad de las medias poblacionales. En tal caso, para determinar dónde están las diferencias se puede emplear el procedimiento de la diferencia mínima significativa (LSD, por sus siglas en inglés) de Fisher. Con el fin de ilustrar el uso del procedimiento de la LSD de Fisher para la comparación de pares de medias poblacionales, se retoma el experimento de Chemitech, visto en la sección 13.1. A partir del análisis de varianza, se concluyó que el número medio de unidades producidas por semana no era el mismo con los tres métodos. En tal caso la siguiente pregunta es: se cree que hay diferencia entre los métodos pero, ¿dónde están las diferencias? Es decir, las medias que difieren ¿son las de las poblaciones 1 y 2? ¿O las de las poblaciones 1 y 3? ¿O las de las poblaciones 2 y 3? En el capítulo 10 se presentó un procedimiento estadístico para probar la hipótesis de la igualdad de dos medias poblacionales. Con una pequeña modificación en la manera de evaluar
13Ander(490-542).qxd 2/11/08 7:25 PM Page 509
13.3
509
Procedimiento de comparación múltiple
la varianza poblacional, el procedimiento de la LSD de Fisher que basa en el estadístico de prueba t presentado para el caso de dos poblaciones. En la tabla siguiente se resume el procedimiento de la LSD de Fisher. PROCEDIMIENTO DE LA LSD DE FISHER
H0: μ i μ j Ha: μ i μ j ESTADÍSTICO DE PRUEBA
x̄ i x̄ j
冑
t
冢
1 1 CME MSE ni nj
(13.16)
冣
REGLA DE RECHAZO
Método del valor-p: Método del valor crítico:
Rechazar H0 si el valor-p α Rechazar H0 si t tα/2 o t
tα/2
donde el valor tα/2 se basa en la distribución t con nT k grados de libertad. A continuación se usará este procedimiento para determinar si existe alguna diferencia significativa entre la media de la población 1 (método A) y la media de la población 2 (método B) con α 0.05 como nivel de significancia. En la tabla 13.1 se ve que la media obtenida con el método A es 62 y la media obtenida con el método B es 66. En la tabla 13.3 se presenta el valor del CME, que es 28.33; ésta es la estimación de σ 2 con 12 grados de libertad. Con los datos de Chemitech, el valor que se obtiene para el estadístico de prueba es t
冑
62 66
冢
1 1 28.33 5 5
冣
1.19
Como se trata de una prueba de dos colas, el valor-p es el doble del área bajo la curva de la distribución t a la izquierda de t 1.19. En la tabla 2 del apéndice B se encuentra la información siguiente para la distribución t con 12 grados de libertad. Área en la cola superior
0.20
0.10
0.05
0.025
0.01
0.005
Valor t (12 gl)
0.873
1.356
1.782
2.179
2.681
3.055
t 1.19
En el apéndice F se muestra cómo calcular los valores-p usando Minitab o Excel.
En la tabla de la distribución t sólo hay valores positivos de t. Sin embargo, como la distribución t es simétrica, se puede hallar el área bajo la curva a la derecha de t 1.19 y duplicarla para hallar el valor-p que corresponde a t 1.19. En esta tabla se ve que t 1.19 se encuentra entre 0.20 y 0.10. Al duplicar estas cantidades, se tiene que el valor-p debe estar entre 0.40 y 0.20. Si emplea Minitab o Excel puede encontrar el valor-p exacto, que es 0.2571. Como el valor-p es mayor que α 0.05, no se puede rechazar la hipótesis nula. Por tanto, no se puede concluir que las medias poblacionales de los números de unidades producidas por semana con los métodos A y B sean diferentes.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 510
510
Capítulo 13
Diseño de experimentos y análisis de varianza
Muchas personas encuentran más fácil determinar qué tan grande tiene que ser la diferencia entre las medias muestrales para que se rechace H0. En este caso el estadístico de prueba es x̄i x̄j , y la prueba se realiza siguiendo el procedimiento que se presenta a continuación. PROCEDIMIENTO DE LA LSD DE FISHER BASADO EN EL ESTADÍSTICO DE PRUEBA x̄i x̄j
H0: μ i μ j Ha: μ i μ j ESTADÍSTICO DE PRUEBA
x̄ i x̄ j REGLA DE RECHAZO PARA EL NIVEL DE SIGNIFICANCIA α
Rechazar H0 si 冷 x̄ i x̄ j 冷
LSD
donde
冑
冢
1 1 CME LSD tα/2 MSE ni nj
冣
(13.17)
En el experimento de Chemitech, el valor de la LSD es
冑
LSD 2.179 28.33
冢5 5冣 7.34 1
1
Observe que si todos los tamaños muestrales son iguales sólo se necesita calcular un valor de la LSD. En tales casos, basta comparar la magnitud de la diferencia entre dos medias muestrales con el valor de la LSD. Por ejemplo, la diferencia entre las medias muestrales de las poblaciones 1 (método A) y 3 (método C) es 62 – 52 10. Esta diferencia es mayor que la LSD 7.34, lo que significa que se puede rechazar la hipótesis de que las medias del número de unidades producidas por semana con los métodos A y C sean iguales. De manera similar, entre las medias muestrales de las poblaciones 2 y 3, la diferencia es 66 – 52 14 7.34, y se puede rechazar la hipótesis de que las medias poblacionales obtenidas con el método B y con el método C sean iguales. Así, la conclusión es que tanto el método A como el método B difieren del método C. La LSD de Fisher también se usa para obtener una estimación mediante un intervalo de confianza de la diferencia entre las medias de dos poblaciones. El procedimiento general que se emplea es el siguiente. ESTIMACIÓN POR INTERVALO DE CONFIANZA DE LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONES USANDO EL PROCEDIMIENTO DE LA LSD DE FISHER
x̄ i x̄ j LSD
(13.18)
donde
冑
冢
1 1 LSD tα/2 CME MSE n n i j
冣
y tα/2 pertenece a la distribución t con nT k grados de libertad.
(13.19)
13Ander(490-542).qxd 2/11/08 7:25 PM Page 511
13.3
511
Procedimiento de comparación múltiple
Si el intervalo de confianza hallado con la expresión (13.18) incluye el valor cero, no se puede rechazar la hipótesis nula de que las dos medias poblacionales sean iguales. Pero, si el intervalo de confianza no incluye al valor cero, se puede concluir que sí hay diferencia entre las medias poblacionales. En el caso del experimento de Chemitech, recuerde que la LSD 7.34 (que corresponde a t0.025 2.179). Por tanto, una estimación de la diferencia entre las medias poblacionales 1 y 2 empleando un intervalo de 95% de confianza es 62 66 7.34 4 7.34 11.34 to 3.34; como este intervalo incluye el cero, no se puede rechazar la hipótesis de que las dos medias sean iguales.
Tasas de error tipo I El estudio del procedimiento de la LSD de Fisher inició con la premisa de que el análisis de varianza proporcionaba evidencias estadísticas para rechazar la hipótesis nula de la igualdad entre medias poblacionales. Se mostró que en tales casos se puede emplear el procedimiento de la LSD de Fisher para determinar dónde están las diferencias. Técnicamente a este procedimiento se le conoce como prueba restringida o protegida de la LSD debido a que sólo se usa si primero se ha encontrado un valor F significativo al usar el análisis de varianza. Para ver porqué es importante esta distinción en las pruebas de comparación múltiple, es necesario explicar la diferencia entre tasa de error tipo I por comparación y tasa de error tipo I por experimentación. En el experimento de Chemitech se usa el procedimiento de la LSD de Fisher para hacer tres pares de comparaciones Prueba 1
Prueba 2
H0: μ 1 μ 2 Ha: μ 1 μ 2
H0: μ 1 μ 3 Ha: μ 1 μ 3
Prueba 3 H0: μ 2 μ 3 Ha: μ 2 μ 3
En cada caso el nivel de significancia empleado es α 0.05. Por tanto, en cada prueba, si la hipótesis nula es verdadera, la probabilidad de que se cometa un error tipo I es α 0.05, entonces la probabilidad de no cometer un error tipo I es 1 0.05 0.95. En el estudio de los procedimientos de comparación múltiple a esta probabilidad de cometer un error tipo I (α 0.05) se le conoce como tasa de error tipo I por comparación. Las tasas de error tipo I por comparación indican el nivel de significancia que corresponde a una sola comparación por pares. Considere ahora una cuestión ligeramente diferente. ¿Cuál es la probabilidad de que al hacer tres comparaciones por pares se cometa un error tipo I en por lo menos una de las tres pruebas? Para responder esta pregunta, observe que la probabilidad de que no se cometa un error tipo I en ninguna de las tres pruebas es (0.95)(0.95)(0.95) = 0.8574.* Por tanto, la probabilidad de cometer por lo menos un error tipo I es 1 0.8574 0.1426. Entonces, cuando se usa el procedimiento de la LSD de Fisher para hacer los tres pares de comparaciones, la tasa de error tipo I correspondiente a este método no es 0.05, sino 0.1426; a esta tasa de error se le conoce como tasa de error tipo I por experimentación o general. Para evitar confusiones, la tasa de error tipo I por experimentación se denota αEW. La tasa de error tipo I por experimentación es mayor en problemas con más poblaciones. Por ejemplo, en un problema con cinco poblaciones hay 10 pares de comparaciones. Si se prueban todas las comparaciones posibles por pares usando el procedimiento de la LSD de Fisher con una tasa de error por comparación de α 0.05, la tasa de error tipo I por experimentación será 1 – (1 0.05)10 0.40. En tales casos se prefiere buscar otras alternativas que proporcionen un mejor control sobre la tasa de error por experimentación. Una alternativa para controlar la tasa de error general por experimentación, conocida como el ajuste de Bonferroni, consiste en usar en cada prueba tasas de error por comparación más pe-
*Se supone que las tres pruebas son independientes y, por tanto, la probabilidad conjunta de los tres eventos se obtiene con la simple multiplicación de las probabilidades individuales. De hecho, las tres pruebas no son independientes porque CME se usa en cada prueba; en consecuencia, el error supuesto es mayor que el error mostrado.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 512
512
Capítulo 13
Diseño de experimentos y análisis de varianza
queñas. Por ejemplo, si se quieren probar C comparaciones por pares y se desea que la probabilidad máxima de cometer un error tipo I en todo el experimento sea αEW simplemente se usa una tasa de error por comparación igual a αEW/C. En el experimento de Chemitech, si se desea emplear el procedimiento de la LSD de Fisher, para probar los tres pares de comparaciones con una tasa de error máximo por experimentación de αEW 0.05, se establece como tasa de error por comparación α 0.05/3 0.017. En un problema con cinco poblaciones y 10 comparaciones por pares, el ajuste de Bonferroni sugeriría una tasa de error por comparación de 0.05/10 0.005. Recuerde que cuando se estudiaron las pruebas de hipótesis en el capítulo 9 se vio que para un tamaño de muestra dado, toda disminución en la probabilidad de cometer un error tipo I aumenta la probabilidad de cometer un error tipo II, el cual corresponde a aceptar la hipótesis de que las dos medias poblacionales son iguales cuando en realidad no lo son. Por tanto suele haber una renuencia a realizar pruebas individuales con una baja tasa de error tipo I por comparación debido al aumento del riesgo de cometer un error tipo II. Como solución para tales situaciones se han elaborado otros varios procedimientos como el procedimiento de Turkey y la prueba de rango múltiple de Duncan. Sin embargo, en la comunidad estadística existe una gran controversia respecto a cuál es el “mejor” procedimiento. La verdad es que no hay uno que sea el mejor para todo tipo de problemas.
Ejercicios
Métodos
Auto examen
13. Los datos siguientes se obtuvieron con un diseño completamente aleatorizado. Tratamiento A
Tratamiento B
Tratamiento C
32 30 30 26 32
44 43 44 46 48
33 36 35 36 40
30 6.00
45 4.00
36 6.50
Media muestral Varianza muestral
a. b. c.
Con α 0.05 como nivel de significancia, ¿puede rechazar la hipótesis nula: las medias de los tres tratamientos son iguales? Use el procedimiento LSD de Fisher para probar si existe una diferencia significativa entre las medias de los tratamientos A y B, A y C y B y C. Use α 0.05. Use el procedimiento LSD de Fisher para obtener un intervalo de estimación de 95% de confianza para la diferencia entre las medias de los tratamientos A y B.
14. Los datos siguientes se obtuvieron con un diseño completamente aleatorizado. Para los cálculos siguientes use α 0.05.
x̄ j s 2j
Tratamiento 1
Tratamiento 2
Tratamiento 3
63 47 54 40
82 72 88 66
69 54 61 48
51 96.67
77 97.34
58 81.99
13Ander(490-542).qxd 2/11/08 7:25 PM Page 513
13.3
513
Procedimiento de comparación múltiple
a. b.
Use el análisis de varianza para probar si hay una diferencia significativa entre las medias de los tres tratamientos. Use el procedimiento LSD de Fisher para probar cuáles son las medias que difieren.
Aplicaciones
Auto examen
15. Con el fin de probar si la media del tiempo necesario para mezclar un lote de un material es la misma si emplea las máquinas de tres fabricantes, la empresa Jacobs Chemical obtiene los datos siguientes. Fabricantes 1
2
3
20 26 24 22
28 26 31 27
20 19 23 22
a.
Auto examen
Utilice estos datos para probar si las medias de los tiempos necesarios para mezclar un lote de material usando las máquinas de estos tres fabricantes difieren. Use α 0.05. b. Con α 0.05 como nivel de significancia, use el procedimiento LSD de Fisher para probar la igualdad entre las medias obtenidas con las máquinas del fabricante 1 y del fabricante 3. ¿Qué conclusión se obtiene después de realizar la prueba? 16. Vuelva al ejercicio 15, use el procedimiento LSD de Fisher para obtener una estimación por intervalo de 95% de confianza para la diferencia entre las medias de las poblaciones 1 y 2. 17. En un experimento diseñado para investigar la percepción de los valores éticos corporativos
entre personas especializadas en marketing se obtuvieron los datos siguientes (puntuaciones más altas indican valores éticos más elevados). Gerentes de marketing
Investigación en marketing
Publicidad
6 5 4 5 6 4
5 5 4 4 5 4
6 7 6 5 6 6
Use α 0.05 para probar si existe una diferencia significativa de percepción entre los tres grupos. b. Con α 0.05, como nivel de significancia, se puede concluir que sí hay diferencias entre la percepción de los gerentes de marketing, los especialistas en investigación sobre marketing y los especialistas en publicidad. Emplee los procedimientos de esta sección para determinar dónde están las diferencias. Use α 0.05. a.
18. Para probar si existe una diferencia significativa entre cuatro máquinas respecto al número de horas entre dos averías se obtuvieron los datos siguientes. Máquina 1
Máquina 2
Máquina 3
Máquina 4
6.4 7.8 5.3 7.4 8.4 7.3
8.7 7.4 9.4 10.1 9.2 9.8
11.1 10.3 9.7 10.3 9.2 8.8
9.9 12.8 12.1 10.8 11.3 11.5
13Ander(490-542).qxd 2/11/08 7:25 PM Page 514
514
Capítulo 13
a. b.
Diseño de experimentos y análisis de varianza
Con α 0.05, como nivel de significancia, ¿cuál es la diferencia, si hay alguna, entre las medias poblacionales de los tiempos de las cuatro máquinas? Use el procedimiento LSD de Fisher para probar la igualdad de las medias en las máquinas 2 y 4. Use 0.05 como nivel de significancia.
19. Vuelva al ejercicio 18. Use el ajuste de Bonferroni para probar si hay diferencia significativa entre todos los pares de muestras. Suponga que desea que el máximo de la tasa de error por experimentación sea 0.05. 20. Condé Nast Traveler realizó un sondeo anual en el que se pidió a los lectores que dieran una
calificación para su crucero favorito. Se calificaron por separado embarcaciones pequeñas, (hasta 500 pasajeros), medianas (más de 500 pero menos de 1 500 pasajeros) y grandes (mínimo de 1 500 pasajeros). A continuación se presentan las calificaciones dadas a ocho embarcaciones de cada uno de los tamaños, chico, mediano y grande; las ocho embarcaciones de cada grupo fueron tomadas aleatoriamente. Todas las embarcaciones se calificaron con una escala de 100 en la que las puntuaciones más altas corresponden a mejor servicio (Condé Nast Traveler, febrero de 2003). Embarcaciones pequeñas Nombre
archivo CD en Ships
Hanseactic Mississippi Queen Philae Royal Clipper Seabourn Pride Seabourn Spirit Silver Cloud Silver Wind
Calificación 90.5 78.2 92.3 95.7 94.1 100 91.8 95
Embarcaciones medianas Nombre
Calificación
Amsterdam Crystal Symphony Maasdam Noordam Royal Princess Ryndam Statendam Veendam
91.1 98.9 94.2 84.3 84.8 89.2 86.4 88.3
Embarcaciones grandes Nombre Century Disney Wonder Enchantment of the Seas Grand Princess Infinity Legend of the Seas Paradise Sun Princess
Calificación 89.2 90.2 85.9 84.2 90.2 80.6 75.8 82.3
Use α 0.05 para probar si existe alguna diferencia significativa entre las medias de las calificaciones dadas al servicio de cada uno de los grupos de tamaño. b. Emplee los procedimientos de esta sección para determinar dónde están las diferencias. Use α 0.05. a.
13.4
Diseño de bloques aleatorizado Hasta ahora sólo se ha considerado el diseño completamente aleatorizado. Como se recordará, para probar la diferencia entre las medias de los tratamientos se calcula el valor de F mediante el cociente F
Un diseño completamente aleatorizado resulta útil cuando las unidades experimentales son homogéneas. Si las unidades experimentales son heterogéneas, se suele emplear la formación de bloques para tener grupos homogéneos.
CMTR CME
(13.20)
Sin embargo, si diferencias debidas a factores extraños (factores no considerados en el experimento) hacen que en este cociente el término CME se vuelva más grande, pueden surgir problemas. En estos casos, en la ecuación (13.20) el valor de F será más pequeño, haciendo que se concluya que no hay diferencia entre las medias de los tratamientos cuando en realidad sí la hay. En esta sección se presenta un diseño experimental conocido como diseño de bloques aleatorizado. El objetivo en este diseño es controlar algunas fuentes extrañas de variación eliminándolas del término CME. Este diseño tiende a proporcionar una mejor estimación de la varianza del error y conduce a pruebas de hipótesis más robustas en términos de la posibilidad de detec-
13Ander(490-542).qxd 2/11/08 7:25 PM Page 515
13.4
515
Diseño de bloques aleatorizado
tar diferencias entre medias de tratamientos. Para ilustrar esto se verá un estudio sobre el estrés que experimentan los controladores del tráfico aéreo.
Prueba de estrés para los controladores del tráfico aéreo
En los estudios experimentales relacionados con negocios suelen intervenir unidades muy heterogéneas; en consecuencia los diseños de bloques aleatorizados se suelen emplear con frecuencia. En el diseño experimental, la formación de bloques es similar a la estratificación en el muestreo.
Como resultado de un estudio para medir la fatiga y el estrés de los controladores del tráfico aéreo, se propusieron modificaciones y rediseños al puesto de trabajo. Después de considerar diversos diseños del puesto de trabajo, se seleccionaron tres alternativas consideradas con el mayor potencial para reducir el estrés en los controladores. La pregunta clave es: ¿En qué medida difieren estas tres alternativas en su efecto sobre el estrés de los controladores? Para responder esta pregunta se necesita diseñar un experimento que proporcione mediciones del estrés de los controladores del tráfico aéreo bajo cada una de estas alternativas. Si se empleara un diseño completamente aleatorizado, una muestra aleatoria de controladores sería asignada a cada uno de los alternativos puestos de trabajo. Pero, se entiende que los controladores difieren sustancialmente en su habilidad para manejar situaciones estresantes. Lo que para un controlador es un gran estrés, para otro puede ser sólo un estrés moderado e incluso pequeño. Por tanto, al considerar la fuente de variación dentro del grupo (CME), hay que tener en cuenta que esta variación comprende tanto el error aleatorio como el error debido a las diferencias individuales de los controladores. En efecto, los administradores consideran que la variabilidad entre los controladores será la contribución principal al término CME. Una manera de hacer a un lado el efecto de las diferencias individuales es usar el diseño de bloques aleatorizado. En ese diseño, se identifica la variabilidad debida a las diferencias individuales de los controladores y se elimina del término CME. En el diseño de bloques aleatorizado se emplea una sola muestra de controladores. Cada uno de los controladores de la muestra se prueba con cada una de las tres alternativas de puestos de trabajo. En la terminología del diseño de experimentos el puesto de trabajo es el factor de interés y los controladores son los bloques. Los tres tratamientos o poblaciones del factor puesto de trabajo son las tres alternativas de puesto de trabajo. Para simplificar, a las tres alternativas del puesto de trabajo se les designará como sistema A, sistema B y sistema C. El aspecto aleatorizado en el diseño de bloques aleatorizado es el orden aleatorio en el que les son asignados los tratamientos (sistemas) a los controladores. Si cada controlador probara los tres sistemas en el mismo orden, cualquier diferencia encontrada entre los sistemas podría deberse al orden de la prueba y no a las verdaderas diferencias entre los sistemas. Para obtener los datos necesarios, en el Centro de Control Cleveland en Oberlin, Ohio, se instalaron las tres alternativas de puesto de trabajo. Se seleccionaron seis controladores en forma aleatoria y se asignó cada uno a uno de los sistemas para que lo operara. Después de practicar una entrevista y un examen médico a cada uno de los participantes en el estudio se obtuvieron las mediciones del estrés de cada controlador en cada uno de los sistemas. En la tabla 13.5 se presentan estos datos. En la tabla 13.6 aparece un resumen de los datos de estrés recolectados. En esta tabla se presentan también los totales de las columnas (tratamientos) y los totales de los renglones (bloques) TABLA 13.5
DISEÑO DE BLOQUES ALEATORIZADO PARA LA PRUEBA DE ESTRÉS EN LOS CONTROLADORES DE TRÁFICO AÉREO.
Sistema A
archivo CD en AirTraf
Bloques
Controlador 1 Controlador 2 Controlador 3 Controlador 4 Controlador 5 Controlador 6
15 14 10 13 16 13
Tratamiento Sistema B 15 14 11 12 13 13
Sistema C 18 14 15 17 16 13
13Ander(490-542).qxd 2/11/08 7:25 PM Page 516
516
Capítulo 13
TABLA 13.6
Diseño de experimentos y análisis de varianza
RESUMEN DE LOS DATOS DE ESTRÉS OBTENIDOS EN LA PRUEBA DE ESTRÉS APLICADA A LOS CONTROLADORES AÉREOS Tratamientos Sistema A Sistema B Sistema C
Bloques
Total de la columna o tratamiento Media del tratamiento
Controlador 1 Controlador 2 Controlador 3 Controlador 4 Controlador 5 Controlador 6
Total del renglón o del bloque Media del bloque
15 14 10 13 16 13
15 14 11 12 13 13
18 14 15 17 16 13
48 42 36 42 45 39
81
78
93
252
81 6 13.5
x̄.1
78 6 13.0
x̄.2
x̄1. x̄ 2. x̄ 3. x̄ 4. x̄ 5. x̄ 6.
x̄¯
48/3 42/3 36/3 42/3 45/3 39/3
16.0 14.0 12.0 14.0 15.0 13.0
252 14.0 18
93 6 15.5
x̄.3
así como algunas medias muestrales necesarias que serán útiles para hacer los cálculos de la suma de los cuadrados del ANOVA. Como valores bajos de estrés se consideran mejores, los datos muestrales parecen favorecer al sistema B, en el que la media de las mediciones del estrés es 13. Sin embargo, la pregunta persiste: ¿los resultados muestrales justifican la conclusión de que las medias poblacionales de los niveles de estrés, con estos tres sistemas, difieren? Es decir, ¿son las diferencias estadísticamente significativas? Para responder esta pregunta estadística se emplea un análisis del cálculo de la varianza, similar al empleado en el diseño completamente aleatorizado.
Procedimiento ANOVA En el procedimiento ANOVA para el diseño de bloques aleatorizados se requiere que se haga una partición de la suma total de cuadrados (STC) en tres grupos: suma de cuadrados debidas a los tratamientos, suma de cuadrados debidas a los bloques y suma de cuadrado debidas al error. La fórmula para esta partición es la siguiente. STC = SCTR + SCBL + SCE
(13.21)
Esta suma de la partición de cuadrados se presenta en la tabla ANOVA para el diseño de bloques aleatorizado, como se muestra en la tabla 13.7. La notación empleada en la tabla es k número de tratamientos b número de bloques nT tamaño muestral total (nT kb) Observe que en la tabla ANOVA también se muestra la partición de los nT 1 grados de libertad totales de manera que k 1 grados de libertad correspondan a los tratamientos, b 1 correspondan a los bloques y (k 1)( b 1) correspondan al término del error. En la columna cuadrado medio se dan las sumas de los cuadrados divididas entre los grados de libertad y F CMTR/CME es el cociente F que se usa para probar si hay diferencias significativas entre las medias de los tratamientos. La contribución más importante del diseño de bloques aleatorizado es que, al emplear bloques se eliminan del término CME las diferencias individuales de los controladores y se obtiene una prueba más sólida para las diferencias de estrés entre las tres alternativas de puestos de trabajo.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 517
13.4
517
Diseño de bloques aleatorizado
TABLA 13.7
TABLA ANOVA PARA EL DISEÑO DE BLOQUES ALEATORIZADO CON k TRATAMIENTOS Y b BLOQUES
Fuente de variación
Suma de cuadrados
Grados de libertad
Tratamientos
SCTR
k 1
Bloques
SCBL
b 1
Error
SCE
(k 1)(b 1)
Total
STC
nT 1
Cuadrado medio SCTR k 1 SCBL CMBL b 1
CMTR
CME
F CMTR
Valor-p
CME
SCE (k 1)(b 1)
Cálculos y conclusiones Para calcular el estadístico F que se necesita para probar si hay diferencia entre las medias de los tratamientos en un diseño de bloques aleatorizado, se necesita calcular el CMTR y el CME. Para calcular estos dos cuadrados medios, es necesario calcular primero SCTR y SCE; para esto también se calcula SCBL y STC. Para hacerlo más sencillo, estos cálculos se realizan en cuatro pasos. Además de la notación k, b y nT ya introducida, se usará: x ij x̄.j x̄ i . x̄¯
valor de la observación correspondiente al tratamiento j en el bloque i. media muestral con el tratamiento j media muestral en el bloque i media muestral general
Paso 1. Calcular la suma total de cuadrados (STC) b
STC
k
兺 兺(x
ij
x̄¯ )2
(13.22)
i 1 j 1
Paso 2. Calcular la suma de los cuadrados debidos a los tratamientos (SCTR). k
SCTR b
兺(x̄. x̄¯ )
2
j
(13.23)
j 1
Paso 3. Calcular la suma de los cuadrados debidos a los bloques (SCBL). b
SCBL k
兺(x̄ . x̄¯ )
2
i
(13.24)
i 1
Paso 4. Calcular la suma de cuadrados debidos al error (SCE). SCE STC SCTR SCBL
(13.25)
En el caso de los datos de la tabla 13.6 sobre los controladores del tráfico aéreo, con estos cálculos se obtienen las sumas de los cuadrados siguientes. Paso 1. STC (15 14)2 (15 14)2 (18 14)2 . . . (13 14)2 70 Paso 2. SCTR 6[(13.5 14)2 (13.0 14)2 (15.5 14)2] 21 Paso 3. SCBL 3[(16 14)2 (14 14)2 (12 14)2 (14 14)2 (15 14)2 (13 14)2] 30 Paso 4. SCE 70 21 30 19
13Ander(490-542).qxd 2/11/08 7:25 PM Page 518
518
Capítulo 13
TABLA 13.8
Diseño de experimentos y análisis de varianza
TABLA ANOVA PARA LA PRUEBA DEL ESTRÉS DE LOS CONTROLADORES DEL TRÁFICO AÉREO
Fuentes de variación
Suma de cuadrados
Grados de libertad
Cuadrado medio
Tratamientos Bloqueos Error Total
21 30 19 70
2 5 10 17
10.5 6.0 1.9
F
Valor-p
10.5/1.9 5.53
0.0241
Las sumas de cuadrados divididas entre sus grados de libertad dan los correspondientes cuadrados medios que se muestran en la tabla 13.8. Ahora, para realizar la prueba de hipótesis, se va a usar α = 0.05 como nivel de significancia. El valor del estadístico de prueba es F
CMTR 10.5 5.53 CME 1.9
Los grados de libertad en el numerador son k 1 3 1 2 y los grados de libertad en el denominador son (k 1)(b 1) (3 1)(6 1) 10. Como la prueba de hipótesis se rechaza sólo cuando los valores del estadístico de prueba son grandes, el valor-p es el área bajo la distribución F a la derecha de F 5.53. En la tabla 4 del apéndice B se encuentra que para 2 y 10 grados de libertad, F 5.53 se encuentra entre F0.025 5.46 y F0.01 7.56. Por tanto, el área en la cola superior, o valor-p, se encuentra entre 0.01 y 0.025. Se pueden usar también Excel o Minitab y encontrar que el valor-p exacto para F 5.53 es 0.0241. Como el valor-p α 0.05, se rechaza la hipótesis nula H0: μ1 μ2 μ3 y se concluye que las medias poblacionales de los niveles de estrés en las tres alternativas de puesto de trabajo no son iguales. Acerca de este diseño de bloques aleatorizado se pueden hacer algunos comentarios generales. El diseño de experimentos descrito en esta sección es un diseño de bloques completo; la palabra “completo” indica que cada bloque se somete a todos los k tratamientos. Es decir, todos los controladores (bloques) fueron probados con los tres sistemas (tratamientos). A los diseños de experimentos en los que a cada bloque se le aplican algunos, pero no todos, los tratamientos se les llaman diseños de bloques incompletos. El estudio del diseño de bloques incompletos queda fuera del alcance de este libro. Como en la prueba sobre el estrés de los controladores del tráfico aéreo, cada controlador usó todos los sistemas, este método garantiza un diseño de bloques completo. En algunos casos la formación de los bloques se realiza con unidades experimentales “similares” en cada bloque. Por ejemplo, suponga que en una prueba preliminar realizada a los controladores del tráfico aéreo, se divide la población de controladores en grupos que van desde personas con mucho estrés hasta individuos con estrés sumamente bajo. Aquí también se puede tener la formación de bloques haciendo que en el estudio participen tres controladores de cada nivel de estrés. En este caso, cada bloque consistirá en tres controladores de un mismo nivel de estrés. El aspecto aleatorizado del diseño debloques será la designación aleatoria de los tres controladores de cada bloque a los tres sistemas. Por último, observe que en la tabla ANOVA que se presenta en la tabla 13.7, se da un valor F para probar los efectos de los tratamientos pero no de los bloques. La razón es que el experimento se diseñó para probar un solo factor: el diseño del puesto de trabajo. La formación de bloques basada en las diferencias del estrés individuales se hizo para eliminar tal variación del término CME. Pero, el estudio no se diseñó para detectar las diferencias individuales de estrés. Algunos analistas calculan F CMBL/CME y usan este estadístico para probar la significancia de los bloques. Después usan los resultados como guía para determinar si el mismo tipo de bloques puede ser útil en experimentos futuros. Sin embargo, si la diferencia en el estrés de las personas ha de ser un factor en el estudio, deberá emplearse un diseño experimental diferente. Una prueba de significancia sobre los bloques no debe hacerse como una base para una conclusión acerca de un segundo factor.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 519
13.4
519
Diseño de bloques aleatorizado
NOTAS Y COMENTARIOS En un diseño de bloques aleatorizado, los grados de libertad del error son menos que en un diseño completamente aleatorizado debido a que en los b bloques se pierden b 1 grados de libertad. Si n
es pequeño, los efectos potenciales debidos a los bloques pueden quedar ocultos debido a la pérdida de grados de libertad del error; con n grande los efectos se minimizan.
Ejercicios
Métodos
Auto examen
21. Considere los siguientes resultados experimentales obtenidos con un diseño de bloques aleatorizado. Realice los cálculos necesarios para dar la tabla de análisis de varianza.
Tratamientos
Bloques
1 2 3 4 5
A
B
C
10 12 18 20 8
9 6 15 18 7
8 5 14 18 8
Use α 0.05 y realice la prueba para determinar si existe una diferencia significativa entre los tratamientos. 22. Los datos siguientes se obtuvieron mediante un diseño de bloques aleatorizado con cinco tratamientos y tres bloques: STC 430, SCTR 310, SCBL 85. Dé la tabla ANOVA y realice una prueba para determinar si hay diferencia significativa entre los tratamientos. 23. Se realizó un experimento con cuatro tratamientos y ocho bloques. Complete la siguiente tabla de análisis de varianza.
Fuente de variación Tratamientos Bloques Error Total
Suma de cuadrados
Grados de libertad
Cuadro medio
F
900 400 1800
Use α 0.05 y realice una prueba para determinar si existe diferencia significativa entre los tratamientos.
Aplicaciones 24. Un comerciante de automóviles realiza una prueba para determinar si la cantidad de tiempo en minutos que se necesita para una afinación de motor depende de si se emplea un analizador computarizado o un analizador electrónico. Los datos obtenidos son los siguientes.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 520
520
Capítulo 13
Diseño de experimentos y análisis de varianza
Analizador
Automóvil
Computarizado
Electrónico
50 55 63
42 44 46
Compacto Mediano Grande
Use α 0.05 y realice una prueba para determinar si existe diferencia significativa entre los
tratamientos. 25. Durante los últimos años, los precios de las vitaminas y de otros complementos alimenticios aumentaron, también suele haber una gran variación de precios entre los distintos establecimientos. Los datos siguientes son los precios de 13 productos en cuatro establecimientos.
archivo CD en Vitamins
Artículo
CVS
Kmart
Rite-Aid
Wegmans
Caltrate D (600 mg/60 tablets) Centrum (130 tablets) Cod liver oil (100 gel tablets) Fish oil (1,000 mg/60 tablets) Flintstones Children’s (60 tablets) Folic acid (400 mcg/250 tablets) One-a-Day Maximum (100 tablets) One-a-Day Scooby (50 tablets) Poly-Vi-Sol (drops, 50 ml) Vitamin B-12 (100 mcg/100 tablets) Vitamin C (500 mg/100 tablets) Vitamin E (200 IU/100 tablets) Zinc (50 mg/100 tablets)
8.49 9.49 2.66 6.19 7.69 2.19 8.99 7.49 9.99 3.59 2.99 4.69 2.66
5.99 9.47 2.59 4.99 5.99 2.49 7.49 5.99 8.49 1.99 2.49 3.49 2.59
7.99 9.89 1.99 4.99 5.99 3.74 6.99 6.49 9.99 1.99 1.99 2.99 3.99
5.99 7.97 2.69 5.99 6.29 2.69 6.99 5.47 8.37 1.79 2.39 3.29 2.79
Use α 0.05 y realice una prueba para determinar si existe diferencia significativa entre los
precios medios de los cuatro establecimientos. 26. Un factor importante en la elección de un procesador de palabras o de un sistema para la administración de datos es el tiempo necesario para aprender a usar el sistema. Para evaluar tres sistemas de administración de archivos, una empresa diseña una prueba con cinco operadores. Como se considera que la variabilidad entre los operadores es un factor significativo, se capacita a cada uno de los cinco operadores en cada uno de los tres sistemas de administración de archivos. A continuación se presentan los datos obtenidos Sistema
Operador
1 2 3 4 5
A
B
C
16 19 14 13 18
16 17 13 12 17
24 22 19 18 22
Use α 0.05 y realice una prueba para determinar si existe diferencia significativa entre los tiempos, en horas, necesarios para aprender a usar cada uno de los tres sistemas. 27. En un estudio publicado en el Journal of the American Medical Association se investigaba la demanda cardiaca al apalear grandes cantidades de nieve. Diez hombres saludables se sometieron a pruebas de ejercicio empleando una corredora y una bicicleta ergonómica para brazos. Después estos mismos hombres limpiaron dos tramos de nieve mojada y pesada con una pala ligera para nieve y una máquina eléctrica para despejar nieve. Se midió el ritmo cardiaco, la presión sanguínea y el consumo de oxígeno de cada uno de los participantes en la prueba, durante la remoción de nieve, y estos valores se compararon con los valores durante las pruebas de ejercicio. En la ta-
13Ander(490-542).qxd 2/11/08 7:25 PM Page 521
13.5
521
Experimentos factoriales
bla siguiente se presentan los valores de ritmo cardiaco, dados en pulsaciones por minuto, de cada uno de los 10 individuos.
archivo CD en Snow
Sujeto
Corredora
Bici ergonómica para brazos
Pala para nieve
Máquina eléctrica
1 2 3 4 5 6 7 8 9 10
177 151 184 161 192 193 164 207 177 174
205 177 166 152 142 172 191 170 181 154
180 164 167 173 179 205 156 160 175 191
98 120 111 122 151 158 117 123 127 109
Con α = 0.05, como nivel de significancia, realice una prueba para determinar si existe dife-
rencia significativa entre los diversos tratamientos.
13.5
Experimentos factoriales Los diseños de experimentos vistos hasta ahora permiten obtener conclusiones estadísticas acerca de un solo factor. Sin embargo, en algunos experimentos se desean obtener conclusiones acerca de más de un factor o variable. Un experimento factorial es un diseño experimental que permite obtener, simultáneamente, conclusiones acerca de dos o más factores. El término factorial se emplea debido a que las condiciones experimentales comprenden todas las posibles combinaciones de los factores. Por ejemplo, si se tienen a niveles del factor A y b niveles del factor B, se obtendrán datos de ab combinaciones de tratamientos. En esta sección se verá un experimento factorial para dos factores. La idea básica se extiende a experimentos factoriales con más de dos factores. Para ilustrar los experimentos factoriales para dos factores, se considerará un estudio realizado en relación con un examen de admisión para estudiantes con licenciatura que desean hacer un estudio sobre administración de negocios. Las puntuaciones que se pueden obtener en este examen de admisión van de 200 a 800, las puntuaciones más altas reflejan mejores aptitudes para el estudio en el futuro. Como ayuda para la preparación de este examen, una institución ofrece los tres programas siguientes. 1. Una sesión de repaso de tres horas, en la que se revisa el tipo de preguntas que suelen encontrarse en el examen. 2. Un programa de un día en el que se ve el material más importante que se necesita saber para el examen y se hace un examen muestra que es incluso calificado. 3. Un curso intensivo de diez semanas en el que se determinan las debilidades de cada estudiante y se establece un programa individualizado para superar esas debilidades. Por tanto, un factor en este estudio es el programa de preparación para el examen de admisión. Para este factor hay tres tratamientos: un repaso de tres horas, un programa de un día y un curso de 10 semanas. Se quiere determinar el efecto de cada uno de los programas sobre las puntuaciones obtenidas en este examen de admisión. Por lo común este examen lo hacen estudiantes de tres licenciaturas, administración, ingeniería y ciencias. En consecuencia, el segundo factor que interesa en este estudio es si la licenciatura del estudiante influye en la calificación en el examen de admisión. Para este segundo factor hay también tres tratamientos, administración, ingeniería y ciencias. En el diseño factorial de este experimento en el que hay tres tratamientos para el factor A, programa de preparación, y tres tratamientos
13Ander(490-542).qxd 2/11/08 7:25 PM Page 522
522
Capítulo 13
TABLA 13.9
Diseño de experimentos y análisis de varianza
LAS NUEVE COMBINACIONES DE TRATAMIENTOS EN EL EXPERIMENTO CON DOS FACTORES DEL EXAMEN DE ADMISIÓN Factor B: licenciatura Administración Ingeniería Ciencias
Factor A: programa de preparación
Repaso de tres horas Programa de un día Curso de 10 semanas
1 4 7
2 5 8
3 6 9
para el factor B, tipo de licenciatura, habrá en total 3 3 9 combinaciones de tratamientos. En la tabla 13.9 se resumen estas combinaciones de tratamientos o condiciones experimentales. Suponga que se toma una muestra de dos estudiantes para cada una de las combinaciones de tratamientos de la tabla 13.9: dos estudiantes de administración participarán en el repaso de tres horas, dos participarán en el programa de un día y dos participarán en el curso de 10 semanas. Además, dos estudiantes de ingeniería y dos estudiantes de ciencias participarán en cada uno de los tres programas. En la terminología del diseño de experimentos, el tamaño muestral de dos para cada combinación de tratamientos indica que se tienen dos replicaciones. Se pueden usar también más replicaciones y tamaños muestrales mayores, pero en esta aplicación se quisieron minimizar los cálculos para hacer más claro este ejemplo. En este diseño experimental se requiere que de cada una de las licenciaturas (administración, ingeniería y ciencias) se tomen aleatoriamente seis estudiantes que pretendan realizar este examen de admisión y, que después, dos estudiantes de cada licenciatura sean asignados de manera aleatoria a cada uno de los programas de preparación para el examen, con lo que en total participan 18 estudiantes en este estudio. En la tabla 13.10 se presentan las puntuaciones obtenidas en el examen por estos estudiantes después de haber participado en los programas de preparación para el examen. Los cálculos para el análisis de varianza con los datos de la tabla 13.10 permitirán responder las preguntas siguientes:
• Efecto principal (factor A): ¿Tienen los programas de preparación efectos diferentes sobre la puntuación obtenida en el examen de admisión?
• Efecto principal (factor B): ¿Tienen las licenciaturas efectos diferentes sobre la puntuación obtenida en el examen de admisión?
• Efecto de interacción (factor A y B): ¿Es uno de los programas de preparación mejor para los estudiantes que vienen de una de las tres licenciaturas, mientras que para los de otras licenciaturas es mejor otro de los programas? El término interacción se refiere a un nuevo efecto que es posible estudiar debido a que se emplea un experimento factorial. Si el efecto interacción tiene algún impacto significante sobre TABLA 13.10
PUNTUACIONES EN EL EXAMEN DE ADMISIÓN DEL EXPERIMENTO DE DOS FACTORES Factor B: licenciatura Administración Ingeniería Ciencias
archivo CD en GMAT
Factor A: programa de preparación
Repaso de tres horas
500 580
540 460
480 400
Programa de un día
460 540
560 620
420 480
Curso de 10 semanas
560 600
600 580
480 410
13Ander(490-542).qxd 2/11/08 7:25 PM Page 523
13.5
523
Experimentos factoriales
TABLA 13.11
TABLA ANOVA PARA EL EXPERIMENTO FACTORIAL DE DOS FACTORES CON r REPLICACIONES
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrado medio
Factor A
SCA
a 1
Factor B
SCB
b 1
SCAB
(a 1)(b 1)
Error
SCE
ab(r 1)
Total
STC
nT 1
SCA a 1 SCB CMB b 1 SCAB CMAB (a 1)(b 1) SCE CME ab(r 1)
Interacción
CMA
F
Valor-p
CMA CME CMB CME CMAB CME
las puntuaciones del examen de admisión, se podrá concluir que el efecto del tipo de programa de preparación depende de la licenciatura
Procedimiento ANOVA El ANOVA para el experimento factorial de dos factores se parece al del experimento completamente aleatorizado y al del experimento con bloques aleatorizado en que también hay partición de las sumas de cuadrados y los grados de libertad en sus fuentes correspondientes. La fórmula para la partición de las sumas de cuadrados en sus diversos componentes se da a continuación. STC = SCA + SCB + SCAB + SCE
(13.26)
En la tabla 13.11 se resumen las particiones de las sumas de cuadrados y de los grados de libertad. Se emplea la notación siguiente: a b r nT
número de niveles (valores) del factor A número de niveles (valores) del factor B número de replicaciones número total de observaciones realizadas en el experimento; nT = abr
Cálculos y conclusiones Para calcular los estadísticos F que se necesitan para las pruebas de significancia del factor A, del factor B y de la interacción, se necesitan calcular CMA, CMB, CMAB y CME. Para calcular estos cuatro cuadrados medios (o medias de cuadrados), se deben calcular primero SCA, SCB, SCAB y SCE; con esto se calcula también STC. Para simplificar, los cálculos se dividen en cinco pasos. Además de la notación ya introducida, se emplea la siguiente: x ijk observación correspondiente a la réplica k del tratamiento i del factor A y del tratamiento j del factor B x̄ i . media muestral de las observaciones del tratamiento i (factor A) x̄ .j media muestral de las observaciones del tratamiento j (factor B) x̄ ij media muestral de las observaciones correspondientes a la combinación del tratamiento i (factor A) y del tratamiento j (factor B) x̄¯ media muestral general de todas las nT observaciones
13Ander(490-542).qxd 2/11/08 7:25 PM Page 524
524
Capítulo 13
Diseño de experimentos y análisis de varianza
Paso 1. Calcular la suma total de cuadrados a
STC
b
r
兺 兺 兺 (x
ijk
x̄¯ )2
(13.27)
i 1 j 1 k 1
Paso 2. Calcular la suma de cuadrados del factor A a
SCA br
兺(x̄ . x̄¯ )
2
(13.28)
2
(13.29)
i
i 1
Paso 3. Calcular la suma de cuadrados del factor B b
SCB ar
兺(x̄. x̄¯ ) j
j 1
Paso 4. Calcular la suma de cuadrados debida a la interacción a
SCAB r
b
兺 兺(x̄
ij
x̄ i. x̄.j x̄¯ )2
(13.30)
i 1 j 1
Paso 5. Calcular la suma de cuadrados debida al error SCE STC SCA SCB SCAB
(13.31)
En la tabla 13.12 se muestran los datos obtenidos en el experimento y las diversas sumas necesarias para los cálculos de las sumas de cuadrados. Mediante las ecuaciones (13.27) a (13.31), se calculan las diversas sumas de cuadrados del experimento factorial de dos factores del examen de admisión. STC (500 515)2 (580 515)2 (540 515)2 . . . (410 515)2 82 450 Paso 2. SCA (3)(2)[(493.33 515)2 (513.33 515)2 (538.33 515)2] 6100 Paso 3. SCB (3)(2)[(540 515)2 (560 515)2 (445 515)2] 45 300 Paso 4. SCAB 2[(540 493.33 540 515)2 (500 493.33 560 515)2] . . . (445 538.33 445 515)2] 11 200 Paso 5. SCE 82 450 6100 45 300 11 200 19 850 Paso 1.
Estas sumas de cuadrados divididas entre sus grados de libertad dan los correspondientes cuadrados medios para estimar los dos efectos principales (programas de preparación y licenciatura) y el efecto de la interacción. Para realizar la prueba de hipótesis de dos factores en el estudio del examen de admisión se usará el nivel de significancia, α 0.05. Debido a la gran cantidad de cálculos en un experimento factorial, la computadora tiene un papel importante en la realización de los cálculos necesarios en el análisis de varianza y para obtener los valores-p que se emplean para tomar las decisiones en la prueba de hipótesis. En la figura 13.6 se presenta la pantalla de resultados de Minitab para el análisis de varianza del experimento factorial de dos factores del examen de admisión. El valor-p para probar si hay diferencias significativas entre los tres programas de preparación (factor A) es 0.299. Como este valor-p 0.299 es mayor a α 0.05, se concluye que los programas de preparación no hacen que haya diferencia significativa entre las medias de las puntuaciones obtenidas en los exámenes de admisión. Sin embargo, en relación con el efecto de la licenciatura, el valor-p 0.005 es menor que α 0.05; por tanto, entre las tres licenciaturas
Repaso de tres horas
Totales de combinación de tratamiento
Media del factor B
Totales de columna
Curso de 10 semanas
x̄.1
x̄ 31
x̄ 21
x̄11
1180
1180 590 2
1160
1160 580 2
3360 3360 560 6
3240 3240 540 6
x̄.2
600 580
560 600
x̄ 32
1180 590 2
1000 500 2 x̄ 22
1180
1000
1000 500 2
1080 540 2 560 620
1000
1080
460 540
540 460
x̄ 12
Ingeniería
500 580
Administración
Factor B: licenciatura
x̄.3
x̄ 33
x̄ 23
x̄ 13
2670 445 6
2670
890 445 2
890
480 410
900 450 2
900
420 480
880 440 2
880
480 400
Ciencias
x̄¯
x̄ 3.
x̄ 2.
Total general
3230 538.33 6
3080 513.33 6
2960 493.33 6
Medias del factor A
x̄ 1.
9270 515 18
9270
3230
3080
2960
Totales de renglón
RESUMEN DE LOS DATOS DEL EXAMEN DE ADMISIÓN PARA EL EXPERIMENTO DE DOS FACTORES
Factor A: preparación Programa de un día del programa
TABLA 13.12
13Ander(490-542).qxd 2/11/08 7:25 PM Page 525
525
13Ander(490-542).qxd 2/11/08 7:25 PM Page 526
526
Capítulo 13
FIGURA 13.6
Diseño de experimentos y análisis de varianza
PANTALLA DE RESULTADOS DE MINITAB PARA EL DISEÑO DE DOS FACTORES PARA EL EXAMEN DE ADMISIÓN
SOURCE Factor A Factor B Interaction Error Total
DF 2 2 4 9 17
SS 6100 45300 11200 19850 82450
MS 3050 22650 2800 2206
F 1.38 10.27 1.27
P 0.299 0.005 0.350
sí hay una diferencia significativa en las medias de las puntuaciones en el examen de admisión. Por último, como el valor-p, 0.350, correspondiente al efecto de la interacción es mayor que α 0.05, no hay un efecto significativo de interacción. Por tanto, en este estudio no se encuentran razones para pensar que los tres programas de preparación difieran en su capacidad de preparación, para este examen de admisión, de estudiantes de las distintas licenciaturas. Se encontró que la licenciatura sí era un factor significativo. Al revisar los cálculos de la tabla 13.2, se ve que las medias muestrales son: estudiantes de administración x̄.1 540, estudiantes de ingeniería x̄.2 560 y estudiantes de ciencias x̄.3 445. Es posible realizar pruebas para los distintos tratamientos; sin embargo, después de observar las tres medias muestrales es de anticipar que no hay diferencia entre los estudiantes con las licenciaturas de ingeniería y administración. Pero, los estudiantes de ciencias parecen estar menos preparados para este examen que los estudiantes de las otras dos licenciaturas. Quizás esta observación haga que la universidad busque otras opciones para ayudar a estos estudiantes a prepararse para el examen de admisión.
Ejercicios
Métodos
Auto examen
28. En un experimento factorial con dos niveles para el factor A y tres niveles para el factor B se obtuvieron los datos siguientes. Factor B Nivel 1
Nivel 2
Nivel 3
Nivel 1
135 165
90 66
75 93
Nivel 2
125 95
127 105
120 136
Factor A
Realice una prueba para determinar si hay algunos efectos principales significativos o algún efecto de interacción. Use α 0.05. 29. De los cálculos de un experimento factorial con cuatro niveles para el factor A, tres niveles para el factor B y tres replicaciones se obtuvieron los datos siguientes: STC 280, SCA 26, SCB 23, SCAB 175. Dé la tabla ANOVA y pruebe si hay algunos efectos principales significativos o algún efecto de interacción. Use α 0.05.
Aplicaciones 30. Una empresa de venta por catálogo diseñó un experimento factorial para probar el efecto de tamaño y diseño de los anuncios publicitarios, en el catálogo, sobre el número de solicitudes de catálogos recibidas (los datos están dados en miles). Se pusieron a consideración tres diseños publicitarios y dos tamaños. Los datos obtenidos se presentan a continuación. Emplee el ANO-
13Ander(490-542).qxd 2/11/08 7:25 PM Page 527
13.5
527
Experimentos factoriales
VA para un diseño factorial para probar si hay efectos significativos debidos al tipo de diseño, al tamaño o a la interacción. Use α = 0.05. Tamaño del anuncio
Diseño
Pequeño
Grande
A
8 12
12 8
B
22 14
26 30
C
10 18
18 14
31. Un parque de diversión estudió los métodos para disminuir el tiempo de espera (en minutos) al bajar y subir a los pasajeros a los diversos juegos. Se propusieron dos métodos para subir y bajar a los pasajeros de los juegos. Para tomar en cuenta las diferencias debidas al tipo de juego y a la interacción que puede haber entre el tipo de juego y el método de subir y bajar a los pasajeros, se diseñó un experimento factorial. Use los datos siguientes para hacer una prueba sobre cualquier efecto significante debido al método parea subir y bajar a los pasajeros, al tipo de juego y a la interacción. Use α 0.05. Tipo de juego Montaña rusa
Rueda de la fortuna
Tobogán
Método 1
41 43
52 44
50 46
Método 2
49 51
50 46
48 44
32. La U.S. Bureau of Labor Statistics, recoge información sobre sueldos de hombres y mujeres en diversas ocupaciones. Suponga que se desea investigar si hay diferencia entre los sueldos semanales de hombres y mujeres que trabajan como administradores financieros, programadores y farmacéuticos. De cada una de estas ocupaciones se toma una muestra de cinco hombres y cinco mujeres y se registra el sueldo semanal de cada uno de ellos. Los datos obtenidos son los que se presentan a continuación.
Sueldo semanal ($)
archivo CD en Salaries
872 859 1028 1117 1019 519 702 805 558 591 747 766 901 690
Ocupación Administrador financiero Administrador financiero Administrador financiero Administrador financiero Administrador financiero Administrador financiero Administrador financiero Administrador financiero Administrador financiero Administrador financiero Programador Programador Programador Programador
Género Hombre Hombre Hombre Hombre Hombre Mujer Mujer Mujer Mujer Mujer Hombre Hombre Hombre Hombre (continúa)
13Ander(490-542).qxd 2/11/08 7:25 PM Page 528
528
Capítulo 13
Diseño de experimentos y análisis de varianza
Sueldo semanal ($) 881 884 765 685 700 671 1105 1144 1085 903 998 813 985 1006 1034 817
Ocupación
Género
Programador Programador Programador Programador Programador Programador Farmacéutico/a Farmacéutico/a Farmacéutico/a Farmacéutico/a Farmacéutico/a Farmacéutico/a Farmacéutico/a Farmacéutico/a Farmacéutico/a Farmacéutico/a
Hombre Mujer Mujer Mujer Mujer Mujer Hombre Hombre Hombre Hombre Hombre Mujer Mujer Mujer Mujer Mujer
Utilice el nivel de significancia α 0.05, pruebe si hay algún efecto significativo debido a la ocupación, el género y la interacción. 33. En un estudio publicado en The Accounting Review se examinaron los efectos separados y conjuntos de dos grados de presión de tiempo (bajo y moderado) y de tres grados de conocimiento (inexperto, declarativo y de procedimiento) en la conducta al seleccionar palabras clave en una investigación de impuestos. A las personas se les presentaban casos que contenían una serie de hechos, un asunto sobre impuestos y un índice de palabras clave con 1 336 palabras clave. Se les pedía que seleccionaran las palabras clave que creyeran los llevarían a una autoridad tributaria relevante para resolver el caso. Antes del experimento, un grupo de expertos en impuestos determinó que en el texto había 19 palabras clave relevantes. Las personas en el grupo inexperto, poseían poco o ningún conocimiento declarativo o de procedimiento, las personas en el grupo declarativo tenían un conocimiento declarativo significativo pero poco o ningún conocimiento de procedimiento y las personas en el grupo de procedimiento tenían considerables conocimientos declarativos y de procedimiento. El conocimiento declarativo consistía en el conocimiento tanto de las reglas de impuestos aplicables como de los términos técnicos empleados para describir esas reglas. El conocimiento de procedimiento es el conocimiento de las reglas que guían la búsqueda del investigador de impuestos para hallar palabras clave. A las personas en el grupo de poca presión de tiempo se les dieron 25 minutos para resolver un problema, cantidad de tiempo que debía ser “más que adecuada” para resolver el caso, a las personas en el grupo de presión de tiempo moderada se les dieron “sólo” 11 minutos para resolver el caso. Se seleccionaron 25 personas para cada una de las seis combinaciones de tratamientos; las medias muestrales de cada combinación de tratamientos son las que se indican a continuación (las desviaciones estándar están entre paréntesis).
Conocimiento Inexperto
Declarativo
De procedimiento
Baja
1.13 (1.12)
1.56 (1.33)
2.00 (1.54)
Moderada
0.48 (0.80)
1.68 (1.36)
2.86 (1.80)
Presión de tiempo
Emplee el ANOVA para probar si hay diferencias significativas debidas a la presión de tiempo, al conocimiento o a la interacción. Use 0.05 como nivel de significancia. La suma total de cuadrados en este experimento fue 327.50.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 529
Glosario
529
Resumen En este capítulo se mostró cómo emplear el análisis de varianza para hallar diferencias entre las medias de varias poblaciones o tratamientos. Se presentó el diseño completamente aleatorizado, el diseño de bloques aleatorizado y el experimento factorial de dos factores. El diseño completamente aleatorizado y el diseño de bloques aleatorizado se usaron para sacar conclusiones acerca de las diferencias en las medias de un solo factor. El objetivo principal de la formación de bloques en el diseño de bloques aleatorizado es eliminar, del término del error, fuentes extrañas de variación. La formación de bloques proporciona una mejor estimación de la verdadera varianza del error y una mejor prueba para determinar si las medias de las poblaciones o tratamientos del factor difieren significativamente. Se mostró que la base para las pruebas estadísticas empleadas en el análisis de varianza y en el diseño de experimentos es la obtención de dos estimaciones independientes de la varianza poblacional σ 2. En el caso de un solo factor, uno de los estimadores se basa en la variación entre los tratamientos; este estimador sólo proporciona un estimador insesgado de σ 2 si las medias μ 1, μ 2, …, μ k, son iguales. El otro estimador de σ 2 se basa en la variación de las observaciones dentro de cada muestra; este estimador siempre proporciona un estimador insesgado de σ 2. Al calcular el cociente entre estos dos estimadores (el estadístico F) se obtiene la regla de rechazo para rechazar o no la hipótesis nula que establece que las medias poblacionales o de los tratamientos son iguales. En todos los diseños de experimentos aquí considerados, la partición de las sumas de cuadrados y de los grados de libertad en sus diferentes fuentes permiten calcular las cantidades necesarias para el análisis de varianza y para las pruebas. Se mostró también cómo usar el procedimiento de las LSD de Fisher y el ajuste de Bonferroni para realizar comparaciones por pares y determinar cuáles son las medias que son diferentes.
Glosario Tabla ANOVA Tabla usada para resumir los cálculos y los resultados del análisis de varianza. Esta tabla tiene columnas en las que se muestran las fuentes de variación, las sumas de cuadrados, los grados de libertad, los cuadrados medios y el o los valores F. Partición Proceso que distribuye la suma total de cuadrados y de grados de libertad entre sus diversos componentes. Procedimientos de comparación múltiple Procedimientos estadísticos que se emplean para realizar comparaciones estadísticas entre pares de medias poblacionales. Tasa de error tipo I por comparación Probabilidad de cometer un error tipo I en la comparación de un solo par. Tasa de error tipo I por experimentación Probabilidad de cometer un error tipo I en por lo menos una de varias comparaciones por pares. Factor Otro término empleado para la variable independiente de interés. Tratamientos Los diferentes niveles (valores) del factor. Experimento de un solo factor Experimento en el que hay un solo factor con k poblaciones o tratamientos. Variable de respuesta Otro término para la variable dependiente de interés. Unidades experimentales Los objetos de interés en el experimento. Diseño completamente aleatorizado Diseño experimental en el que los tratamientos se asignan en forma aleatoria a las unidades experimentales. Formación de bloques Proceso que consiste en usar una misma o similares unidades experimentales para todos los tratamientos. El objetivo de la formación de bloques es eliminar, del término del error, fuentes extrañas de variación y con esto proporcionar una prueba más sólida para diferenciar las medias de las poblaciones o tratamientos. Diseño de bloques aleatorizado Diseño de experimentos en el que se usa la formación de bloques. Experimento factorial Diseño experimental en el que se obtienen simultáneamente conclusiones acerca de dos o más factores.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 530
530
Capítulo 13
Diseño de experimentos y análisis de varianza
Replicaciones Número de veces que en un experimento se repite una condición experimental. Interacción Efecto que se produce cuando los niveles (valores) de un factor interactúan con los niveles (valores) del otro factor e influyen en la variable de respuesta.
Fórmulas clave
Diseño completamente aleatorizado Media muestral del tratamiento j nj
兺x
x̄ j
ij
i 1
(13.1)
nj
Varianza muestral del tratamiento j nj
s 2j
兺(x
x̄ j )2
ij
i 1
(13.2)
nj 1
Media muestral general nj
k
x̄¯
兺兺x
ij
j 1 i 1
(13.3)
nT
nT n1 n2 . . . nk
(13.4)
Cuadrado medio debido a los tratamientos CMTR
SCTR k 1
(13.7)
Suma de cuadrados debida a los tratamientos k
SCTR
兺 n (x̄ j
j
x̄¯ )2
(13.8)
j 1
Cuadrado medio debido al error CME
SCE nT k
(13.10)
Suma de cuadrados debida al error k
SCE
兺(n 1)s j
2 j
(13.11)
j 1
Estadístico de prueba para la igualdad de k medias poblacionales F
SCTR CME
(13.12)
13Ander(490-542).qxd 2/11/08 7:25 PM Page 531
531
Fórmulas clave
Suma de cuadrados del total nj
k
兺 兺(x
STC
x̄¯ )2
(13.13)
STC SCTR SCE
(13.14)
ij
j 1 i 1
Partición de la suma de cuadrados
Procedimiento de comparación múltiple Prueba estadística para el procedimiento de la LSD de Fisher t
x̄ i x̄ j
冑
冢
1 1 CME n n i j
LSD de Fisher
冑
(13.16)
冣
冢
1 1 LSD tα/2 CME n n i j
冣
(13.17)
Diseño de bloques aleatorizado Suma de cuadrados del total b
STC
k
兺 兺(x
x̄¯ )2
ij
(13.22)
i 1 j 1
Suma de cuadrados debida a los tratamientos k
兺(x̄. x̄¯ )
SCTR b
2
(13.23)
2
(13.24)
j
j 1
Suma de cuadrados debida a los bloques b
SCBL k
兺(x̄ . x̄¯ ) i
i 1
Suma de cuadrados debida al error SCE STC SCTR SCBL
(13.25)
Experimentos factoriales Suma de cuadrados del total a
STC
b
r
兺 兺 兺 (x
ijk
x̄¯ )2
(13.27)
i 1 j 1 k 1
Suma de cuadrados del factor A a
SCA br
兺(x̄ . x̄¯ )
2
i
i 1
(13.28)
13Ander(490-542).qxd 2/11/08 7:25 PM Page 532
532
Capítulo 13
Diseño de experimentos y análisis de varianza
Suma de cuadrados del factor B b
SCB ar
兺(x̄. x̄¯ )
2
(13.29)
j
j 1
Suma de cuadrados debida a la interacción a
SCAB r
b
兺 兺(x̄
x̄ i. x̄.j x̄¯ )2
(13.30)
SCE STC SCA SCB SCAB
(13.31)
ij
i 1 j 1
Suma de cuadrados debida al error
Ejercicios complementarios 34. En un diseño experimental completamente aleatorizado se probó la capacidad absorbente de agua de tres marcas de toallas de papel. Se usaron toallas de un mismo tamaño para probar cuatro secciones de toalla por marca. A continuación se dan los datos de la capacidad de absorción. Emplee 0.05 como nivel de significancia. ¿Parece haber alguna diferencia en la capacidad de absorción de estas marcas? Marca x
y
z
91 100 88 89
99 96 94 99
83 88 89 76
35. En un estudio publicado en el Journal of Small Business Management se concluyó que los individuos que se autoemplean no experimentan tanta satisfacción en el trabajo como los que no se autoemplean. En este estudio, la satisfacción en el trabajo se midió empleando 18 puntos, cada uno de los cuales se evaluaba con una escala de Liker con 1–5 opciones de respuesta que iban de totalmente de acuerdo a totalmente en desacuerdo. En esta escala una puntuación mayor corresponde a mayor satisfacción con el trabajo. La suma de las puntuaciones de los 18 puntos, que iba de 18–90, se empleó para medir la satisfacción con el trabajo. Suponga que se emplea este método para medir la satisfacción en el trabajo de abogados, terapeutas físicos, carpinteros y analistas de sistemas. A continuación se encuentran los resultados obtenidos en una muestra de 10 individuos de cada profesión. Abogados
archivo CD en SatisJob
44 42 74 42 53 50 45 48 64 38
Terapeutas físicos
Carpinteros
Analistas de sistemas
55 78 80 86 60 59 62 52 55 50
54 65 79 69 79 64 59 78 84 60
44 73 71 60 64 66 41 55 76 62
Con α 0.05 como nivel de significancia, pruebe si hay diferencia en la satisfacción con el trabajo en estas cuatro profesiones.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 533
533
Ejercicios complementarios
36. La revista Money publicó porcentajes de las proporciones de rendimientos y gastos de acciones y fondos de bonos. Los datos siguientes son las proporciones de gastos en 10 fondos de acciones “midcap”, 10 fondos de acciones “small-cap”, 10 fondos de acciones híbridos y 10 fondos por sector especialista (Money, marzo de 2003).
archivo CD en Funds
Midcap
Small-Cap
Híbridos
Especialista
1.2 1.1 1.0 1.2 1.3 1.8 1.4 1.4 1.0 1.4
2.0 1.2 1.7 1.8 1.5 2.3 1.9 1.3 1.2 1.3
2.0 2.7 1.8 1.5 2.5 1.0 0.9 1.9 1.4 0.3
1.6 2.7 2.6 2.5 1.9 1.5 1.6 2.7 2.2 0.7
Use α 0.05 para probar si hay diferencias significativas entre las proporciones de gastos medios de estos cuatro fondos de acciones. 37. La primera encuesta anual sobre empleo de Business 2.0 proporcionó datos sobre los salarios anuales de 97 empleos diferentes. Los datos siguientes son salarios anuales de 30 empleos diferentes en tres campos, software y hardware para computadoras, construcción e ingeniería.
Computación Empleo
archivo CD en JobSalary
Construcción Salario
Administrador de datos Administrador de fabricación Programador Administrador de proyecto Desarrollador de software Diseñador Sistemas de personal Analista de sistemas
94 90 63 84 73 75 94 77
Empleo
Ingeniería Salario
Administrador Arquitecto Administrador arquitecto Administrador de la construcción Maestro de obras Diseñador de interiores Arquitecto de paisaje Estimador
Empleo
Salario
55 53 77 60
Aeronáutica Agrícola Química Civil
75 70 88 77
41 54 51 64
Eléctrica Mecánica Minera Nuclear
89 85 96 105
Use α 0.05 para probar si hay alguna diferencia significativa entre los salarios medios anua-
les de los tres campos de trabajo. 38. Se proponen tres nuevos métodos de fabricación para un producto nuevo. Para determinar con cuál de los métodos se producen más unidades por hora se elige un diseño experimental completamente aleatorizado y a 30 trabajadores tomados al azar se les asigna alguno de los métodos de fabricación. En la tabla siguiente se presenta el número de unidades producidas por cada uno de los trabajadores. Método
archivo CD en Assembly
A
B
C
97 73 93 100 73 91 100 86 92 95
93 100 93 55 77 91 85 73 90 83
99 94 87 66 59 75 84 72 88 86
13Ander(490-542).qxd 2/11/08 7:25 PM Page 534
534
Capítulo 13
Diseño de experimentos y análisis de varianza
Utilice estos datos y realice una prueba para ver si el número medio de unidades producidas es la misma con los tres métodos de fabricación. Use α 0.05. 39. En un estudio realizado para investigar la actividad de los clientes en las tiendas grandes, a cada cliente se le clasificó al inicio como poco activo, medianamente activo y muy activo. De cada cliente se obtuvo un valor que medía cuán a gusto se encontraba el cliente en la tienda. Valores más altos indicaban que el cliente se encontraba más a gusto. Los datos obtenidos fueron los siguientes.
Poco activo
Medianamente activo
Muy activo
4 5 6 3 3 4 5 4
5 6 5 4 7 4 6 5
5 7 5 7 4 6 5 7
archivo CD en Browsing
a. b.
Use α 0.05 para probar si hay diferencia en el grado en que se sienten a gusto los tres tipos de clientes. Use el procedimiento de la LSD de Fisher para comparar los grados en que se encuentran a gusto los poco activos y los medianamente activos. Use α 0.05 ¿Cuál es la conclusión?
40. Una empresa realiza una investigación para determinar el rendimiento, en millas por galón, característico de tres marcas de gasolina. Como cada gasolina da rendimientos distintos en automóviles de marcas diferentes, se eligen cinco marcas de automóviles que se tratan como bloques en el experimento; es decir, el automóvil de cada marca se prueba con los tres tipos de gasolina. Los resultados del experimento (en millas por galón) se presentan a continuación.
Marcas de gasolina
Automóviles
a. b.
A B C D E
I
II
III
18 24 30 22 20
21 26 29 25 23
20 27 34 24 24
Con α 0.05, ¿se encuentra alguna diferencia entre los rendimientos medios en millas por galón de los tres tipos de gasolina? Analice los datos experimentales usando el ANOVA para diseños completamente aleatorizados. Compare sus hallazgos con los obtenidos en el inciso a. ¿Cuál es la ventaja de tratar de eliminar el efecto de bloque?
41. Wegman’s Food Markets y Tops Frendly Markets son cadenas grandes de tiendas de abarrotes en una zona de Nueva York. Cuando Wal-Mart abrió un supermercado en esta zona, los expertos predijeron que Wal-Mart vendería más barato que estas dos tiendas locales. Un periódico publicó los precios de 15 artículos que se presentan en la tabla siguiente.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 535
535
Ejercicios complementarios
archivo CD en Grocery
Artículo
Tops
Wal-Mart
Wegmans
Plátanos (1 lb) Sopa Cambell’s (10.75 oz) Pechuga de pollo (3 lb) Pasta de dientes (6.2 oz) Huevos (1 docena) Salsa cátsup (36 oz) Jell-o (3 onz) Cacahuatina (18 oz) Leche (descremada, 1/2 gal) Oscar Meyer hotdogs (1 lb) Salsa ragú para pasta (1 lb, 10 oz) Galletas Ritz (1 lb) Detergente Tid (líquido, 100 oz) Jugo de naranja Tropicana (1/2 gal) Twizzlers (frambuesas, 1 lb)
0.49 0.60 10.47 1.99 1.59 2.59 0.67 2.29 1.34 3.29 2.09 3.29 6.79 2.50 1.19
0.48 0.54 8.61 2.40 0.88 1.78 0.42 1.78 1.24 1.50 1.50 2.00 5.24 2.50 1.27
0.49 0.77 8.07 1.97 0.79 2.59 0.65 2.09 1.34 3.39 1.25 3.39 5.99 2.50 1.69
Con α 0.05 como nivel de significancia, pruebe si hay una diferencia significativa entre las tres tiendas en las medias del precio de estos 15 artículos. 42. El U.S. Department of Housing and Urban Development publica datos que muestran el mercado de rentas mensuales en las áreas metropolitanas. Los datos siguientes son las rentas mensuales aceptables en cinco zonas metropolitanas para departamentos de 1, 2 y 3 recámaras (The New York Times Almanac, 2006). Boston
Miami
San Diego
San Jose
Washington
1077 1266 1513
775 929 1204
975 1183 1725
1107 1313 1889
1045 1187 1537
1 recámara 2 recámaras 3 recámaras
Emplee 0.05 como nivel de significancia, pruebe si las rentas mensuales aceptables son iguales en estas cinco zonas metropolitanas. 43. Se tienen dos sistemas de software para traducción del inglés a otros idiomas. Para ver si hay diferencia en la rapidez de estos dos sistemas de traducción se diseña un experimento factorial. Como el idioma al que se traduzca es también un factor importante, los dos sistemas se prueban traduciendo a tres idiomas: español, francés y alemán. Los datos siguientes dan el tiempo en horas que se necesitó en cada uno de los sistemas.
Idioma Español
Francés
Alemán
Sistema 1
8 12
10 14
12 16
Sistema 2
6 10
14 16
16 22
Realice una prueba para determinar si hay alguna diferencia significativa de rapidez entre los dos sistemas de software, entre los idiomas a que se traduce y si hay algún efecto de interacción. Use α 0.05. 44. En una fábrica se diseña un experimento factorial para determinar si hay diferencia entre el número de artículos defectuosos producidos por dos máquinas y si el número de defectos depende también de si a estas máquinas se les suministra la materia prima que necesitan, manualmen-
te o mediante un sistema de alimentación automático. A continuación se presentan los datos
13Ander(490-542).qxd 2/11/08 7:25 PM Page 536
536
Capítulo 13
Diseño de experimentos y análisis de varianza
del número de artículos defectuosos producidos. Use α 0.05 para probar si hay algún efecto significativo debido a la máquina, al sistema de suministro de la materia prima y a la interacción. Suministro de la materia prima
Caso problema 1
Manual
Automático
Máquina 1
30 34
30 26
Máquina 2
20 22
24 28
Centro Médico Wentworth Como parte de un estudio a largo plazo realizado con personas de 65 años o más, médicos y sociólogos del Centro Médico Wentworth en Nueva York, investigaron la relación entre ubicación geográfica y depresión. Se tomó una muestra de 60 personas, todas en buenas condiciones de salud; 20 de Florida, 20 de Nueva York y 20 de Carolina del Norte. A cada una de estas personas se le aplicó una prueba estandarizada para medir la depresión. Los datos obtenidos se encuentran en el disco compacto en el archivo Medical1. Otra parte del estudio consistió en analizar la relación entre ubicación geográfica y depresión en personas de 65 años o más pero que tenían algún padecimiento crónico como artritis, hipertensión o padecimientos cardiacos. Para este estudio se tomó también una muestra aleatoria de personas en estas condiciones, 20 de Florida, 20 de Nueva York y 20 de Carolina del Norte. Los datos obtenidos en este estudio se presentan a continuación. Estos datos se encuentran en el disco compacto en el archivo Medical2.
Datos de Medical1 Carolina Florida Nueva York del Norte
archivo CD en Medical1
archivo CD en Medical2
3 7 7 3 8 8 8 5 5 2 6 2 6 6 9 7 5 4 7 3
8 11 9 7 8 7 8 4 13 10 6 8 12 8 6 8 5 7 7 8
10 7 3 5 11 8 4 3 7 8 8 7 3 9 8 12 6 3 8 11
Datos de Medical2 Carolina Florida Nueva York del Norte 13 12 17 17 20 21 16 14 13 17 12 9 12 15 16 15 13 10 11 17
14 9 15 12 16 24 18 14 15 17 20 11 23 19 17 14 9 14 13 11
10 12 15 18 12 14 17 8 14 16 18 17 19 15 13 14 11 12 13 11
13Ander(490-542).qxd 2/11/08 7:25 PM Page 537
Caso problema 2
537
Compensación para profesionales de ventas
Informe administrativo 1. Use la estadística descriptiva para resumir los datos de estos dos estudios. ¿Cuáles son sus observaciones preliminares acerca de los valores de depresión? 2. Utilice al análisis de varianza para ambos conjuntos de datos. En cada caso dé las hipótesis a probar. ¿Cuáles son sus conclusiones? 3. Si es necesario use inferencias acerca de las medias de cada uno de los tratamientos. ¿Cuáles son las conclusiones?
Caso problema 2
Compensación para profesionales de ventas Un grupo local de profesionales de ventas de San Francisco realiza una investigación entre sus miembros para ver si hay alguna relación entre los años de experiencia y el salario de los individuos empleados como vendedores internos y externos. En esta encuesta se pide a los encuestados que especifiquen uno de tres niveles de años de experiencia: bajo (1 a 10 años), medio (11 a 20 años) o alto (21 o más años). A continuación se presenta una parte de los datos obtenidos. El conjunto de datos completo, que contiene 120 observaciones, se encuentra en el archivo SalesSalary del disco compacto que viene con el libro.
archivo CD en SalesSalary
Observación
Salario $
Posición
1 2 3 4 5 6 7 8 9 10 • • • 115 116 117 118 119 120
53 938 52 694 70 515 52 031 62 283 57 718 79 081 48 621 72 835 54 768 • • • 58 080 78 702 83 131 57 788 53 070 60 259
Interno Interno Externo Interno Externo Interno Externo Interno Externo Interno • • • Interno Externo Externo Interno Interno Externo
Experiencia Medio Medio Bajo Medio Bajo Bajo Alto Bajo Alto Medio • • • Alto Medio Medio Alto Medio Bajo
Informe administrativo 1. Use la estadística descriptiva para resumir los datos. 2. Dé, mediante un intervalo de 95% de confianza, una estimación del salario medio anual de todos los vendedores, sin importar los años de experiencia y el tipo de vendedor. 3. Proporcione, mediante un intervalo de 95% de confianza, una estimación del salario medio anual de los vendedores internos. 4. Dé, mediante un intervalo de 95% de confianza, una estimación del salario medio anual de los vendedores externos.
13Ander(490-542).qxd 2/11/08 7:25 PM Page 538
538
Capítulo 13
Diseño de experimentos y análisis de varianza
5. Utilice el análisis de varianza para determinar si hay diferencias significativas debidas al tipo de vendedor (externo o interno). Use 0.05 como nivel de significancia, y, por ahora, ignore el efecto de los años de experiencia. 6. Use el análisis de varianza para determinar si hay diferencias significativas debidas a los años de experiencia. Use 0.05 como nivel de significancia y, por ahora, ignore el efecto del tipo de vendedor (externo o interno). 7. Con 0.05 como nivel de significancia, realice una prueba para determinar si hay diferencias significativas debidas al tipo de vendedor, a los años de experiencia o a la interacción.
Apéndice 13.1
Análisis de varianza con Minitab Diseño completamente aleatorizado
archivo CD en Chemitech
En la sección 13.2 se mostró el uso del análisis de varianza para probar la igualdad de k medias poblacionales con los datos de un diseño completamente aleatorizado. Para ilustrar el uso de Minitab en este tipo de diseño de experimentos, se muestra cómo probar si las medias del número de unidades producidas semanalmente con cada uno de los métodos del experimento de Chemitech, presentado en la sección 13.1, son iguales. Los datos muestrales se han ingresado en las tres primeras columnas de la hoja de cálculo de Minitab. La columna 1 se rotuló A, la columna 2 se rotuló B y la columna 3 se rotuló C. Mediante los pasos siguientes se obtiene la pantalla de Minitab presentada en la figura 13.5. Paso 1. Paso 2. Paso 3. Paso 4.
Seleccionar el menú Stat Elegir ANOVA Elegir One way (Unstacked) Cuando aparezca el cuadro de diálogo One-way Analysis of Variance: Ingresar C1-C3 en el cuadro Responses (in separate columns) Clic en OK
Diseño de bloques aleatorizado En la sección 13.4 se mostró el uso del análisis de varianza para probar la igualdad de k medias poblacionales con los datos de un diseño de bloques aleatorizado. Para ilustrar el uso de Minitab en este tipo de diseño de experimentos, se muestra cómo probar si las medias de los grados de estrés de los controladores aéreos es la misma en los tres puestos de trabajo. Los valores de los grados de estrés de la tabla 13.5 se han ingresado en la columna 1 de la hoja de cálculo de Minitab. Codificando los tratamientos como 1, el del sistema A; 2, el del sistema B, y 3, el del sistema C, los valores codificados de los tratamientos se ingresaron en la columna 2 de la hoja de cálculo. Por último el número correspondiente a cada controlador (1, 2, 3, 4, 5 y 6) se ingresó en la columna 3. De esta manera, los valores en el primer renglón de la hoja de cálculo son 15, 1, 1; los valores en el segundo renglón son 15, 2, 1; los valores en el renglón 3 son 18, 3, 1; los valores en el renglón 4 son 14, 1, 2; etc. Con los pasos siguientes se obtiene la pantalla de Minitab que corresponde a la tabla de ANOVA de la tabla 13.8. Paso 1. Paso 2. Paso 3. Paso 4.
Seleccionar el menú Stat Elegir ANOVA Elegir Two-way Cuando aparezca el cuadro de diálogo Two-way Analysis of Variance: Ingresar C1 en el cuadro Response Ingresar C2 en el cuadro Row factor Ingresar C3 en el cuadro Column factor Seleccionar Fit additive model Clic OK
13Ander(490-542).qxd 2/11/08 7:25 PM Page 539
Apéndice 13.2
Análisis de varianza con Excel
539
Experimento factorial En la sección 13.5 se mostró el uso del análisis de varianza para probar la igualdad de k medias poblacionales con los datos de un experimento factorial. Para ilustrar el uso de Minitab en este tipo de diseño de experimentos, se muestra cómo analizar los datos del experimento de dos factores para el examen de admisión, presentado en esa sección. Las puntuaciones obtenidas en el examen de admisión, que se presentan en la tabla 13.10 se han ingresado en la columna 1 de la hoja de cálculo de Minitab; la columna 1 ha sido rotulada como Puntuación ( Score), la columna 2 ha sido rotulada como Factor A, y la columna 3 como Factor B. Para el factor A, los programas de preparación, se ha codificado como 1 el repaso de tres horas, como 2 el programa de un día y como 3 el curso de 10 semanas. Los valores codificados del factor A se han ingresado en la columna 2 de la hoja de cálculo. Para el factor B, las licenciaturas, se ha codificado como 1 administración, como 2 ingeniería y como 3 ciencias. Los valores codificados del factor B se han ingresado en la columna 3. Por tanto, los valores en el primer renglón de la hoja de cálculo son 500, 1, 1; los valores en el renglón 2 son 580, 1, 1; los valores en el renglón 3 son 540, 1, 2; los valores en el renglón 4 son 460, 1, 2; etc. Con los pasos siguientes se obtienen los resultados de Minitab correspondientes a la tabla ANOVA que se muestra en la figura 13.6 Paso 1. Paso 2. Paso 3. Paso 4.
Apéndice 13.2
Seleccionar el menú Stat Elegir ANOVA Elegir Two-way Cuando aparezca la ventana de diálogo Two-way Analysis of Variance: Ingresar C1 en el cuadro Response Ingresar C2 en el cuadro Row factor Ingresar C3 en el cuadro Column factor Clic en OK
Análisis de varianza con Excel Diseño completamente aleatorizado
archivo CD en Chemitech
En la sección 13.2 se mostró el uso del análisis de varianza para probar la igualdad de k medias poblacionales con los datos de un diseño completamente aleatorizado. Para ilustrar el uso de Excel en este tipo de diseño de experimentos, se muestra cómo probar si las medias del número de unidades producidas semanalmente con cada uno de los métodos del experimento de Chemitech, presentado en la sección 13.1, son iguales. Los datos muestrales se han ingresado en los renglones 2 a 6 de las columnas A, B y C de la hoja de cálculo de Excel, como se observa en la figura 13.7. Mediante los pasos siguientes se obtienen los resultados que aparecen en las celdas A9:G23; la parte del ANOVA corresponde a la tabla ANOVA presentada en la tabla 13.3. Paso 1. Seleccionar el menú Herramientas Paso 2. Elegir Análisis de datos Paso 3. Elegir, de la lista Funciones para análisis, Análisis de varianza de un factor Clic en OK Paso 4. Cuando aparezca el cuadro Análisis de varianza de un factor: Ingresar A1:C6 en el cuadro Rango de entrada Seleccionar Columnas Seleccionar Rótulos en la primera fila Seleccionar Rango de salida e ingresar A9 en el cuadro correspondiente Click en OK
13Ander(490-542).qxd 2/11/08 7:25 PM Page 540
540
Capítulo 13
FIGURA 13.7
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Diseño de experimentos y análisis de varianza
SOLUCIÓN DE EXCEL PARA EL EXPERIMENTO DE CHEMITECH A Method A 58 64 55 66 67
B C Method B Method C 58 48 69 57 71 59 64 47 68 49
D
E
F
G
H
Anova: Single Factor SUMMARY Groups Method A Method B Method C
ANOVA Source of Variation Between Groups Within Groups
Count 5 5 5
SS
Total
Sum Average Variance 310 62 27.5 330 66 26.5 260 52 31
520 340
df
MS 2 260 12 28.3333
860
14
F P-value F crit 9.1765 0.0038 3.8853
Diseño de bloque aleatorizado
archivo CD en AirTraf
En la sección 13.4 se mostró el uso del análisis de varianza para probar la igualdad de k medias poblacionales con los datos de un diseño de bloques aleatorizado. Para ilustrar el uso de Excel en este tipo de diseño de experimentos, se muestra cómo probar si las medias de los grados de estrés de los controladores aéreos es la misma en los tres puestos de trabajo. Los valores de los grados de estrés de la tabla 13.5 se han ingresado en los renglones 2 a 7 de las columnas B, C y D de la hoja de cálculo, como se observa en la figura 13.8. En las celdas de los renglones 1 a 6 de la columna A se encuentra el número de cada controlador (1, 2, 3, 4, 5, 6). Con los pasos siguientes se obtienen los resultados de Excel y que corresponden a la tabla ANOVA de la tabla 13.8. Paso 1. Seleccionar el menú Herramientas Paso 2. Elegir Análisis de datos Paso 3. Elegir, de la lista Funciones para análisis, Análisis de varianza de dos factores con varias muestras por grupo Click en OK Paso 4. Cuando aparezca el cuadro de diálogo Análisis de varianza de dos factores sin varias muestras por grupo Ingresar A1:D7 en el cuadro Rango de entrada Seleccionar Rótulos Seleccionar Rango de salida e ingresar A9 en el cuadro Clic en OK
Experimento factorial En la sección 13.5 se mostró el uso del análisis de varianza para probar la igualdad de k medias poblacionales con los datos de un experimento factorial. Para ilustrar el uso de Excel en este tipo
13Ander(490-542).qxd 2/11/08 7:25 PM Page 541
Apéndice 13.2 FIGURA 13.8
541
Análisis de varianza con Excel
SOLUCIÓN DE EXCEL PARA LA PRUEBA DE ESTRÉS DE LOS CONTROLADORES AÉREOS A B C D E 1 Controller System A System B System C 2 1 15 15 18 3 2 14 14 14 4 3 10 11 15 5 4 13 12 17 6 5 16 13 16 7 6 13 13 13 8 9 Anova: Two-Factor Without Replication 10 11 SUMMARY Count Sum Average Variance 12 1 3 48 16 3 13 2 3 42 14 0 14 3 3 36 12 7 15 4 3 42 14 7 16 5 3 45 15 3 17 6 3 39 13 0 18 19 System A 6 81 13.5 4.3 20 System B 6 78 13 2 21 System C 6 93 15.5 3.5 22 23 24 25 26 27 28 29 30 31
archivo CD en GMAT
ANOVA Source of Variation Rows Columns Error Total
SS
df
MS
30 21 19
5 2 10
70
17
6 10.5 1.9
F
G
H
F P-value F crit 3.16 0.0574 3.33 5.53 0.0242 4.10
de diseño de experimentos, se muestra cómo analizar los datos del experimento de dos factores para el examen de admisión, presentado en esa sección. Las puntuaciones obtenidas en el examen de admisión, que se presentan en la tabla 13.10 se han ingresado en los renglones 2 a 7 de las columnas B, C y D de la hoja de cálculo como se observa en la figura 13.9. Con los pasos siguientes se muestran los resultados que se observan en las celdas A9:G44; la parte del ANOVA corresponde a la tabla de ANOVA de la figura 13.6. Paso 1. Seleccionar el menú Herramientas Paso 2. Elegir Análisis de datos Paso 3. Elegir, de la lista de Funciones para análisis, Análisis de varianza de dos factores con varias muestras por grupo Click en OK Paso 4. Cuando aparezca el cuadro de diálogo Análisis de varianza de dos factores con varias muestras por grupo: Ingresar A1:D7 en el cuadro Rango de entrada Ingresar 2 en el cuadro Fila por muestra Seleccionar Rango de salida e ingresar A9 en el cuadro correspondiente Click en OK
13Ander(490-542).qxd 2/11/08 7:25 PM Page 542
542
Capítulo 13
FIGURA 13.9
Diseño de experimentos y análisis de varianza
SOLUCIÓN DE EXCEL PARA EL EXPERIMENTO DE DOS FACTORES DEL EXAMEN DE ADMISIÓN
A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
B C D Business Engineering Arts and Sciences 500 540 480 580 460 400 460 560 420 540 620 480 560 600 480 600 580 410
3-hour review 1-day program 10-week course
E
F
G
Anova: Two-Factor With Replication SUMMARY
Business Engineering
Arts and Sciences
Total
3-hour review Count Sum Average Variance
2 1080 540 3200
2 1000 500 3200
2 6 880 2960 440 493.33333 3200 3946.6667
2 1000 500 3200
2 1180 590 1800
2 6 900 3080 450 513.33333 1800 5386.6667
2 1160 580 800
2 1180 590 200
2 6 890 3230 445 538.33333 2450 5936.6667
6 3240 540 2720
6 3360 560 3200
6 2670 445 1510
1-day program Count Sum Average Variance 10-week course Count Sum Average Variance Total Count Sum Average Variance
ANOVA Source of Variation Sample Columns Interaction Within
SS 6100 45300 11200 19850
Total
82450
df 2 2 4 9 17
MS
F
3050 22650 2800 2205.5556
1.38 10.27 1.27
P-value F crit 0.2994 4.26 0.0048 4.26 0.3503 3.63
H
14Ander(543-623).qxd 2/28/08 7:17 PM Page 543
CAPÍTULO
14
Regresión lineal simple CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: ALLIANCE DATA SYSTEMS 14.1 MODELO DE REGRESIÓN LINEAL SIMPLE Modelo de regresión y ecuación de regresión Ecuación de regresión estimada 14.2 MÉTODO DE MÍNIMOS CUADRADOS 14.3 COEFICIENTE DE DETERMINACIÓN Coeficiente de correlación 14.4 SUPOSICIONES DEL MODELO 14.5 PRUEBA DE SIGNIFICANCIA Estimación de σ 2 Prueba t Intervalo de confianza para β1 Prueba F Algunas advertencias acerca de la interpretación de las pruebas de significancia 14.6 USO DE LA ECUACIÓN DE REGRESIÓN ESTIMADA PARA ESTIMACIONES Y PREDICCIONES
Estimación puntual Estimación por intervalo Intervalo de confianza para el valor medio de y Intervalo de predicción para un solo valor de y 14.7 SOLUCIÓN POR COMPUTADORAS 14.8 ANÁLISIS RESIDUAL: CONFIRMACIÓN DE LAS SUPOSICIONES DEL MODELO Gráfica de residuales contra x Gráfica de residuales contra ŷ Residuales estandarizados Gráfica de probabilidad normal 14.9 ANÁLISIS DE RESIDUALES: OBSERVACIONES ATÍPICAS Y OBSERVACIONES INFLUYENTES Detección de observaciones atípicas Detección de observaciones influyentes
14Ander(543-623).qxd 2/28/08 7:17 PM Page 544
544
LA ESTADÍSTICA
Capítulo 14
Regresión lineal simple
en LA PRÁCTICA
ALLIANCE DATA SYSTEMS* DALLAS TEXAS
Alliance Data Systems (ADS), una empresa de la creciente industria de administración de la relación con el cliente (Customer Relationship Management, CRM) proporciona servicios de transacciones, crédito y mercadotecnia. Los clientes de ADS están concentrados en cuatro industrias: industria minorista, supermercados pequeños, derivados del petróleo/energía eléctrica y transporte. En 1983, Alliance empezó ofreciendo servicios extremo a extremo de tramitación de crédito para la industria minorista, la industria de derivados del petróleo y la industria de restaurantes de categoría media: actualmente ADS emplea a más de 6500 personas que proporcionan servicios a clientes en todo el mundo. ADS, sólo en Estados Unidos, opera más de 140 000 terminales de punto de venta, y procesa más de 2.5 miles de millones de transacciones anuales. En Estados Unidos ADS es la segunda empresa en servicios de crédito de establecimientos locales representando 49 programas de establecimientos locales con casi 72 millones de tarjetahabientes. En 2001, ADS hizo una oferta pública inicial y ahora cotiza en la bolsa de Nueva York. Uno de los servicios de mercadotecnia ofrecidos por ADS es el de campañas y publicidad directas por correo. La empresa posee una base de datos con información sobre los hábitos de consumo de más de 100 millones de consumidores, lo que le permite dirigir sus acciones a los consumidores que tienen la mayor probabilidad de beneficiarse de la publicidad por correo. El Grupo de desarrollo analítico de ADS emplea el análisis de regresión en la obtención de modelos para medir y predecir la receptividad del consumidor a las campañas de mercadotecnia directa. Algunos modelos de regresión predicen la probabilidad de compra de las personas que reciben la publicidad y otros predicen la cantidad que gastarán cuando realicen una compra. En una determinada campaña, una cadena de tiendas deseaba atraer a nuevos clientes. Para predecir el efecto de la campaña, los analistas de ADS tomaron de la base de datos una muestra de consumidores, les enviaron material promocional y después recogieron datos sobre la respuesta de los consumidores. Los datos recogidos se referían al monto de la compra realizada por los consumidores que respondieron a la campaña, así como a diversas variables específicas del consumidor, que se consideraron útiles para *Los autores agradecemos a Philip Clemance de Desarrollo analítico de Alliance Data Systems por proporcionarnos este artículo para La estadística en la práctica.
Analistas de ADS discuten sobre el uso del modelo de regresión para predecir las ventas en una campaña de comercialización directa. © Cortesía de Alliance Data Systems.
predecir las ventas. La variable del consumidor que más contribuyó a predecir el monto de compra fue la cantidad total de compras a crédito realizadas en tiendas semejan-
tes en los últimos 39 meses. Los analistas de ADS obtuvieron una ecuación de regresión estimada con la que se relacionaba el monto de compra con la cantidad gastada en tiendas semejantes: ŷ 26.7 0.00205x donde
ŷ monto de compra x monto gastado en tiendas similares Con esta ecuación, pudieron predecir que una persona que hubiera gastado $10 000 en tiendas semejantes en los últimos 39 meses, gastaría $47.20 como respuesta a la publicidad directa por correo. En este capítulo se verá cómo obtener estas ecuaciones de regresión estimada. En el modelo final que obtuvieron los analistas de ADS también participaban algunas otras variables que incrementaban el poder predictivo de la ecuación de predicción. Entre estas variables se encontraba la existencia o no de una tarjeta de crédito, el ingreso estimado, y la cantidad promedio gastada en cada visita a la tienda seleccionada. En el capítulo siguiente se verá cómo incorporar estas variables adicionales a un modelo de regresión múltiple.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 545
14.1
Sir Francis Galton (1822-1911) fue el primero en emplear los métodos estadísticos para estudiar la relación entre dos variables. Galton estaba interesado en estudiar la relación entre la estatura de padre e hijo. Karl Pearson (18571936) analizó esta relación en 1078 pares de padrehijo.
14.1
Modelo de regresión lineal simple
545
En la administración, las decisiones suelen basarse en la relación entre dos o más variables. Por ejemplo, observar la relación entre el gasto en publicidad y las ventas puede permitir a un gerente de mercadotecnia tratar de predecir las ventas correspondientes a un determinado gasto en publicidad. O, una empresa de servicios públicos puede emplear la relación entre la temperatura diaria y la demanda de electricidad para predecir la demanda de electricidad considerando las temperaturas diarias que se esperan el mes siguiente. Algunas veces los directivos se apoyan en la intuición para juzgar la relación entre dos variables. Sin embargo, cuando es posible tener datos, puede emplearse un procedimiento estadístico llamado análisis de regresión para obtener una ecuación que indique cuál es la relación entre las variables. En la terminología que se emplea en regresión, a la variable que se va a predecir se le llama variable dependiente. A la variable o variables que se usan para predecir el valor de la variable dependiente se les llama variables independientes. Por ejemplo, al analizar el efecto de los gastos en publicidad sobre las ventas, como lo que busca el gerente de mercadotecnia es predecir las ventas, esto indica que las ventas serán la variable dependiente. En este capítulo se estudia el tipo más sencillo de análisis de regresión en el que interviene una variable independiente y una variable dependiente y en el que la relación entre estas variables es aproximada mediante una línea recta. A este tipo de análisis de regresión se le conoce como regresión lineal simple. Al análisis de regresión en el que intervienen dos o más variables independientes se le llama análisis de regresión múltiple; el análisis de regresión múltiple y los casos en los que la relación es curvilínea se estudian en los capítulos 15 y 16.
Modelo de regresión lineal simple Armand’s Pizza Parlors es una cadena de restaurantes de comida italiana. Sus mejores ubicaciones son las que se encuentran cerca de los campus de las universidades. Los gerentes creen que las ventas trimestrales de estos restaurantes (que se denotan por y) están directamente relacionadas con el tamaño de la población estudiantil (que se denota x); es decir, en los restaurantes que están cerca de campus que tienen una población estudiantil grande se generan más ventas que en los restaurantes situados cerca de campus con una población estudiantil pequeña. Empleando el análisis de regresión, se puede obtener una ecuación que muestre cuál es la relación entre la variable dependiente y y la variable dependiente x.
Modelo de regresión y ecuación de regresión En el ejemplo de los restaurantes Armand’s Pizza Parlors, la población consta de todos los restaurantes Armand. Para cada restaurante de la población, hay un valor x (población estudiantil) y un correspondiente valor y (ventas trimestrales). A la ecuación con que se describe cómo se relaciona y con x y en la que se da un término para el error, se le llama modelo de regresión. El siguiente es el modelo que se emplea en la regresión lineal simple.
MODELO DE REGRESIÓN LINEAL SIMPLE
y β0 β1x
(14.1)
β0 y β1 se conocen como los parámetros del modelo, y (la letra griega épsilón) es una variable aleatoria que se conoce como término del error. El término del error da cuenta de la variabilidad de y que no puede ser explicada por la relación lineal entre x y y.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 546
546
Capítulo 14
Regresión lineal simple
La población de los restaurantes Armand’s puede verse también como una colección de subpoblaciones, una para cada uno de los valores de x. Por ejemplo, una subpoblación está formada por todos los campus universitarios de 8000 estudiantes; otra subpoblación consta de todos los restaurantes Armand’s localizados cerca de los campus universitarios de 9000 estudiantes; etc. Para cada subpoblación hay una distribución de valores y. Así, hay una distribución de valores y que corresponde a los restaurantes localizados cerca de los campus de 8000 estudiantes; hay otra distribución de valores y que corresponde a los restaurantes ubicados cerca de los campus de 9000 estudiantes, y así sucesivamente. Cada una de estas distribuciones de valores y tiene su propia media o valor esperado. A la ecuación que describe la relación entre el valor esperado de y, que se denota E(x), y x se le llama ecuación de regresión. La siguiente es la ecuación de regresión para la regresión lineal simple.
ECUACIÓN DE REGRESIÓN LINEAL SIMPLE
E( y) β0 β1x
(14.2)
La gráfica de la ecuación de regresión lineal simple es una línea recta; β0 es la intersección de la recta de regresión con el eje y, β1 es la pendiente y E(y) es la media o valor esperado de y para un valor dado de x. En la figura 14.1 se presentan ejemplos de posibles rectas de regresión. La recta de regresión de la gráfica A indica que el valor medio de y está relacionado positivamente con x. La recta de regresión de la gráfica B indica que el valor medio de y está relacionado negativamente con x, valores menores de E(y) corresponden a valores mayores de x. La recta de regresión de la gráfica C muestra el caso en el que el valor medio de y no está relacionado con x; es decir, el valor medio de y es el mismo para todos los valores de x.
Ecuación de regresión estimada Si se conocieran los valores de los parámetros poblacionales β0 y β1, se podría emplear la ecuación (14.2) para calcular el valor medio de y para un valor dado de x. Sin embargo, en la práctica no se conocen los valores de estos parámetros y es necesario estimarlos usando datos muestrales. Se calculan estadísticos muestrales (que se denotan b0 y b1) como estimaciones de los parámetros poblacionales β0 y β1. Sustituyendo en la ecuación de regresión b0 y b1 por los
FIGURA14.1
EJEMPLOS DE LÍNEAS DE REGRESIÓN EN LA REGRESIÓN LINEAL SIMPLE Gráfica A: Relación lineal positiva
Gráfica B: Relación lineal negativa
E(y)
E(y)
Recta de regresión
Intersección
Gráfica C: No hay relación E(y)
Intersección La pendiente es negativa
Intersección
La pendiente es positiva
La pendiente es cero Recta de regresión
Recta de regresión x
x
14Ander(543-623).qxd 2/28/08 7:17 PM Page 547
14.1
547
Modelo de regresión lineal simple
valores de los estadísticos muestrales β0 y β1, se obtiene la ecuación de regresión estimada. La ecuación de regresión estimada de la regresión lineal simple se da a continuación.
ECUACIÓN DE REGRESIÓN LINEAL SIMPLE ESTIMADA
ŷ b0 b1x
(14.3)
A la gráfica de la ecuación de regresión simple estimada se le llama recta de regresión estimada; b0 es la intersección con el eje y y b1 es la pendiente. En la sección siguiente se muestra el uso del método de mínimos cuadrados para calcular los valores de b0 y b1 para la ecuación de regresión estimada. En general, ŷ es el estimador puntual de E(y), el valor medio de las y para un valor dado de x. Por lo tanto, para estimar la media o el valor esperado de las ventas trimestrales de todos los restaurantes situados cerca de los campus de 10 000 estudiantes, Armad’s tendrá que sustituir en la ecuación (14.3) x por 10 000. pero, en algunos casos, a Armand’s lo que le interesará será predecir las ventas de un determinado restaurante. Por ejemplo, supóngase que Armand’s desee predecir las ventas trimestrales del restaurante que se encuentra cerca de Talbot Collage, una escuela de 10 000 estudiantes. Resulta que la mejor estimación de la y que corresponde a un determinado valor de x es también la proporcionada por ŷ. Por lo tanto, para predecir las ventas trimestrales del restaurante ubicado cerca de Talbot Collage, Armad’s también sustituirá la x de la ecuación (14.3) por 10 000. Como el valor de ŷ proporciona tanto una estimación puntual de E(x) para un valor dado de x como una estimación puntual de un solo valor de y para un valor dado de x, a ŷ se le llamará simplemente valor estimado de y. En la figura 14.2 se presenta en forma resumida el proceso de estimación en la regresión lineal simple.
FIGURA 14.2
La estimación de β0 y β1 es un proceso estadístico muy parecido a la estimación de que se vio en el capítulo 7. β0 y β1 son los parámetros de interés que son desconocidos, y b0 y b1 son los estadísticos muestrales que se usan para estimar los parámetros.
PROCESO DE ESTIMACIÓN EN LA REGRESIÓN LINEAL SIMPLE
Modelo de regresión
Datos muestrales
Ecuación de regresión Parámetros desconocidos
y
Ecuación de regresión estimada
son las estimaciones de y
Estadísticos muestrales
14Ander(543-623).qxd 2/28/08 7:17 PM Page 548
548
Capítulo 14
Regresión lineal simple
NOTAS Y COMENTARIOS 1. El análisis de regresión no puede entenderse como un procedimiento para establecer una relación de causa y efecto entre las variables. Este procedimiento sólo indica cómo o en qué medida las variables están relacionadas una con otra. Conclusiones acerca de una relación causa y efecto deben basarse en los conocimientos de los especialistas en la aplicación de que se trate.
14.2 En la regresión lineal simple, cada observación consta de dos valores: uno de la variable independiente y otro de la variable dependiente.
Método de mínimos cuadrados El método de mínimos cuadrados es un método en el que se usan los datos muestrales para hallar la ecuación de regresión estimada. Para ilustrar el método de mínimos cuadrados, supóngase que se recolectan datos de una muestra de 10 restaurantes Armand’s Pizza Parlors ubicados todos cerca de campus universitarios. Para la observación i o el restaurante i de la muestra, xi es el tamaño de la población de estudiantes (en miles) en el campus y yi son las ventas trimestrales (en miles de dólares). En la tabla 14.1 se presentan los valores de xi y yi en esta muestra de 10 restaurantes. Como se ve, el restaurante 1, para el que x1 2 y y1 58, está cerca de un campus de 2000 estudiantes y sus ventas trimestrales son de $58 000. El restaurante 2, para el que x2 6 y y2 105, está cerca de un campus de 6000 estudiantes y sus ventas trimestrales son de $105 000. El valor mayor es el que corresponde a ventas del restaurante 10, el cual está cerca de un campus de 26 000 estudiantes y sus ventas trimestrales son de $202 000. La figura 14.3 es el diagrama de dispersión de los datos de la tabla 14.1. La población de estudiantes se indica en el eje horizontal y las ventas trimestrales en el eje vertical. Los diagramas de dispersión para el análisis de regresión se trazan colocando la variable independiente x en el eje horizontal y la variable dependiente y en el eje vertical. El diagrama de dispersión permite observar gráficamente los datos y obtener conclusiones acerca de la relación entre las variables. ¿Qué conclusión preliminar se puede obtener de la figura 14.3? Las ventas trimestrales parecen ser mayores cerca de campus en los que la población de estudiantes es mayor. Además, en estos datos se observa que la relación entre el tamaño de la población de estudiantes y las ventas trimestrales parece poder aproximarse mediante una línea recta; en efecto, se observa que hay TABLA 14.1
archivo CD en Armand’s
2. La ecuación de regresión en la regresión lineal simple es E( y) β0 β1 x. En libros más avanzados sobre análisis de regresión se suele escribir la ecuación de regresión como E( yⱍx) β0 β1x enfatizando así que lo que proporciona esta ecuación es el valor medio de las y para un valor dado de x.
POBLACIÓN DE ESTUDIANTES Y VENTAS TRIMESTRALES EN 10 RESTAURANTES ARMAND’S PIZZA PARLORS
Restaurante i
Población de estudiantes (miles) xi
Ventas trimestrales (miles de $) yi
1 2 3 4 5 6 7 8 9 10
2 6 8 8 12 16 20 20 22 26
58 105 88 118 117 137 157 169 149 202
14Ander(543-623).qxd 2/28/08 7:17 PM Page 549
14.2
549
Método de mínimos cuadrados
FIGURA 14.3
DIAGRAMA DE DISPERSIÓN EN EL QUE SE MUESTRA LA POBLACIÓN DE ESTUDIANTES Y LAS VENTAS TRIMESTRALES DE ARMAND’S PIZZA PARLORS y 220
Ventas trimestrales (miles de $)
200 180 160 140 120 100 80 60 40 20 0
2
4
6
8
10 12 14 16 18 20 22 24 26
x
Población de estudiantes (miles)
una relación lineal positiva entre x y y. Por tanto, para representar la relación entre ventas trimestrales y la población de estudiantes, se elige el modelo de regresión lineal simple. Decidido esto, la tarea siguiente es usar los datos muestrales de la tabla 14.1 para determinar los valores de b0 y b1 en la ecuación de regresión lineal simple. Para el restaurante i, la ecuación de regresión simple estimada es ŷi b0 b1xi
(14.4)
donde ŷi valor estimado de las ventas trimestrales (en miles de dólares) del restaurante i b0 intersección de la recta de regresión con el eje y b1 pendiente de la recta de regresión x i tamaño de la población de estudiantes (en miles) del restaurante i Como para el restaurante i, yi denota ventas observadas (reales) y ŷi denota ventas estimadas mediante la ecuación (14.4), para cada uno de los restaurantes de la muestra habrá un valor de ventas observadas yi y un valor de ventas estimadas ŷi . Para que la recta de regresión estimada proporcione un buen ajuste a los datos, las diferencias entre los valores observados y los valores estimados deben ser pequeñas. En el método de mínimos cuadrados se usan los datos muestrales para obtener los valores de b0 y b1 que minimicen la suma de los cuadrados de las desviaciones (diferencias) entre los valores observados de la variable dependiente yi y los valores estimados de la variable dependiente. El criterio que se emplea en el método de mínimos cuadrados es el de la expresión (14.5).
14Ander(543-623).qxd 2/28/08 7:17 PM Page 550
550
Capítulo 14
Regresión lineal simple
CRITERIO DE MÍNIMOS CUADRADOS Carl Friedrich Gauss (1777- 1855) fue quien propuso el método de mínimos cuadrados.
min 兺( yi ŷi )2
(14.5)
donde yi valor observado de la variable dependiente en la observación i ŷi valor estimado de la variable independiente en la observación i
Se puede usar cálculos diferenciales para demostrar (véase apéndice 14.1) que los valores de b0 y b1 que minimiza la expresión (14.5) se pueden encontrar usando las ecuaciones (14.6) y (14.7).
PENDIENTE E INTERSECCIÓN CON EL EJE y DE LA ECUACIÓN DE REGRESIÓN ESTIMADA* Al calcular b1 con una calculadora, en los cálculos intermedios deben llevarse tantas cifras significativas como sea posible. Se recomienda llevar por lo menos cuatro cifras significativas
b1
兺 (xi x̄)( yi ȳ) 兺 (xi x̄)2
(14.6)
b0 ȳ b1x̄
(14.7)
donde xi yi x̄ ȳ n
valor de la variable independiente en la observación i valor de la variable dependiente en la observación i media de la variable independiente media de la variable dependiente número total de observaciones
En la tabla 14.2 se presentan los cálculos necesarios para obtener la ecuación de regresión estimada en el ejemplo de Armand’s Pizza Parlors. Como la muestra es de 10 restaurantes, tenemos 10 observaciones. Dado que en las ecuaciones (14.6) y (14.7) se necesitan x̄ y ȳ, se empieza por calcular x̄ y ȳ. 兺 xi 140 14 n 10 兺 yi 1300 ȳ 130 n 10
x̄
Usando las ecuaciones (14.6) y (14.7) y la información de la tabla 14.2, se calcula la pendiente y la intersección con el eje y de la ecuación de regresión de Armand’s Pizza Parlors. La pendiente (b1) se calcula como sigue.
*Otra fórmula de calcular b1, es b1
兺xi yi (兺xi 兺yi )兾n 兺x 2i (兺xi )2兾n
Esta forma de la ecuación (14.6) suele recomendarse cuando se emplea una calculadora para calcular b1.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 551
14.2
551
Método de mínimos cuadrados
TABLA 14.2
ECUACIÓN DE REGRESIÓN ESTIMADA PARA ARMAND’S PIZZA PARLORS OBTENIDA POR EL MÉTODO DE MÍNIMOS CUADRADOS
Restaurante i
xi
yi
xi ⴚ x̄
yi ⴚ ȳ
(xi ⴚ x̄)( yi ⴚ ȳ)
(xi ⴚ x̄)2
1 2 3 4 5 6 7 8 9 10
2 6 8 8 12 16 20 20 22 26
58 105 88 118 117 137 157 169 149 202
12 8 6 6 2 2 6 6 8 12
72 25 42 12 13 7 27 39 19 72
864 200 252 72 26 14 162 234 152 864
144 64 36 36 4 4 36 36 64 144
Totales
140
1300
2840
568
兺xi
兺yi
兺(xi x̄)( yi ȳ)
兺(xi x̄)2
兺(xi x̄)( yi ȳ) 兺(xi x̄)2 2840 568 5
b1
La intersección con el eje y (b0) se calcula como sigue. b0 ȳ b1x̄ 130 5(14) 60 Por lo tanto, la ecuación de regresión estimada es ŷ 60 5x
Debe tenerse mucho cuidado al usar la ecuación de regresión estimada para hacer predicciones fuera del rango de valores de la variable independiente, ya que fuera de ese rango no puede asegurarse que esta relación sea válida.
En la figura 14.4 se muestra esta ecuación graficada sobre el diagrama de dispersión. La pendiente de la ecuación de regresión estimada (b1 = 5) es positiva, lo que implica que a medida que aumenta el tamaño de la población de estudiantes, aumentan las ventas. Se concluye (basándose en las ventas dadas en miles de $ y en el tamaño de la población de estudiantes en miles) que un aumento de 1000 en el tamaño de la población de estudiantes corresponde a un aumento esperado de $5000 en las ventas; es decir, se espera que las ventas trimestrales aumenten $5 por cada aumento de un estudiante. Si se considera que la ecuación de regresión estimada obtenida por el método de mínimos cuadrados describe adecuadamente la relación entre x y y, parecerá razonable usar esta ecuación de regresión estimada para estimar el valor de y para un valor dado de x. Por ejemplo, si se quisieran predecir las ventas trimestrales de un restaurante ubicado cerca de un campus de 16 000 estudiantes, se calcularía ŷ 60 5(16) 140 De manera que las ventas trimestrales pronosticadas para este restaurante serían de $140 000. En la sección siguiente se verán los métodos para evaluar el uso correcto de la ecuación de regresión para hacer estimaciones y predicciones.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 552
552
Capítulo 14
FIGURA 14.4
Regresión lineal simple
GRÁFICA DE LA ECUACIÓN DE REGRESIÓN ESTIMADA DE ARMAND’S PIZZA PARLORS: ŷ 60 5x y 220
Ventas trimestrales (miles de $)
200
Intersección con el eje y b0 = 60
180 160
x
140
^y
0 =6
+5
120
Pendiente b1 = 5
100 80 60 40 20 0
2
4
6
8
10 12 14 16 18 20 22 24 26
x
Población de estudiantes (miles)
NOTAS Y COMENTARIOS El método de mínimos cuadrados proporciona una ecuación de regresión estimada que minimiza la suma de los cuadrados de las desviaciones entre los valores observados de la variable dependiente yi y los valores estimados de la variable dependiente ŷi . El criterio de mínimos cuadrados permite obtener la
ecuación de mejor ajuste. Si se empleara otro criterio, como minimizar la suma de las desviaciones absolutas entre yi y ŷi , se obtendría una ecuación diferente. En la práctica el método de mínimos cuadrados es el método más usado.
Ejercicios
Método
Auto examen
1. Dadas las siguientes cinco observaciones de las variables x y y.
a. b.
xi
1
2
3
4
5
yi
3
7
5
11
14
Trace el diagrama de dispersión correspondiente a estos datos. ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre las dos variables?
14Ander(543-623).qxd 2/28/08 7:17 PM Page 553
14.2
553
Método de mínimos cuadrados
c. d. e.
Trate de aproximar la relación entre x y y trazando una línea recta que pase a través de los puntos de los datos. Con las ecuaciones (14.6) y (14.7) calcule b0 y b1 para obtener la ecuación de regresión estimada. Use la ecuación de regresión estimada para predecir el valor de y cuando x = 4.
2. Dadas las siguientes cinco observaciones de las variables x y y.
a. b. c. d. e.
xi
3
12
6
20
14
yi
55
40
55
10
15
Trace, con estos datos, el diagrama de dispersión. ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre las dos variables? Trate de aproximar la relación entre x y y trazando una línea recta a través de los puntos de los datos. Con las ecuaciones (14.6) y (14.7) calcule b0 y b1, para obtener la ecuación de regresión estimada. Use la ecuación de regresión estimada para predecir el valor de y cuando x = 4.
3. Dadas las observaciones siguientes sobre estas dos variables obtenidas en un estudio de regresión.
a. b. c.
xi
2
6
9
13
20
yi
7
18
9
26
23
Con estos datos trace el diagrama de dispersión. Obtenga la ecuación de regresión estimada correspondiente a estos datos. Use la ecuación de regresión estimada para predecir el valor de y cuando x = 4.
Aplicaciones
Auto examen
4. Los datos siguientes son estaturas y pesos de nadadoras. Estatura Peso a. b. c. d. e.
68
64
62
65
66
132
108
102
115
128
Trace el diagrama de dispersión de estos datos usando la estatura como variable independiente. ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre las dos variables? Trate de aproximar la relación entre estatura y peso trazando una línea recta a través de los puntos de los datos. Obtenga la ecuación de regresión estimada calculando b0 y b1 Si la estatura de una nadadora es 63 pulgadas, ¿cuál será su peso estimado?
5. Los adelantos tecnológicos han hecho posible fabricar botes inflables. Estos botes de goma inflables, que pueden enrollarse formando un paquete no mayor que una bolsa de golf, tienen tamaño suficiente para dos pasajeros con su equipo de excursionismo. La revista Canoe & Kayac probó los botes de nueve fabricantes para ver su funcionamiento en un recorrido de tres días. Uno de los criterios de evaluación fue su capacidad para equipaje que se evaluó utilizando una escala de 4 puntos, siendo 1 la puntuación más baja y 4 la puntuación más alta. Los datos siguientes muestran la evaluación que obtuvieron respecto a capacidad para equipaje y los precios de los botes (Canoe Kayak, marzo 2003).
14Ander(543-623).qxd 2/28/08 7:17 PM Page 554
554
Capítulo 14
Regresión lineal simple
Bote S14 Orinoco Outside Pro Explorer 380X River XK2 Sea Tiger Maverik II Starlite 100 Fat Pack Cat
archivo CD en Boats
a. b. c. d. e. f.
Capacidad para equipaje
Precio ($)
4 4 4 3 2.5 4 3 2 3
1595 1399 1890 795 600 1995 1205 583 1048
Trace el diagrama de dispersión de estos datos empleando la capacidad para equipaje como variable independiente. ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre capacidad para equipaje y precio? A través de los puntos de los datos trace una línea recta para aproximar la relación lineal entre capacidad para equipaje y precio. Utilice el método de mínimos cuadrados para obtener la ecuación de regresión estimada. Dé una interpretación de la pendiente de la ecuación de regresión estimada. Diga cuál será el precio de un bote que tenga 3 en la evaluación de su capacidad para equipaje.
6. Wageweb realiza estudios sobre datos salariales y presenta resúmenes de éstos en su sitio de la Red. Basándose en datos salariales desde el 1 de octubre de 2002 Wageweb publicó que el salario anual promedio de los vicepresidentes de ventas era $142 111 con una gratificación anual promedio de $15 432 (Wageweb.com, 13 de mazo de 2003). Suponga que los datos siguientes sean una muestra de salarios y bonos anuales de 10 vicepresidentes de ventas. Los datos se dan en miles de dólares.
archivo CD en VPSalary
a. b. c. d. e.
Vicepresidente
Salario
Gratificación
1 2 3 4 5 6 7 8 9 10
135 115 146 167 165 176 98 136 163 119
12 14 16 19 22 24 7 17 18 11
Trace un diagrama de dispersión con estos datos tomando como variable independiente los salarios. ¿Qué indica el diagrama de dispersión del inciso a) acerca de la relación entre salario y gratificación? Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada. Dé una interpretación de la ecuación de regresión estimada. ¿Cuál será la gratificación de un vicepresidente que tenga un salario anual de $120 000?
7. ¿Esperaría que los automóviles más confiables fueran los más caros? Consumer Reports evaluó 15 de los mejores automóviles sedán. La confiabilidad se evaluó con una escala de 5 puntos: mala (1), regular (2), buena (3), muy buena (4) y excelente (5). Los precios y la evaluación sobre la confiabilidad de estos 15 automóviles se presenta en la tabla siguiente (Consumer Reports, febrero de 2004).
14Ander(543-623).qxd 2/28/08 7:17 PM Page 555
14.2
555
Método de mínimos cuadrados
Marca y modelo Acura TL BMW 330i Lexus IS300 Lexus ES330 Mercedes-Benz C320 Lincoln LS Premium (V6) Audi A4 3.0 Quattro Cadillac CTS Nissan Maxima 3.5 SE Infiniti I35 Saab 9-3 Aero Infiniti G35 Jaguar X-Type 3.0 Saab 9-5 Arc Volvo S60 2.5T
archivo CD en Cars
a. b. c. d.
Confiabilidad
Precio ($)
4 3 5 5 1 3 2 1 4 5 3 4 1 3 3
33 150 40 570 35 105 35 174 42 230 38 225 37 605 37 695 34 390 33 845 36 910 34 695 37 995 36 955 33 890
Trace un diagrama de dispersión con estos datos tomando como variable independiente las evaluaciones de confiabilidad. Dé la ecuación de regresión obtenida por el método de mínimos cuadrados. De acuerdo con este análisis, ¿cree usted que los automóviles más confiables sean más caros? Estime el precio de un automóvil sedán cuya evaluación de confiabilidad sea 4.
8. Las bicicletas de montaña que actualmente cuestan menos de $1000 tienen muchos de los componentes de alta calidad que hasta hace poco sólo tenían los modelos de alta calidad. Hoy, incluso modelos de menos de $1000 suelen ofrecer suspensión flexible, pedales clipless y cuadro muy bien diseñado. Una cuestión interesante es si precios más altos corresponden a mayor facilidad de manejo, medida a través del agarre lateral de la bicicleta. Para medir el agarre lateral, Outside Magazine empleó una escala de evaluación del 1 al 5, en la que el 1 correspondía a mala y 5 a promedio. A continuación se presenta el agarre lateral y los precios de 10 bicicletas de montaña probadas por Outside Magazine (Outside Magazine Buyer’s Guide, 2001)
Fabricante y modelo
archivo CD en MtnBikes
Raleigh M80 Marin Bear Valley Feminina GT Avalanche 2.0 Kona Jake the Snake Schwinn Moab 2 Giant XTC NRS 3 Fisher Paragon Genesisters Jamis Dakota XC Trek Fuel 90 Specialized Stumpjumper M4
a. b. c. d.
Agarre lateral
Precio ($)
1 1 2 1 3 4 4 3 5 4
600 649 799 899 950 1100 1149 1300 1550 1625
Trace un diagrama de dispersión con estos datos tomando como variable independiente el agarre lateral. ¿Parecen indicar estos datos que los modelos más caros sean de más fácil manejo? Explique. Dé la ecuación de regresión estimada obtenida por el método de mínimos cuadrados. ¿Cuál es el precio estimado de una bicicleta de montaña cuyo agarre lateral tenga una evaluación de 4?
14Ander(543-623).qxd 2/28/08 7:17 PM Page 556
556
Capítulo 14
Regresión lineal simple
9. Un gerente de ventas recolectó los datos siguientes sobre ventas anuales y años de experiencia.
archivo CD en Sales
a. b. c.
Vendedor
Años de experiencia
Ventas anuales (miles de $)
1 2 3 4 5 6 7 8 9 10
1 3 4 4 6 8 10 10 11 13
80 97 92 102 103 111 119 123 117 136
Elabore un diagrama de dispersión con estos datos, en el que la variable independiente sean los años de experiencia. Dé la ecuación de regresión estimada que puede emplearse para predecir las ventas anuales cuando se conocen los años de experiencia. Use la ecuación de regresión estimada para pronosticar las ventas anuales de un vendedor de 9 años de experiencia.
10. Bergans of Norway ha estado fabricando equipo para excursionismo desde 1908. En los datos que se presentan en la tabla siguiente se da la temperatura (°F) y el precio ($) de 11 modelos de sacos de dormir fabricados por Bergans (Backpacker 2006 Gear Guide)
Modelo Ranger 3-Seasons Ranger Spring Ranger Winter Rondane 3-Seasons Rondane Summer Rondane Winter Senja Ice Senja Snow Senja Zero Super Light Tight & Light
archivo CD en SleepingBags
a. b. c. d.
Temperatura
Precio
12 24 3 13 38 4 5 15 25 45 25
319 289 389 239 149 289 359 259 229 129 199
Trace un diagrama de dispersión con estos datos, en el que la variable independiente sea la temperatura (°F). ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre temperatura y precio? Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada. Prediga cuál será el precio de un saco de dormir si el índice de temperatura (°F) es 20.
11. Aunque actualmente en los aeropuertos grandes los retrasos son menos frecuentes, es útil saber en qué aeropuertos es más probable que le echen a perder a uno sus planes. Además, si su vuelo llega con retraso a un determinado aeropuerto en el que tiene que hacer un trasbordo, ¿cuál es la probabilidad de que se retrase la salida y que pueda hacer así el trasbordo? En la tabla siguiente se muestra el porcentaje de llegadas y salidas retrasadas durante el mes de agosto en 13 aeropuertos (Business 2.0, febrero 2002).
14Ander(543-623).qxd 2/28/08 7:17 PM Page 557
14.2
557
Método de mínimos cuadrados
Aeropuerto
Llegadas retrasadas (%)
Salidas retrasadas (%)
24 20 30 20 20 23 18 20 18 21 25 18 16
22 20 29 19 22 23 19 16 18 22 22 17 16
Atlanta Charlotte Chicago Cincinnati Dallas Denver Detroit Houston Minneapolis Phoenix Pittsburgh Salt Lake City St. Louis
archivo CD en Airport
a. b. c. d. e.
Trace un diagrama de dispersión con estos datos, en el que la variable independiente sean las llegadas retrasadas. ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre llegadas retrasadas y salidas retrasadas? Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada. ¿Cómo se debe interpretar la pendiente de la ecuación de regresión estimada? Suponga que en el aeropuerto de Filadelfia hubo 22% de llegadas retrasadas. ¿Cuál es el porcentaje estimado de salidas retrasadas?
12. Una moto acuática personal (personal watercraft, PWC) es una embarcación a motor dentro de borda diseñada para ser conducida por una persona sentada, de pie o arrodillada. Al principio de los años 80, Kawasaki Motors Corp. USA introdujo la moto acuática JET SKI©, la primera moto acuática comercial. Hoy jet ski se usa como término genérico para motos acuáticas personales. En la tabla siguiente se dan pesos (redondeados a la decena de libra más cercana) y precios (redondeados a los 50 dólares más cercanos) de 10 motos acuáticas personales de tres plazas (www.jetskinews.com, 2006).
Fabricante y modelo Honda AquaTrax F-12 Honda AquaTrax F-12X Honda AquaTrax F-12X GPScape Kawasaki STX-12F Jetski Yamaha FX Cruiser Waverunner Yamaha FX High Output Waverunner Yamaha FX Waverunner Yamaha VX110 Deluxe Waverunner Yamaha VX110 Sport Waverunner Yamaha XLT1200 Waverunner
archivo CD en JetSki
a. b. c. d. e.
Peso (lb)
Precio ($)
750 790 800 740 830 770 830 720 720 780
9 500 10 500 11 200 8 500 10 000 10 000 9 300 7 700 7 000 8 500
Trace el diagrama de dispersión correspondiente a estos datos, empleando el peso como variable independiente. ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre peso y precio? Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada. Indique cuál será el precio de una moto acuática de tres plazas cuyo peso sea 750 libras. La Honda Aqua Trax F-12 pesa 750 libras y su precio es $9500. ¿No debería ser el precio pronosticado en el inciso d) también de $950?
14Ander(543-623).qxd 2/28/08 7:17 PM Page 558
558
Capítulo 14
f.
Regresión lineal simple
La Jetski Kawasaki SX-R 800 tiene asiento para una persona y pesa 350 libras. ¿Cree usted que la ecuación de regresión estimada obtenida en el inciso c) deba emplearse para predecir su precio?
13. Para la Dirección general de impuestos internos de Estados Unidos el que las deducciones parezcan razonables depende del ingreso bruto ajustado del contribuyente. Deducciones grandes que comprenden deducciones por donaciones de caridad o por atención médica son más probables en contribuyentes que tengan un ingreso bruto ajustado grande. Si las deducciones de un contribuyente son mayores que las correspondientes a un determinado nivel de ingresos, aumentan las posibilidades de que se le realice una auditoría.
a. b. c.
Ingreso bruto ajustado (miles de $)
Monto razonable de las deducciones (miles de $)
22 27 32 48 65 85 120
9.6 9.6 10.1 11.1 13.5 17.7 25.5
Trace un diagrama de dispersión con estos datos empleando como variable independiente el ingreso bruto ajustado. Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada Si el ingreso bruto ajustado de un contribuyente es $52 500, estime el monto razonable de deducciones. Si el contribuyente tiene deducciones por $20 400, ¿estará justificada una auditoría? Explique.
14. Los salarios iniciales de contadores y auditores en Rochester, Nueva York, corresponden a los de muchos ciudadanos de Estados Unidos. En la tabla siguiente se presentan salarios iniciales (en miles de dólares) y el índice del costo de vida en Rochester y en otras nueve zonas metropolitanas (Democrat and Chronicle, 1 de septiembre de 2002).
archivo CD en Salaries
a. b. c.
Área metropolitana
Índice
Salario (miles de $)
Oklahoma City Tampa/St. Petersburg/Clearwater Indianapolis Buffalo/Niagara Falls Atlanta Rochester Sacramento Raleigh/Durham/Chapel Hill San Diego Honolulu
82.44 79.89 55.53 41.36 39.38 28.05 25.50 13.32 3.12 0.57
23.9 24.5 27.4 27.7 27.1 25.6 28.7 26.7 27.8 28.3
Elabore un diagrama de dispersión con estos datos empleando como variable independiente el índice del costo de vida. Obtenga la ecuación de regresión para relacionar el índice del costo de vida con el salario inicial. Estime el salario inicial en una zona metropolitana en la que el índice del costo de vida es 50.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 559
14.3
14.3
559
Coeficiente de determinación
Coeficiente de determinación En el ejemplo de Armand Pizza Parlors para aproximar la relación lineal entre el tamaño de la población de estudiantes x y las ventas trimestrales y se obtuvo la ecuación de regresión estimada ŷ 60 5x. Ahora la pregunta es: ¿qué tan bien se ajusta a los datos la ecuación de regresión estimada? En esta sección se muestra que una medida de la bondad de ajuste de la ecuación de regresión estimada (lo bien que se ajusta la ecuación a los datos) es el coeficiente de determinación. A la diferencia que existe, en la observación i, entre el valor observado de la variable dependiente yi, y el valor estimado de la variable dependiente ŷi , se le llama residual i. El residual i representa el error que existe al usar ŷi para estimar yi. Por lo tanto, para la observación i, el residual es yi ŷi . La suma de los cuadrados de estos residuales o errores es la cantidad que se minimiza empleando el método de los mínimos cuadrados. Esta cantidad, también conocida como suma de cuadrados debida al error, se denota por SCE. SUMA DE CUADRADOS DEBIDA AL ERROR
SCE 兺( yi ŷi )2
(14.8)
El valor de SCE es una medida del error al utilizar la ecuación de regresión estimada para estimar los valores de la variable dependiente en los elementos de la muestra. En la tabla 14.3 se muestran los cálculos que se requieren para calcular la suma de cuadrados debida al error en el ejemplo de Armand´s Pizza Parlors. Por ejemplo, los valores de las variables independiente y dependiente para/del restaurante 1 son x1 = 2 y y1 = 58. El valor estimado para las ventas trimestrales del restaurante 1 obtenido con la ecuación de regresión estimada es ŷ1 60 5(2) 70. Por lo tanto, para el restaurante 1, el error al usar ŷ1 para estimar y1 es y1 ŷ1 58 70 12. El error elevado al cuadrado, ( 12)2 144, aparece en la última columna de la tabla 14.3. Después de calcular y elevar al cuadrado los residuales de cada uno de los restaurantes de la muestra, se suman y se obtiene que SCE 1530. Por lo tanto, SCE 1530 mide el error que existe al utilizar la ecuación de regresión estimada ŷ 60 5x para predecir las ventas. Ahora supóngase que se pide una estimación de las ventas trimestrales sin saber cuál es el tamaño de la población de estudiantes. Sin tener conocimiento de ninguna otra variable relacionada con las ventas trimestrales, se emplearía la media muestral como una estimación de las venTABLA 14.3
CÁLCULO DE SCE EN EL EJEMPLO ARMAND’S PIZZA PARLORS
xi ⴝ población Restaurante de estudiantes i (miles) 1 2 3 4 5 6 7 8 9 10
2 6 8 8 12 16 20 20 22 26
yi ⴝ ventas trimestrales (miles de $)
Ventas pronosticadas ŷi ⴝ 60 ⴙ 5xi
Error yi ⴚ ŷi
Error al cuadrado ( yi ⴚ ŷi )2
58 105 88 118 117 137 157 169 149 202
70 90 100 100 120 140 160 160 170 190
12 15 12 18 3 3 3 9 21 12
144 225 144 324 9 9 9 81 441 144 SCE 1530
14Ander(543-623).qxd 2/28/08 7:17 PM Page 560
560
Capítulo 14
TABLA 14.4
Regresión lineal simple
CÁLCULO DE LA SUMA TOTAL DE CUADRADOS EN EL EJEMPLO DE ARMAND’S PIZZA PARLORS
Restaurante i
xi ⴝ población de estudiantes (miles)
yi ⴝ ventas trimestrales (miles de $)
Desviación yi ⴚ ȳ
Desviación al cuadrado (yi ⴚ ȳ)2
1 2 3 4 5 6 7 8 9 10
2 6 8 8 12 16 20 20 22 26
58 105 88 118 117 137 157 169 149 202
72 25 42 12 13 7 27 39 19 72
5 184 625 1 764 144 169 49 729 1 521 361 5 184 STC 15 730
tas trimestrales de/en cualquiera de los restaurantes. En la tabla 14.2 se mostró que de acuerdo con los datos de las ventas, 兺yi 1300. Por lo tanto, la media de las ventas trimestrales en la muestra de los 10 restaurantes Armand’s es ȳ 兺yi /n 1300/10 130. En la tabla 14.4 se presenta la suma de las desviaciones al cuadrado que se obtiene cuando se usa la media muestral ȳ 130 para estimar el valor de las ventas trimestrales de cada uno de los restaurantes de la muestra. Para el i-ésimo restaurante de la muestra, la diferencia yi ȳ proporciona una medida del error que hay al usar ȳ para estimar las ventas. La correspondiente suma de cuadrados, llamada suma total de cuadrados, se denota STC.
SUMA TOTAL DE CUADRADOS
STC 兺( yi ȳ)2
Como STC = 15 730 y SCE = 1530, la línea de regresión estimada se ajusta mucho mejor a los datos que la línea y ȳ.
(14.9)
La suma debajo de la última columna de la tabla 14.4 es la suma total de cuadrados en el ejemplo de Armand’s Pizza Parlors; esta suma es STC = 15 730. En la figura 14.5 se muestra la línea de regresión estimada ŷ 60 5x y la línea correspondientes a ȳ 130. Obsérvese que los puntos se encuentran más agrupados en torno a la recta de regresión estimada que en torno a la línea ȳ 130. Por ejemplo, se ve que para el 10o. restaurante de la muestra, el error es mucho más grande cuando se usa ȳ 130 para estimar y10 que cuando se usa ŷ10 60 5(26) 190. Se puede entender STC como una medida de qué tanto se agrupan las observaciones en torno a la recta ȳ y SCE como una medida de qué tanto se agrupan las observaciones en torno de la recta ŷ. Para medir qué tanto se desvían de ȳ los valores ȳ, de la recta de regresión, se calcula otra suma de cuadrados. A esta suma se le llama suma de cuadrados debida a la regresión y se denota SCR.
SUMA DE CUADRADOS DEBIDA A LA REGRESIÓN
SCR 兺( ŷi ȳ)2
(14.10)
14Ander(543-623).qxd 2/28/08 7:17 PM Page 561
14.3
561
Coeficiente de determinación
FIGURA 14.5
DESVIACIONES RESPECTO A LA LÍNEA DE REGRESIÓN ESTIMADA Y A LA LÍNEA y ȳ EN EL EJEMPLO DE ARMAND’S PIZZA PARLORS y 220 y10 – ^ y10
Ventas trimestrales (miles de $)
200 180 160 y=
^
140
60
^ y10
x +5
–y
y10 – y
y = y = 130
120 100 80 60 40 20 0
2
4
6
8
10 12 14 16 18 20 22 24 26
x
Población de estudiantes (miles)
Por lo antes dicho, se esperaría que hubiera alguna relación entre STC, SCR y SCE. En efecto, y la relación entre estas tres sumas de cuadrados constituye uno de los resultados más importantes de la estadística.
RELACIÓN ENTRE STC, SCR Y SCE La SCR puede entenderse como la parte explicada de la STC, y la SCE puede entenderse como la parte no explicada de la STC.
STC = SCR + SCE
(14.11)
donde
STC = suma total de cuadrados SCR = suma de cuadrados debida a la regresión SCE = suma de cuadrados debida al error
La ecuación (14.11) muestra que la suma total de cuadrados puede ser dividida en dos componentes, la suma de los cuadrados debida a la regresión y la suma de cuadrados debida al error. Por lo tanto, si se conocen dos cualesquiera de estas sumas de cuadrados, es fácil calcular la tercera suma de cuadrados. Por ejemplo, en el ejemplo de Armand’s Pizza Parlors, se conocen SCE = 1530 y STC 15 730; por lo tanto, despejando de la ecuación (14.11) SCR, se encuentra que la suma de los cuadrados debidos a la regresión es SCR = STC + SCE = 15 730 – 1530 = 14 200
14Ander(543-623).qxd 2/28/08 7:17 PM Page 562
562
Capítulo 14
Regresión lineal simple
Ahora se verá cómo se usan estas tres sumas de cuadrados, STC, SCR y SCE, para obtener una medida de la bondad de ajuste de la ecuación de regresión estimada. La ecuación de regresión estimada se ajustaría perfectamente a los datos si cada uno de los valores de la variable independiente yi se encontraran sobre la recta de regresión. En este caso para todas las observaciones se tendría que yi ŷi sería igual a cero, con lo que SCE 0. Como STC SCR SCE se ve que para que haya un ajuste perfecto SCR debe ser igual a STC, y el cociente (SCR/STC) debe ser igual a uno. Cuando los ajustes son malos, se tendrán valores altos para SCE. Si en la ecuación (14.11) se despeja SCE, se tiene que SCE STC SCR. Por lo tanto, los valores más grandes de SCE (y por lo tanto un peor ajuste) se presentan cuando SCR 0 y SCE STC. El cociente SCR/STC, que toma valores entre cero y uno, se usa para evaluar la bondad de ajuste de la ecuación de regresión estimada. A este cociente se le llama coeficiente de determinación y se denota r2.
COEFICIENTE DE DETERMINACIÓN
r2
SCR STC
(14.12)
En el ejemplo de Armand’s Pizza Parlors, el valor del coeficiente de determinación es r2
SCR 14 200 0.9027 STC 15 730
Si se expresa el coeficiente de determinación en forma de porcentaje, r2 se puede interpretar como el porcentaje de la suma total de cuadrados que se explica mediante el uso de la ecuación de regresión estimada. En el ejemplo de Armand’s Pizza Parlors, se concluye que 90.27% de la variabilidad en las ventas se explica por la relación lineal que existe entre el tamaño de la población de estudiantes y las ventas. Sería bueno que la ecuación de regresión tuviera un ajuste tan bueno.
Coeficiente de correlación En el capítulo 3 se presentó el coeficiente de correlación como una medida descriptiva de la intensidad de la relación lineal entre dos variables x y y. Los valores del coeficiente de correlación son valores que van desde 1 hasta 1. El valor 1 indica que las dos variables x y y están perfectamente relacionadas en una relación lineal positiva. Es decir, los puntos de todos los datos se encuentran en una línea recta que tiene pendiente positiva. El valor 1 indica que x y y están perfectamente relacionadas, en una relación lineal negativa, todos los datos se encuentran en una línea recta que tiene pendiente negativa. Los valores del coeficiente de correlación cercanos a cero indican que x y y no están relacionadas linealmente. En la sección 3.5 se presentó la ecuación para calcular el coeficiente de correlación muestral. Cuando se ha realizado un análisis de regresión y se ha calculado el coeficiente de determinación r2, el coeficiente de correlación muestral se puede calcular como se indica a continuación.
COEFICIENTE DE CORRELACIÓN MUESTRAL
rxy (signo de b1)兹Coeficiente de determinación (signo de b1)兹r 2
(14.13)
14Ander(543-623).qxd 2/28/08 7:17 PM Page 563
14.3
563
Coeficiente de determinación
donde b1 pendiente de la ecuación de regresión estimada ŷ b0 b1x
El signo del coeficiente de regresión muestral es positivo si la ecuación de regresión tiene pendiente positiva (b1 0) y es negativo si la ecuación de regresión estimada tiene pendiente negativa (b1 0). En el ejemplo de Armand’s Pizza Parlor, el valor del coeficiente de determinación correspondiente a la ecuación de regresión estimada ŷ 60 + 5x es 0.9027. Como la pendiente de la ecuación de regresión estimada es positiva, la ecuación (14.13) indica que el coeficiente de correlación muestral es 0.9027 0.9501 Con este coeficiente de correlación muestral, rxy = +0.9501, se concluye que existe una relación lineal fuerte entre x y y. En el caso de una relación lineal entre dos variables, tanto el coeficiente de determinación como el coeficiente de correlación muestral proporcionan medidas de la intensidad de la relación. El coeficiente de determinación proporciona una medida cuyo valor va desde cero hasta uno, mientras que el coeficiente de correlación muestral proporciona una medida cuyo valor va desde –1 hasta +1. El coeficiente de correlación lineal está restringido a la relación lineal entre dos variables, pero el coeficiente de determinación puede emplearse para relaciones no lineales y para relaciones en las que hay dos o más variables independientes. Por tanto, el coeficiente de determinación tiene un rango más amplio de aplicaciones.
NOTAS Y COMENTARIOS implican el tamaño de la muestra y las propiedades de la distribución muestral adecuada de los estimadores de mínimos cuadrados. 2. Para fines prácticos, cuando se trata de datos que se encuentran en las ciencias sociales, valores de r2 tan pequeños como 0.25 suelen considerarse útiles. En datos de la física o de las ciencias de la vida, suelen encontrarse valores de r2 de 0.60 o mayores; en algunos casos pueden encontrarse valores mayores de 0.90. En las aplicaciones a los negocios, los valores de r2 varían enormemente dependiendo de las características particulares de cada aplicación.
1. Al obtener la ecuación de regresión estimada mediante el método de mínimos cuadrados y calcular el coeficiente de determinación, no se hizo ninguna suposición probabilística acerca del término del error ni tampoco una prueba de significancia para la relación entre x y y. Los valores grandes de r2 implican que la recta de mínimos cuadrados se ajusta mejor a los datos; es decir, las observaciones se encuentran más cerca de la recta de mínimos cuadrados. Sin embargo, usando únicamente r2 no se pueden sacar conclusiones acerca de si la relación entre x y y es estadísticamente significativa. Tal conclusión debe basarse en consideraciones que
Ejercicios
Método 15. Los datos a continuación son los datos del ejercicio 1.
Auto examen
xi
1
2
3
4
5
yi
3
7
5
11
14
La ecuación de regresión estimada para estos datos es ŷ 0.20 + 2.60x. a. Empleando las ecuaciones (14.8), (14.9) y (14.10) calcule SCE, STC y SCR. b. Calcule el coeficiente de determinación r2. Haga un comentario sobre la bondad del ajuste. c. Calcule el coeficiente de correlación muestral.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 564
564
Capítulo 14
Regresión lineal simple
16. Los datos a continuación son los datos del ejercicio 2. xi
3
12
6
20
14
yi
55
40
55
10
15
La ecuación de regresión estimada para estos datos es ŷ = 68 3x. a. Calcule SCE, STC y SCR. b. Calcule el coeficiente de determinación r2. Haga un comentario sobre la bondad del ajuste. c. Calcule el coeficiente de correlación muestral. 17. Los datos a continuación son los datos del ejercicio 3. xi
2
6
9
13
20
yi
7
18
9
26
23
La ecuación de regresión estimada para estos datos es ŷ 7.6 0.9x. ¿Qué porcentaje de la suma total de cuadrados puede explicarse mediante la ecuación de regresión estimada? ¿Cuál es el valor del coeficiente de correlación muestral?
Aplicaciones
Auto examen
18. En los datos siguientes, y corresponde a los salarios mensuales y x es el promedio obtenido por los estudiantes que terminaron la licenciatura de administración con especialidad en sistemas de información. La ecuación de regresión estimada obtenida con estos datos es ŷ 1790.5 581.1x.
a. b. c.
Promedio
Salario mensual ($)
2.6 3.4 3.6 3.2 3.5 2.9
3300 3600 4000 3500 3900 3600
Calcule SCE, STC y SCR. Calcule el coeficiente de determinación r 2. Haga un comentario sobre la bondad del ajuste. Calcule el coeficiente de correlación muestral.
19. Los datos a continuación son los datos del ejercicio 7.
archivo CD en Cars
Fabricante y modelo Acura TL BMW 330i Lexus IS300 Lexus ES330 Mercedes-Benz C320 Lincoln LS Premium (V6) Audi A4 3.0 Quattro Cadillac CTS Nissan Maxima 3.5 SE Infiniti I35 Saab 9-3 Aero Infiniti G35 Jaguar X-Type 3.0 Saab 9-5 Arc Volvo S60 2.5T
x ⴝ confiabilidad 4 3 5 5 1 3 2 1 4 5 3 4 1 3 3
y ⴝ precio ($) 33 150 40 570 35 105 35 174 42 230 38 225 37 605 37 695 34 390 33 845 36 910 34 695 37 995 36 955 33 890
14Ander(543-623).qxd 2/28/08 7:17 PM Page 565
14.3
565
Coeficiente de determinación
La ecuación de regresión estimada para estos datos es ŷ 40 639 1301.2x. ¿Qué porcentaje de la suma total de cuadrados puede explicarse mediante la ecuación de regresión estimada? Haga un comentario sobre la bondad del ajuste ¿Cuál es el valor del coeficiente de correlación muestral? 20. Consumer Reports publica pruebas y evaluaciones sobre televisores de alta definición. Para cada modelo se elaboró una evaluación general basada principalmente en la calidad de la imagen. Una evaluación más alta indica un mejor funcionamiento. En los datos siguientes se dan evaluación general y precio de televisores de plasma de 45 pulgadas (Consumer Reports, marzo 2006).
Marca Dell Hisense Hitachi JVC LG Maxent Panasonic Phillips Proview Samsung
archivo CD en PlasmaTV
a.
b. c.
Precio
Puntuación en la valuación
2800 2800 2700 3500 3300 2000 4000 3000 2500 3000
62 53 44 50 54 39 66 55 34 39
Use estos datos para obtener una ecuación de regresión estimada que pueda emplearse para estimar la puntuación en la evaluación general de una televisión de 42 pulgadas dado el precio. Calcule r2. ¿Proporcionó un buen ajuste la ecuación de regresión estimada? Estime la puntuación en la evaluación general de un televisor cuyo precio es $3200.
21. Una aplicación importante del análisis de regresión a la contaduría es la estimación de costos. Con datos sobre volumen de producción y costos y empleando el método de mínimos cuadrados para obtener la ecuación de regresión estimada que relacione volumen de producción y costos, los contadores pueden estimar los costos correspondientes a un determinado volumen de producción. Considere la siguiente muestra de datos sobre volumen de producción y costos totales de una operación de fabricación.
a. b. c. d.
Volumen de producción (unidades)
Costos totales ($)
400 450 550 600 700 750
4000 5000 5400 5900 6400 7000
Con estos datos obtenga la ecuación de regresión estimada para pronosticar los costos totales dado un volumen de producción. ¿Cuál es el costo por unidad producida? Calcule el coeficiente de determinación. ¿Qué porcentaje de la variación en los costos totales puede ser explicada por el volumen de producción? De acuerdo con el programa de producción de la empresa, el mes próximo se deberán producir 500 unidades. ¿Cuál es el costo total estimado de esta operación?
22. PC World publicó evaluaciones de las cinco mejores impresoras láser de oficina y de las cinco mejores impresoras láser corporativas (PC World, febrero 2003). La impresora de oficina mejor evaluada fue la Minolta-QMS PagePro 1250W, que en la evaluación general obtuvo una puntuación de 91 puntos. La impresora láser corporativa mejor evaluada fue la Xerox Phase 4400/N, que
14Ander(543-623).qxd 2/28/08 7:17 PM Page 566
566
Capítulo 14
Regresión lineal simple
en la evaluación general obtuvo una puntuación de 83 puntos. En la tabla siguiente se da rapidez, en páginas por minuto (ppm), en la impresión de texto y precio de cada impresora. Nombre
archivo CD en Printers
Minolta-QMS PagePro 1250W Brother HL-1850 Lexmark E320 Minolta-QMS PagePro 1250E HP Laserjet 1200 Xerox Phaser 4400/N Brother HL-2460N IBM Infoprint 1120n Lexmark W812 Oki Data B8300n
a. b. c.
14.4
Tipo Oficina Oficina Oficina Oficina Oficina Corporativa Corporativa Corporativa Corporativa Corporativa
Velocidad (ppm)
Precio ($)
12 10 12.2 10.3 11.7 17.8 16.1 11.8 19.8 28.2
199 499 299 299 399 1850 1000 1387 2089 2200
Dé la ecuación de regresión estimada empleando velocidad como variable independiente. Calcule r2. ¿Qué porcentaje de la variación del precio puede ser explicado por la velocidad de la impresora? ¿Cuál es el coeficiente de correlación muestral entre velocidad y precio? ¿Refleja este coeficiente una relación fuerte o débil entre la velocidad de la impresora y el costo?
Suposiciones del modelo En un análisis de regresión se empieza por hacer una suposición acerca del modelo apropiado para la relación entre las variables dependientes e independientes. En el caso de la regresión lineal simple, se supone que el modelo de regresión es y β0 β1x Después empleando el método de mínimos cuadrados se obtienen los valores de b0 y b1, que son las estimaciones de los parámetros β0 y β1, respectivamente, del modelo. Así se llega la ecuación de regresión estimada ŷ b0 b1x Como se vio, el valor del coeficiente de determinación (r 2) es una medida de la bondad de ajuste de la ecuación de regresión estimada. Sin embargo, aun cuando se obtenga un valor grande para r2, la ecuación de regresión estimada no debe ser usada hasta que se realice un análisis para determinar si el modelo empleado es adecuado. Un paso importante para ver si el modelo empleado es adecuado es probar la significancia de la relación. Las pruebas de significancia en el análisis de regresión están basadas en las suposiciones siguientes acerca del término del error . SUPOSICIONES ACERCA DEL TÉRMINO DEL ERROR EN EL ANÁLISIS DE REGRESIÓN
y β0 β1x 1. El término del error es una variable aleatoria cuya media, o valor esperado, es cero; es decir, E( ) 0. Implicación: β0 y β1 son constantes, por lo tanto E( β0) β0 y E( β1) β1; así, para un valor dado de x, el valor esperado de y es E( y) β0 β1x
(14.14) (continúa)
14Ander(543-623).qxd 2/28/08 7:17 PM Page 567
14.4
567
Suposiciones del modelo
Como ya se indicó, a la ecuación (14.14) se le conoce como ecuación de regresión. 2. La varianza de , que se denota σ 2, es la misma para todos los valores de x. Implicación: La varianza de y respecto a la recta de regresión es igual a σ 2 y es la misma para todos los valores de x. 3. Los valores de son independientes. Implicación: El valor de correspondiente a un determinado valor de x no está relacionado con el valor de correspondiente a ningún otro valor de x; por lo tanto, el valor de y correspondiente a un determinado valor de x no está relacionado con el valor de y de ningún otro valor de x. 4. El término del error es una variable aleatoria distribuida normalmente. Implicación: como y es función lineal de , también y es una variable aleatoria distribuida normalmente.
En la figura 14.6 se muestran las suposiciones del modelo y sus implicaciones; obsérvese que en esta interpretación gráfica, el valor de E(y) cambia de acuerdo con el valor de x que se considere. Sin embargo, sea cual sea el valor de x, la distribución de probabilidad de , y por tanto la distribución de probabilidad de y, son distribuciones normales, que tienen, todas, la misma varianza. El valor específico del error en cualquier punto depende de si el valor real de y es mayor o menor que E(y). En este punto, hay que tener presente que también se hace una suposición o se tienen una hipótesis acerca de la forma de la relación entre x y y. Es decir, se supone que la base de la relación entre las variables es una recta representada por β0 β1x. No se debe perder de vista el FIGURA 14.6
SUPOSICIONES DEL MODELO DE REGRESIÓN
Distribución de y en x = 20
Distribución de y en x = 30 y
Distribución de y en x = 10 E(y) cuando x = 10 E(y) cuando x=0 β0
x=0 x = 10 x = 20 x = 30
E(y) cuando x = 20
Nota: Para cada uno de los valores de x las distribuciones y tienen la misma forma.
E(y) cuando x = 30
E(y) = β 0 + β 1x
x
14Ander(543-623).qxd 2/28/08 7:17 PM Page 568
568
Capítulo 14
Regresión lineal simple
hecho de que puede haber algún otro modelo, por ejemplo y β0 β1x2 , que resulte ser un mejor modelo para la relación en estudio.
14.5
Prueba de significancia En una ecuación de regresión lineal simple, la media o valor esperado de y es una función lineal de x: E( y) β0 β1x. Pero si el valor de β1 es cero, E( y) β0 (0)x β0. En este caso, el valor medio de y no depende del valor de x y por lo tanto se puede concluir que x y y no están relacionadas linealmente. Pero si el valor de β1 es distinto de cero, se concluirá que las dos variables están relacionadas. Por lo tanto, para probar si existe una relación de regresión significante, se debe realizar una prueba de hipótesis para determinar si el valor de β1 es distinto de cero. Hay dos pruebas que son las más usadas. En ambas, se requiere una estimación de σ 2, la varianza de en el modelo de regresión.
Estimación de σ 2 De acuerdo con el modelo de regresión y con sus suposiciones, se puede concluir que σ 2, la varianza de , representa también la varianza de los valores de y respecto a la recta de regresión. Recuérdese que a las desviaciones de los valores de y de la recta de regresión estimada se les conoce como residuales. Por lo tanto, SCE, la suma de los cuadrados de los residuales, es una medida de la variabilidad de las observaciones reales respecto a la línea de regresión estimada. El error cuadrado medio (ECM) proporciona una estimación de σ 2; esta estimación es SCE dividida entre sus grados de libertad. Como ŷi b0 b1xi , SCE se puede expresar como SCE 兺( yi ŷi )2 兺( yi b0 b1xi )2 A cada suma de cuadrados le corresponde un número llamado sus grados de libertad. Se ha demostrado que SCE tiene n 2 grados de libertad porque para calcular SCE es necesario estimar dos parámetros (β0 y β1). Por lo tanto, el cuadrado medio se calcula dividiendo SCE entre n 2. ECM proporciona un estimador insesgado de σ 2. Como el valor del ECM proporciona un estimado de σ 2, se emplea también la notación s2. ERROR CUADRADO MEDIO (ESTIMACIÓN DE σ 2)
s 2 ECM
SCE n 2
(14.15)
En la sección 14.3 se encontró que en el ejemplo de Armand’s Pizza Parlors, SCE = 1530; por lo tanto, s 2 ECM
1530 191.25 8
es un estimador insesgado de σ 2. Para estimar σ se saca la raíz cuadrada de s2. Al valor que se obtiene, s, se le conoce como el error estándar de estimación. ERROR ESTÁNDAR DE ESTIMACIÓN
s 兹ECM
冑
SCE n 2
(14.16)
14Ander(543-623).qxd 2/28/08 7:17 PM Page 569
14.5
569
Prueba de significancia
En el ejemplo de Armand’s Pizza Parlors, s = 兹ECM 兹191.25 = 13.829. El error estándar de estimación se emplea en la discusión siguiente acerca de las pruebas de significancia de la relación entre x y y.
Prueba t El modelo de regresión lineal simple es y β0 β1 x . Si x y y están relacionadas linealmente, entonces β1 0. El objetivo de la prueba t es determinar si se puede concluir que β1 0. Para probar la hipótesis siguiente acerca del parámetro β1 se emplearán los datos muestrales. H0: β1 0 Ha: β1 0 Si se rechaza H0, se concluirá que β1 0 y que entre las dos variables existe una relación estadísticamente significante. La base para esta prueba de hipótesis la proporcionan las propiedades de la distribución muestral de b1, el estimador de β1, obtenido mediante el método de mínimos cuadrados. Primero, considérese que es lo que ocurriría si para el mismo estudio de regresión se usara otra muestra aleatoria simple. Supóngase, por ejemplo, que Armand’s Pizza Parlors usa una muestra de las ventas de otros 10 restaurantes. El análisis de regresión de esta otra muestra dará como resultado una ecuación de regresión parecida a la ecuación de regresión anterior ŷ 60 5x. Sin embargo, no puede esperarse que se obtenga exactamente la misma ecuación (una ecuación en la que la intersección con el eje y sea exactamente 60 y la pendiente sea exactamente 5). Los estimadores b0 y b1, obtenidos por el método de mínimos cuadrados, son estadísticos muestrales que tienen su propia distribución muestral. A continuación se presentan las propiedades de la distribución muestral de b1.
DISTRIBUCIÓN MUESTRAL DE b1
Valor esperado E(b1) β1 Desviación estándar σ σb1 兹兺(xi x̄)2
(14.17)
Forma de la distribución Normal
Obsérvese que el valor esperado de b1 es β1, por lo que b1 es un estimador insesgado de β1. Como no se conoce el valor de σ, se obtiene una estimación de σb1, que se denota sb1, estimando σ mediante s en la ecuación (14.17). De esta manera se obtiene el estimador siguiente de σb1.
A la desviación estándar de b1, se le conoce también como error estándar de b1. Por lo tanto, sb1 proporciona una estimación del error estándar de b1.
DESVIACIÓN ESTÁNDAR ESTIMADA DE b1
sb1
s
兹兺(xi x̄)2
(14.18)
14Ander(543-623).qxd 2/28/08 7:17 PM Page 570
570
Capítulo 14
Regresión lineal simple
En el ejemplo de Armand’s Pizza Parlors, s 13.829. Por lo tanto, dado que 兺(xi x̄)2 568 como se muestra en la tabla 14.2, se tiene que 13.829
sb1
568
0.5803
es la desviación estándar estimada de b1. La prueba t para determinar si la relación es significativa se basa en el hecho de que el estadístico de prueba b1 β1 sb1 sigue una distribución t con n 2 grados de libertad. Si la hipótesis nula es verdadera, entonces β1 = 0 y t b1/sb1. Ahora se realizará esta prueba de significancia con los datos de Armand’s Pizza Parlors, empleando como nivel de significancia α = 0.01. El estadístico de prueba es t En los apéndices 14.3 y 14.4 se muestra el uso de Minitab y de Excel para calcular el valor-p
b1 sb1
5 0.5803
8.62
En las tablas de la distribución t se encuentra que para n 2 10 2 8 grados de libertad, t 3.355 da un área de 0.005 en la cola superior. Por lo tanto, el área en la cola superior de la distribución t correspondiente al valor del estadístico de prueba t 8.62 debe ser menor a 0.005. Como esta prueba es una prueba de dos colas, este valor se duplica y se concluye que el valor-p para t 8.62 debe ser menor a 2(0.005) 0.01. Empleando Excel o Minitab se encuentra valor-p 0.000. Dado que el valor-p es menor a α 0.01 se rechaza H0 y se concluye que β1 no es igual a cero. Esto es suficiente evidencia para concluir que existe una relación significativa entre la población de estudiantes y las ventas trimestrales. A continuación se presenta un resumen de la prueba t de significancia para la regresión lineal simple.
PRUEBA t DE SIGNIFICANCIA PARA LA REGRESIÓN LINEAL SIMPLE
H0: β1 0 Ha: β1 0 ESTADÍSTICO DE PRUEBA
b t s1 b1
(14.19)
REGLA DE RECHAZO
Método del valor-p: Rechazar H0 si valor-p α Método del valor crítico: Rechazar H0 si t tα/2 o si t donde tα/2 se toma de la distribución t con n 2 grados de libertad.
Intervalo de confianza para β1 La fórmula para un intervalo de confianza para β1 es la siguiente: b1 tα/2 sb1
tα/2
14Ander(543-623).qxd 2/28/08 7:17 PM Page 571
14.5
571
Prueba de significancia
El estimador puntual es b1 y el margen de error es tα/2 sb1. El coeficiente de confianza para este intervalo es 1 α y tα/2 es el valor t que proporciona un área α/2 en la cola superior de la distribución t con n 2 grados de libertad. Supóngase, por ejemplo, que en el caso de Armand’s Pizza Parlors se desea obtener una estimación de β1 mediante un intervalo de 99% de confianza. En la tabla 2 del apéndice B se encuentra que el valor t correspondiente a α 0.01 y n 2 10 – 2 8 grados de libertad es t0.005 3.355. Por lo tanto, la estimación mediante un intervalo de 99% de confianza es b1
tα/2 sb1
5
3.355(0.5803)
5
1.95
o el intervalo que va de 3.05 a 6.95. Al emplear la prueba t de significancia la hipótesis probada fue H0: β1 0 Ha: β1 0 Empleando α 0.01 como nivel de significancia, se puede usar el intervalo de 99% de confianza como alternativa para llegar a la conclusión de la prueba de hipótesis que se obtiene con los datos de Armand’s. Como 0, que es el valor hipotético de β1, no está comprendido en el intervalo de confianza (3.05 a 6.95), se rechaza H0 y se concluye que entre el tamaño de la población de estudiantes y las ventas trimestrales sí existe una relación estadísticamente significativa. En general, se puede usar un intervalo de confianza para probar cualquier hipótesis de dos colas acerca de β1. Si el valor hipotético de β1 está contenido en el intervalo de confianza, no se rechaza H0. De lo contrario, se rechaza H0.
Prueba F Una prueba F, basada en la distribución de probabilidad F puede emplearse también para probar la significancia en la regresión. Cuando sólo se tiene una variable independiente, la prueba F lleva a la misma conclusión que la prueba t; es decir, si la prueba t indica que β1 0 y por lo tanto que existe una relación significante, la prueba F también indicará que existe una relación significante. Pero cuando hay más de una variable independiente, sólo la prueba F puede usarse para probar que existe una relación significante general. La lógica detrás del uso de la prueba F para determinar si la relación de regresión es estadísticamente significativa se basa en la obtención de dos estimaciones independiente de σ 2. Se explicó cómo ECM proporciona una estimación de σ 2. Si la hipótesis nula H0: β1 0 es verdadera, la suma de cuadrados debida a la regresión, SCR, dividida entre sus grados de libertad proporciona otra estimación independiente de σ 2. A esta estimación se le llama el cuadrado medio debido a la regresión o simplemente el cuadrado medio de la regresión. Y se denota CMR. En general, CMR
SCR Grados de libertad de la regresión
En los modelos que se consideran en este texto, el número de grados de libertad de la regresión es siempre igual al número de variables independientes en el modelo: CMR
SCR Número de variables independientes
(14.20)
Como en este capítulo sólo se consideran modelos de regresión con una sola variable independiente, se tiene CMR SCR/1 SCR. Por lo tanto, en el ejemplo de Armand’s Pizza Parlors, CMR SCR 14 200. Si la hipótesis nula es verdadera (H0: β1 0), CMR y ECM son dos estimaciones independientes de σ 2 y la distribución muestral de CMR/ECM sigue una distribución F en la que el nú-
14Ander(543-623).qxd 2/28/08 7:17 PM Page 572
572
Capítulo 14
Regresión lineal simple
mero de grados de libertad en el numerador es igual a uno y el número de grados de libertad en el denominador es igual a n 2. Por lo tanto, si β1 0 el valor de CMR/ECM deberá ser un valor cercano a uno. Pero, si la hipótesis nula es falsa, (β1 0), CMR sobreestimará σ 2 y el valor de CMR/ECM se inflará; de esta manera valores grandes de CMR/ECM conducirán al rechazo de H0 y a la conclusión de que la relación entre x y y es estadísticamente significante. A continuación se realizará la prueba F en el ejemplo de Armand’s Pizza Parlors. El estadístico de prueba es F En la regresión lineal simple, la prueba F y la prueba t proporcionan resultados idénticos.
CMR ECM
14 200 191.25
74.25
En la tabla de la distribución F (tabla 4 del apéndice B) se observa que con un grado de libertad en el numerador y n 2 = 10 2 = 8 grados de libertad en el denominador, F 11.26 proporciona un área de 0.01 en la cola superior. Por lo tanto, el área en la cola superior de la distribución F que corresponde al estadístico de prueba F 74.25 debe de ser menor a 0.01. Por lo tanto, se concluye que el valor-p debe de ser menor a α 0.01. Empleando Excel o Minitab se encuentra que valor-p = 0.000. Como el valor–p es menor a α 0.01, se rechaza H0 y se concluye que entre el tamaño de la población de estudiantes y las ventas trimestrales, existe una relación significante. A continuación se presenta un resumen de la prueba F de significancia para la regresión lineal simple.
PRUEBA F DE SIGNIFICANCIA EN EL CASO DE LA REGRESIÓN LINEAL SIMPLE Si H0 es falsa, ECM proporciona una estimación insesgada de σ 2 y el CMR sobreestima σ 2. Si H0 es verdadera, tanto ECM como CMR proporcionan una estimación insesgada de σ 2; en este caso el valor de CMR/ECM es cercano a 1.
H0: β1 0 Ha: β1 0 ESTADÍSTICO DE PRUEBA
F
CMR ECM
(14.21)
REGLA DE RECHAZO
Método del valor-p: Rechaza H0 si valor-p Método del valor crítico: Rechaza H0 si F Fα
α
donde Fα es un valor de la distribución F con 1 grado de libertad en el numerador y n 2 grados de libertad en el denominador.
En el capítulo 13 se vio el análisis de varianza (ANOVA) y el uso de la tabla de ANOVA para proporcionar una visión resumida de los cálculos que se emplean en el análisis de varianza. Para resumir los cálculos de la prueba F de significancia para la regresión se emplea una tabla ANOVA similar. En la tabla 14.5 se presenta la forma general de una tabla ANOVA para la regresión lineal simple. En la tabla 14.6 se presenta la tabla ANOVA con los cálculos para la prueba F del ejemplo de Armand’s Pizza Parlors. Regresión, error y total son los rótulos de las tres fuentes de variación, y SCR, SCE y STC las sumas de cuadrados correspondientes que aparecen en la columna 2. En la columna 3 aparecen los grados de libertad 1 para SCR, n 2 para SCE y n 1 para STC. Los valores de CMR y ECM aparecen en la columna 4. En la columna 5 aparece el valor de F CMR/ECM, y en la columna 6 aparece el valor-p que corresponde al valor de F de la columna 5. Casi todos los resultados proporcionados por computadoras para el análisis de regresión presentan una tabla ANOVA de la prueba F de significancia.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 573
14.5
TABLA 14.5
En toda tabla para el análisis de varianza, la suma total de cuadrados es la suma de la suma de cuadrados de la regresión más la suma de cuadrados del error; además, el total de los grados de libertad es la suma de los grados de libertad de la regresión más los grados de libertad del error.
573
Prueba de significancia
Fuente de variación
FORMA GENERAL DE LA TABLA ANOVA PARA LA REGRESIÓN LINEAL SIMPLE Suma de cuadrados
Grados de libertad
Regresión
SCR
1
Error
SCE
n 2
Total
STC
n 1
Cuadrado medio SCR CMR 1
CME
F F
Valor-p
CMR CME
SCE n
2
Algunas advertencias acerca de la interpretación de las pruebas de significancia
El análisis de regresión, que se usa para identificar la relación entre las variables, no puede emplearse como evidencia de una relación de causa y efecto.
Cuando se rechaza la hipótesis nula H0: β1 0, concluir que la relación que existe entre x y y es significativa no permite que se concluya que existe una relación de causa y efecto entre x y y. Que exista una relación de causa y efecto sólo puede concluirse cuando el analista pueda dar justificaciones teóricas de que en efecto la relación es causal. En el ejemplo de Armand’s Pizza Parlors, se concluye que existe una relación significante entre el tamaño de la población de estudiantes x y las ventas trimestrales y; aún más, la ecuación de regresión estimada ŷ 60 5x da una estimación de la relación obtenida por el método de mínimos cuadrados. Sin embargo, por el solo hecho de que se haya encontrado que hay una relación estadísticamente significativa entre x y y, no se puede concluir que cambios en la población de estudiantes x causen cambios en las ventas trimestrales y. Si es posible concluir que haya una relación de causa y efecto se deja a las justificaciones teóricas y a la opinión de los analistas. Los administradores de Armand’s creían que el aumento en la población de estudiantes probablemente fuera una causa del aumento de las ventas trimestrales. Por lo tanto, el resultado de la prueba de significancia les permite concluir que hay una relación de causa y efecto. Además, el hecho de que se pueda rechazar H0: β1 0 y demostrar que hay significancia estadística no permite concluir que la relación entre x y y sea lineal. Lo único que se puede decir es que x y y están relacionadas y que la relación lineal explica una porción significante de la variabilidad de y sobre el rango de los valores de x observados en la muestra. En la figura 14.7 se ilustra esta relación. La prueba de significancia lleva al rechazo de la hipótesis nula H0: β1 0 y a la hipótesis de que x y y están significantemente relacionadas, pero en la figura se observa que la verdadera relación entre x y y no es lineal. Aunque la aproximación lineal proporcionada
TABLA 14.6
Fuente de variación
TABLA ANOVA PARA EL EJEMPLO DE ARMAND’S PIZZA PARLORS Suma de cuadrados
Grados de libertad
14 200
1
14 200 1
14 200
Error
1 530
8
1530 8
191.25
Total
15 730
9
Regresión
Cuadrado medio
F 14 200 191.25
Valor-p 74.25
0.000
14Ander(543-623).qxd 2/28/08 7:17 PM Page 574
574
Capítulo 14
FIGURA 14.7
Regresión lineal simple
EJEMPLO DE UNA APROXIMACIÓN LINEAL PARA UNA RELACIÓN QUE NO ES LINEAL y Relación real
^
y = b0 + b1x
x
Valor menor de x
Valor mayor de x
Rango de los valores de x observados
por ŷ b0 b1x es buena en el rango de los valores observados de x en la muestra, se vuelve deficiente fuera de ese rango. Dada una relación significante, la ecuación de regresión estimada se puede usar con confianza para predicciones correspondientes a valores de x dentro del rango de los valores de x observados en la muestra. En el ejemplo de Armand’s Pizza Parlors, este rango corresponde a los valores de x entre 2 y 26. A menos que haya otras razones que indiquen que el modelo es válido más allá de este rengo, las predicciones fuera del rango de la variable independiente deben hacerse con cuidado. En el ejemplo de Armand’s Pizza Parlors, como se ha encontrado que la relación de regresión es significante al nivel de significancia de 0.01, se puede tener confianza para usar esta relación para predecir las ventas de restaurantes en los que la población de estudiantes correspondiente esté en el intervalo de 2000 a 26 000. NOTAS Y COMENTARIOS 1. Las suposiciones hechas acerca del término del error (sección 14.4) son las que permiten las pruebas de significancia estadística de esta sección. Las propiedades de la distribución muestral de b1 y las subsiguientes pruebas t y F siguen directamente de estas suposiciones. 2. No se debe confundir la significancia estadística con la significancia práctica. Con tamaños de muestra muy grandes, se pueden obtener resultados estadísticamente significantes para valores pequeños de b1; en tales casos hay que tener cuidado al concluir que la relación tiene significancia práctica. 3. Una prueba de significancia para la relación lineal entre x y y también se puede realizar usando el coeficiente de correlación muestral rxy.
Empleando rxy para denotar el coeficiente de correlación poblacional, las hipótesis son las siguientes. H 0 : rx y 0 H a : rx y 0 Si se rechaza H0, se puede concluir que existe una relación significante. En el apéndice 14.2 se proporcionan los detalles de esta prueba. Sin embargo, las pruebas t y F presentadas en esta sección dan el mismo resultado que la prueba de significancia usando el coeficiente de correlación. Por lo tanto, si ya se ha realizado una prueba t o una prueba F no es necesario realizar una prueba de significancia usando el coeficiente de correlación.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 575
14.5
575
Prueba de significancia
Ejercicios
Métodos 23. A continuación se presentan los datos del ejercicio 1.
Auto examen a. b. c. d.
xi
1
2
3
4
5
yi
3
7
5
11
14
Usando la ecuación (14.15) calcule el error cuadrado medio. Usando la ecuación (14.16) calcule el error estándar de estimación. Usando la ecuación (14.18) calcule la desviación estándar estimada de b1. Use la prueba t para probar las hipótesis siguientes (α 0.05) H 0: β 1 0 H a: β 1 0
e.
Use la prueba F para probar las hipótesis del inciso d) empleando como nivel de significancia 0.05. Presente los resultados en el formato de tabla de análisis de varianza.
24. A continuación se presentan los datos del ejercicio 2.
a. b. c. d.
xi
3
12
6
20
14
yi
55
40
55
10
15
Usando la ecuación (14.15) calcule el error cuadrado medio. Usando la ecuación (14.16) calcule el error estándar de estimación. Usando la ecuación (14.18) calcule la desviación estándar estimada de b1. Use la prueba t para probar las hipótesis siguientes (α 0.05). H 0: β 1 0 H a: β 1 0
e.
Use la prueba F para probar las hipótesis del inciso d) empleando como nivel de significancia 0.05. Presente los resultados en el formato de tabla de análisis de varianza.
25. A continuación se presentan los datos del ejercicio 3.
a. b. c.
xi
2
6
9
13
20
yi
7
18
9
26
23
¿Cuál es el valor del error estándar de estimación? Pruebe si existe una relación significante usando la prueba t. Use α 0.05. Emplee la prueba F para ver si existe una relación significante. Use α 0.05. ¿Cuál es la conclusión?
Aplicaciones
Auto examen
26. En el ejercicio 18 los datos sobre promedio obtenido en la licenciatura y salarios mensuales fueron los siguientes. Promedio
Salario mensual ($)
Promedio
Salario mensual ($)
2.6 3.4 3.6
3300 3600 4000
3.2 3.5 2.9
3500 3900 3600
14Ander(543-623).qxd 2/28/08 7:17 PM Page 576
576
Capítulo 14
a. b. c.
Regresión lineal simple
¿Indica la prueba t que haya una relación significante entre promedio y salario mensual? Pruebe si la relación es significante usando la prueba F. ¿Cuál es la conclusión? Use α 0.05. Dé la tabla ANOVA.
27. La revista Outside Magazine probó 10 modelos de mochilas y botas para excursionismo. En la tabla siguiente se presentan los datos de soporte superior y precio de cada modelo. El soporte superior se midió con una escala del 1 al 5 en la que 1 significa aceptable y 5 denota excelente soporte superior (Outside Magazine Buyer´s Guide 2001).
Fabricante y modelo
Soporte superior
Precio ($)
2 3 3 3 3 5 5 4 4 5
120 125 130 135 150 189 190 195 200 220
Salomon Super Raid Merrell Chameleon Prime Teva Challenger Vasque Fusion GTX Boreal Maigmo L.L. Bean GTX Super Guide Lowa Kibo Asolo AFX 520 GTX Raichle Mt. Trail GTX Scarpa Delta SL M3
archivo CD en Boots
a. b. c.
d.
Use estos datos para obtener la ecuación de regresión estimada para estimar el precio de las mochilas y las botas para excursionismo con base en el soporte superior. Empleando α = 0.05, determine si hay relación entre soporte superior y precio. Confiaría en usar la ecuación de regresión estimada obtenida en el inciso a) para estimar el precio de las mochilas y botas para excursión con base en la evaluación del soporte superior. Estime el precio de una mochila que tiene un 4 como evaluación del soporte superior
28. En el ejercio 10, con los datos de temperatura (°F) y precio ($) de 11 sacos de dormir de Bergans de Norway se obtuvo la ecuación de regresión estimada ŷ 359.2668 5. 2772x. Empleando 0.05 como nivel de significancia, determine si temperatura y precio están relacionados. Dé la tabla de ANOVA. ¿Cuál es la conclusión? 29. Vuelva al ejercicio 21, en el que se usaron los datos sobre volumen de producción y costos para obtener una ecuación de regresión estimada que relacionaba el volumen de producción y los costos de una determinada operación de producción. Use α 0.05 para determinar si el volumen de producción está relacionado de manera significativa con los costos totales. Dé la tabla ANOVA. ¿Cuál es la conclusión? 30. Vuelva al ejercicio 22, en el que se emplearon los datos siguientes para determinar si el precio de una impresora estaba relacionado con su velocidad para imprimir un texto (PC World, febrero 2003).
Nombre
archivo CD en Printers
Minolta-QMS PagePro 1250W Brother HL-1850 Lexmark E320 Minolta-QMS PagePro 1250E HP Laserjet 1200 Xerox Phaser 4400/N Brother HL-2460N
Tipo Oficina Oficina Oficina Oficina Oficina Corporativa Corporativa
Velocidad (ppm)
Precio ($)
12 10 12.2 10.3 11.7 17.8 16.1
199 499 299 299 399 1850 1000 (continúa)
14Ander(543-623).qxd 2/28/08 7:17 PM Page 577
14.6
577
Uso de la ecuación de regresión estimada para estimaciones y predicciones
Nombre IBM Infoprint 1120n Lexmark W812 Oki Data B8300n
Tipo
Velocidad (ppm)
Precio ($)
Corporativa Corporativa Corporativa
11.8 19.8 28.2
1387 2089 2200
¿Indican las evidencias que haya una relación significante entre velocidad de impresión y precio? Realice la prueba estadística apropiada y dé su conclusión. Use α 0.05. 31. En el ejercicio 20 con los datos sobre x precio ($) y y evaluación general de 10 televisores de plasma, de 42 pulgadas probadas por Consumer Reports se obtuvo la ecuación de regresión estimada ŷ 12.0169 + 0.0127x. Con estos datos se obtuvieron SCE 540.04 y STC 982.40. Use la prueba F para determinar si el precio de los televisores de plasma, de 42 pulgadas y la evaluación general están relacionados. Use α = 0.05.
14.6
Uso de la ecuación de regresión estimada para estimaciones y predicciones Al usar el modelo de regresión lineal simple se hace una suposición acerca de la relación entre x y y. Después se usa el método de mínimos cuadrados para obtener una ecuación de regresión lineal simple estimada. Si existe una relación significante entre x y y y si el coeficiente de determinación indica que el ajuste es bueno, la ecuación de regresión estimada es útil para estimaciones y predicciones.
Estimación puntual En el ejemplo de Armand’s Pizza Parlors, la ecuación de regresión estimada ŷ 60 5x proporciona una estimación de la relación entre x el tamaño de la población de estudiantes y y las ventas trimestrales. Con la ecuación de regresión estimada se puede obtener una estimación puntual del valor medio de y correspondiente a un determinado valor de x o se puede predecir el valor de y que corresponde a un valor de x. Por ejemplo, supóngase que los gerentes de Armand’s desean una estimación puntual de la media de las ventas trimestrales de todos los restaurantes que se encuentren cerca de campus de 10 000 estudiantes. Usando la ecuación de regresión estimada ŷ 60 5x, con x = 10 (o 10 000 estudiantes) se obtiene ŷ 60 5(10) = 110. Por lo tanto, una estimación puntual de la media de las ventas trimestrales de todos los restaurantes ubicados cerca de campus de 10 000 estudiantes es $110 000. Ahora supóngase que los administradores de Armand´s desean predecir las ventas de un determinado restaurante ubicado cerca de Talbot College, una escuela de 10 000 estudiantes. En este caso lo que interesa no es la media correspondiente a todos los restaurantes que están cerca de campus de 10 000 estudiantes, sino únicamente predecir las ventas trimestrales de un determinado restaurante. En realidad, la estimación puntual de un solo valor de y es igual a la estimación puntual de la media de los valores de y. Por lo tanto, la predicción de las ventas trimestrales de este restaurante serán ŷ 60 5(10) 110 o $110 000.
Estimación por intervalo Los intervalos de confianza y los intervalos de predicción indican la precisión de los resultados de la regresión. Los intervalos más estrechos proporcionan mayor precisión.
Las estimaciones puntuales no proporcionan información alguna acerca de la precisión de una estimación. Para eso es necesario obtener estimaciones por intervalo que son muy parecidas a las de los capítulos 8, 10 y 11. El primer tipo de estimación por intervalo, el intervalo de confianza es una estimación por intervalo del valor medio de las y que corresponden a un valor dado de x. El segundo tipo de estimación por intervalo, el intervalo de predicción, se usa cuando se necesita una estimación por intervalo de un solo valor de y para un valor dado de x. La estimación puntual del valor medio de y es igual a la estimación puntual de un solo valor de y. Pero las estimaciones por intervalo que se obtienen para estos dos casos son diferentes. En un intervalo de predicción el margen de error es mayor.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 578
578
Capítulo 14
Regresión lineal simple
Intervalo de confianza para el valor medio de y Con la ecuación de regresión estimada se obtiene una estimación puntual del valor medio de y que corresponde a un valor dado de x. Para obtener un intervalo de confianza se usa la notación siguiente. x p valor dado de la variable independiente x y p valor de la variable dependiente y que corresponde al valor dado xp E(yp ) valor medio o valor esperado de la variable dependiente y que corresponde al valor dado xp ŷp b0 b1x p estimación puntual de E(yp) cuando x xp Empleando esta notación para estimar la media de las ventas de los restaurantes Armand’s que se encuentran cerca de un campus de 10 000 estudiantes, se tiene que xp 10 y E(yp) denota el valor medio desconocido de las ventas de todos los restaurantes para los que xp 10. La estimación puntual de E(yp) está dada por ŷp 60 + 5(10) 110. En general, no se puede esperar que ŷp sea exactamente igual a E(yp). Para hacer una inferencia acerca de qué tan cerca está ŷp de la media E(yp), es necesario estimar la varianza de ŷp . La fórmula para estimar la varianza de ŷp para un xp dado se denota s 2ŷp, y es s 2ŷp s 2
冤
(x p x̄)2 1 n 兺(xi x̄)2
冥
(14.22)
Una estimación de la desviación estándar de ŷp está dada por la raíz cuadrada de la ecuación (14.22).
冑
sŷp s
(x p x̄)2 1 n 兺(xi x̄)2
(14.23)
En los resultados obtenidos en la sección 14.5 para el ejemplo de Armand’s Pizza Parlors se tiene s 13.829. Como xp = 10, x̄ 14 y 兺(xi x̄ )2 568, usando la ecuación (14.23) se obtiene sŷp
1 (10 14)2 10 568 13.829 0.1282 4.95
13.829
A continuación se presenta la fórmula general para obtener un intervalo de confianza.
INTERVALO DE CONFIANZA PARA E( yp ) El margen de error en esta estimación por intervalo (este intervalo de estimación) es tα/2 sŷp.
ŷp tα/2sŷp
(14.24)
donde el coeficiente de confianza es 1 α y ta/2 es un valor de la distribución t con n 2 grados de libertad.
Para obtener, con la fórmula (14.24), un intervalo de confianza de 95% para la media de las ventas trimestrales de los restaurantes Armand’s que se encuentran cerca de campus de 10 000 estudiantes, se necesita el valor de t para α/2 0.025 y n 2 = 10 2 = 8 grados de libertad. En la tabla 2 del apéndice B, se encuentra t0.025 2.306. Por lo tanto, como ŷp 110 y el margen de error es tα/2s ŷp 2.306(4.95) 11.415, la estimación por intervalo de 95% de confianza es 110 11.415
14Ander(543-623).qxd 2/28/08 7:17 PM Page 579
14.6
FIGURA 14.8
579
Uso de la ecuación de regresión estimada para estimaciones y predicciones
INTERVALOS DE CONFIANZA PARA LA MEDIA DE LAS VENTAS y CORRESPONDIENTES A VALORES DADOS DEL TAMAÑO DE LA POBLACIÓN DE ESTUDIANTES x
y 220
Límite superior
200 ^
y
Ventas trimestrales (miles de $)
180
0 =6
x
+5
Límite inferior
160 140
Los límites de los intervalos de confianza dependen de xp
120 100 En xp = x se tiene la menor amplitud del intervalo de confianza
80 60 40
x = 14
20 0
0
2
4
6
8
10 12 14 16 18 Población de estudiantes (miles)
20
22
24
26
x
En dólares, el intervalo de 95% de confianza para la media de las ventas trimestrales de todos los restaurantes que se encuentran cerca de un campus de 10 000 estudiantes es 110 000 $11 415. Por lo tanto, si el tamaño de la población de estudiantes es 10 000, el intervalo de 95% de confianza para la media de las ventas trimestrales en los restaurantes cercanos a un campus de 10 000 estudiantes es el intervalo que va de $98 585 a $121 415. Obsérvese que la desviación estándar estimada de ŷp, dada por la ecuación (14.23), es menor cuando x p x̄ y la cantidad x p x̄ 0. En este caso, la desviación estándar estimada de ŷp se convierte en
冑
sŷp s
冑
1 (x̄ x̄)2 1 2 s n 兺(xi x̄) n
Esto significa que cuando xp x̄ se obtiene la mejor estimación o la estimación más precisa del valor medio de y. Entre más alejada esté x p de x̄, mayor será x p x̄ . El resultado es que los intervalos de confianza para el valor medio de y son más amplios a medida que x p se aleja de x̄ . En la figura 14.8 se muestra esto gráficamente.
Intervalo de predicción para un solo valor de y Supóngase que en lugar de que lo que interese sea estimar el valor medio de las ventas de todos los restaurantes Armand’s que se encuentran cerca de campus de 10 000 estudiantes, se deseen estimar las ventas de un solo restaurante que se encuentra cerca de Talbot College, una escuela
14Ander(543-623).qxd 2/28/08 7:17 PM Page 580
580
Capítulo 14
Regresión lineal simple
de 10 000 estudiantes. Como ya se indicó, la estimación puntual de yp , el valor de y que corresponde a un valor dado x p, se obtiene mediante la ecuación de regresión ŷp b0 b1x p. En el caso del restaurante cerca de Talbot College, como x p 10, las ventas trimestrales pronosticadas serán ŷp 60 5(10) 110 o $110 000. Obsérvese que este valor es el mismo que el obtenido como estimación puntual de la media de las ventas en los restaurantes que se encuentran cerca de campus de 10 000 estudiantes. Para obtener un intervalo de predicción, es necesario determinar primero la varianza correspondiente al uso de ŷp como estimación de un valor individual de y cuando a x x p. Esta varianza está formada por la suma de los dos componentes siguientes. 1. La varianza de los valores individuales de y respecto a la media E( yp ), para la cual una estimación está dada por s2 2. La varianza correspondiente al uso de ŷp para estimar E( yp ), para la cual una estimación está dada por s 2ŷp La fórmula para estimar la varianza de un valor individual de yp que se denota s 2ind, es s 2ind s 2 s 2ŷp (x p x̄)2 1 s s n 兺(x i x̄)2 (x p x̄)2 1 s2 1 n 兺(x i x̄)2 2
2
冤
冤
冥
冥
(14.25)
Por lo tanto, una estimación de la desviación estándar de un solo valor de yp es la dada por sind s
冑
1
(x p x̄)2 1 n 兺(x i x̄)2
(14.26)
En el ejemplo de Armand’s Pizza Parlors, la desviación estándar estimada que corresponde a la predicción de las ventas de un determinado restaurante que esté cerca de un campus de 10 000 estudiantes se calcula como sigue.
冑
1 (10 14)2 10 568 13.829 兹1.1282 14.69
sind 13.829
1
La fórmula general para un intervalo de predicción es como sigue
INTERVALO DE PREDICCIÓN PARA yp El margen de error de este intervalo de estimación es tα/2 sind.
ŷp tα/2 sind
(14.27)
donde el coeficiente de confianza es 1 α y tα/2 es un valor de la distribución t para n 2 grados de libertad
El intervalo de predicción de las ventas trimestrales del restaurante situado cerca de Talbot Collage se encuentra empleando t0.025 2.306 y sind 14.69. Por lo tanto, como ŷp 110 y el margen de error es tα/2sind 2.306(14.69) 33.875, el intervalo de predicción de 95% de confianza es 110 33.875
14Ander(543-623).qxd 2/28/08 7:17 PM Page 581
14.6
FIGURA14.9
581
Uso de la ecuación de regresión estimada para estimaciones y predicciones
INTERVALOS DE CONFIANZA Y DE PREDICCIÓN PARA LAS VENTAS y QUE CORRESPONDEN A VALORES DADOS x DEL TAMAÑO DE LA POBLACIÓN DE ESTUDIANTES
y 240
Ventas trimestrales (miles de $)
220 200
y=
^
180 160
60
+ 5x
Límites del intervalo de confianza
Los intervalos de predicción son más anchos
140 120
Límites de los intervalos de predicción
100 80 Los dos intervalos tienen la menor amplitud en xp = x̄ x¯ = 14
60 40 20 0
0
En general, tanto las líneas de los límites para los intervalos de confianza como las de los límites para los intervalos de predicción tienen cierta curvatura.
2
4
6
8
10 12 14 16 18 Población de estudiantes (miles)
20
22
24
26
x
En dólares, el intervalo de predicción es $110 000 $33 875 o el intervalo que va de $76 125 a $143 875. Obsérvese que el intervalo de predicción para un solo restaurante que se encuentre cerca de un campo de 10 000 estudiantes es más amplio que el intervalo de confianza para la media de las ventas de todos los restaurantes que se encuentran cerca de campus de 10 000 estudiantes. Esta diferencia refleja el hecho de que se puede estimar con más precisión la media de y que un solo valor individual de y. Tanto las estimaciones mediante un intervalo de confianza como las estimaciones mediante un intervalo de predicción son más precisas cuando el valor de la variable independiente es x p x̄. En la figura 14.9 se muestra la forma general de los intervalos de confianza y de los intervalos de predicción que son más anchos.
Ejercicios
Métodos
Auto examen
32. Los datos siguientes son los del ejercicio 1.
a. b.
xi
1
2
3
4
5
yi
3
7
5
11
14
Use la ecuación (14.23) para estimar la desviación estándar de ŷp cuando x 4. Use la expresión (14.24) para obtener un intervalo de confianza de 95% para el valor esperado de y cuando x 4.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 582
582
Capítulo 14
c. d.
Regresión lineal simple
Use la ecuación (14.26) para estimar la desviación estándar de un valor de y cuando x 4. Use la expresión (14.27) para obtener un intervalo de predicción de 95% para y cuando x 4
33. Los datos siguientes son los del ejercicio 2.
a. b. c. d.
xi
3
12
6
20
14
yi
55
40
55
10
15
Estime la desviación estándar de ŷp cuando x = 8. Obtenga un intervalo de 95% de confianza para el valor esperado de y cuando x 8. Estime la desviación estándar de un valor individual de y cuando x 8. Obtenga un intervalo de predicción de 95% para y cuando x 8.
34. Los datos siguientes son los del ejercicio 3. xi
2
6
9
13
20
yi
7
18
9
26
23
Obtenga los intervalos de confianza y de predicción del 95% para x 12. Explique por qué
son diferentes estos dos intervalos.
Aplicaciones
Auto examen
archivo CD en SleepingBags
35. En el ejercicio 18, con los datos de los promedios de calificaciones x y los salarios mensuales y se obtuvo la ecuación de regresión estimada ŷ 1790.5 + 581.1x. a. Dé un intervalo de 95% de confianza para el salario medio inicial de todos los estudiantes cuyo promedio fue 3.0. b. Dé un intervalo de 95% de predicció para el salario medio inicial de Joe Heller cuyo promedio fue 3.0. 36. En el ejercicio 10, a partir de los datos de temperatura (°F) x y precio ($) y de 12 sacos de dormir, fabricados por Bergans of Noway, se obtuvo la ecuación de regresión ŷ 359.2668 5.2772x. Para estos datos s = 37.9372. a. Dé una estimación puntual del precio de un saco de dormir cuya temperatura sea 30. b. Dé un intervalo de 95% de confianza para el precio medio de todos los sacos de dormir cuya temperatura sea 30. c. Suponga que Bergans elabora un nuevo modelo cuya temperatura es 30. Dé un intervalo de predicción de 95% para el precio de este nuevo modelo. d. Explique la diferencia entre sus respuestas a los incisos b) y c). 37. En el ejercicio 13 se proporcionaron datos sobre el ingreso bruto ajustado y el monto de las deducciones en las declaraciones de impuestos. Los datos se dieron en miles de dólares. Como la ecuación de regresión estimada es ŷ 4.68 0.16x, el monto razonable de las deducciones, para un contribuyente cuyo ingreso bruto ajustado sea $52 500, es $13 080. a. Dé un intervalo de 95% de confianza para el monto medio de las deducciones de todos los contribuyentes cuyo ingreso bruto ajustado sea $52 500. b. Dé un intervalo de predicción de 95% para el monto total de deducciones de un contribuyente cuyo ingreso bruto ajustado sea $52 500. c. Si el contribuyente del inciso b) solicita deducciones de $20 400, ¿se justificaría que se le quiera hacer una auditoría? d. Emplee su respuesta al inciso b) para indicar el monto de las deducciones que puede solicitar un contribuyente cuyo ingreso bruto ajustado sea $52 500 sin que se le haga una auditoría. 38. Retome el ejercicio 21, en el que la ecuación de regresión estimada ŷ 1246.67 + 7.6x se obtuvo empleando los datos de volumen de producción x y costos totales y de una determinada operación de fabricación. a. En el plan de producción de la empresa se ve que el mes próximo deberán producirse 500 unidades. Dé la estimación puntual de los costos totales.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 583
14.7
583
Solución por computadoras
b. c.
Dé un intervalo de predicción de 99% para el costo total de producción de las 500 unidades, el mes próximo. Si al final del mes próximo, el informe de costos de un contador indica que en ese mes los costos reales de producción fueron $6000, ¿debería preocupar a los gerentes el haber incurrido ese mes en costos totales tan altos? Analice.
39. En Estados Unidos casi todo el sistema de tranvías usa vagones eléctricos que corren sobre vías a nivel de la calle. La Administración de Tránsito Federal afirma que el tranvía es uno de los medios de transporte más seguros, ya que la tasa de accidentes es 0.99 accidentes por millón de millas-pasajero en comparación con 2.29 en los autobuses. En los datos siguientes se dan las millas de vía y la cantidad de pasajeros transportados en los días laborables, en miles, de seis sistemas de tranvías (USA Today, 7 de enero 2003).
Ciudad Cleveland Denver Portland Sacramento San Diego San Jose St. Louis
a. b. c. d.
14.7
Millas de vías
Pasajeros transportados (miles)
15 17 38 21 47 31 34
15 35 81 31 75 30 42
Use estos datos para obtener la ecuación de regresión estimada que podría emplearse para predecir la cantidad de pasajeros dadas las millas de vías. ¿Proporciona la ecuación de regresión estimada un buen ajuste? Explique. Obtenga un intervalo de 95% de confianza para la media de la cantidad de pasajeros transportados en los días laborables en los sistemas de tranvías que tienen 30 millas de vías. Suponga que Charlotte está considerando la construcción de un sistema de tranvía de 30 millas de vías. Dé un intervalo de predicción de 95% para la cantidad de pasajeros transportada en un día laborable por el sistema Charlotte. ¿Cree usted que el intervalo de predicción que desarrolló pueda ser útil a los que están planeando Charlotte para anticipar la cantidad de pasajeros en un día laborable en su sistema de tranvía? Explique
Solución por computadoras Realizar los cálculos del análisis de regresión sin la ayuda de una computadora puede costar mucho tiempo. En esta sección se verá cómo mediante el uso de paquetes de software como Minitab puede minimizarse la complicación de hacer tantos cálculos. Los datos sobre población de estudiantes y ventas se han ingresado en la hoja de cálculo de Minitab. A la variable independiente se le ha llamado Pop y a la variable independiente se le ha llamado Ventas para facilitar la interpretación de los resultados que proporciona la computadora. Usando Minitab para el ejemplo de Armand’s Pizza Parlors se obtuvieron los resultados que se muestran en la figura 14.10*. A continuación se explica cómo interpretar estos resultados. 1. Minitab da la ecuación de regresión estimada como Ventas 60.0 + 5.00 Pop. 2. Da también una tabla en la que indica el valor de los coeficientes b0 y b1, la desviación estándar de cada coeficiente, el valor t obtenido al dividir cada coeficiente entre su desviación estándar y el valor-p correspondiente a la prueba t. Como el valor-p es cero (a tres cifras decimales), los resultados muestrales indican que debe rechazarse la hipótesis nula (H0: β1 0). O bien, se puede comparar 8.62 (que aparece en la columna t) con el valor crítico apropiado. Este procedimiento para la prueba t se describió en la sección 14.5. *En el apéndice 14.3 se dan los pasos que hay que seguir con Minitab para obtener estos resultados.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 584
584
Capítulo 14
FIGURA 14.10
Regresión lineal simple
RESULTADOS DADOS POR MINITAB PARA EL PROBLEMA DE ARMAND’S PIZZA PARLORS
The regression equation is Sales = 60.0 + 5.00 Pop Predictor Constant Pop
Coef 60.000 5.0000
S = 13.83
SE Coef 9.226 0.5803
R-sq = 90.3%
Estimated regression equation
T 6.50 8.62
p 0.000 0.000
R-sq(adj) = 89.1%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 8 9
SS 14200 1530 15730
MS 14200 191
F 74.25
p 0.000
¶
ANOVA table
Predicted Values for New Observations New Obs 1
Fit 110.00
SE Fit 4.95
95% C.I. (98.58, 121.42)
95% P.I. (76.12, 143.88)
Interval estimates
3. Minitab da el error estándar de estimación, s 13.83, así como información acerca de la bondad de ajuste. Observe que “R-sq 90.3%” es el coeficiente de determinación expresado como porcentaje. El valor “R-sq (adj) 89.1%” se verá en el capítulo 15. 4. La tabla ANOVA se presenta bajo el encabezado Analysis of Variance. Minitab usa el rótulo Residual Error para la fuente de variación del error. Obsérvese que DF es la abreviación de degrees of freedom ( = grados de libertad) y que CMR está dado como 14 200 y ECM como 191. El cociente de estos dos valores da el valor F que es 74.25 y el correspondiente valor-p 0.000. como el valor-p es cero (a tres lugares decimales), la relación entre ventas (Sales) y población (Pop) se considera estadísticamente significante. 5. La estimación de las ventas esperadas mediante un intervalo de confianza de 95% y la estimación de las ventas de un determinado restaurante cercano a un campus de 10 000 estudiantes mediante un intervalo de estimación de 95% se dan abajo de la tabla ANOVA. El intervalo de confianza es (98.58, 121.42) y el intervalo de predicción es (76.12, 143.88) como se indicó en la sección 14.6.
Ejercicios
Aplicaciones
Auto examen
40. La división comercial de una empresa inmobiliaria realiza un análisis de regresión de la relación entre x, rentas brutas anuales (en miles de dólares) y y, precio de venta (en miles de dólares) de edificios de departamentos. Se obtuvieron datos sobre varias propiedades vendidas últimamente y con la computadora se obtuvieron los resultados siguientes.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 585
14.7
585
Solución por computadoras
The regression equation is Y = 20.0 + 7.21 X Predictor Constant X
Coef 20.000 7.210
SE Coef 3.2213 1.3626
T 6.21 5.29
Analysis of Variance SOURCE Regression Residual Error Total
a. b. c. d. e.
DF 1 7 8
SS 41587.3 51984.1
¿Cuántos edificios de departamentos había en la muestra? Dé la ecuación de regresión estimada ¿Cuál es el valor de sb1? Use el estadístico F para probar la significancia de la relación empleando 0.05 como nivel de significancia. Estime el precio de venta de un edificio de departamentos cuyas rentas anuales brutas son $50 000.
41. A continuación se presenta una parte de los resultados por computadora de un análisis de regresión en el que se relaciona y gastos de mantenimiento (dólares por mes) con x uso (horas por semana) para una marca determinada de terminal de computadora.
The regression equation is Y = 6.1092 + .8951 X Predictor Constant X
Coef 6.1092 0.8951
SE Coef 0.9361 0.1490
Analysis of Variance SOURCE Regression Residual Error Total
a. b. c.
DF 1 8 9
SS 1575.76 349.14 1924.90
MS 1575.76 43.64
Dé la ecuación de regresión estimada. Use una prueba t para determinar si los gastos mensuales de mantenimiento están relacionados con el uso, empleando 0.05 como nivel de significancia. Utilice la ecuación de regresión estimada para predecir los gastos mensuales de mantenimiento de una terminal que se usa 25 hora por semana.
42. Un modelo de regresión que relaciona x, el número de vendedores en una sucursal, con y, las ventas anuales en esa sucursal (en miles de dólares), proporcionó el siguiente resultado de computadora empleando análisis de regresión de los datos.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 586
586
Capítulo 14
Regresión lineal simple
The regression equation is Y = 20.0 + 7.21 X Predictor Constant X
Coef 20.000 7.210
SE Coef 3.2213 1.3626
T 6.21 5.29
Analysis of Variance SOURCE Regression Residual Error Total
a. b. c. d.
DF 1 7 8
SS 41587.3 51984.1
Dé la ecuación de regresión estimada. ¿Cuántas sucursales participaron en el estudio? Calcule el estadístico F y pruebe la significancia de la relación empleando 0.05 como nivel de significancia. Pronostique las ventas anuales de la sucursal Menphis. En esta sucursal hay 12 vendedores.
43. Los expertos en salud recomiendan que los corredores beban 4 onzas de agua por cada 15 minutos que corran. Aunque las botellas de plástico son una buena alternativa para la mayoría de los corredores, cuando se corre todo un día a campo traviesa se requieren sistemas de hidratación que se llevan sobre la cintura o sobre la espalda. Estos sistemas de hidratación además de permitir llevar más agua permiten llevar también alimento o ropas. Por supuesto, a medida que aumenta la capacidad de estos sistemas, aumenta también su peso y su precio. En la lista siguiente se da peso y precio de 26 de estos sistemas de hidratación (Trail Runner Gear Guide, 2003).
Modelo
archivo CD en Hydration1
Fastdraw Fastdraw Plus Fitness Access Access Plus Solo Serenade Solitaire Gemini Shadow SipStream Express Lightning Elite Extender Stinger GelFlask Belt GelDraw GelFlask Clip-on Holster GelFlask Holster SS Strider (W)
Peso (onzas)
Precio ($)
3 4 5 7 8 9 9 11 21 15 18 9 12 14 16 16 3 1 2 1 8
10 12 12 20 25 25 35 35 45 40 60 30 40 60 65 65 20 7 10 10 30
14Ander(543-623).qxd 2/28/08 7:17 PM Page 587
14.7
587
Solución por computadoras
Modelo Walkabout (W) Solitude I.C.E. Getaway I.C.E. Profile I.C.E. Traverse I.C.E.
a. b. c. d.
e.
Peso (onzas)
Precio ($)
14 9 19 14 13
40 35 55 50 60
Con estos datos obtenga una ecuación de regresión estimada que pueda ser empleada para predecir el precio de un sistema de hidratación en función de su peso. Pruebe la significancia de la relación empleando 0.05 como nivel de significancia. ¿Proporciona un buen ajuste la ecuación de regresión estimada? Suponga que la ecuación de regresión estimada obtenida en el inciso a) también pueda usarse para sistemas de hidratación elaborados por otras empresas. Obtenga un intervalo de confianza de 95% para estimar el precio de todos los sistemas de hidratación que pesan 10 onzas. Suponga que la ecuación de regresión estimada obtenida en el inciso a) también pueda usarse para sistemas de hidratación elaborados por otras empresas. Obtenga un intervalo de predicción de 95% para estimar el precio del sistema Back Draft elaborado por Eastern Mountain Sports; este sistema de hidratación pesa 10 onzas.
44. Cushman Wakefield, Inc. recoge datos sobre la tasa de desocupación en edificios de oficinas y las tasas de las rentas en mercados de Estados Unidos. Los datos siguientes dan la tasa de desocupación (%) y las tasas de rentas promedio (por pie cuadrado) en las zonas comerciales centrales de 18 mercados.
Mercado Atlanta Boston Hartford Baltimore Washington Philadelphia Miami Tampa Chicago San Francisco Phoenix San Jose West Palm Beach Detroit Brooklyn Downtown, NY Midtown, NY Midtown South, NY
archivo CD en OffRates
a. b. c. d.
Tasa de desocupación (%)
Tasa promedio ($)
21.9 6.0 22.8 18.1 12.7 14.5 20.0 19.2 16.0 6.6 15.9 9.2 19.7 20.0 8.3 17.1 10.8 11.1
18.54 33.70 19.67 21.01 35.09 19.41 25.28 17.02 24.04 31.42 18.74 26.76 27.72 18.20 25.00 29.78 37.03 28.64
Con estos datos trace un diagrama de dispersión; en el eje horizontal grafique la tasa de desocupación. ¿Parece haber alguna relación entre las tasas de desocupación y las tasas de rentas? Dé la ecuación de regresión para predecir la tasa promedio de renta en función de una tasa de desocupación dada. Empleando como nivel de significancia 0.05 pruebe la significancia de esta relación.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 588
588
Capítulo 14
e. f. g.
14.8
El análisis residual es la herramienta principal para determinar si el modelo de regresión empleado es apropiado.
Regresión lineal simple
¿Proporciona, la ecuación de regresión estimada, un buen ajuste? Explique. Pronostique la tasa de renta esperada en los mercados en los que la tasa de desocupación en zonas comerciales centrales es 25%. La tasa de desocupación general en la zona comercial central de Ft. Lauderdale es 11.3%. Pronostique la tasa de renta esperada en Ft. Lauderdale.
Análisis residual: confirmación de las suposiciones del modelo Como ya se indicó, el residual de la observación i es la diferencia entre el valor observado de la variable dependiente (yi ) y el valor estimado de la variable dependiente (ŷi )
RESIDUAL DE LA OBSERVACIÓN i
yi ŷi
(14.28)
donde yi es el valor observado de la variable dependiente ŷi es el valor estimado de la variable dependiente
En otras palabras, el residual i es el error que resulta de usar la ecuación de regresión estimada para predecir el valor de la variable dependiente. En la tabla 14.7 se calculan estos residuales correspondientes a los datos del ejemplo de Armand’s Pizza Parlors. En la segunda columna de la tabla se presentan los valores observados de la variable dependiente y en la tercera columna, los valores estimados de la variable dependiente obtenidos usando la ecuación de regresión estimada ŷ 60 5x. Un análisis de los residuales correspondientes, que se encuentran en la cuarta columna de la tabla, ayuda a determinar si las suposiciones hechas acerca del modelo de regresión son adecuadas. A continuación se revisan las suposiciones de regresión en el ejemplo de Armand’s Pizza Parlors. Se supuso un modelo de regresión lineal simple y β0 β1x
TABLA 14.7
(14.29)
RESIDUALES EN EL EJEMPLO DE ARMAND’S PIZZA PARLORS
Población de estudiantes xi 2 6 8 8 12 16 20 20 22 26
Ventas yi
Ventas estimadas ŷi ⴝ 60 ⴙ 5xi
Residuales yi ⴚ ŷi
58 105 88 118 117 137 157 169 149 202
70 90 100 100 120 140 160 160 170 190
12 15 12 18 3 3 3 9 21 12
14Ander(543-623).qxd 2/28/08 7:17 PM Page 589
14.8
Análisis residual: confirmación de las suposiciones del modelo
589
Este modelo indica que se supone que las ventas trimestrales (y) son función lineal del tamaño de la población de estudiantes (x), más un término del error . En la sección 14.4, para el término del error se hicieron las siguientes suposiciones 1. 2. 3. 4.
E( ) 0. La varianza de , que se denota σ 2, es la misma para todos los valores de x. Los valores de son independientes. El término del error tiene distribución normal.
Estas suposiciones son la base teórica para las pruebas t y F que se usan para determinar si la relación entre x y y es significativa y para las estimaciones, mediante intervalos de confianza y de predicción, presentadas en la sección 14.6. Si las suposiciones acerca del término del error son dudosas, puede ser que las pruebas de hipótesis acerca de la significancia de la relación de regresión y los resultados de la estimación por intervalo no sean correctos. Los residuales proporcionan la mejor información acerca de ; por lo tanto, el análisis de los residuales es muy importante para determinar si las suposiciones hechas acerca de son apropiadas. Gran parte del análisis residual se basa en examinar gráficas. En esta sección se estudiarán las siguientes gráficas de residuales. 1. 2. 3. 4.
La gráfica de residuales contra los valores de la variable independiente x La gráfica de residuales contra los valores pronosticados para la variable dependiente ŷ La gráfica de residuales estandarizados La gráfica de probabilidad normal.
Gráfica de residuales contra x La gráfica de residuales contra la variable independiente x es una gráfica en la que los valores de la variable independiente se representan en el eje horizontal y los valores de los residuales correspondientes se representan en el eje vertical. Para cada residual se grafica un punto. La primera coordenada de cada punto está dada por el valor xi y la segunda coordenada está dada por el correspondiente valor del residual yi ŷi. En la gráfica de residuales contra x obtenida con los datos de Armand’s Pizza Parlors de la tabla 14.7, las coordenadas del primer punto son (2, 12), que corresponden a x1 = 2 y y1 ŷ1 12; las coordenadas del segundo punto son (6, 15), que corresponden a x2 = 6 y y 2 ŷ 2 15; etc. En la figura 14.11 se muestra la gráfica de residuales obtenida. Antes de interpretar los resultados de esta gráfica de residuales, se considerarán algunas de las formas generales que pueden tener las gráficas de residuales. En la figura 14.12 se muestran tres ejemplos. Si la suposición de que la varianza de es la misma para todos los valores de x y si el modelo de regresión empleado representa adecuadamente la relación entre las variables, el aspecto general de la gráfica de residuales será el de una banda horizontal de puntos como en la gráfica A de la figura 14.12. Pero si la varianza de no es la misma para todos los valores x —por ejemplo, si la variabilidad respecto a la línea de regresión es mayor para valores de x mayores— el aspecto de la gráfica puede ser como el de la gráfica B de la figura 14.12. En este caso, se viola la suposición de que tiene una varianza constante. En la gráfica C se muestra otra forma que puede tomar la gráfica de residuales. En este caso, se puede concluir que el modelo de regresión empleado no representa adecuadamente la relación entre las variables, y deberá considerarse un modelo de regresión curvilíneo o múltiple. Volviendo, ahora, a la gráfica de los residuales del ejemplo de Armand’s Pizza Parlors, figura 14.11. Estos residuales parecen tener una forma que se aproxima a la forma de banda horizontal de la gráfica A de la figura 14.12. Por lo tanto, se concluye que esta gráfica de residuales no muestra evidencias de que las suposiciones hechas para el modelo de regresión de Armand’s puedan ser dudosas. Se concluye que el modelo de regresión lineal simple empleado para el ejemplo de Armand’s, es válido.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 590
Capítulo 14
Regresión lineal simple
FIGURA 14.11
GRÁFICA DE RESIDUALES CONTRA LA VARIABLE INDEPENDIENTE x OBTENIDA CON LOS DATOS DE ARMAND’S PIZZA PARLORS ∧
y–y
+20
+10 Residuales
590
0
–10
–20 0
2
4
6
8
10
12
14
16
18
20
22
24
26
x
Para la adecuada interpretación de las gráficas de residuales experiencia y criterio son muy importantes. Es raro que una gráfica de residuales tenga exactamente la forma de una de las gráficas presentadas en la figura 14.12. Sin embargo, los analistas que realizan frecuentemente estudios de regresión y gráficas de residuales se vuelven expertos en reconocer las diferencias entre las formas razonables y las que indican que se pude dudar de las suposiciones del modelo. Una gráfica de residuales proporciona una técnica para evaluar la validez de las suposiciones en un modelo de regresión.
Gráfica de residuales contra ^ y En otra gráfica de residuales los valores pronosticados para la variable dependiente ŷ se representan en el eje horizontal y los valores de los residuales en el eje vertical. A cada residual corresponde un punto en la gráfica. La primera coordenada de cada uno de los puntos es ŷi y la segunda coordenada es el valor correspondiente del residual i,yi ŷi. Empleando los datos de Armand’s, tabla 14.7, las coordenadas del primer punto son (70, 12), que corresponden a ŷ1 70 y y1 ŷ1 12; las coordenadas del segundo punto son (90, 15), etc. En la figura 14.13 se presenta esta gráfica de residuales. Obsérvese que la forma de esta gráfica de residuales es igual a la forma de la gráfica de residuales contra la variable independiente x. Esta no es una forma que pudiera llevar a dudar de las suposiciones del modelo. En la regresión lineal simple, tanto la gráfica de residuales contra x como la gráfica de residuales contra ŷ tienen la misma forma. En el análisis de regresión múltiple, la gráfica de residuales contra ŷ se usa más debido a que se tiene más de una variable independiente.
Residuales estandarizados Muchas de las gráficas de residuales que se obtienen con los paquetes de software utilizan una versión estandarizada de los residuales. Como se demostró en el capítulo anterior, una variable aleatoria se estandariza sustrayéndole su media y dividiendo el resultado entre su desviación es-
14Ander(543-623).qxd 2/28/08 7:17 PM Page 591
591
Análisis residual: confirmación de las suposiciones del modelo
FIGURA 14.12
GRÁFICAS DE LOS RESIDUALES CORRESPONDIENTES A TRES ESTUDIOS DE REGRESIONES y – y^
Residual
Gráfica A
• 0
• •
• • • • • • •• • • • Forma adecuada • • • • • • • •
x
y – y^ Gráfica B
•
Residual
•
• • • • • Varianza no constante • • • • • • • • • •
• 0
• •
x
y – y^ Gráfica C
•
• Residual
14.8
• •
•
•
0
•
• •
• •
•
•
Forma no adecuada
•
•
•
• •
•
x
14Ander(543-623).qxd 2/28/08 7:17 PM Page 592
Capítulo 14
Regresión lineal simple
FIGURA 14.13
GRÁFICA DE RESIDUALES CONTRA EL VALOR PRONOSTICADO ŷ OBTENIDA CON LOS DATOS DE ARMAND’S PIZZA PARLORS ∧
y–y +20
+10 Residuales
592
0
–10
–20 ∧
60
80
100
120
140
160
180
y
tándar. Cuando se emplea el método de mínimos cuadrados, la media de los residuales es cero. Por lo tanto, para obtener el residual estandarizado sólo es necesario dividir cada residual entre su desviación estándar. Se puede demostrar que la desviación estándar del residual i depende del error estándar de estimación s y del valor correspondiente de la variable independiente xi.
DESVIACIÓN ESTÁNDAR DEL RESIDUAL i*
syi ŷi s 兹1 hi
(14.30)
donde syi ŷi desviación estándar del residual i s error estándar de estimación 1 (x x̄)2 hi i n 兺(xi x̄)2
(14.31)
Obsérvese que la ecuación (14.30) indica que la desviación estándar del residual i depende de xi, debido a la presencia de hi en la fórmula.** Una vez calculada la desviación estándar de cada uno de los residuales, se pueden calcular los residuales estandarizados dividiendo cada residual entre sus desviaciones estándar correspondientes *En realidad, esta ecuación proporciona una estimación de la desviación estándar del residual i ya que se usa s en lugar de σ. ** A hi se le conoce como el influencial de la observación i. El influencial se verá en la sección 14.9 cuando se consideren las observaciones influyentes.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 593
14.8
TABLA 14.8
593
Análisis residual: confirmación de las suposiciones del modelo
CÁLCULO DE LOS RESIDUALES ESTANDARIZADOS DEL EJEMPLO DE ARMAND’S PIZZA PARLORS
Restaurantes Restaurant i
xi
xi ⴚ x̄
1 2 3 4 5 6 7 8 9 10
2 6 8 8 12 16 20 20 22 26
12 8 6 6 2 2 6 6 8 12 Total
(xi ⴚ x̄)2
(xi ⴚ x̄)2 ⌺(xi ⴚ x̄)2
hi
syiⴚŷi
yi ⴚ ŷi
Residuales estandarizados
144 64 36 36 4 4 36 36 64 144
0.2535 0.1127 0.0634 0.0634 0.0070 0.0070 0.0634 0.0634 0.1127 0.2535
0.3535 0.2127 0.1634 0.1634 0.1070 0.1070 0.1634 0.1634 0.2127 0.3535
11.1193 12.2709 12.6493 12.6493 13.0682 13.0682 12.6493 12.6493 12.2709 11.1193
12 15 12 18 3 3 3 9 21 12
1.0792 1.2224 0.9487 1.4230 0.2296 0.2296 0.2372 0.7115 1.7114 1.0792
568
Nota: En la tabla 14.7 se calculó el valor de los residuales.
RESIDUAL ESTANDARIZADO DE LA OBSERVACIÓN i
yi ŷi syi ŷi
Desviaciones pequeñas de la normalidad no tienen un efecto grande en las pruebas estadísticas empleadas en el análisis de regresión.
(14.32)
En la tabla 14.8 se presentan los cálculos de los residuales estandarizados utilizando el ejemplo de Armand’s Pizza Parlors. Recuérdese que ya en cálculos previos se obtuvo s 13 829. La figura 14.14 es la gráfica de los residuales estandarizados contra la variable independiente x. La gráfica de los residuales estandarizados permite ver si la suposición de que el término del error tiene distribución normal es correcta. Si esta suposición se satisface debe parecer que la distribución de los residuales estandarizados, proviene de una distribución de probabilidad normal estándar.* Por lo tanto, al observar la gráfica de los residuales estandarizados, se espera encontrar que aproximadamente 95% de los residuales estandarizados están entre 2 y 2. En la figura 14.14 se ve que en el ejemplo de Armand’s todos los residuales estandarizados se encuentran entre 2 y 2. Por lo tanto, de acuerdo con los residuales estandarizados, esta gráfica no da razones para dudar de la suposición de que tiene una distribución normal. Debido al trabajo que significa calcular los valores estimados de ŷ, los residuales y los residuales estandarizados, la mayoría de los paquetes de software para estadística proporcionan, de manera opcional, estos datos como parte de los resultados de la regresión.
Gráfica de probabilidad normal Otro manera de determinar la validez de la suposición de que el término del error tiene una distribución normal es la gráfica de probabilidad normal. Para mostrar cómo se elabora una gráfica de probabilidad normal, se introduce el concepto de puntos normales. Supóngase que, de una distribución de probabilidad normal en la que la media es cero y la desviación estándar es uno, se toman aleatoriamente 10 valores; supóngase que este proceso de muestreo se repite una y otra vez y que los 10 valores de cada muestra se ordenan de menor a mayor. Por ahora, considérese únicamente el valor menor de cada muestra. A la variable aleato*Como en la fórmula (14.30) se usa s en lugar de σ, la distribución de probabilidad de los residuales estandarizados no es técnicamente normal. Sin embargo, en la mayoría de los estudios de regresión, el tamaño de la muestra es suficientemente grande para que una aproximación normal sea muy buena.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 594
594
Capítulo 14
Regresión lineal simple
FIGURA 14.14
GRÁFICA DE RESIDUALES ESTANDARIZADOS CONTRA LA VARIABLE INDEPENDIENTE x, OBTENIDA CON LOS DATOS DE ARMAND’S PIZZA PARLORS.
Residuales estandarizados
+2
+1
0
–1
–2 0
2
4
6
8
10
12
14
16
18
20
22
24
26
x
TABLA 14.9 PUNTOS NORMALES PARA n 10
ria que representa el valor menor de estos varios muestreos se le conoce como el estadístico de primer orden. Estadístico Punto En la ciencia de la estadística se ha demostrado que en muestras de tamaño 10 tomadas de de orden normal una distribución de probabilidad normal estándar, el valor esperado del estadístico de primer or1 1.55 den es 1.55. A este valor esperado se le conoce como punto normal. En el caso de una mues2 1.00 3 0.65 tra de tamaño n 10, hay 10 estadísticos de orden y 10 puntos normales (ver tabla 14.9). En 4 0.37 general, un conjunto de datos que conste de n observaciones tendrá n estadísticos de orden y por 5 0.12 lo tanto n puntos normales. 6 0.12 7 0.37 A continuación se ve el uso de estos 10 puntos normales para determinar si parece ser que los 8 0.65 residuales estandarizados de Armand’s Pizza Parlors provengan de una distribución de probabili9 1.00 dad normal. Para empezar los 10 residuales estandarizados de la tabla 14.8 se ordenan. En la tabla 10 1.55 14.10 se presentan los 10 puntos normales y los residuales estandarizados normales. Si se satisface la suposición de normalidad, el menor residual estandarizado deberá tener un valor parecido al TABLA 14.10 del menor punto normal, el siguiente residual estandarizado deberá tener un valor parecido al del PUNTOS NORMALES Y siguiente punto normal, y así sucesivamente. En el caso de que los residuales estandarizados se encuentren distribuidos de una manera aproximadamente normal, en una gráfica en la que los puntos RESIDUALES ORDENADOS DE ARMAND’S normales correspondan al eje horizontal y los correspondientes residuales estandarizados al eje vertical, los puntos de la gráfica estarán situados cercanos a una línea recta a 45 grados que pase por PIZZA PARLORS el origen. A esta gráfica es a lo que se le conoce como gráfica de probabilidad normal. Residuales La figura 14.15 es la gráfica de probabilidad normal del ejemplo de Armand’s Pizza Parlors. Puntos estandarizados normales ordenados Para determinar si el patrón observado se desvía lo suficiente de la recta como para concluir que los 1.55 1.7114 residuales estandarizados no provienen de una distribución de probabilidad normal habrá que em 1.00 1.0792 plear el propio criterio. En la figura 14.15, todos los puntos se encuentran cerca de esta recta. Se 0.65 0.9487 concluye, por lo tanto, que la suposición de que los términos del error tienen una distribución de 0.37 0.2372 0.12 0.2296 probabilidad normal es razonable. En general, entre más cerca de la recta a 45 grados se encuentren 0.12 0.2296 los puntos, más fuerte es la evidencia a favor de la suposición de normalidad. Cualquier curvatura 0.37 0.7115 sustancial en la gráfica de probabilidad normal es evidencia de que los residuales no provienen de 0.65 1.0792 una distribución de probabilidad normal. Tanto los puntos normales como la correspondiente gráfi1.00 1.2224 1.55 1.4230 ca de probabilidad normal pueden obtenerse fácilmente empleando paquetes como Minitab.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 595
14.8
595
Análisis residual: confirmación de las suposiciones del modelo
FIGURA 14.15
GRÁFICA DE PROBABILIDAD NORMAL OBTENIDA CON LOS DATOS DE ARMAND’S PIZZA PARLORS 2
Residuales estandarizados
45 recta
1
0
–1
–2 –2
–1
0
+1
+2
Puntos normales
NOTAS Y COMENTARIOS 1. Las gráficas de residuales y de probabilidad normal se usan para confirmar las suposiciones de un modelo de regresión. Si en esta revisión se encuentra que una o más de las suposiciones son dudosas, habrá que considerar otro modelo o una transformación de los datos. Cuando se violan las suposiciones, las medidas a tomar deben basarse en un criterio adecuado; las recomendaciones de una persona con experiencia en estadística pueden ser útiles. 2. El análisis de residuales es el principal método estadístico para verificar si las suposiciones del
modelo de regresión son válidas. Aun cuando no se encuentre ninguna violación, esto no necesariamente implica que el modelo vaya a proporcionar buenas predicciones. Pero, si además existen otras pruebas estadísticas que favorezcan la conclusión de significancia y si el coeficiente de determinación es grande, deberá ser posible obtener buenas estimaciones y predicciones empleando la ecuación de regresión estimada.
Ejercicios
Métodos 45. Dados los datos de las dos variables x y y.
Auto examen a. b. c.
xi
6
11
15
18
20
yi
6
8
12
20
30
A partir de estos datos obtenga una ecuación de regresión estimada. Calcule los residuales. Trace una gráfica de residuales contra la variable independiente x. ¿Parecen satisfacerse las suposiciones acerca de los términos del error?
14Ander(543-623).qxd 2/28/08 7:17 PM Page 596
596
Capítulo 14
d. e.
Regresión lineal simple
Calcule los residuales estandarizados. Elabore una gráfica de residuales estandarizados contra ŷ. ¿Qué conclusión puede sacar de esta gráfica?
46. En un estudio de regresión se emplearon los datos siguientes.
a. b.
Observación
xi
yi
Observación
xi
yi
1 2 3 4 5
2 3 4 5 7
4 5 4 6 4
6 7 8 9
7 7 8 9
6 9 5 11
A partir de estos datos obtenga una ecuación de regresión estimada. Trace una gráfica de residuales. ¿Parecen satisfacerse las suposiciones del término del error?
Aplicaciones
Auto examen
47. A continuación se presentan datos sobre los gastos en publicidad y los ingresos (en miles de dólares) del restaurante Cuatro Estaciones.
a. b. c. d.
Gastos en publicidad
Ingresos
1 2 4 6 10 14 20
19 32 44 40 52 53 54
Sea x igual gastos en publicidad y y igual a ingresos. Utilice el método de mínimos cuadrados para obtener una línea recta que aproxime la relación entre las dos variables. Empleando como nivel de significancia 0.05, pruebe si los ingresos y los gastos en publicidad están relacionados. Elabore una gráfica de residuales de y ŷ contra ŷ. Use el resultado del inciso a) para obtener los valores de ŷ. ¿Qué conclusiones se pueden sacar del análisis de residuales? ¿Se puede usar este modelo o se debe buscar uno mejor?
48. En el ejercicio 9 se obtuvo una ecuación de regresión estimada que relaciona los años de experiencia con las ventas anuales. a. Calcule los residuales y trace una gráfica de residuales para este problema. b. A la luz de la gráfica de residuales, ¿parecen razonables las suposiciones acerca de los términos del error? 49. American Depository Receipts (ADR) son certificados que cotizan en la bolsa de Nueva York y que representan acciones de empresas extranjeras que mantienen un depósito en un banco de su propio país. En la tabla siguiente se presenta la relación precio/ganancia (P/G) y el porcentaje de rendimiento de la inversión (ROE, por sus siglas en inglés), de 10 empresas hindúes que es probable que sean nuevos (Bloomberg Personal Finance, abril 2000).
14Ander(543-623).qxd 2/28/08 7:17 PM Page 597
14.9
Bharti Televentures Gujarat Ambuja Cements Hindalco Industries ICICI Mahanagar Telephone Nigam NIIT Pentamedia Graphics Satyam Computer Services Silverline Technologies Videsh Sanchar Nigam
archivo CD en ADRs
a. b. c.
14.9
597
Análisis de residuales: observaciones atípicas y observaciones influyentes
ROE
P/G
6.43 13.49 14.04 20.67 22.74 46.23 28.90 54.01 28.02 27.04
36.88 27.03 10.83 5.15 13.35 95.59 54.85 189.21 75.86 13.17
Emplee un paquete de software para obtener una ecuación de regresión estimada que relacione y P/G y x ROE. Construya una gráfica de residuales contra la variable independiente. A la luz de la gráfica de residuales, ¿parecen razonables las suposiciones acerca de los términos del error y de la forma del modelo?
Análisis de residuales: observaciones atípicas y observaciones influyentes En la sección 14.8 se mostró cómo emplear el análisis de residuales para determinar violaciones a las suposiciones del modelo de regresión. En esta sección se ve el uso del análisis de residuales para identificar observaciones que se pueden clasificar como observaciones atípicas o como observaciones especialmente influyentes sobre la ecuación de regresión estimada. También se discuten algunas de las medidas que han de tomarse cuando se presentan tales observaciones.
Detección de observaciones atípicas La figura 14.16 es un diagrama de dispersión de un conjunto de datos que contiene una observación atípica, un dato (una observación) que no sigue la tendencia del resto de los datos. Las observaciones atípicas son observaciones que son sospechosas y que requieren un análisis cuidaFIGURA 14.16
UN CONJUNTO DE DATOS CON UNA OBSERVACIÓN ATÍPICA y
Observación atípica
x
14Ander(543-623).qxd 2/28/08 7:17 PM Page 598
598
Capítulo 14
FIGURA 14.17
Regresión lineal simple
DIAGRAMA DE DISPERSIÓN DE UN CONJUNTO DE DATOS EN EL QUE HAY UNA OBSERVACIÓN ATÍPICA y
80
60
40
20
0
TABLA 14.11 CONJUNTO DE DATOS PARA ILUSTRAR EL EFECTO DE UNA OBSERVACIÓN ATÍPICA xi
yi
1 1 2 3 3 3 4 4 5 6
45 55 50 75 40 45 30 35 25 15
1
2
3
4
5
6
x
doso. Puede tratarse de datos erróneos; si es así, esos datos debe ser corregidos. Puede tratarse de una violación a las suposiciones del modelo; si es así, habrá que considerar otro modelo. Por último, puede tratarse, simplemente, de valores inusuales que se presenten por casualidad. En ese caso, esos valores deberán conservarse. Para mostrar cómo se detectan las observaciones atípicas, considérense los datos de la tabla 14.11; la figura 14.17 muestra el diagrama de dispersión de estos datos. Con excepción de la observación 4 (x4 3, y4 75), estos datos parecen seguir un patrón que indicar una relación lineal negativa. En efecto, dado el patrón que parece seguir el resto de los datos, se esperaría que y4 fuera mucho más pequeño, por lo que a esta observación se le considera como un dato atípico. En el caso de la regresión lineal simple, las observaciones atípicas pueden detectarse mediante un simple examen del diagrama de dispersión. Para detectar observaciones atípicas también se pueden usar los residuales estandarizados. Si una observación se aleja mucho del patrón del resto de los datos (por ejemplo, la observación atípica de la figura 14.16), el valor absoluto del correspondiente residual estandarizado será grande. Muchos paquetes de software identifican de manera automática las observaciones cuyos residuales tienen un valor absoluto grande. En la figura 14.18 se presentan los resultados dados por Minitab para el análisis de regresión de los datos de la tabla 14.11. En el penúltimo renglón de los resultados dados por Minitab se lee que el residual estandarizado de la observación 4 es 2.67. Minitab identifica como una observación inusual toda observación cuyo residual estandarizado sea menor a 2 o mayor a 2; en tales casos la observación aparece en un renglón aparte con una R al lado del residual estandarizado, como se observa en la figura 14.18. Si los errores están distribuidos normalmente, sólo 5% de los residuales estandarizados se encontrarán fuera de estos límites. Para decidir qué hacer con una observación atípica, primero hay que verificar si es una observación correcta. Puede ser que se trate de un error al anotar los datos o al ingresarlos a la computadora. Supóngase, por ejemplo, que al verificar la observación atípica de la tabla 14.17, se encuentra que hubo un error; el valor correcto de la observación 4 era x4 3, y4 30. En la figura 14.19 se presenta el resultado que proporciona Minitab una vez corregido el valor de y4. Se observa que el dato incorrecto afecta sustancialmente la bondad de ajuste. Con el dato correcto, el valor de R-sq aumenta de 49.7% a 83.8% y el valor de b0 disminuye de 64.958 a 59.237. La pendiente de la recta cambia de 7.33 a 6.949. La identificación de los datos atípicos permite corregir errores en los datos y mejora los resultados de la regresión.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 599
14.9
Análisis de residuales: observaciones atípicas y observaciones influyentes
FIGURA 14.18
599
RESULTADOS QUE DA MINITAB PARA EL ANÁLISIS DE REGRESIÓN DEL CONJUNTO DE DATOS CON UNA OBSERVACIÓN ATÍPICA
The regression equation is y = 65.0 - 7.33 x Predictor Constant X S = 12.67
Coef 64.958 -7.331
SE Coef 9.258 2.608
R-sq = 49.7%
T 7.02 -2.81
p 0.000 0.023
R-sq(adj) = 43.4%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 8 9
SS 1268.2 1284.3 2552.5
Unusual Observations Obs x y Fit 4 3.00 75.00 42.97
MS 1268.2 160.5
SE Fit 4.04
F 7.90
p 0.023
Residual 32.03
St Resid 2.67R
R denotes an observation with a large standardized residual.
FIGURA 14.19
RESULTADOS QUE DA MINITAB PARA EL CONJUNTO DE DATOS CON UNA OBSERVACIÓN ATÍPICA YA CORREGIDA The regression equation is Y = 59.2 - 6.95 X Predictor Constant X S = 5.248
Coef 59.237 -6.949
SE Coef 3.835 1.080
R-sq = 83.8%
T 15.45 -6.43
p 0.000 0.000
R-sq(adj) = 81.8%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 8 9
SS 1139.7 220.3 1360.0
MS 1139.7 27.5
F 41.38
p 0.000
Detección de observaciones influyentes Algunas veces una o más de las observaciones tienen una influencia fuerte sobre los resultados que se obtienen. En la figura 14.20 se muestra un ejemplo de una observación influyente en una regresión lineal simple. La recta de regresión estimada tiene pendiente negativa, pero si la observación influyente se elimina del conjunto de datos, la pendiente de la recta de regresión estimada cambia de negativa a positiva y la intersección con el eje y es menor. Es claro que esta sola
14Ander(543-623).qxd 2/28/08 7:17 PM Page 600
600
Capítulo 14
FIGURA 14.20
Regresión lineal simple
CONJUNTO DE DATOS CON UNA OBSERVACIÓN INFLUYENTE y
Observación influyente
x
observación tiene mucha más influencia sobre la recta de regresión estimada que cualquiera otra observación; el efecto que tiene la eliminación de cualquiera de las otras observaciones sobre la ecuación de regresión estimada es muy pequeño. Cuando sólo se tiene una variable independiente, las observaciones influyentes pueden identificarse mediante un diagrama de dispersión. Una observación influyente puede ser una observación atípica (una observación cuyo valor de y se desvía sustancialmente de la tendencia general), puede ser un valor de x muy alejado de la media (por ejemplo, ver la figura 14.20) o puede tratarse de la combinación de estas dos cosas (un valor de y algo fuera de la tendencia y un valor de x un poco extremo). Las observaciones influyentes deben examinarse cuidadosamente dado el gran efecto que tienen sobre la ecuación de regresión estimada. Lo primero que hay que hacer es verificar que no se haya cometido algún error al recolectar los datos. Si se cometió algún error, se corrige y se obtiene una nueva ecuación de regresión estimada. Si la observación es correcta, puede uno considerarse afortunado de tenerla. Tal dato, cuando es correcto, contribuye a una mejor comprensión del modelo adecuado y conduce a una mejor ecuación de regresión estimada. En la figura 14.20, la presencia de la observación influyente, si es correcta, llevará a tratar de obtener datos con valores x intermedios, que permitan comprender mejor la relación entre x y y. Las observaciones en las que la variable independiente toma valores extremos se denominan datos (puntos, observaciones) de gran influencia. La observación influyente de la figura 14.20 es un punto de gran influencia. La influencia de una observación depende de qué tan lejos está el valor de la variable independiente de su media. En el caso de una sola variable independiente, la influencia (leverage) de la observación i, que se denota hi se calcula mediante la ecuación (14.33).
INFLUENCIA DE LA OBSERVACIÓN i
hi
1 (x x̄)2 i n 兺(xi x̄)2
(14.33)
De acuerdo con esta fórmula, es claro que entre más alejada se encuentre xi de su media x̄ mayor será la influencia (leverage) de la observación i. Muchos de los paquetes para estadística identifican automáticamente, como parte de los resultados estándar de regresión, los puntos de gran influencia. Para ilustrar cómo identifica Minitab los puntos de gran influencia, se considerará el conjunto de datos de la tabla 14.12.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 601
14.9
601
Análisis de residuales: observaciones atípicas y observaciones influyentes
FIGURA 14.21
DIAGRAMA DE DISPERSIÓN DEL CONJUNTO DE DATOS CON UN DATO DE GRAN INFLUENCIA y
130.00
120.00
110.00
Observación de gran influencia
100.00 10.00
TABLA 14.12 CONJUNTO DE DATOS CON UNA OBSERVACIÓN DE GRAN INFLUENCIA xi
yi
10 10 15 20 20 25 70
125 130 120 115 120 110 100
Los paquetes de software son esenciales para hacer los cálculos que permiten determinar las observaciones influyentes. Aquí se discute la regla de selección que emplea Minitab.
25.00
40.00
55.00
70.00
85.00
x
Observando la figura 14.21, que es el diagrama de dispersión del conjunto de datos presentado en la tabla 14.12, se ve que la observación 7 (x = 70, y = 100) es una observación en la que el valor de x es un valor extremo. Por lo tanto, es de esperarse que sea identificado como un punto de gran influencia. La influencia de esta observación se calcula usando la ecuación (14.33).
h7
1 n
(x 7 (xi
x̄)2 x̄)2
1 7
(70
24.286)2 2621.43
0.94
En el caso de la regresión lineal simple, Minitab identifica como observaciones de gran influencia las observaciones para las que hi 6/n o hi 0.99, lo que sea menor. En el conjunto de datos de la tabla 14.12, 6/n = 6/7 0.86. Como h7 0.94 0.86. Minitab identificará la observación 7 como una observación cuyo valor x tiene una gran influencia. En la figura 14.22 se presenta el resultado que da Minitab del análisis de regresión de este conjunto de datos. A la observación 7 (x 70, y 100) la identifica como una observación de gran influencia; esta observación la presenta en un renglón aparte en la parte inferior de los resultados con una X en el margen derecho. Las observaciones influyentes debidas a la interacción de una observación de gran influencia y de residuales grandes, suelen ser difíciles de detectar. Existen procedimientos de diagnóstico que para determinar si una observación es influyente toman en cuenta ambas cosas. En el capítulo 15 se estudiará uno de estos procedimientos, el estadístico D de Cook. NOTAS Y COMENTARIOS Una vez identificada una observación como potencialmente influyente, debido a que tiene un residual grande o por ser de gran influencia, su impacto sobre la ecuación de regresión estimada debe ser evaluado. En textos más avanzados se presentan los métodos de diagnóstico apropiados.
Pero, cuando no se está familiarizado con el material más avanzado, una manera sencilla de hacer este diagnóstico es realizar el análisis de regresión con y sin esa observación. Este método permite apreciar la influencia que tiene la observación potencialmente influyente sobre el resultado.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 602
602
Capítulo 14
Regresión lineal simple
FIGURA 14.22
RESULTADO DE MINITAB EMPLEANDO EL CONJUNTO DE DATOS CON UNA OBSERVACIÓN DE GRAN INFLUENCIA
The regression equation is y = 127 - 0.425 x Predictor Constant X S = 4.883
Coef 127.466 -0.42507
SE Coef 2.961 0.09537
R-sq = 79.9%
T 43.04 -4.46
p 0.000 0.007
R-sq(adj) = 75.9%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 5 6
SS 473.65 119.21 592.86
Unusual Observations Obs x y Fit 7 70.0 100.00 97.71
MS 473.65 23.84
SE Fit 4.73
F 19.87
Residual 2.29
p 0.007
St Resid 1.91 X
X denotes an observation whose X value gives it large influence.
Ejercicios
Métodos 50. Considérense los datos siguientes para las variables x y y.
Auto examen a. b. c.
xi
135
110
130
145
175
160
120
yi
145
100
120
120
130
130
110
Calcule los residuales estandarizados de estos datos. ¿Hay entre los datos alguna observación atípica? Explique. Haga una gráfica de residuales estandarizados contra ŷ. ¿Se observa en esta gráfica la presencia de alguna observación atípica? Con estos datos elabore un diagrama de dispersión. ¿Se observa en el diagrama de dispersión la presencia de alguna observación atípica? En general, ¿qué consecuencias tienen, para la regresión lineal simple, estos hallazgos?
51. Considérense los datos siguientes para las variables x y y.
a. b. c.
xi
4
5
7
8
10
12
12
22
yi
12
14
16
15
18
20
24
19
Calcule los residuales estandarizados de estos datos. ¿Hay entre los datos alguna observación atípica? Explique. Calcule las observaciones de influencia que haya en estos datos. Entre estos datos, ¿parece haber alguna observación influyente? Explique. Con estos datos elabore un diagrama de dispersión. ¿Se observa en el diagrama de dispersión la presencia de alguna observación atípica? Explique.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 603
14.9
603
Análisis de residuales: observaciones atípicas y observaciones influyentes
Aplicaciones 52. Los datos siguientes muestran los gastos (en millones de $) y los envíos en bbls. (millones) de 10 importantes marcas de cerveza.
Marca Budweiser Bud Light Miller Lite Coors Light Busch Natural Light Miller Genuine Draft Miller High Life Busch Light Milwaukee’s Best
archivo CD en Beer
a. b.
Gastos medios (millones de $)
Envío
120.0 68.7 100.1 76.6 8.7 0.1 21.5 1.4 5.3 1.7
36.3 20.7 15.9 13.2 8.1 7.1 5.6 4.4 4.3 4.3
Con estos datos obtenga una ecuación de regresión estimada. Emplee el análisis residual para hallar observaciones atípicas u observaciones influyentes. Resuma sus hallazgos y conclusiones.
53. Los especialistas en salud recomiendan que las personas que corren tomen unos 200 ml de agua cada 15 minutos mientras están corriendo. Las personas que corren de tres a ocho horas, requieren sistemas de hidratación que se llevan sobre la cintura o sobre la espalda. En los datos a continuación se da el volumen (en onzas fluidas, 1 oz. flu = 30 ml aprox.) y el precio de 26 sistemas de hidratación que se llevan sobre la cintura o sobre la espalda (Trail Runner Gear Guide, 2003).
Modelo
archivo CD en Hydration2
Fastdraw Fastdraw Plus Fitness Access Access Plus Solo Serenade Solitaire Gemini Shadow SipStream Express Lightning Elite Extender Stinger GelFlask Belt GelDraw GelFlask Clip-on Holster GelFlask Holster SS Strider (W) Walkabout (W) Solitude I.C.E. Getaway I.C.E. Profile I.C.E. Traverse I.C.E.
Volumen (oz fl)
Precio ($)
20 20 20 20 24 20 20 20 40 64 96 20 28 40 40 32 4 4 4 4 20 230 20 40 64 64
10 12 12 20 25 25 35 35 45 40 60 30 40 60 65 65 20 7 10 10 30 40 35 55 50 60
14Ander(543-623).qxd 2/28/08 7:17 PM Page 604
604
Capítulo 14
a. b.
Regresión lineal simple
Obtenga la ecuación de regresión estimada que sirva para predecir el precio de un sistema de hidratación, dado su volumen. Use el análisis residual para determinar si hay observaciones atípicas u observaciones influyentes. Resuma sus hallazgos y conclusiones.
54. En la tabla siguiente se presenta la capitalización de mercado y los salarios del presidente del consejo de administración (CEO, por sus siglas en inglés) de 20 empresas (The Wall Street Journal, 24 de febrero de 2000 y 6 de abril de 2000).
Anheuser-Busch AT&T Charles Schwab Chevron DuPont General Electric Gillette IBM Johnson & Johnson Kimberly-Clark Merrill Lynch Motorola Philip Morris Procter & Gamble Qualcomm Schering-Plough Sun Microsystems Texaco USWest Walt Disney
archivo CD en CEO
a. b.
Capitalización de mercado (millones de $)
Salario del CEO (miles de $)
32 977.4 162 365.1 31 363.8 56 849.0 68 848.0 507 216.8 44 180.1 194 455.9 143 131.0 35 377.5 31 062.1 92 923.7 54 421.2 144 152.9 116 840.8 62 259.4 120 966.5 30 040.7 36 450.8 61 288.1
1130 1400 800 1350 1000 3325 978 2000 1365 950 700 1275 1625 1318.3 773 1200 116 950 897 750
Obtenga la ecuación de regresión estimada para predecir el salario del CEO dada la capitalización de mercado. Use el análisis de residuales para determinar si hay observaciones atípicas u observaciones influyentes. Resuma sus hallazgos y conclusiones.
Resumen En este capítulo se mostró el uso del análisis de regresión para determinar cómo es la relación entre una variable dependiente y y una variable independiente x. En la regresión lineal simple, el modelo de regresión es y β0 β1x . La ecuación de regresión lineal simple E( y) β0 β1x describe la relación de la media o valor esperado de y con x. Para obtener la ecuación de regresión estimada ŷ b0 b1x se emplearon datos muestrales y el método de mínimos cuadrados. En efecto, b0 y b1 son estadísticos muestrales que se usan para estimar los parámetros desconocidos del modelo, β0 y β1. El coeficiente de determinación se presentó como una medida de la bondad de ajuste de la ecuación de regresión estimada; el coeficiente de determinación se puede interpretar como la proporción de la variación en la variable dependiente que puede ser explicada por la ecuación de regresión estimada. Se volvió a ver la correlación como una medida descriptiva de la intensidad de la relación lineal entre las dos variables. Se discutieron las suposiciones acerca del modelo de regresión y del correspondiente término del error, y se presentaron las pruebas t y F, basadas en esas suposiciones, como un medio para determinar si la relación entre las dos variables es estadísticamente significativa. Se mostró
14Ander(543-623).qxd 2/28/08 7:17 PM Page 605
Glosario
605
cómo usar la ecuación de regresión estimada para obtener estimaciones por medio de intervalos de confianza para el valor medio de y y estimaciones por medio de intervalos de predicción para valores individuales de y. El capítulo concluyó con una sección sobre soluciones por computadora de los problemas de regresión y dos secciones sobre el uso del análisis residual para verificar las suposiciones del modelo e identificar las observaciones atípicas e influyentes.
Glosario Variable dependiente La variable que se predice o explicada. Se denota y. Variable independiente Variable que predice o explica. Se denota x. Regresión lineal simple Análisis de regresión en el que participan una variable independiente y una variable dependiente, y en el que la relación entre estas variables se aproxima mediante una línea recta. Modelo de regresión Ecuación que describe cómo están relacionadas y y x, más un término del error; en la regresión lineal simple, el modelo de regresión es y β0 β1x . Ecuación de regresión Ecuación que describe cómo está relacionada la media o valor esperado de la variable dependiente con la variable independiente; en la regresión lineal simple, E( y) β0 β1 x. Ecuación de regresión estimada Estimación de la ecuación de regresión obtenida a partir de datos muestrales, empleando el método de mínimos cuadrados. En la regresión lineal simple, la ecuación de regresión estimada es ŷ b0 b1 x. Método de mínimos cuadrados Procedimiento empleado para obtener la ecuación de regresión estimada. El objetivo es minimizar 兺( yi ŷi)2. Diagrama de dispersión Gráfica de datos bivariados en la que la variable independiente va en el eje horizontal y la variable dependiente va en el eje vertical. Coeficiente de determinación Medida de la bondad de ajuste de la ecuación de regresión estimada. Se puede interpretar como la proporción de la variabilidad de la variable dependiente y que es explicada por la ecuación de regresión estimada. Residual i Diferencia que existe entre el valor observado de la variable dependiente y el valor pronosticado empleando la ecuación de regresión estimada; para la observación i, el residual i es yi ŷi. Coeficiente de correlación Medida de la intensidad de la relación lineal entre dos variables (ya visto en el capítulo 3). Error cuadrado medio Estimación insesgada de la varianza del término del error σ2. Se denota ECM o s2. Error estándar de estimación Raíz cuadrada del error cuadrado medio, se denota s. Es una estimación de σ, la desviación estándar del error. Tabla ANOVA En el análisis de varianza, tabla que se usa para resumir los cálculos necesarios en la prueba F de significancia. Intervalo de confianza Estimación por intervalo del valor medio de y para un valor dado de x. Intervalo de predicción Estimación por intervalo de un solo valor de y para un valor dado de x. Análisis residual Análisis de los residuales que se usa para determinar si parecen ser válidas las suposiciones hechas acerca del modelo de regresión. El análisis de residuales también se usa para identificar observaciones atípicas y observaciones influyentes. Gráfica de residuales Representación gráfica de los residuales, se usa para determinar si parecen ser válidas las suposiciones hechas acerca del modelo de regresión. Residual estandarizado Valor obtenido al dividir un residual entre su desviación estándar.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 606
606
Capítulo 14
Regresión lineal simple
Gráfica de probabilidad normal Gráfica en la que los residuales estandarizados se grafican contra los puntos normales. Esta gráfica ayuda a determinar si parece ser válida la suposición de que los términos del error tienen una distribución de probabilidad normal. Observación atípica Dato u observación que no sigue la tendencia del resto de los datos. Observación influyente Observación en la que la variable independiente tiene un valor extremo. Puntos de gran influencia Observaciones en las que la variable independiente tiene valores extremos.
Fórmulas clave Modelo de regresión lineal simple y β0 β1x
(14.1)
Ecuación de regresión lineal simple E(y) β0 β1x
(14.2)
Ecuación de regresión lineal simple estimada ŷ b0 b1x
(14.3)
Criterio de mínimos cuadrados mín (yi
ŷi )2
(14.5)
Intersección con el eje y y pendiente de la ecuación de regresión lineal simple b1
兺(xi x̄)(yi ȳ) 兺(xi x̄)2 b0 ȳ b1x̄
(14.6) (14.7)
Suma de cuadrados debidos al error SCE 兺(yi ŷi )2
(14.8)
STC 兺(yi ȳ)2
(14.9)
Suma de cuadrados total
Suma de cuadrados debida a la regresión SCR 兺(ŷi ȳ)2
(14.10)
STC = SCR + SCE
(14.11)
Relación entre STC, SCR y SCE
Coeficiente de determinación r2
SCR STC
(14.12)
Coeficiente de correlación muestral rxy (signo de b1)兹Coeficiente de determinación (signo de b1)兹r 2
(14.13)
14Ander(543-623).qxd 2/28/08 7:17 PM Page 607
607
Fórmulas clave
Error cuadrado medio (estimación de σ 2) SCE n 2
s 2 ECM Error estándar de estimación s 兹CME Desviación estándar de b1
冑
SCE n 2
σ
σb1
兹兺(xi x̄)2
(14.15)
(14.16)
(14.17)
Desviación estándar estimada de b1 s
sb1
兹兺(xi x̄)2
(14.18)
Estadístico de prueba t b t s1 b1
(14.19)
Regresión cuadrática media CMR
SCR Número de variables independientes
(14.20)
Estadístico de prueba F F Desviación estándar estimada de ^ yp
冑
sŷp s Intervalo de confianza para E(yp)
CMR CME
(xp x̄)2 1 n 兺(xi x̄)2
ŷp tα/2 sŷp
(14.21)
(14.23)
(14.24)
Desviación estándar estimada para un solo valor
冑
sind s 1 Intervalo de predicción para yp
(xp x̄)2 1 n 兺(xi x̄)2
(14.26)
ŷp tα/2 sind
(14.27)
yi ŷi
(14.28)
Residual de la observación i
14Ander(543-623).qxd 2/28/08 7:17 PM Page 608
608
Capítulo 14
Regresión lineal simple
Desviación estándar del residual i
syi ŷi s 兹1 hi
(14.30)
Residual estandarizado de la observación i yi ŷi syi ŷi
(14.32)
Influencia de la observación hi
1 (x x̄)2 i n 兺(xi x̄)2
(14.33)
Ejercicios complementarios 55. Si el valor de r2 es elevado, ¿implica eso que entre las dos variables hay una relación de causa y efecto? 56. Explique con sus propias palabras la diferencia entre estimación por intervalo del valor medio de las y para un valor dado de x y estimación por intervalo de un valor de y para una x dada. 57. ¿Qué objeto tiene probar si β1 = 0? Si se rechaza que β1 = 0, ¿significa eso un buen ajuste? 58. En la tabla siguiente se da el número de acciones vendidas (en millones) y el precio esperado (el promedio del precio mínimo y del precio máximo) de 10 acciones de oferta pública inicial.
Empresa American Physician Apex Silver Mines Dan River Franchise Mortgage Gene Logic International Home Foods PRT Group Rayovac RealNetworks Software AG Systems
archivo CD en IPO
a. b. c. d.
Acciones vendidas
Precio esperado ($)
5.0 9.0 6.7 8.75 3.0 13.6 4.6 6.7 3.0 7.7
15 14 15 17 11 19 13 14 10 13
Obtenga la ecuación de regresión estimada en la que la cantidad de acciones vendidas sea la variable independiente y el precio la variable dependiente. Empleando 0.05 como nivel de significancia, ¿existe una relación significativa entre las dos variables? ¿Proporciona la ecuación de regresión estimada un buen ajuste? Explique. Empleando la ecuación de regresión estimada, estime el precio esperado en una empresa que considera una oferta pública inicial de 6 millones de acciones.
59. Los programas de recompra de acciones corporativas, suelen promoverse como un beneficio para los accionistas. Pero Robert Gabele, director de investigación interna de First Call/Thomson Financial, hizo notar que muchos de estos programas se realizan únicamente con el objetivo de obtener acciones que se emplean como opciones como incentivo para los altos directivos de la empresa. En todas las empresas, las opciones de acciones existentes en 1998 representaban el 6.2 por ciento de todas las acciones comunes en circulación. En los datos siguientes se da la cantidad de opciones otorgadas y la cantidad de acciones en circulación de 13 empresas (Bloomberg Personal Finance, enero/febrero, 2000)
14Ander(543-623).qxd 2/28/08 7:17 PM Page 609
609
Ejercicios complementarios
archivo CD en Options
Adobe Systems Apple Computer Applied Materials Autodesk Best Buy Fruit of the Loom ITT Industries Merrill Lynch Novell Parametric Technology Reebok International Silicon Graphics Toys “R” Us
a. b. c.
Opciones otorgadas en circulación (en millones)
Acciones comunes en circulación (en millones)
20.3 52.7 109.1 15.7 44.2 14.2 18.0 89.9 120.2 78.3 12.8 52.6 54.8
61.8 160.9 375.4 58.9 203.8 66.9 87.9 365.5 335.0 269.3 56.1 188.8 247.6
Obtenga una ecuación de regresión estimada que sirva para estimar la cantidad en circulación de opciones otorgadas dada la cantidad de acciones comunes en circulación. Emplee la ecuación de regresión estimada para estimar la cantidad en circulación de opciones otorgadas por una empresa que tiene 150 millones de acciones comunes en circulación. ¿Cree que la ecuación de regresión estimada proporcione una buena predicción de la cantidad en circulación de opciones otorgadas? Emplee r2 para justificar su respuesta.
60. El promedio industrial Dow Jones (DJIA) y el Estándar & Poor’s 500 (S & P) son índices que se emplean como una medida del movimiento general del mercado de valores. El DJIA se basa en los movimientos de los precios de 30 empresas grandes; el S&P 500 es un índice compuesto de 500 acciones. Algunos dicen que el S&P 500 es una mejor medida de la actividad del mercado de valores porque tiene una base más amplia. A continuación se presenta el precio de cierre del DJIA y del S&P 500 durante 20 semanas a partir del 9 de septiembre del 2005 (Borron’s, 30 de enero de 2006).
archivo CD en DJIAS&P500
Fecha 9 de septiembre 16 de septiembre 23 de septiembre 30 de septiembre 7 de octubre 14 de octubre 21 de octubre 28 de octubre 4 de noviembre 11 de noviembre 18 de noviembre 25 de noviembre 2 de diciembre 9 de diciembre 16 de diciembre 23 de diciembre 30 de diciembre 6 de enero 13 de enero 20 de enero
DJIA 10 679 10 642 10 420 10 569 10 292 10 287 10 215 10 403 10 531 10 686 10 766 10 932 10 878 10 779 10 876 10 883 10 718 10 959 10 960 10 667
S&P 500 1241 1238 1215 1229 1196 1187 1180 1198 1220 1235 1248 1268 1265 1259 1267 1269 1248 1285 1288 1261
14Ander(543-623).qxd 2/28/08 7:17 PM Page 610
610
Capítulo 14
a. b. c. d. e. f.
Regresión lineal simple
Dé el diagrama de dispersión de estos datos empleando DJIA como variable independiente. Obtenga la ecuación de regresión estimada. Pruebe la significancia de la relación. Use α = 0.05. ¿Proporciona un buen ajuste la ecuación de regresión estimada? Explique. Suponga que el precio de cierre del DJIA es 11 000. Estime el precio de cierre del S&P 500. ¿Debe preocupar que el valor de 11 000 del DJIA empleado en el inciso e) para predecir el del S&P 500 se encuentre fuera del intervalo de los datos empleado para obtener la ecuación de regresión estimada?
61. Jensen Tire & Auto está por decidir si firma un contrato de mantenimiento para su nueva máquina de alineamiento y balanceo de neumáticos. Los gerentes piensan que los gastos de mantenimiento deberán estar relacionados con el uso y recolectan los datos siguientes sobre uso semanal (horas) y gastos anuales de mantenimiento (en cientos de dólares).
archivo CD en Jensen
a. b. c. d.
Uso semanal (horas)
Gastos anuales de mantenimiento
13 10 20 28 32 17 24 31 40 38
17.0 22.0 30.0 37.0 47.0 30.5 32.5 39.0 51.5 40.0
Obtenga la ecuación de regresión estimada que relaciona gastos anuales de mantenimiento con el uso semanal. Pruebe la significancia de la relación del inciso a) con 0.05 como nivel de significancia. Jensen piensa que usará la nueva máquina 30 horas a la semana. Obtenga un intervalo de predicción de 95% para los gastos anuales de mantenimiento de la empresa. Si el precio del contrato de mantenimiento es $3000 anuales, ¿recomendaría firmar el contrato de mantenimiento? ¿Por qué sí o por qué no?
62. En un determinado proceso de fabricación se cree que la velocidad (pies por minuto) de la línea de ensamblado afectaba al número de partes defectuosas halladas en el proceso de inspección. Para probar esto, los administradores idearon un procedimiento en el que la misma cantidad de partes por lote se examinaba visualmente a diferentes velocidades de la línea. Se recolectaron los datos siguientes.
a.
Velocidad de la línea
Número de partes defectuosas halladas
20 20 40 30 60 40
21 19 15 16 14 17
Obtenga la ecuación de regresión estimada que relaciona velocidad de la línea de producción con el número de partes defectuosas encontradas.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 611
611
Ejercicios complementarios
b. c. d.
Empleando el nivel de significancia 0.05, determine si la velocidad de la línea y el número de partes defectuosas halladas están relacionadas. ¿Se ajusta bien a los datos la ecuación de regresión estimada? Dé un intervalo de confianza de 95% para predecir el número medio de partes defectuosas si la velocidad de la línea es 50 pies por minuto.
63. Un hospital grande de una ciudad contrató a un sociólogo para que investigara la relación entre el número de días por año de ausencia con autorización, y la distancia (en millas) entre la casa y el trabajo del empleado. Se tomó una muestra de 10 empleados y se obtuvieron los datos siguientes.
archivo CD en Absent
a. b. c. d. e.
Distancia al trabajo
Número de días de ausencia
1 3 4 6 8 10 12 14 14 18
8 5 8 7 6 3 5 2 4 2
Elabore, con estos datos, un diagrama de dispersión. Obtenga la ecuación de regresión de mínimos cuadrados. ¿Existe una relación significativa entre las dos variables? Explique. ¿Proporciona la ecuación de regresión estimada un buen ajuste? Explique Emplee la ecuación de regresión estimada obtenida en el inciso b) para calcular un intervalo de confianza de 95% para el número esperado de ausencias (días) de los empleados que vivan a 5 millas de la empresa.
64. La autoridad de tránsito de una zona metropolitana importante desea determinar si hay relación entre la antigüedad de un autobús y los gastos de mantenimiento del mismo. En una muestra de 10 autobuses se obtuvieron los datos siguientes.
archivo CD en AgeCost
a. b. c. d.
Antigüedad del autobús (años)
Costo de mantenimiento ($)
1 2 2 2 2 3 4 4 5 5
350 370 480 520 590 550 750 800 790 950
Empleando el método de mínimos cuadrados obtenga la ecuación de regresión estimada. Haga una prueba para determinar si las dos variables están relacionadas de manera significativa con α = 0.05. ¿Proporciona la recta de mínimos cuadrados una buena aproximación a los datos observados? Explique. Calcule un intervalo de predicción de 95% para los gastos de mantenimiento de un determinado autobús cuya antigüedad es de 4 años.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 612
612
Capítulo 14
Regresión lineal simple
65. Un profesor de mercadotecnia de una universidad desea saber cuál es la relación entre las horas de estudio y la calificación en un curso. A continuación se presentan los datos obtenidos de 10 estudiantes que tomaron el curso el trimestre pasado.
archivo CD en HoursPts
a. b. c. d.
Horas de estudio
Calificación total
45 30 90 60 105 65 90 80 55 75
40 35 75 65 90 50 90 80 45 65
Obtenga la ecuación de regresión estimada que indica la relación entre calificación y horas de estudio. Empleando α = 0.05 pruebe la significancia del modelo. Pronostique la calificación que obtendrá Mark Sweeney. Él estudió 95 horas. Calcule un intervalo de predicción de 95% para la calificación de Mark Sweeney.
66. Bloomberg Personal Finance (julio/agosto 2001) publicó que la beta del mercado de Texas Instrument era 1.46. La beta del mercado de cada acción se determina mediante regresión lineal simple. En cada caso, la variable dependiente es la rentabilidad porcentual trimestral (revalorización más dividendos) menos el rendimiento porcentual que se hubiera obtenido en una inversión libre de riesgos (como tasa libre de riesgo se empleó la tasa Treasury Bill). La variable independiente es la rentabilidad porcentual trimestral (revalorización de capital más dividendos) para el mercado de valores (S&P 500) menos la rentabilidad porcentual de una inversión libre de riesgos. A partir de los datos trimestrales se desarrolla la ecuación de regresión estimada; la beta del mercado de la acción en cuestión es la pendiente de la ecuación de regresión estimada (b1). La beta del mercado suele interpretarse como una medida de lo riesgoso de la acción. Si la beta del mercado es mayor a 1, la volatilidad de la acción es mayor al promedio en el mercado; si la beta del mercado es menor a 1, la volatilidad de la acción es menor al promedio en el mercado. Supóngase que las cifras siguientes son diferencias entre rentabilidad porcentual y rentabilidad libre de riesgos a lo largo de 10 trimestres de S&P 500 y Horizon Technology.
archivo CD en MktBeta
S&P 500
Horizon
1.2 2.5 3.0 2.0 5.0 1.2 3.0 1.0 0.5 2.5
0.7 2.0 5.5 4.7 1.8 4.1 2.6 2.0 1.3 5.5
14Ander(543-623).qxd 2/28/08 7:17 PM Page 613
613
Ejercicios complementarios
a. b. c. d.
Obtenga la ecuación de regresión estimada que sirve para determinar la beta del mercado de Horizon Technology. ¿Cuál es la beta del mercado de Horizon Technology? Empleando 0.05 como nivel de significancia, pruebe la significancia de la relación. ¿Proporciona la ecuación de regresión estimada un buen ajuste? Explique. Utilice las betas del mercado de Horizon Techology y de Texas Instrument para comparar los riesgos de estas dos acciones.
67. La Transactional Record Access Clearinghouse de la Universidad de Syracuse publica datos que muestran las posibilidades de una auditoría del Departamento de Tesorería de los Estados Unidos. En la tabla siguiente se muestra la media del ingreso bruto ajustado y el porcentaje de declaraciones que fueron auditadas en 20 municipios
Municipio Los Ángeles Sacramento Atlanta Boise Dallas Providence San José Cheyenne Fargo Nueva Orleans Oklahoma City Houston Portland Phoenix Augusta Albuquerque Greensboro Columbia Nashville Buffalo
archivo CD en IRSAudit
a. b. c. d.
Ingreso bruto ajustado
Porcentaje auditado
36 664 38 845 34 886 32 512 34 531 35 995 37 799 33 876 30 513 30 174 30 060 37 153 34 918 33 291 31 504 29 199 33 072 30 859 32 566 34 296
1.3 1.1 1.1 1.1 1.0 1.0 0.9 0.9 0.9 0.9 0.8 0.8 0.7 0.7 0.7 0.6 0.6 0.5 0.5 0.5
Obtenga la ecuación de regresión estimada que sirve para pronosticar el porcentaje de auditorías dado un ingreso bruto ajustado. Empleando como nivel de significancia 0.05, determine si hay relación entre el ingreso bruto ajustado y el porcentaje de auditorías. ¿Proporciona la ecuación de regresión estimada un buen ajuste? Explique. Emplee la ecuación de regresión estimada del inciso a) para calcular un intervalo de 95% de confianza para el porcentaje de auditorías en un municipio en el que el promedio del ingreso bruto ajustado es $35 000.
68. Una institución de un determinado país publicó evaluaciones sobre la satisfacción con el trabajo. Una de las cosas que se pedían en la encuesta era elegir (de una lista de factores) los cinco factores principales para la satisfacción en el trabajo. Después se pedía a los encuestados que indicaran su nivel de satisfacción con cada uno de esos cinco factores. En la tabla siguiente se presentan los porcentajes de personas para los que el factor indicado fue uno de los cinco factores principales, junto con una evaluación obtenida empleando el porcentaje de personas que consideraron al factor como uno de los principales y que estaban “muy satisfechos” o “satisfechos” con ese factor. (www.apse. gov.au/stateoftheservice).
14Ander(543-623).qxd 2/28/08 7:17 PM Page 614
614
Capítulo 14
Factor
archivo CD en JobSat
b. c. d. e. f.
archivo CD en Beta
Cinco principales (%)
Carga de trabajo adecuada Posibilidad de ser creativo o de hacer innovaciones Posibilidad de hacer contribuciones útiles a la sociedad Obligaciones y expectativas claramente planteadas Condiciones flexibles de trabajo Buena relación de trabajo Trabajo interesante Oportunidad de hacer carrera Oportunidad de desarrollar sus habilidades Oportunidad de utilizar sus habilidades Retroalimentación y reconocimiento al esfuerzo realizado Salario Poder ver resultados tangibles del trabajo
a.
Caso problema 1
Regresión lineal simple
Evaluación (%)
30 38 40 40 55 60 48 33 46 50 42 47 42
49 64 67 69 86 85 74 43 66 70 53 62 69
Elabore un diagrama de dispersión colocando en el eje horizontal los porcentajes de los factores principales y en el eje vertical la evaluación correspondiente. ¿Qué indica, respecto a la relación entre las dos variables, el diagrama de dispersión elaborado en el inciso a)? Obtenga la ecuación de regresión estimada que sirva para pronosticar la evaluación (%) dado el porcentaje del factor (%). Empleando como nivel de significancia 0.05 realice una prueba para determinar la significancia de la relación. ¿Proporciona la ecuación de regresión estimada un buen ajuste? Dé el valor del coeficiente de correlación muestral.
Medición del riesgo en el mercado bursátil Una medida del riesgo o volatilidad de una acción es la desviación estándar del rendimiento durante un lapso de tiempo. Aunque la desviación estándar es fácil de calcular, no toma en cuenta la variación del precio de una acción en función de un índice estándar del mercado, como el S&P 500. Por esta razón, muchos analistas financieros prefieren emplear otra medida, conocida como beta, para medir el riesgo. La beta de una acción se determina mediante regresión lineal simple. La variable independiente es la rentabilidad total de la acción de que se trate y la variable independiente es la rentabilidad total del mercado de valores.* En este caso problema se usará el índice S&P 500 como medida de la rentabilidad total del mercado de valores y se obtendrá una ecuación de regresión estimada usando datos mensuales. La beta de una acción es la pendiente en la ecuación de regresión estimada (b1). En el archivo Beta del disco compacto que se distribuye con el libro se proporciona la rentabilidad total de ocho acciones comunes muy conocidas y la del S&P 500 a lo largo de 36 meses. El valor beta del mercado de valores siempre será 1; por lo tanto, una acción que tienda a subir o a bajar con el mercado de valores tendrá también una beta cercana a 1. Betas mayores a 1 corresponden a acciones que son más volátiles que el mercado y betas menores a 1 corresponden a acciones menos volátiles que el mercado. Por ejemplo, si la beta de una acción es 1.4, esta acción es 40% más volátil que el mercado, y si la beta de una acción es 0.4, la acción es 60% menos volátil que el mercado. *Diversas fuentes emplean diferentes métodos para calcular las betas. Por ejemplo, algunas fuentes, antes de calcular la ecuación de regresión estimada, restan, de la variable independiente, la rentabilidad que podría haberse obtenido con una inversión libre de riesgos [por ejemplo, letras del tesoro (Estados Unidos)(T-bills)]. Otras, para la rentabilidad total del mercado de valores emplean diversos índices; por ejemplo, Value line calcula las betas usando el índice compuesto de la bolsa de Nueva York
14Ander(543-623).qxd 2/28/08 7:17 PM Page 615
Caso problema 2
615
Departamento de Transporte de Estados Unidos
Reporte administrativo Se le ha encomendado la tarea de analizar las características del riesgo de estas acciones. Elabore un informe que comprenda los puntos siguientes, sin limitarse sólo a ellos. a. Calcular los estadísticos descriptivos de cada una de las acciones y del S&P 500. Hacer comentarios sobre los resultados. ¿Qué acción es la más volátil? b. Calcular la beta de cada acción. ¿Cuál de estas acciones se esperaría que se comportara mejor en un mercado de alta calidad? ¿Cuál conservaría mejor su valor en un mercado para el sector popular? c. Haga un comentario sobre qué tanto de la rentabilidad de cada una de las acciones es explicado por el mercado.
Caso problema 2
Departamento de Transporte de Estados Unidos Como parte de un estudio sobre seguridad en el transporte, el Departamento de Transporte de Estados Unidos, de una muestra de 42 ciudades, recogió datos sobre el número de accidentes fatales por cada 1000 licencias y sobre el porcentaje de licencia de conductores menores de 21 años. A continuación se presentan los datos recogidos en el lapso de un año. Estos datos se encuentran también en el archivo titulado Safety del disco compacto que se distribuye con el libro.
archivo CD en Safety
Porcentaje de menores de 21 años
Accidentes fatales por 1000 licencias
Porcentaje de menores de 21 años
Accidentes fatales por 1000 licencias
13 12 8 12 11 17 18 8 13 8 9 16 12 9 10 9 11 12 14 14 11
2.962 0.708 0.885 1.652 2.091 2.627 3.830 0.368 1.142 0.645 1.028 2.801 1.405 1.433 0.039 0.338 1.849 2.246 2.855 2.352 1.294
17 8 16 15 9 8 14 8 15 10 10 14 18 10 14 16 12 15 13 9 17
4.100 2.190 3.623 2.623 0.835 0.820 2.890 1.267 3.224 1.014 0.493 1.443 3.614 1.926 1.643 2.943 1.913 2.814 2.634 0.926 3.256
Informe administrativo 1. Presente resúmenes numéricos y gráficos de los datos. 2. Emplee el análisis de regresión para investigar la relación entre el número de accidentes fatales y el porcentaje de conductores menores de 21 años. Analice sus hallazgos. 3. ¿Qué conclusión y qué recomendaciones puede deducir de su análisis?
14Ander(543-623).qxd 2/28/08 7:17 PM Page 616
616
Caso problema 3
Capítulo 14
Regresión lineal simple
Donaciones de los ex alumnos Las donaciones de los ex alumnos son una importante fuente de ingresos para las universidades. Si los gerentes pudieran determinar los factores que influyen sobre el aumento del porcentaje de alumnos que hace donaciones, podrían poner en marcha políticas que llevarían a ganancias mayores. Las investigaciones indican que estudiantes más satisfechos con la relación con sus profesores tienen más probabilidad de titularse, lo que a su vez puede llevar al aumento del porcentaje de alumnos que haga donaciones. En la tabla 14.13 se muestran datos de 48 universidades de Estados Unidos (American’s Best Collage, edición del año 2000). La columna titulada “% de grupos con menos de 20” muestra el porcentaje de grupos con menos de 20 alumnos. La columna que tiene como título “Tasa de estudiantes/facultad” da el número de estudiantes inscritos, dividido entre el número total de facultades. Por último, la columna que tiene como título “Tasa de alumnos que donan” da el porcentaje de alumnos que han hecho alguna donación a la universidad.
Reporte administrativo 1. Presente resúmenes numéricos y gráficos de los datos. 2. Emplee el análisis de regresión para obtener una ecuación de regresión estimada que sirva para pronosticar el porcentaje de los estudiantes que hacen donaciones dado el porcentaje de grupos con menos de 20 estudiantes. 3. Use el análisis de regresión para obtener una ecuación de regresión estimada que sirva para pronosticar el porcentaje de los alumnos que hacen donaciones dada la proporción de estudiantes por facultad. 4. ¿Cuál de las dos ecuaciones de regresión estimada muestra un mejor ajuste? Con esa ecuación de regresión estimada realice un análisis de residuales y discuta sus hallazgos y conclusiones. 5. ¿Qué conclusiones y recomendaciones puede obtener de este análisis?
Caso problema 4
Valor de los equipos de béisbol de la liga mayor Un grupo encabezado por John Henry pagó $700 millones por la adquisición del equipo Boston Red Sox (Medias Rojas de Boston) en 2002, aun cuando el Boston Red Sox no había ganado la serie mundial desde 1918 y tenía una pérdida de operación de $11.4 millones de 2001. Es más, la revista Forbes estima que el valor actual del equipo es en realidad $426 millones. Forbes atribuye la diferencia entre valor actual del equipo y precio que los inversionistas están dispuestos a pagar, al hecho de que la compra de un equipo suele incluir la adquisición de una red de cable exageradamente subvaluada. Por ejemplo, con la compra del equipo, los nuevos propietarios obtuvieron también la New England Sports Network. En la tabla 14.14 se presentan los datos de 30 equipos de la liga mayor (Forbes, 15 de abril de 2002). En la columna titulada Valor se da el valor de los equipos con base en las actuales negociaciones con los estadios, sin deducción de deudas. En la columna titulada Ingreso se presentan las ganancias sin intereses, impuestos y depreciación.
Informe administrativo 1. Presente resúmenes numéricos y gráficos de los datos. 2. Use el análisis de regresión para investigar la relación entre valor e ingreso. Discuta sus hallazgos. 3. Use el análisis de regresión para investigar la relación entre valor y ganancias. Discuta sus hallazgos. 4. ¿Qué conclusiones y recomendaciones puede sacar de este análisis?
14Ander(543-623).qxd 2/28/08 7:17 PM Page 617
Caso problema 4
TABLA 14.13
archivo CD en Alumni
617
Valor de los equipos de béisbol de la liga mayor
DATOS DE 48 UNIVERSIDADES NACIONALES
Boston College Brandeis University Brown University California Institute of Technology Carnegie Mellon University Case Western Reserve Univ. College of William and Mary Columbia University Cornell University Dartmouth College Duke University Emory University Georgetown University Harvard University Johns Hopkins University Lehigh University Massachusetts Inst. of Technology New York University Northwestern University Pennsylvania State Univ. Princeton University Rice University Stanford University Tufts University Tulane University U. of California–Berkeley U. of California–Davis U. of California–Irvine U. of California–Los Angeles U. of California–San Diego U. of California–Santa Barbara U. of Chicago U. of Florida U. of Illinois–Urbana Champaign U. of Michigan–Ann Arbor U. of North Carolina–Chapel Hill U. of Notre Dame U. of Pennsylvania U. of Rochester U. of Southern California U. of Texas–Austin U. of Virginia U. of Washington U. of Wisconsin–Madison Vanderbilt University Wake Forest University Washington University–St. Louis Yale University
% de grupos con menos de 20
Tasa de estudiantes/ facultad
Tasa de alumnos que donan
39 68 60 65 67 52 45 69 72 61 68 65 54 73 64 55 65 63 66 32 68 62 69 67 56 58 32 42 41 48 45 65 31 29 51 40 53 65 63 53 39 44 37 37 68 59 73 77
13 8 8 3 10 8 12 7 13 10 8 7 10 8 9 11 6 13 8 19 5 8 7 9 12 17 19 20 18 19 20 4 23 15 15 16 13 7 10 13 21 13 12 13 9 11 7 7
25 33 40 46 28 31 27 31 35 53 45 37 29 46 27 40 44 13 30 21 67 40 34 29 17 18 7 9 13 8 12 36 19 23 13 26 49 41 23 22 13 28 12 13 31 38 33 50
14Ander(543-623).qxd 2/28/08 7:17 PM Page 618
618
Capítulo 14
TABLA 14.14
Regresión lineal simple
DATOS DE LOS EQUIPOS DE LA LIGA MAYOR DE BASQUETBOL
Equipo
archivo CD en MLB
Apéndice 14.1
New York Yankees New York Mets Los Angeles Dodgers Boston Red Sox Atlanta Braves Seattle Mariners Cleveland Indians Texas Rangers San Francisco Giants Colorado Rockies Houston Astros Baltimore Orioles Chicago Cubs Arizona Diamondbacks St. Louis Cardinals Detroit Tigers Pittsburgh Pirates Milwaukee Brewers Philadelphia Phillies Chicago White Sox San Diego Padres Cincinnati Reds Anaheim Angels Toronto Blue Jays Oakland Athletics Kansas City Royals Tampa Bay Devil Rays Florida Marlins Minnesota Twins Montreal Expos
Valor
Ganancia
Ingreso
730 482 435 426 424 373 360 356 355 347 337 319 287 280 271 262 242 238 231 223 207 204 195 182 157 152 142 137 127 108
215 169 143 152 160 166 150 134 142 129 125 133 131 127 123 114 108 108 94 101 92 87 103 91 90 85 92 81 75 63
18.7 14.3 29.6 11.4 9.5 14.1 3.6 6.5 16.8 6.7 4.1 3.2 7.9 3.9 5.1 12.3 9.5 18.8 2.6 3.8 5.7 4.3 5.7 20.6 6.8 2.2 6.1 1.4 3.6 3.4
Deducción de la fórmula de mínimos cuadrados empleando el cálculo Como ya se indicó en este capítulo, el método de mínimos cuadrados se usa para determinar los valores de b0 y b1 que minimicen la suma de los cuadrados de los residuales. La suma de los cuadrados de los residuales está dada por 兺( yi ŷi )2 Sustituyendo ŷi b0 b1x i , se obtiene 兺( yi b0 b1xi )2
(14.34)
como expresión que hay que minimizar. Para minimizar la expresión (14.14), se sacan las derivadas parciales respecto a b0 y b1, se igualan a cero y despeja. Haciendo esto se obtiene
14Ander(543-623).qxd 2/28/08 7:17 PM Page 619
Apéndice 14.2
619
Una prueba de significancia usando correlación
兺( yi b0 b1xi )2 2兺( yi b0 b1xi ) 0 b0 兺( yi b0 b1xi )2 2兺 xi ( yi b0 b1xi ) 0 b1
(14.35) (14.36)
Dividiendo la ecuación (14.35) entre dos y haciendo las sumas por separado, se obtiene 兺 yi 兺 b0 兺 b1xi 0 Llevando 兺yi al otro lado del signo igual y observando que 兺b0 nb0, se obtiene nb0 (兺xi )b1 兺yi
(14.37)
Simplificaciones algebraicas similares aplicadas a la ecuación (14.36) producen (兺xi )b0 (兺x 2i )b1 兺xi yi
(14.38)
A las ecuaciones (14.37) y (14.38) se les conoce como ecuaciones normales. Despejando b0 en la ecuación (14.37) se obtiene 兺y 兺x b0 n i b1 n i
(14.39)
Usando la ecuación (14.39) para sustituir a b0 en la ecuación (14.38) da 兺xi 兺yi (兺xi )2 2 n n b1 (兺x i )b1 兺xi yi
(14.40)
Reordenando los términos de la ecuación (14.40), se obtiene b1
兺xi yi (兺xi 兺yi )兾n 兺(xi x̄)( yi ȳ) 兺x 2i (兺xi )2兾n 兺(xi x̄)2
(14.41)
Como ȳ 兺yi 兾n y `x̄ 兺xi 兾n, la ecuación (14.39) se puede rescribir como b0 ȳ b1x̄
(14.42)
Las ecuaciones (14.41) y (14.42) son las fórmulas (14.6) y (14.7) usadas en este capítulo para calcular los coeficientes de la ecuación de regresión estimada.
Apéndice 14.2
Una prueba de significancia usando correlación Empleando el coeficiente de correlación muestral rxy, también se puede determinar si la relación lineal entre x y y es significativa mediante la siguiente prueba de hipótesis acerca del coeficiente de correlación muestral. H0: rxy 0 Ha: rxy 0
14Ander(543-623).qxd 2/28/08 7:17 PM Page 620
620
Capítulo 14
Regresión lineal simple
Si H0 es rechazada, se concluye que el coeficiente de correlación no es igual a cero y que la relación entre las dos variables no es significativa. A continuación se presenta esta prueba de significancia. PRUEBA DE SIGNIFICANCIA USANDO CORRELACIÓN
H0: rxy 0 Ha: rxy 0 ESTADÍSTICO DE PRUEBA
t rxy
冑
n 2 1 r 2xy
(14.43)
REGLA DE RECHAZO
Método del valor-p : Rechazar H0 si valor-p α Método del valor crítico : Rechazar H0 si t tα/2 o si t
tα/2
donde tα/2 pertenece a la distribución t con n 2 grados de libertad. En la sección 14.4 con una muestra n 10 se encontró que el coeficiente de correlación muestral para la población de estudiantes y las ventas trimestrales era rxy 0.9501. El estadístico de prueba es t
rxy
n 1
2 r 2xy
0.9501
10 2 1 (0.9501)2
8.61
En la tabla de la distribución t se encuentra que para n 2 10 2 8 grados de libertad, t 3.355 proporciona un área de 0.005 en la cola superior. Por lo tanto, al área en la cola superior que corresponde al estadístico de prueba t = 8.61 debe ser menor a 0.005. Como esta prueba es una prueba de dos colas, se duplica este valor y se concluye que el valor t que corresponde a t 8.62 debe ser menor a 2(0.005) 0.01. Con Excel o con Minitab se obtiene valor-p 0.000. Como el valor-p es menor a α 0.01, se rechaza H0 y se concluye que rxy no es igual a cero. Esta evidencia es suficiente para concluir que entre la población de estudiantes y las ventas trimestrales existe una relación lineal significativa. Obsérvese que el valor del estadístico de prueba t y la conclusión sobre la significancia de la relación son idénticos con los resultados obtenidos en la prueba t de la sección 14.5, en donde se usó la ecuación de regresión estimada ŷ 60 5x. El análisis de regresión permite obtener una conclusión sobre la relación entre las variables x y y; además, permite obtener la ecuación que indica cuál es la relación entre las variables. Por consiguiente, la mayoría de los analistas emplean paquetes modernos de software para realizar el análisis de regresión y encuentran que el empleo de la correlación como prueba de significancia es innecesario.
Apéndice 14.3
archivo CD en Armand’s
Análisis de regresión con Minitab En la sección 14.7 mostrando los resultados que da Minitab para el problema de Armand’s Pizza Parlors se estudió la solución de los problemas de regresión mediante el empleo de paquetes de software. En este apéndice se describen los pasos necesarios al emplear Minitab para generar esos resultados. Primero, en una hoja de cálculo de Minitab se ingresan los datos. Los datos de las poblaciones de estudiantes se ingresan en la columna C1 y los datos de las ventas trimestrales se ingresan en la columna C2. Los nombres de las variables Pop y Sales (Ventas) se ingresan como encabezados de esas columnas. En la descripción de los pasos a seguir, para referirse a los datos se emplearán los nombres de las variables o los indicadores de las columnas C1 y C2. Los
14Ander(543-623).qxd 2/28/08 7:17 PM Page 621
Apéndice 14.4
Análisis de regresión con Excel
621
pasos siguientes describen cómo usar Minitab para obtener los resultados del análisis de regresión que se muestran en la figura 14.10. Paso 1. Paso 2. Paso 3. Paso 4.
Seleccionar el menú Stat Seleccionar el menú Regression Elegir Regression Cuando aparezca el cuadro de diálogo Regresión: Ingresar Sales en el cuadro Response Ingresar Pop en el cuadro Predictors Clic en el botón Options Cuando aparezca el cuadro de diálogo Regression-Options: Ingresar 10 en el cuadro Prediction intervals for new observations Clic en OK Cuando aparezca el cuadro de diálogo Regression: Clic en OK
El cuadro de diálogo de Minitab tiene otras posibilidades más que se pueden aprovechar seleccionando las opciones deseadas. Por ejemplo, para obtener una gráfica de residuales, en la que los valores pronosticados ŷ aparezcan en el eje horizontal y los valores de los residuales estandarizados en el eje vertical, el paso 4 deberá ser como sigue: Paso 4 Cuando aparezca el cuadro de diálogo Regression: Ingresar Sales en el cuadro Response Ingresar Pop en el cuadro Predictors Clic en el botón Graphs Cuando aparezca el cuadro de diálogo Regression-Graphs: Seleccionar Standardized en Residuals for Plots Seleccionar Residuals versus fits en Residual Plots Clic en OK Cuando aparezca el cuadro de diálogo Regression: Clic en OK
Apéndice 14.4
archivo CD en Armand’s
Análisis de regresión con Excel En este apéndice se ilustra el uso de la herramienta de Excel para realizar los cálculos del análisis de regresión empleando el problema de Armand´s Pizza Parlors. Consúltese la figura 14.23, para seguir la descripción de los pasos. En las celdas A1:C1 de la hoja de cálculo se ingresan los rótulos Restaurante, Población y Ventas. Para identificar cada una de las 10 observaciones, se ingresan los números del 1 al 10 en las celdas A2:A11. Los datos muestrales se ingresan en las celdas B2:C11. Los pasos siguientes indican cómo obtener los resultados del análisis de regresión. Paso 1. Paso 2. Paso 3. Paso 4. Paso 5.
Seleccionar el menú Herramientas Elegir el menú Análisis de datos Elegir Regresión en el menú de Funciones para análisis Clic en OK Cuando aparezca el cuadro de diálogo Regresión: Ingresar C1:C11 en el cuadro Rango Y de entrada Ingresar B1:B11 en el cuadro Rango X de entrada Seleccionar Rótulos Seleccionar Nivel de confianza Ingresar 99 en el cuadro Nivel de confianza Seleccionar Rango de salida Ingresar A13 en el cuadro Rango de salida (También se puede ingresar cualquier celda, de la esquina superior izquierda, para indicar dónde deberán empezar los resultados.) Clic en OK
14Ander(543-623).qxd 2/28/08 7:17 PM Page 622
622
Capítulo 14
FIGURA 14.23
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
Regresión lineal simple
SOLUCIÓN CON EXCEL AL PROBLEMA DE ARMAND’S PIZZA PARLORS
A Restaurant 1 2 3 4 5 6 7 8 9 10
B Population 2 6 8 8 12 16 20 20 22 26
C Sales
D
E
F
G
H
I
J
58 105 88 118 117 137 157 169 149 202
SUMMARY OUTPUT Regression Statistics Multiple R 0.9501 R Square 0.9027 Adjusted R Square 0.8906 Standard Error 13.8293 Observations 10 ANOVA df Regression Residual Total
Intercept Population
SS 1 8 9
MS F 14200 14200 74.2484 1530 191.25 15730
Coefficients Standard Error t Stat P-value 60 9.2260 6.5033 0.0002 5 0.5803 8.6167 2.55E-05
Significance F 2.55E-05
Lower 95% Upper 95% Lower 99.0% Upper 99.0% 38.7247 81.2753 29.0431 90.9569 3.6619 6.3381 3.0530 6.9470
La primera sección de los resultados, titulada Estadísticas de regresión, contiene resúmenes estadísticos como el coeficiente de determinación (R*2). La segunda sección de los resultados, titulada Análisis de varianza, contiene la tabla del análisis de varianza. La última sección de los resultados, que no tiene ningún título, contiene los coeficientes de regresión estimados e información relacionada con ellos. A continuación se da la interpretación de los resultados de la regresión empezando con la información contenida en las celdas A28:I30
Interpretación de los resultados de la ecuación de regresión estimada La intersección de la recta de regresión con el eje y, b0 60, aparece en la celda B29 y la pendiente de la recta de regresión estimada, b1 5, aparece en la celda B30. El rótulo Intercepción en la celda A29 y el rótulo Población en la celda A30 sirven para identificar estos dos valores. En la sección 14.5 se mostró que la desviación estándar estimada de b1 es sb1 0.5803. Obsérvese que el valor de la celda C30 es 0.5803. El rótulo Error típico que aparece en la celda C28, es la manera en que Excel indica que el valor de la celda C30 es el error estándar o la desviación estándar de b1. Recuérdese que en la prueba t de significancia de la relación fue necesario calcular el estadístico t, t b1兾sb1. Empleando los datos de Armand’s, se obtuvo como valor t, t 5/.5803 8.62. El rótulo Estadístico t de la celda D28 sirve para recordar que en la celda D30 se encuentra el valor del estadístico t.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 623
Apéndice 14.4
Análisis de regresión con Excel
623
El valor en la celda E30 es el valor –p que corresponde a la prueba t de significancia. El valor-p que da Excel en la celda E30, está en notación científica. Para obtener este valor en notación decimal, se recorre el punto decimal 5 lugares a la izquierda, con lo que se obtiene 0.0000255. Dado que valor-p 0.0000255 α 0.01, se rechaza H0 y se concluye que entre la población de estudiantes y las ventas trimestrales existe una relación significativa. La información de las celdas F28:I30 se emplea para obtener estimaciones por Intervalos de confianza para la intersección con el eje y y la pendiente de la ecuación de regresión estimada. Excel siempre da los límites inferior y superior de un intervalo de 95% de confianza. Como en el paso 4 se seleccionó Intervalo de confianza y se ingresó 99 en el cuadro de Nivel de Confianza, la herramienta de Excel para regresión da también los límites inferior y superior de un intervalo de 99% de confianza. El valor en la celda H30 es el límite inferior de la estimación por intervalo del 99% de confianza de b1 y el valor en la celda I30 es el límite superior. Por lo tanto, una vez redondeada, el intervalo de 99% de confianza para estimar b1 va de 3.05 a 6.95. Los valores en las celdas F30 a G30 proporcionan los límites inferior y superior del intervalo de 95% de confianza. El intervalo de 95% de confianza va de 3.66 a 6.34.
Interpretación de los resultados del ANOVA
El rótulo Valor crítico de F se entiende mejor si se considera el valor en la celda F24 como el nivel de significancia observado en la prueba F.
La información en las celdas A22:F26 es un resumen de los cálculos del análisis de varianza. Las tres fuentes de variación están rotuladas como Regresión, Residuo y Total. La etiqueta df en la celda B23 representa los grados de libertad, la etiqueta SS en la celda C23 representa la suma de los cuadrados y la etiqueta MS en la celda D23 representa el cuadrado de la media. En la sección 14.5 se dijo que el error cuadrado medio, que se obtiene dividiendo el error o la suma de cuadrados del residual entre sus grados de libertad, proporciona una estimación de σ 2. El valor en la celda D25, 191.25, es el error cuadrado medio de los resultados de regresión para el problema de Armand’s. En la sección 14.5 se mostró que también se puede usar una prueba F como prueba de significancia en la regresión. El valor en la celda F24, 0.0000255, es el valor-p que corresponde a la prueba F de significancia. Dado que valor-p 0.0000255 α 0.01, se rechaza H0 y se concluye que se tiene una relación significante entre la población de estudiantes y las ventas trimestrales. En la celda F23, el rótulo que emplea Excel para identificar el valor-p de la prueba F de significancia es Valor crítico de F.
Interpretación de los estadísticos de regresión de los resultados El coeficiente de determinación, 0.9027, aparece en la celda B17; el rótulo correspondiente, Coeficiente de determinación R*2, aparece en la celda A17. La raíz cuadrada del coeficiente de determinación es el coeficiente de correlación muestral, 0.9501, que aparece en la celda B16. Obsérvese que para identificar este valor, Excel emplea como rótulo Coeficiente de correlación múltiple. En la celda A19, el rótulo Error Estándar se usa para identificar el valor del error estándar de estimación que aparece en la celda B19. Así que el error estándar de estimación es 13.8293. Hay que tener presente que en los resultados de Excel, el rótulo Error típico aparece en dos lugares. En la sección de los resultados titulada Estadísticas de regresión, el rótulo Error típico se refiere a la estimación de σ ; en la sección de los resultados correspondiente a la Ecuación de regresión estimada, el rótulo Error típico se refiere a sb1, la desviación estándar de la distribución muestral de b1.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 624
CAPÍTULO
15
Regresión múltiple CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: INTERNATIONAL PAPER
15.1 MODELO DE REGRESIÓN MÚLTIPLE Modelo de regresión y ecuación de regresión Ecuación de regresión múltiple estimada
15.2 MÉTODO DE MÍNIMOS CUADRADOS Un ejemplo: Butler Trucking Company Nota sobre la interpretación de los coeficientes
15.3 COEFICIENTE DE DETERMINACIÓN MÚLTIPLE
15.4 SUPOSICIONES DEL MODELO
15.5 PRUEBA DE SIGNIFICANCIA Prueba F Prueba t Multicolinealidad
15.6 USO DE LA ECUACIÓN DE REGRESIÓN ESTIMADA PARA ESTIMACIONES Y PREDICCIONES
15.7 VARIABLES CUALITATIVAS INDEPENDIENTES Un ejemplo: Johnson Filtration Inc. Interpretación de los parámetros Variables cualitativas más complejas
15.8 ANÁLISIS RESIDUAL Detección de observaciones atípicas Residuales estudentizados eliminados y observaciones atípicas Observaciones influyentes Uso de la medida de la distancia de Cook para identificar observaciones influyentes
15.9 REGRESIÓN LOGÍSTICA Ecuación de regresión logística Estimación de la ecuación de regresión logística Prueba de significancia Uso en la administración Interpretación de la ecuación de regresión logística Transformación logit
15Ander(624-692).qxd 2/29/08 11:06 AM Page 625
625
La estadística en la práctica
LA ESTADÍSTICA
en LA PRÁCTICA
INTERNATIONAL PAPER* PURCHASE, NUEVA YORK
International Paper es la mayor empresa del mundo que se dedica a la producción de papel y productos forestales. Esta empresa da empleo a más de 117 000 personas en casi 50 países y exporta sus productos a más de 130 naciones. International Paper produce materiales de construcción como madera para construcción y madera de contrachapa; materiales de empaque como vasos y recipientes desechables; materiales para empaque industrial como cajas de cartón corrugado y embalaje de expedición, además de una gran variedad de papeles para fotocopiadoras, impresoras, libros y material para publicidad. En la fabricación de los productos de papel, se procesan virutas de madera y productos químicos en molinos de pulpa para obtener la pulpa de madera. Después, la pulpa de madera se emplea para producir los productos de papel. Para los productos de papel blanco, es necesario blanquear la pulpa con objeto de eliminar cualquier alteración cromática. El agente blanqueador esencial en este proceso es el dióxido de cloro, el cual, debido a su naturaleza combustible, suele producirse en un molino de pulpa, de donde, en forma de solución, es transportado a través de una tubería a la torre de blanqueo del molino de pulpa. Con objeto de mejorar uno de los procesos empleados en la producción del dióxido de cloro, se estudió el control y la eficiencia del proceso. Uno de los aspectos estudiados fue la velocidad de alimentación de las sustancias químicas que intervienen en la producción del dióxido de cloro. En la producción del dióxido de cloro intervienen cuatro sustancias químicas que llegan, a velocidades controladas, al generador de dióxido de cloro. El dióxido de cloro producido en el generador se recibe en un absorbente, de donde el dióxido de cloro gaseoso es absorbido en agua helada formando una solución de dióxido de cloro. A continuación la solución pasa a un molino de papel. Parte esencial del control de este proceso es la velocidad de alimentación de las sustancias químicas. Antes, los operadores fijaban la velocidad de alimentación de las sustancias químicas, método que llevaba a un sobrecontrol del proceso. Debido a esto, los ingenieros químicos encargados del molino solicitaron que, como ayuda para fijar las velocidades de alimentación de estas sustancias, se obtuviera un * Los autores agradecen a Mariam Williams y Hill Griggs por proporcionar este artículo para La estadística en la práctica. Esta aplicación fue elaborada por Champion International Corporation, empresa que en 2000 se volvió parte de International Paper.
El análisis de regresión múltiple se empleó para obtener un mejor proceso de blanqueo en la fabricación de productos de papel blanco. © Lester Lefkowitz/Corbis.
conjunto de ecuaciones de control, una para la alimentación de cada una de las sustancias químicas. Empleando el análisis de regresión múltiple, los analistas obtuvieron, para cada una de las cuatro sustancias químicas empleadas en el proceso, una ecuación de regresión múltiple estimada. Cada ecuación relaciona la producción de dióxido de cloro con la cantidad de la sustancia química empleada y con la concentración de la solución de dióxido de cloro. En cada uno de los molinos se programó en una microcomputadora el conjunto de las cuatro ecuaciones obtenidas. Con el nuevo sistema, los operadores ingresan al sistema la concentración de la solución de dióxido de cloro y la velocidad de producción deseadas; el paquete de software calcula la velocidad de alimentación de la sustancia química que permite obtener esa velocidad de producción deseada. Desde que los operadores empezaron a usar las ecuaciones de control, aumentó significativamente la eficiencia del generador de dióxido de cloro así como la cantidad de veces en las que la concentración de cloro caía dentro del rango aceptable. Este ejemplo muestra el empleo del análisis de regresión múltiple en la obtención de mejores procesos de blanqueo para producir productos de papel blanco. En este capítulo se verá el uso de los paquetes de software para tales propósitos. La mayor parte de los conceptos presentados en el capítulo 14, para la regresión lineal simple, pueden extenderse a la regresión múltiple.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 626
626
Capítulo 15
Regresión múltiple
En el capítulo 14 se presentó la regresión lineal simple y se mostró su uso en la obtención de una ecuación de regresión estimada que describe la relación entre dos variables. Recuérdese que la variable que se predice o explica es la variable dependiente y la variable que se usa para predecir o explicar la variable dependiente es la variable independiente. En este capítulo se continúa con el estudio del análisis de regresión considerando, ahora, las situaciones en las que intervienen dos o más variables independientes. Este estudio, al que se le conoce como análisis de regresión múltiple, permite tomar más factores en consideración y obtener estimaciones mejores que las que son posibles con la regresión lineal simple.
15.1
Modelo de regresión múltiple El análisis de regresión múltiple estudia la relación de una variable dependiente con dos o más variables independientes. Para denotar el número de variables independientes se suele usar p.
Modelo de regresión y ecuación de regresión Los conceptos de modelo de regresión y ecuación de regresión vistos en el capítulo previo, son aplicables en el caso de la regresión múltiple. A la ecuación que describe cómo está relacionada la variable dependiente y con las variables independientes x1, x2, . . ., xp se le conoce como modelo de regresión múltiple. Se supone que el modelo de regresión múltiple toma la forma siguiente MODELO DE REGRESIÓN MÚLTIPLE
y β0 β1x1 β2 x 2 . . . βp xp
(15.1)
En el modelo de regresión múltiple, β0, β1, β2, . . . , βp, son parámetros y el término del error (la letra griega épsilon) es una variable aleatoria. Examinando con atención este modelo se ve que y es una función lineal de x1, x2, . . ., xp (la parte β0 β1x1 β2 x 2 . . . βp xp) más el término del error . El término del error corresponde a la variabilidad en y que no puede atribuirse o explicarse al efecto lineal de las p variables independientes. En la sección 15.4 se discutirán los supuestos para el modelo de regresión múltiple y para . Uno de los supuestos es que la media o valor esperado de es cero. Una consecuencia de este supuesto es que la media o valor esperado de y, que se denota E(y), es igual a β0 β1x1 β2 x 2 . . . βp xp. A la ecuación que describe cómo está relacionada la media de y con x1, x2 , . . . , xp se le conoce como ecuación de regresión múltiple.
ECUACIÓN DE REGRESIÓN MÚLTIPLE
E( y) β0 β1x1 β2 x 2 . . . βp xp
(15.2)
Ecuación de regresión múltiple estimada Si se conocieran los valores de β0, β1, β2, . . . , βp, se podría usar la ecuación (15.2) para calcular la media de las y para valores dados de x1, x2, . . ., xp. Desafortudamente, los valores de estos parámetros no suelen conocerse, es necesario estimarlos a partir de datos muestrales. Para calcular los valores de los estadísticos muestrales b1, b2, . . ., bp, que se usan como estimadores puntuales de los parámetros β0, β1, β2, . . . , βp se emplea una muestra aleatoria simple. Con los estadísticos muestrales se obtiene la siguiente ecuación de regresión múltiple estimada.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 627
15.2
627
Método de mínimos cuadrados
ECUACIÓN DE REGRESIÓN MÚLTIPLE ESTIMADA
ŷ b0 b1x1 b2 x 2 . . . bp xp
(15.3)
donde b0, b1, b2, . . . , bp son las estimaciones de β0, β1, β2, . . . , βp ŷ valor estimado de la variable dependiente Este proceso de estimación en la regresión múltiple se muestra en la figura 15.1.
15.2
Método de mínimos cuadrados En el capítulo 14, se usó el método de mínimos cuadrados para obtener la ecuación de regresión estimada que permitía aproximar mejor la relación lineal entre las variables dependiente e independiente. Este método también se usa para obtener la ecuación de regresión múltiple estimada. El criterio en el método de mínimos cuadrados, como ya se dijo, es el siguiente.
CRITERIO DE MÍNIMOS CUADRADOS
min 兺( yi ŷi )2
FIGURA 15.1
En la regresión lineal simple, b0 y b1 son los estadísticos muestrales que se usan para estimar los parámetros β0 y β1. En la regresión múltiple, en el proceso de inferencia estadística análogo, b0, b1, b2, ..., bp denotan los estadísticos muestrales que se usan para estimar los parámetros β0 , β1, β2 , . . . , βp.
(15.4)
PROCESO DE ESTIMACIÓN EN LA REGRESIÓN MÚLTIPLE
Modelo de regresión múltiple Datos muestrales Ecuación de regresión múltiple
son parámetros desconocidos
Cálculo de la ecuación de regresión múltiple estimada son las estimaciones de son estadísticos muestrales
15Ander(624-692).qxd 2/29/08 11:06 AM Page 628
628
Capítulo 15
Regresión múltiple
donde yi valor observado en la variable dependiente en la observación i ŷi valor estimado para la variable dependiente en la observación i Los valores estimados de la variable dependiente se calculan empleando la ecuación de regresión múltiple estimada ŷ b0 b1x1 b2 x 2 . . . bp xp Como indica la expresión (15.4), el método de mínimos cuadrados emplea datos muestrales para obtener los valores de b0, b1, b2, . . ., bp que hacen que la suma de los cuadrados de los residuales [las diferencias entre los valores observados de la variable dependiente (yi) y los valores estimados de la variable dependiente (ŷi )] sea un mínimo. En el capítulo 14 se dieron las fórmulas para calcular los estimadores b0 y b1 para la ecuación de regresión lineal simple estimada ŷ b0 b1x empleando el método de mínimos cuadrados. Con conjuntos de datos relativamente pequeños, fue posible usar esas fórmulas para obtener b0 y b1 mediante cálculos manuales. En la regresión múltiple, en cambio, las fórmulas para calcular b0, b1, b2, . . . , bp emplean álgebra de matrices y quedan fuera del alcance de este texto. Por esta razón, en el estudio de la regresión múltiple, se centrará la atención en el uso de los paquetes de software para obtener la ecuación de regresión estimada y algunas otras informaciones. Lo importante será la interpretación de los resultados que proporcionan estos paquetes de software y no cómo hacer los cálculos para la regresión múltiple.
Un ejemplo: Butler Trucking Company Para ilustrar el análisis de regresión múltiple, se empleará un problema de la empresa Butler Trucking Company, una empresa que se dedica al transporte de objetos y mercancías en el sur de California. La actividad principal de esta empresa es hacer entregas en su área local. Para mejorar el horario de trabajo, los gerentes deseaban estimar el tiempo total de recorrido diario necesario para hacer las entregas. Al principio, los gerentes creyeron que el tiempo total de recorrido diario estaba estrechamente relacionado con el número de millas recorridas para hacer las entregas. Partiendo de una muestra aleatoria simple de 10 entregas se obtuvieron los datos que se presentan en la tabla 15.1 y en el diagrama de dispersión de la figura 15.2. Después de observar el diagrama de dispersión, los gerentes consideraron que para describir la relación entre tiempo total de recorrido (yi) y el número de millas recorridas (xi) podía emplearse el modelo de regresión lineal simple TABLA 15.1
archivo CD en Butler
DATOS PRELIMINARES DE BUTLER TRUCKING Recorrido
x1 ⴝ Millas recorridas
y ⴝ Tiempo de recorrido (horas)
1 2 3 4 5 6 7 8 9 10
100 50 100 100 50 80 75 65 90 90
9.3 4.8 8.9 6.5 4.2 6.2 7.4 6.0 7.6 6.1
15Ander(624-692).qxd 2/29/08 11:06 AM Page 629
15.2
629
Método de mínimos cuadrados
FIGURA 15.2
DIAGRAMA DE DISPERSIÓN DE LOS DATOS PRELIMINARES DE BUTLER TRUCKING y 10
Tiempo de recorrido (horas)
9 8 7 6 5 4
50
60
70
80
90
100
x1
Millas recorridas
y β0 β1x1 . Para estimar los parámetros β0 y β1, se empleó el método de mínimos cuadrados obteniéndose la ecuación de regresión estimada ŷ b0 b1x1
(15.5)
En la figura 15.3 se presentan los resultados obtenidos con Minitab aplicando la regresión lineal simple a los datos de la tabla 15.1. La ecuación de regresión estimada es ŷ
1.27
0.0678x1
Empleando como nivel de significancia 0.05, el valor-p correspondiente a F de 15.81, es 0.004; esto indica que la relación es significativa, es decir, que se puede rechazar H0: β1 0 debido a que el valor-p es menor a α 0.05. Obsérvese que empleando el valor t, 3.98, y su valor-p correspondiente, 0.004, se llega a la misma conclusión. Por lo tanto, se puede concluir que la relación entre el tiempo total de recorrido y el número de millas recorridas es significativa; recorridos de más duración corresponden a cantidades mayores de millas recorridas. Como el coeficiente de correlación (expresado como porcentaje) es R-sq 66.4%, se ve que 66.4% de la variabilidad en el tiempo de recorrido se puede explicar por el efecto lineal del número de millas recorridas. Este descubrimiento es bastante satisfactorio, sin embargo, los gerentes deseban considerar otra variable independiente más para explicar parte de la variabilidad restante de la variable dependiente. Al tratar de encontrar otra variable independiente los gerentes encontraron que el número de entregas podía contribuir también a la duración total del recorrido. En la tabla 15.2 se presentan los datos de Butler Trucking después de agregar el número de entregas. En la figura 15.4 se presenta el resultado que da Minitab al considerar como variables independientes, tanto el número de millas recorridas (x1) como el número de entregas (x2) realizadas. La ecuación de regresión estimada es ŷ
0.869
0.0611x1
0.923x 2
(15.6)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 630
630
Capítulo 15
Regresión múltiple
FIGURA 15.3
RESULTADOS DE MINITAB PARA EL PROBLEMA DE BUTLER TRUCKING CON UNA VARIABLE INDEPENDIENTE The regression equation is Time = 1.27 + 0.0678 Miles
Los nombres de las variables Miles (millas) y Time (tiempo) que aparecen en los resultados de Minitab fueron ingresados en la hoja de cálculo como encabezados de las columnas correspondientes; por lo tanto, x1 = Miles y y = Time.
Predictor Constant Miles S = 1.002
Coef 1.274 0.06783
SE Coef 1.401 0.01706
R-sq = 66.4%
T 0.91 3.98
p 0.390 0.004
R-sq(adj) = 62.2%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 8 9
SS 15.871 8.029 23.900
MS 15.871 1.004
F 15.81
p 0.004
En la sección siguiente se verá el uso del coeficiente de determinación múltiple para medir la bondad de ajuste de esta ecuación de regresión. Pero, antes, se examinarán con más detenimiento los valores b1 0.0611 y b2 0.923 de la ecuación (15.6).
Nota sobre la interpretación de los coeficientes En este punto es útil hacer una observación sobre la relación entre la ecuación de regresión estimada en la que la única variable independiente es el número de millas recorridas y la ecuación en la que, como segunda variable independiente, se incluye el número de entregas. El valor de b1 no es igual en ambos casos. En la regresión lineal simple, b1 se interpreta como una estimación del cambio en y debido al cambio en una unidad de la variable independiente. En el análisis de regresión múltiple, esta interpretación cambia ligeramente. Es decir, en el análisis de regresión múltiple, cada uno de los coeficientes de regresión se interpreta como sigue: bi representa la estimación del cambio en y debido a un cambio en una unidad en xi mientras todas las demás variables independientes permanecen constantes. En el ejemplo de Butler Trucking con dos variables independientes, b1 = 0.0611. Por lo tanto, 0.0611 horas es la estimación del aumenTABLA 15.2
archivo CD en Butler
DATOS DE BUTLER TRUCKING CON MILLAS RECORRIDAS (x1) Y CANTIDAD DE ENTREGAS (x 2) COMO VARIABLES INDEPENDIENTES
Recorrido asignado
x1 ⴝ Millas recorridas
x2 ⴝ Cantidad de entregas
y ⴝ Tiempo de recorrido (horas)
1 2 3 4 5 6 7 8 9 10
100 50 100 100 50 80 75 65 90 90
4 3 4 2 2 2 3 4 3 2
9.3 4.8 8.9 6.5 4.2 6.2 7.4 6.0 7.6 6.1
15Ander(624-692).qxd 2/29/08 11:06 AM Page 631
15.2
631
Método de mínimos cuadrados
FIGURA 15.4
RESULTADOS DE MINITAB PARA EL PROBLEMA DE BUTLER TRUCKING CON DOS VARIABLES INDEPENDIENTES The regression equation is Time = - 0.869 + 0.0611 Miles + 0.923 Deliveries
Los nombres de las variables Miles (millas), Deliveries (entregas) y Time (tiempo) que aparecen en los resultados de Minitab fueron ingresados en la hoja de cálculo como encabezados de las columnas; por lo tanto, x1 = Miles, x2 = Deliveries y y = Time.
Predictor Constant Miles Deliveries S = 0.5731
Coef -0.8687 0.061135 0.9234
SE Coef 0.9515 0.009888 0.2211
R-sq = 90.4%
T -0.91 6.18 4.18
p 0.392 0.000 0.004
R-sq(adj) = 87.6%
Analysis of Variance SOURCE Regression Residual Error Total
DF 2 7 9
SS 21.601 2.299 23.900
MS 10.800 0.328
F 32.88
p 0.000
to esperado en el tiempo de recorrido que corresponde al aumento en una milla en la distancia recorrida cuando el número de entregas permanece constante. De manera similar, como b2 = 0.923, una estimación del aumento esperado en el tiempo de recorrido que corresponde al aumento de una entrega permaneciendo constante el número de millas recorridas es 0.923 horas.
Ejercicios Nota a los estudiantes: Los ejercicios de esta sección y de las secciones siguientes en los que se dan datos están pensados para ser resueltos empleando un paquete de software.
Métodos 1. A continuación se da la ecuación de regresión estimada obtenida a partir de 10 observaciones para un modelo con dos variables independientes. y 29.1270 0.5906x1 0.4980x2 ^
a. b.
Auto examen
archivo CD en Exer2
Interprete los coeficientes b1 y b2 de esta ecuación de regresión estimada. Estime y para x1 180 y x2 310.
2. Considérense los datos siguientes que corresponden a la variable dependiente y y a las dos variables independientes x1 y x2.
x1
x2
y
30 47 25 51 40 51 74
12 10 17 16 5 19 7
94 108 112 178 94 175 170 (continúa)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 632
632
Capítulo 15
Regresión múltiple
x1
x2
y
36 59 76
12 13 16
117 142 211
a. b. c.
Obtenga una ecuación de regresión estimada que relacione y con x1. Estime y si x1 = 45. Obtenga una ecuación de regresión estimada que relacione y con x2. Estime y si x2 = 15. Obtenga una ecuación de regresión estimada que relacione y con x1 y x2. Estime y si x1 = 45 y x2 = 15. 3. En un análisis de regresión se emplean 30 observaciones y se obtiene la siguiente ecuación de regresión estimada. ŷ 17.6 3.8x1 2.3x 2 7.6x3 2.7x4 a. b.
Interprete los coeficientes b1, b2, b3 y b4 de esta ecuación de regresión. Estime y para x1 10, x2 5, x3 1 y x4 2.
Aplicaciones 4. Para una zapatería se obtiene la siguiente ecuación de regresión estimada en la que se relacionan las ventas con la inversión en inventario y los gastos en publicidad. ŷ 25 10x1 8x 2
donde x1 inversión en inventario (en miles de $) x 2 gasto en publicidad (en miles de $) y ventas (en miles de $) a. b.
Auto examen
Estime las ventas si la inversión en inventario es de $15 000 y el presupuesto para publicidad es de $10 000. Interprete b1 y b2 en esta ecuación de regresión estimada.
5. El dueño de Showtime Movie Theater, Inc., desea estimar el ingreso bruto semanal en función de los gastos en publicidad. A continuación se presentan los datos históricos de 10 semanas.
archivo CD en Showtime
a. b. c.
Ingreso semanal bruto (en miles de $)
Publicidad en televisión (en miles de $)
Publicidad en periódicos (en miles de $)
96 90 95 92 95 94 94 94
5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0
1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5
Obtenga una ecuación de regresión estimada en la que el monto gastado en publicidad en televisión sea la variable independiente. Obtenga una ecuación de regresión estimada en la que los montos gastados en publicidad en televisión y en periódicos sean las variables independientes. ¿Es el coeficiente correspondiente a los gastos de publicidad en televisión de la ecuación de regresión estimada del inciso a) igual al del inciso b)? Interprete este coeficiente en cada caso.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 633
15.2
633
Método de mínimos cuadrados
d.
¿Cuál es el ingreso semanal bruto en una semana en la que se gastan $3500 en publicidad en televisión y $1800 en publicidad en periódicos?
6. En el béisbol, el éxito de un equipo se suele considerar en función del desempeño en bateo y en lanzamiento del equipo. Una medida del desempeño en el bateo es la cantidad de cuadrangulares que anota el equipo y una medida del desempeño en lanzamiento es el promedio de carreras ganadas por el equipo que lanza. En general, se cree que los equipos que anotan más cuadrangulares (home run) y tienen un promedio menor de carreras ganadas ganan un mayor porcentaje de juegos. Los datos siguientes pertenecen a 16 equipos que participaron en la temporada de la Liga Mayor de Béisbol de 2003; se da la proporción de juegos ganados, la cantidad de cuadrangulares del equipo (HR, por sus siglas en inglés) y el promedio de carreras ganadas (ERA, por sus siglas en inglés) (www.usatoday.com, 17 de enero de 2004).
Equipo
archivo CD en MLB
Arizona Atlanta Chicago Cincinnati Colorado Florida Houston Los Ángeles
a. b. c.
d.
Proporción de ganados
HR
ERA
Equipo
0.519 0.623 0.543 0.426 0.457 0.562 0.537 0.525
152 235 172 182 198 157 191 124
3.857 4.106 3.842 5.127 5.269 4.059 3.880 3.162
Milwaukee Montreal Nueva York Philadelphia Pittsburgh San Diego San Francisco St. Louis
Proporción de ganados
HR
ERA
0.420 0.512 0.410 0.531 0.463 0.395 0.621 0.525
196 144 124 166 163 128 180 196
5.058 4.027 4.517 4.072 4.664 4.904 3.734 4.642
Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función de la cantidad de cuadrangulares. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función del promedio de carreras ganadas por los miembros del equipo que lanza. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en función de la cantidad de cuadrangulares y del promedio de carreras ganadas por los miembros del equipo que lanza. En la temporada de 2003, San Diego ganó sólo el 39.5% de sus juegos, siendo el más bajo de la liga nacional. Para mejorar para el año siguiente, el equipo trató de adquirir nuevos jugadores que hicieran que la cantidad de cuadrangulares aumentara a 180 y que el promedio de carreras ganadas por el equipo que lanza disminuyera a 4.0. Use la ecuación de regresión estimada obtenida en el inciso c) para estimar el porcentaje de juegos que ganaría San Diego si tuviera 180 cuadrangulares y su promedio de carreras ganadas fuera 4.0.
7. Los diseñadores de mochilas usan materiales exóticos como supernailon Derlin, polietileno de alta densidad, aluminio para aviones o espumas termo-moldeadas para hacer que las mochilas sean más confortables y que el peso se distribuya uniformemente eliminándose así los puntos de mayor presión. En los datos siguientes se proporciona capacidad (en pulgadas cúbicas), evaluación del confort, y precio de 10 mochilas probadas por Outside Magazine. El confort está medido con una escala del 1 al 5, en la que 1 denota un confort mínimo y 5 un confort excelente. (Outside Buyer’s Guide, 2001). Fabricante y modelo
archivo CD en Backpack
Camp Trails Paragon II EMS 5500 Lowe Alpomayo 90 20 Marmot Muir Kelly Bigfoot 5200 Gregory Whitney Osprey 75 Arc Teryx Bora 95 Dana Design Terraplane LTW The Works @ Mystery Ranch Jazz
Capacidad
Confort
Precio
4330 5500 5500 4700 5200 5500 4700 5500 5800 5000
2 3 4 3 4 4 4 5 5 5
$190 219 249 249 250 340 389 395 439 525
15Ander(624-692).qxd 2/29/08 11:06 AM Page 634
634
Capítulo 15
a. b. c.
Regresión múltiple
Obtenga la ecuación de regresión estimada que permita predecir el precio de una mochila, dada su capacidad y la evaluación de su confort. Interprete b1 y b2. Diga cuál será el precio de una mochila cuya capacidad sea 4500 pulgadas cúbicas y la evaluación de su confort sea 4.
8. En la tabla siguiente se da el rendimiento anual, la evaluación de la seguridad (0 = de alto riesgo, 10 segura) y el coeficiente de gastos anuales de 20 fondos extranjeros (Mutual Funds, marzo de 2000).
archivo CD en ForFunds
Accessor Int’l Equity “Adv” Aetna “I” International Amer Century Int’l Discovery “Inv” Columbia International Stock Concert Inv “A” Int’l Equity Dreyfus Founders Int’l Equity “F” Driehaus International Growth Excelsior “Inst” Int’l Equity Julius Baer International Equity Marshall International Stock “Y” MassMutual Int’l Equity “S” Morgan Grenfell Int’l Sm Cap “Inst” New England “A” Int’l Equity Pilgrim Int’l Small Cap “A” Republic International Equity Sit International Growth Smith Barney “A” Int’l Equity State St Research “S” Int’l Equity Strong International Stock Vontobel International Equity
a. b.
Evaluación de seguridad
Coeficiente de gastos anuales (%)
Rendimiento anual (%)
7.1 7.2 6.8 7.1 6.2 7.4 6.5 7.0 6.9 7.2 7.1 7.7 7.0 7.0 7.2 6.9 7.0 7.1 6.5 7.0
1.59 1.35 1.68 1.56 2.16 1.80 1.88 0.90 1.79 1.49 1.05 1.25 1.83 1.94 1.09 1.50 1.28 1.65 1.61 1.50
49 52 89 58 131 59 99 53 77 54 57 61 88 122 71 51 60 50 93 47
Obtenga la ecuación de regresión estimada que relaciona el rendimiento anual con la evaluación de la seguridad y con el coeficiente de gastos anuales. Estime el rendimiento anual de una empresa cuya evaluación de seguridad es 7.5 y el coeficiente de gastos anuales es 2.
9. El ski acuático y el wakeboarding son dos deportes acuáticos muy actuales. Ya sea que se trate de ski acuático, de wakeboarding o de navegación, hallar el modelo que mejor se ajuste a las necesidades, puede no ser una tarea sencilla. La revista Water Ski probó 88 lanchas y proporcionó una amplia información como ayuda para los consumidores. A continuación se presenta una parte de los datos que publicaron sobre 20 lanchas de 20 y 22 pies longitud (Water Ski, enero/febrero 2006). La manga es el ancho máximo de la lancha (en pulgadas), HP son los caballos de fuerza del motor y velocidad máxima es la velocidad máxima que alcanza la lancha, en millas por hora. Fabricante y modelo
archivo CD en Boats
Calabria Cal Air Pro V-2 Correct Craft Air Nautique 210 Correct Craft Air Nautique SV-211 Correct Craft Ski Nautique 206 Limited Gekko GTR 22 Gekko GTS 20 Malibu Response LXi Malibu Sunsettter LXi Malibu Sunsetter 21 XTi
Manga
HP
Velocidad máxima
100 91 93 91 96 83 93.5 98 98
330 330 375 330 375 375 340 400 340
45.3 47.3 46.9 46.7 50.1 52.2 47.2 46 44
15Ander(624-692).qxd 2/29/08 11:06 AM Page 635
15.2
635
Método de mínimos cuadrados
Fabricante y modelo Malibu Sunscape 21 LSV Malibu Wakesetter 21 XTi Malibu Wakesetter VLX Malibu vRide Malibu Ride XTi Mastercraft ProStar 209 Mastercraft X-1 Mastercraft X-2 Mastercraft X-9 MB Sports 190 Plus Svfara SVONE
a. b.
Manga
HP
Velocidad máxima
98 98 98 93.5 93.5 96 90 94 96 92 91
400 340 400 340 320 350 310 310 350 330 330
47.5 44.9 47.3 44.5 44.5 42.5 45.8 42.8 43.2 45.3 47.7
Empleando estos datos obtenga la ecuación de regresión estimada que relaciona la velocidad máxima con la manga y los caballos de fuerza de la lancha. La Svfara SV 609 tiene una manga de 85 pulgadas y motor de 330 caballos de fuerza. Utilice la ecuación de regresión estimada obtenida en el inciso a) para estimar la velocidad máxima de la Svfara SV609.
10. La Nacional Basketball Association (NBA) lleva un registro de diversos datos estadísticos de cada equipo. Cuatro de estos datos estadísticos son la proporción de juegos ganados (PCT), la proporción de anotaciones de campo (FG%), la proporción de tiros de tres puntos hechos por el equipo contrario (Opp 3 Pt%) y la cantidad de recuperaciones hechas por el equipo contrario (Opp TO). Los siguientes datos muestran los valores de estas estadísticas para los 29 equipos de la NBA en una fracción de la temporada 2004 (www.nba.com, enero 3, 2004)
archivo CD en NBA
Equipo
PCT
FG%
Opp 3 Pt%
Opp TO
Atlanta Boston Chicago Cleveland Dallas Denver Detroit Golden State Houston Indiana L.A. Clippers L.A. Lakers Memphis Miami Milwaukee
0.265 0.471 0.313 0.303 0.581 0.606 0.606 0.452 0.548 0.706 0.464 0.724 0.485 0.424 0.500
0.435 0.449 0.417 0.438 0.439 0.431 0.423 0.445 0.426 0.428 0.424 0.465 0.432 0.410 0.438
0.346 0.369 0.372 0.345 0.332 0.366 0.262 0.384 0.324 0.317 0.326 0.323 0.358 0.369 0.349
13.206 16.176 15.031 12.515 15.000 17.818 15.788 14.290 13.161 15.647 14.357 16.000 17.848 14.970 14.750
a. b. c.
d. e.
PCT
FG%
Opp 3 Pt%
Opp TO
Minnesota 0.677 Nueva Jersey 0.563 Nueva Orleáns 0.636 Neuva York 0.412 Orlando 0.242 Philadelphia 0.438 Phoenix 0.364 Portland 0.484 Sacramento 0.724 San Antonio 0.688 Seattle 0.533 Toronto 0.516 Utah 0.531 Washington 0.300
0.473 0.435 0.421 0.442 0.417 0.428 0.438 0.447 0.466 0.429 0.436 0.424 0.456 0.411
0.348 0.338 0.330 0.330 0.360 0.364 0.326 0.367 0.327 0.293 0.350 0.314 0.368 0.341
13.839 17.063 16.909 13.588 14.242 16.938 16.515 12.548 15.207 15.344 16.767 14.129 15.469 16.133
Equipo
Obtenga una ecuación de regresión estimada que sirva para predecir la proporción de juegos ganados dada la proporción de anotaciones de campo del equipo. Interprete la pendiente de la ecuación de regresión estimada obtenida en el inciso a). Obtenga una ecuación de regresión estimada que sirva para predecir la proporción de juegos ganados dada la proporción de anotaciones de campo del equipo, la proporción de tiros de tres puntos hechos por el equipo contrario y la proporción de recuperaciones hechas por el equipo contrario. Analice las implicaciones prácticas de la ecuación de regresión estimada obtenida en el inciso c). Estime la proporción de juegos ganados por un equipo para el que los valores de las tres variables independientes son: FG% 0.45, Opp 3 Pt% 0.34 y Opp TO 17.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 636
636
Capítulo 15
15.3
Regresión múltiple
Coeficiente de determinación múltiple En la regresión lineal simple se mostró que la suma de cuadrados se podía dividir o particionar en dos componentes: la suma de cuadrados debida a la regresión y la suma de cuadrados debida al error. Esto también aplica a la suma de cuadrados de la regresión múltiple.
RELACIÓN ENTRE STC, SCR Y SCE
STC SCR SCE
(15.7)
donde STC suma total de cuadrados 兺( yi ȳ)2 SCR suma de cuadrados debida a la regresión 兺( ŷi ȳ)2 SCE suma de cuadrados debida al error 兺( yi ŷi )2 Debido a lo complejo de los cálculos de estas tres sumas de cuadrados, es necesario emplear un paquete de software para realizarlos. En los resultados de Minitab que se muestran en la figura 15.4, en la parte del análisis de varianza se presentan estos tres valores para el problema de Butler Trucking con dos variables independientes: STC 23 900, SCR 21.601 y SCE 2.299. Cuando se emplea una sola variable independiente (número de millas recorridas) en los resultados de Minitab de la figura 15.3 se observa que STC 23 900, SCR 15.871 y SCE 8.029. El valor de la STC es el mismo en ambos casos debido a que este valor no depende de ŷ, pero al agregar otra variable (el número de entregas), SCR aumenta y SCE disminuye. Esto tiene como consecuencia que la ecuación de regresión estimada tenga un mejor ajuste a los datos observados. En el capítulo 14, se empleó el coeficiente de determinación, r2 SCR/STC, para medir la bondad de ajuste de la ecuación de regresión estimada. El mismo concepto es válido en la regresión múltiple. El término coeficiente de determinación múltiple indica que mide la bondad de ajuste de la ecuación de regresión múltiple estimada. El coeficiente de determinación múltiple, que se denota R2, se calcula como sigue.
COEFICIENTE DE DETERMINACIÓN MÚLTIPLE
R2
SCR STC
(15.8)
El coeficiente de determinación múltiple puede interpretarse como la proporción de la variabilidad en la variable independiente que es explicada por la ecuación de regresión estimada. Por lo tanto, el producto de este coeficiente por 100, se interpreta como el porcentaje de la variabilidad en y que es explicada por la ecuación de regresión estimada. Cuando se emplean dos variables independientes en el ejemplo de Butler Truckin, como SCR 21.601 y STC 23.900, se tiene R2
21.601 .904 0.904 23.900
Por lo tanto, 90.4% de la variabilidad en el tiempo de recorrido y es explicada por la ecuación de regresión estimada en la que las variables independientes son las millas recorridas y el número de entregas. En la figura 15.4 se observa que en el resultado proporcionado por Minitab aparece también el coeficiente de determinación múltiple, que se denota R-sq 90.4%
15Ander(624-692).qxd 2/29/08 11:06 AM Page 637
15.3 Al aumentar el número de variables independientes los errores de predicción se hacen más pequeños, con lo que se reduce la suma de cuadrados debida al error, SCE. Como SCR STC SCE, cuando SCE se reduce, SCR aumenta, lo que ocasiona que R2 SCR/STC aumente.
Cuando se agrega una variable al modelo, R2 se vuelve más grande, aun cuando la variable agregada no sea estadísticamente significativa. El coeficiente de determinación múltiple ajustado compensa el número de variables independientes en el modelo.
637
Coeficiente de determinación múltiple
En la figura 15.3 el valor de R-sq para la ecuación de regresión estimada con una sola variable, número de millas recorridas (x1), es 66.4%. Por lo tanto, al agregar el número de entregas como una variable independiente más, el porcentaje de variabilidad en el tiempo de recorrido, explicado por la ecuación de regresión estimada, aumenta de 66.4% a 90.4%. En general, siempre que se agrega una variable independiente al modelo, R2 aumenta. Muchos analistas prefieren ajustar R2 al número de variables independientes para evitar sobreestimar el efecto que tiene agregar una variable independiente sobre la cantidad de la variabilidad explicada por la ecuación de regresión estimada. Siendo n el número de observaciones y p el número de variables independientes, el coeficiente de determinación ajustado se calcula como sigue.
COEFICIENTE DE DETERMINACIÓN MÚLTIPLE AJUSTADO
R2a 1 (1 R2)
n 1 n p 1
(15.9)
En el ejemplo de Butler Trucking, como n 10 y p 2, se tiene R2a 1 (1 0.904)
10 1 0.88 10 2 1
Por lo tanto, una vez que el coeficiente de determinación se ha ajustado a dos variables independientes, su valor es 0.88. En los resultados de Minitab de la figura 15.4 este valor se presenta como R-sq(adj) 87.6%; la diferencia con el valor calculado arriba se debe a que en los cálculos de arriba se empleó un valor redondeado de R2. NOTAS Y COMENTARIOS Si el valor de R2 es pequeño y el número de variables independientes en el modelo es grande, el coeficiente de determinación ajustado puede ser
negativo; en tales casos, Minitab da, como coeficiente de determinación ajustado, cero.
Ejercicios
Métodos 11. En el ejercicio 1 se presentó la siguiente ecuación de regresión estimada basada en 10 0bservaciones. y 29.1270 0.5906x1 0.4980x2 ^
Los valores de STC y SCR son 6724.125 y 6216.375, respectivamente. a. Halle SCE. b. Calcule R2. c. Calcule R 2a. d. Analice la bondad de ajuste.
Auto examen
12. En el ejercicio 2, se presentaron 10 observaciones dando los valores de la variable dependiente y y de dos variables independientes x1 y x2; con estos datos STC = 15 182.9 y SCR = 14 052.2. a. Calcule R2. b. Calcule R 2a. c. ¿Explica la ecuación de regresión estimada una proporción grande de la variabilidad de los datos? Explique.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 638
638
Capítulo 15
Regresión múltiple
13. En el ejercicio 3 se presentó la siguiente ecuación de regresión estimada basada en 30 0bservaciones. ŷ 17.6 3.8x1 2.3x 2 7.6x3 2.7x4 Los valores de STC y SCR son 1805 y 1760, respectivamente. a. Calcule R2. b. Calcule R 2a. c. Analice la bondad de ajuste.
Aplicaciones 14. En el ejercicio 4, se dio la siguiente ecuación de regresión estimada, la cual relacionaba las ventas con la inversión en inventario y los gastos de publicidad. ŷ 25 10x1 8x 2 Los datos empleados para desarrollar este modelo eran los datos de 10 tiendas; con estos datos STC 16 000 t SCR y 12 000. a. Calcule R2 para la ecuación de regresión estimada. b. Calcule R 2a. c. ¿Parece explicar este modelo una gran cantidad de la variabilidad de los datos? Explique.
Auto examen
15. En el ejercicio 5, el propietario de Showtime Movie Theater, Inc. empleó el análisis de regresión múltiple para predecir el ingreso bruto (y) en función de la publicidad en televisión (x1) y de la publicidad en los periódicos (x2). La ecuación de regresión estimada fue ŷ 83.2 2.29x1 1.30x 2
archivo CD en Showtime
archivo CD en MLB
archivo CD en Boats
archivo CD en NBA
La solución obtenida con un paquete de software proporcionó STC 25.2 y SCR 23.435. a. Calcule e interprete R2 y R 2a. b. Cuando la publicidad en televisión era la variable independiente, R2 0.653 y Ra2 0.595. ¿Prefiere los resultados de la regresión múltiple? Explique. 16. En el ejercicio 6 se presentaron los datos siguientes de 16 equipos de la Liga mayor de béisbol de 2003: proporción de juegos ganados, cantidad de cuadrangulares anotados por el equipó y promedio de carreras ganadas por el equipo que lanza (http: //www.usatoday.com, 7 de enero de 2004). a. ¿Proporciona un buen ajuste la ecuación de regresión estimada que para predecir la proporción de juegos ganados tiene como única variable independiente la cantidad de cuadrangulares? Explique. b. Analice la ventaja de usar tanto la cantidad de cuadrangulares como el promedio de carreras ganadas para predecir la proporción de juegos ganados. 17. En el ejercicio 9 se obtuvo una ecuación de regresión estimada que relacionaba la velocidad máxima de una lancha con la manga y los caballos de fuerza de la lancha. a. Calcule e interprete R2 y Ra2. b. ¿Proporciona esta ecuación de regresión estimada un buen ajuste? Explique. 18. Vuelva al ejercicio 10, en el que se presentaron varios datos estadísticos de 29 equipos de la Nacional Basketball Association en parte de la temporada de 2004 (www.nba.com, 3 de enero de 2004). a. En el inciso c) del ejercicio 10, se obtuvo una ecuación de regresión estimada que proporcionaba la proporción de juegos ganados dado el porcentaje de anotaciones de campo hechas por el equipo, la proporción de tiros de tres puntos hechas por el equipo contrario y la cantidad de recuperaciones (turnover) hechas por el equipo contrario. ¿Cuáles son los valores de R2 y Ra2? b. ¿Proporciona esta ecuación de regresión estimada un buen ajuste a los datos?
15Ander(624-692).qxd 2/29/08 11:06 AM Page 639
15.4
15.4
639
Suposiciones del modelo
Suposiciones del modelo En la sección 15.1 se presentó el siguiente modelo de regresión múltiple.
MODELO DE REGRESIÓN MÚLTIPLE
y β0 β1x1 β2 x 2 . . . βp xp
(15.10)
Las suposiciones acerca del término del error en el modelo de regresión múltiple son análogas a las suposiciones en el modelo de regresión lineal simple.
SUPOSICIONES SOBRE EL TÉRMINO DEL ERROR EN EL MODELO DE REGRESIÓN MÚLTIPLE y β0 β1x1 . . . βp x p
1. El término del error es una variable aleatoria cuya media o valor esperado es cero, es decir, E( ) 0. Consecuencia: Para valores dados de x1, x 2, . . . , x p , el valor esperado o valor promedio de y está dado por E( y) β0 β1x1 β2 x 2 . . . βp xp.
(15.11)
La ecuación (15.11) es la ecuación de regresión múltiple presentada en la sección 15.1. En esta ecuación, E(y) representa el promedio de todos los valores que puede tomar y para valores dados de x1, x 2, . . . , x p. 2. La varianza de se denota σ 2 y es la misma para todos los valores de las variables independientes x1, x 2 , . . . , x p. Consecuencia: La varianza de y respecto a la línea de regresión es σ 2 y es la misma para todos los valores de x1, x 2 , . . . , x p. 3. Los valores de son independientes. Consecuencia: El valor de para un determinado conjunto de valores de las variables independientes no está relacionado con el valor de de ningún otro conjunto de valores. 4. El término del error es una variable aleatoria distribuida normalmente y que refleja la desviación entre el valor de y y el valor esperado de y dado por β0 β1x1 β2 x 2 . . . βp x p. Consecuencia: Como β0, β1, . . . , βp son constantes para los valores dados de x1, x 2 , . . . , x p, la variable dependiente y es también una variable aleatoria distribuida normalmente.
Para entender mejor la forma de la relación dada por la ecuación 15.11, considérese la siguiente ecuación de regresión múltiple con dos variables independientes. E( y) β0 β1x1 β2 x 2 La gráfica de esta ecuación es un plano en el espacio tridimensional. La figura 15.5 es un ejemplo de gráfica de este tipo. Obsérvese que, como se indica, el valor de es la diferencia entre el verdadero valor de y y el valor esperado de y, E(y), cuando x1 x* 1 y x 2 x* 2.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 640
640
Capítulo 15
FIGURA 15.5
Regresión múltiple
GRÁFICA DE LA ECUACIÓN DE REGRESIÓN EMPLEADA EN EL ANÁLISIS DE REGRESIÓN CON DOS VARIABLES INDEPENDIENTES Valor de y cuando x1 = x*1 and x2 = x2*
y β0
Plano que corresponde a E(y) = β 0 + β 1x1 + β 2x2
E(y) cuando x1 = x*1 y x2 = x2*
x*2 x2
x*1 (x*1, x*2)
x1
Punto que corresponde a x1 = x*1 y x2 = x*2
En el análisis de regresión, suele emplearse del término variable de respuesta en lugar del término variable dependiente. Además, como la ecuación de regresión múltiple genera un plano o superficie, a su gráfica se le llama superficie de respuesta.
15.5
Prueba de significancia En esta sección se muestra cómo realizar una prueba de significancia para una relación de regresión múltiple. Las pruebas de significancia que se usaron en la regresión lineal simple fueron la prueba t y la prueba F. En la regresión lineal simple, estas dos pruebas llevan a la misma conclusión; es decir, si se rechaza la hipótesis nula, se concluye que b1 0. En la regresión múltiple, la prueba t y la prueba F tienen propósitos diferentes. 1. La prueba F se usa para determinar si existe una relación de significancia entre la variable dependiente y el conjunto de todas las variables independientes; a esta prueba F se le llama prueba de significancia global. 2. Si la prueba F indica que hay significancia global, se usa la prueba t para ver si cada una de las variables individuales es significativa. Para cada una de las variables independientes del modelo se realiza una prueba t. A cada una de estas pruebas t se le conoce como prueba de significancia individual. A continuación se explican la prueba F y la prueba t y se aplican al ejemplo de Butler Trucking.
Prueba F El modelo de regresión múltiple que se definió en la sección 15.4 es y β0 β1x1 β2 x 2 . . . βp xp La hipótesis de la prueba F comprende los parámetros del modelo de regresión múltiple. H0: β1 β2 βp 0 Ha: Uno o más de los parámetros es distinto de cero
15Ander(624-692).qxd 2/29/08 11:06 AM Page 641
15.5
641
Prueba de significancia
Cuando se rechaza H0, la prueba proporciona evidencia estadística suficiente para concluir que uno o más de los parámetros no es igual a cero y que la relación global entre y y el conjunto de variables independientes x1, x 2, . . . , xp es significativa. En cambio, si no se puede rechazar H0, no se tiene evidencia suficiente para concluir que exista una relación significativa. Antes de describir los pasos de la prueba F, es necesario revisar el concepto de cuadrado medio. Un cuadrado medio es una suma de cuadrados dividida entre sus correspondientes grados de libertad. En el caso de la regresión múltiple, la suma de cuadrados del total tiene n 1 grados de libertad, la suma de cuadrados debida a la regresión (SCR) tiene p grados de libertad y la suma de cuadrados debida al error tiene n p 1 grados de libertad. Por tanto, el cuadrado medio debido a la regresión (CMR) es SCR/p y el cuadrado medio debido al error (CME) es SCE/(n p 1). SCR CMR p
(15.12)
y CME
SCE n p 1
(15.13)
Como se vio en el capítulo 14, CME proporciona una estimación insesgada de σ 2, la varianza del término del error . Si H0: β1 β2 . . . βp 0 es verdadera, CMR también proporciona un estimador insesgado de σ 2 y el valor de CMR/CME será cercano a 1. Pero, si H0 es falsa, el CMR sobreestima σ 2 y el valor de CMR/CME será mayor. Para determinar qué tan grande debe ser CMR/CME para que se rechace H0, se hace uso del hecho de que si H0 es verdadera y las suposiciones acerca del modelo de regresión múltiple son válidas, la distribución muestral de CMR/CME es una distribución F con p grados de libertad en el numerador y n p 1 en el denominador. A continuación se presenta un resumen de la prueba F de significancia para la regresión múltiple.
PRUEBA F DE SIGNIFICANCIA GLOBAL
... H0: 1 0 2 p Ha: Uno o más de los parámetros no son iguales a cero. ESTADÍSTICO DE PRUEBA
F
CMR CME
(15.14)
REGLA DE RECHAZO
Valor aproximado p: Rechazar H0 si valor p Valor crítico aproximado: Rechazar H0 si F Fα
α
donde Fα pertenece a la distribución F con p grados de libertad en el numerador y n p 1 grados de libertad en el denominador. A continuación se presenta la aplicación de la prueba F al problema de regresión múltiple de la empresa Butler Trucking. Como se tienen dos variables independientes, las hipótesis se expresan como sigue. H0: β1 β2 0 Ha: β1 o β2 no es igual a cero
15Ander(624-692).qxd 2/29/08 11:06 AM Page 642
642
Capítulo 15
FIGURA 15.6
Regresión múltiple
RESULTADOS DE MINITAB PARA EL EJEMPLO DE BUTLER TRUCKING CON DOS VARIABLES INDEPENDIENTES, MILLAS RECORRIDAS (x1) Y NÚMERO DE ENTREGAS (x 2 ) The regression equation is Time = - 0.869 + 0.0611 Miles + 0.923 Deliveries Predictor Constant Miles Deliveries S = 0.5731
Coef –0.8687 0.061135 0.9234
SE Coef 0.9515 0.009888 0.2211
R–sq = 90.4%
T –0.91 6.18 4.18
p 0.392 0.000 0.004
R–sq(adj) = 87.6%
Analysis of Variance SOURCE Regression Residual Error Total
DF 2 7 9
SS 21.601 2.299 23.900
MS 10.800 0.328
F 32.88
p 0.000
En la figura 15.6 se presentan los resultados que da Minitab para el modelo de regresión múltiple con dos variables independientes, millas recorridas (x1) y número de entregas (x2). En la parte de los resultados que corresponde al análisis de varianza, se ve que CMR 10.8 y CME 0.328. Empleando la ecuación (15.14) se obtiene el valor del estadístico de prueba. F
10.8 0.328
32.9
Obsérvese que el valor de F en los resultados de Minitab es F 32.88; este valor difiere del calculado aquí debido a que aquí en los cálculos se emplearon los valores redondeados de CMR y CME. Usando α 0.01, el valor-p 0.000 que aparece en la última columna de la tabla del análisis de varianza (figura 15.6) indica que se puede rechazar H0: β1 β2 0 debido a que el valor-p es menor a 0.01. De manera alternativa, en la tabla 4 del apéndice B se observa que con dos grados de libertad en el numerador y siete grados de libertad en el denominador, F0.01 9.55. Como 32.9 9.55, se rechaza H0: β1 β2 0 y se concluye que existe una relación significativa entre el tiempo de recorrido y y las dos variables independientes, millas recorridas y número de entregas. Como ya se indicó, el error cuadrado medio proporciona un estimador insesgado de σ 2, la varianza del término del error . Observando la figura 15.6 se ve que la estimación de σ 2 es CME = 0.328. La raíz cuadrada del CME es la estimación de la desviación estándar del término del error. Como se definió en la sección 14.5, esta desviación estándar es el error estándar de estimación, que se denota s. Por tanto, se tiene que s CME 0.328 0.573. Observe que este valor del error estándar de estimación aparece en los resultados de Minitab que se muestran en la figura 15.6. La tabla 15.3 es la tabla general para el análisis de varianza (ANOVA) que proporciona los resultados de la prueba F para un modelo de regresión múltiple. El valor del estadístico de prueba F aparece en la última columna y debe compararse con Fα con p grados de libertad en el numerador y n p 1 grados de libertad en el denominador, para obtener la conclusión de la prueba de hipótesis. Revisando los resultados de Minitab para el ejemplo de Butler Trucker Company de la figura 15.6 se ve que la tabla del análisis de varianza contiene esta información. Además, Minitab proporciona también el correspondiente valor-p para el estadístico de prueba F.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 643
15.5
643
Prueba de significancia
TABLA 15.3
TABLA ANOVA PARA EL MODELO DE REGRESIÓN MÚLTIPLE CON p VARIABLES INDEPENDIENTES Suma de cuadrados
Grados de libertad
Regresión
SCR
p
Error
SCE
n p 1
Total
STC
n 1
Fuente
Cuadrado medio SCR CMR p
CME
F CMR F CME
SCE n p 1
Prueba t Si la prueba F indica que la relación de regresión múltiple es significativa, se puede realizar una prueba t para determinar la significancia de cada uno de los parámetros. A continuación se presenta la prueba t de significancia para cada uno de los parámetros.
PRUEBA t DE SIGNIFICANCIA PARA CADA UNO DE LOS PARÁMETROS
Para cualquier parámetro βi H0: βi 0 Ha: βi 0 ESTADÍSTICO DE PRUEBA
b t si bi
(15.15)
REGLA DE RECHAZO
Método del valor-p : Rechazar H0 si valor-p α Método del valor crítico : Rechazar H0 si t tα/2 o si t
tα/2
donde tα/2 es un valor de la distribución t con n p 1 grados de libertad.
En el estadístico de prueba, sbi es la estimación de la desviación estándar de bi. El paquete de software proporciona el valor de sbi. A continuación se realiza la prueba t utilizando el problema de regresión de Butler Trucking. Consúltese la sección de la figura 15.6 en la que se dan los resultados de Minitab para el cálculo del cociente t. Los valores de b1, sb1, b2 y sb 2, son los siguientes b1 b2
0.061135 0.9234
sb1 sb2
0.009888 0.2211
Usando la ecuación (15.15), se obtienen los estadísticos de prueba para las hipótesis en que intervienen β1 y β2 t t
0.061135/0.009888 6.18 0.9234/0.2211 4.18
15Ander(624-692).qxd 2/29/08 11:06 AM Page 644
644
Capítulo 15
Regresión múltiple
Obsérvese que los valores de estos dos cocientes t y sus correspondientes valores-p aparecen en los resultados de Minitab de la figura 15.6. Usando, α 0.01, los valores-p 0.000 y 0.004 que aparecen en los resultados de Minitab indican que se pueden rechazar H0: β1 0 y H0: β2 0. Por lo tanto, ambos parámetros son estadísticamente significativos. También, en la tabla 2 del apéndice B se encuentra que para n p 1 10 2 1 7 grados de libertad, t0.005 = 3.499. Como 6.18 3.499, se rechaza H0: β1 0. De manera similar, como 4.18 3.499, se rechaza H0: β2 0.
Multicolinealidad
Una regla práctica que previene de potenciales problemas de multicolinealidad es que el coeficiente de correlación muestral sea mayor a 0.7 o menor a 0.7
Cuando las variables independientes están fuertemente correlacionadas, es imposible determinar el efecto, por separado, de cada una de las variables independientes sobre la variable dependiente.
En el análisis de regresión el término variable independiente se usa para referirse a cualquier variable que se usa para predecir o explicar el valor de la variable dependiente. Sin embargo, este término no significa que estas variables independientes sean independientes entre ellas, en sentido estadístico. Al contrario, en un problema de regresión múltiple, la mayoría de las variables independientes están, en cierto grado, correlacionadas unas con otras. En el ejemplo de Butler Trucking con dos variables independientes x1 (millas recorridas) y x2 (número de entregas), las millas recorridas pueden tratarse como la variable dependiente y el número de entregas como la variable independiente para determinar si estas dos variables están relacionadas entre sí. Después puede calcularse el coeficiente de correlación muestral rx1x2 para determinar la magnitud de la relación entre estas dos variables. Al hacer esto se obtiene rx1x2 0.16. Por lo tanto, se encuentra que existe cierto grado de relación lineal entre estas dos variables independientes. En el análisis de regresión múltiple multicolinealidad se refiere a la correlación entre las variables independientes. Para tener una mejor visión de los problemas potenciales de la multicolinealidad, se considerará una modificación al ejemplo de Butler Trucking. En lugar de que x2 sea el número de entregas, sea x2 el número de galones de gasolina consumidos. Es claro que x1 (las millas recorridas) y x2 están relacionadas, es decir, se sabe que el número de galones de gasolina consumidos depende del número de millas recorridas. Por lo tanto, se concluirá que x1 y x2 son variables independientes fuertemente correlacionadas. Supóngase que se obtiene la ecuación ŷ b0 b1 x1 b2 x 2 y que se encuentra que la prueba F indica que esta relación es significativa. Después supóngase que se realiza la prueba t para β1 para determinar si β1 0 y no puede rechazarse H0: β1 0. ¿Significa esto que el tiempo de recorrido no esté relacionado con las millas recorridas? No necesariamente. Lo que probablemente significa es que estando x2 en el modelo, x1 no tiene una contribución significativa en la determinación del valor de y. En el presente ejemplo, esta interpretación parece razonable; conociendo la cantidad de gasolina consumida, no se gana mucha más información para la predicción de y al conocer el número de millas recorridas. De manera similar, una prueba t puede llevar a la conclusión de que β2 0 con base en que, cuando está x1 en el modelo, al saber la cantidad de gasolina consumida, no se gana mucho. Resumiendo, en las pruebas t para la significancia de cada uno de los parámetros, la dificultad ocasionada por la multicolinealidad hace posible concluir que ninguno de los parámetros es significativamente distinto de cero cuando la prueba F sobre la ecuación de regresión múltiple general indica que hay una relación significante. Este problema se evita cuando existe poca correlación entre las variables independientes. Para determinar si la multicolinealidad es lo suficientemente alta para ocasionar problemas se han desarrollado diversas pruebas. De acuerdo con la prueba de la regla práctica, la multicolinealidad es un problema potencial si el valor absoluto del coeficiente de correlación muestral es mayor a 0.7 para cualquier par de variables independientes. Otros tipos de pruebas son más avanzadas y quedan fuera del alcance de este libro. Siempre que sea posible, debe evitarse incluir variables independientes que estén fuertemente correlacionadas. Sin embargo, en la práctica, la estricta adherencia a esta conducta no suele ser posible. Cuando las personas que toman las decisiones tienen razones para creer que existe una multicolinealidad importante, se darán cuenta de que es difícil separar los efectos de cada una de las variables independientes sobre la variable dependiente
15Ander(624-692).qxd 2/29/08 11:06 AM Page 645
15.5
645
Prueba de significancia
NOTAS Y COMENTARIOS Por lo general, la multicolinealidad no afecta la manera en que se realiza el análisis de regresión o en que se interpretan los resultados de un estudio. Pero, si la multicolinealidad es severa se pueden tener dificultades al interpretar los resultados de las pruebas t acerca de cada uno de los parámetros. Además del tipo de problemas ilustrados en esta sección, se ha demostrado que los casos severos de multicolinealidad dan como resultado estimaciones por mínimos cuadrados con signo erróneo. Esto es, en estudios simulados en los que los in-
vestigadores crearon el modelo de regresión subyacente y después emplearon el método de mínimos cuadrados para obtener estimaciones de β0 , β1, β, etc., se ha demostrado que en condiciones de fuerte multicolinealidad, las estimaciones obtenidas por mínimos cuadrados pueden tener signo opuesto al del parámetro que se estima. Por ejemplo, β 2 puede ser en realidad 10 y su estimación b2 puede resultar ser 2. Por lo tanto, si existe una fuerte multicolinealidad podrá tenerse poca confianza en los coeficientes.
Ejercicios
Métodos
Auto examen
19. En el ejercicio 1 se presentó la siguiente ecuación de regresión estimada basada en 10 observaciones. y 29.1270 0.5906x1 0.4980x2 ^
Aquí STC 6724.125, SCR 6216.375, sb1 0.0813 y sb 2 0.0567. a. Calcule CMR y CME b. Calcule F y realice la prueba F adecuada. Use α = 0.05. c. Realice una prueba t para la significancia de b1. Use α = 0.05. d. Realice una prueba t para la significancia de b2. Use α = 0.05. 20. Consulte los datos presentados en el ejercicio 2. La ecuación de regresión estimada de estos datos es ŷ 18.4 2.01x1 4.74x 2 Aquí STC = 15 182, SCR = 14 052. 2, sb1 0.2471. a. Realice una prueba para ver si hay una relación significativa entre x1, x2 y y. Use α 0.05. b. ¿Es significativo β1? Use α 0.05. c. ¿Es significativo β2? Use α 0.05. 21. Se obtuvo la ecuación de regresión estimada siguiente para un modelo con dos variables independientes. ŷ 40.7 8.63x1 2.71x 2 Después de eliminar x2 del modelo, se empleó el método de mínimos cuadrados para obtener una ecuación de regresión estimada con una sola variable independiente, x1. ŷ 42.0 9.01x1 a. b.
Dé la interpretación del coeficiente de x1 en ambos modelos. ¿Podría explicar la multicolinealidad por qué el coeficiente de x1 es diferente en los dos modelos? Si es así, ¿cómo?
15Ander(624-692).qxd 2/29/08 11:06 AM Page 646
646
Capítulo 15
Regresión múltiple
Aplicaciones 22. En el ejercicio 4 se dio la siguiente ecuación de regresión estimada que relacionaba las ventas con la inversión en inventario y los gastos de publicidad. ŷ 25 10x1 8x 2 Los datos empleados para obtener el modelo provinieron de un estudio realizado a 10 tiendas; para estos datos STC 16 000 y SCR 12 000. a. Calcule SCE, CME y CMR. b. Use la prueba F y 0.05 como nivel de significancia para determinar si existe una relación entre las variables.
Auto examen
23. Véase el ejercicio 5. a. Use α 0.01 para probar las hipótesis H0: β1 β2 0 Ha: β1 o β2 no son iguales a cero En el modelo y β0 β1x1 β2 x2 , donde x1 publicidad en televisión (en miles de dólares) x2 publicidad en periódicos (en miles de dólares) b. c.
Use α 0.05 para probar la significancia de β1 ¿Debe x1 ser eliminada del modelo? Use α 0.05 para probar la significancia de β 2 ¿Debe x2 ser eliminada del modelo?
24. Véanse los datos del ejercicio 6. Emplee la cantidad de cuadrangulares del equipo y el promedio de carreras ganadas por el equipo que lanza para predecir la proporción de juegos ganados. a. Use la prueba F para determinar la significancia global de la relación. ¿Cuál es la conclusión empleando 0.05 como nivel de significancia? b. Use la prueba t para determinar la significancia de cada una de las variables independientes. ¿Cuál es la conclusión empleando 0.05 como nivel de significancia?
archivo CD en MLB
25. Borron’s realiza revisiones anuales de los corredores de bolsa en línea, en la que se incluyen tanto corredores a los que se les puede contactar vía un explorador de Internet, así como corredores que tienen acceso directo y que ponen al cliente en contacto directo con el servidor de una red de corredores de bolsa. La oferta y el desempeño de cada corredor se evalúa en seis áreas, empleando para cada área una escala de 0 a 5. Los resultados se ponderan para obtener una evaluación general y a cada corredor se le asigna una evaluación final que va de cero a cinco estrellas. Tres de las áreas evaluadas son ejecución de la operación, facilidad de uso y gama de ofertas. Un 5 en ejecución de la operación significa que la llegada del pedido y el proceso de ejecución fluyó con facilidad de un paso a otro. En facilidad de uso, 5 significa que el sitio es de fácil uso y que se puede ajustar para ver lo que le interesa al usuario ver. Un 5 en gama de ofertas significa que todas las transacciones pueden realizarse en línea. En los datos siguientes se presentan las puntuaciones obtenidas en ejecución de la operación, facilidad de uso y gama de ofertas y el número de estrellas obtenidas por los integrantes de una muestra de 10 corredores de bolsa (Barron’s, 10 de marzo de 2003).
Corredor
archivo CD en Brokers
Wall St. Access E*TRADE (Power) E*TRADE (Standard) Preferred Trade my Track TD Waterhouse Brown & Co. Brokerage America Merrill Lynch Direct Strong Funds
Ejecución de la operación
Uso
Gama
Estrellas
3.7 3.4 2.5 4.8 4.0 3.0 2.7 1.7 2.2 1.4
4.5 3.0 4.0 3.7 3.5 3.0 2.5 3.5 2.7 3.6
4.8 4.2 4.0 3.4 3.2 4.6 3.3 3.1 3.0 2.5
4.0 3.5 3.5 3.5 3.5 3.5 3.0 3.0 2.5 2.0
15Ander(624-692).qxd 2/29/08 11:06 AM Page 647
15.6
Uso de la ecuación de regresión estimada para estimaciones y predicciones
a. b. c. d.
archivo CD en NBA
15.6
647
Determine la ecuación de regresión estimada que se puede usar para predecir el número de estrellas dadas las evaluaciones a ejecución, facilidad de uso y gama de ofertas. Emplee la prueba F para determinar la significancia global de la relación. Empleando como nivel de significancia 0.95, ¿cuál es la conclusión? Emplee la prueba t para determinar la significancia de cada una de las variables independientes. Empleando como nivel de significancia 0.05, ¿cuál es la conclusión? Elimine cualquiera de las variables independientes que no sea significativa para la ecuación de regresión estimada. ¿Cuál es la ecuación de regresión estimada que recomienda? Compare R2 con el valor de R2 para el inciso a). Analice las diferencias.
26. En el ejercicio 10 se obtuvo una ecuación de regresión estimada que da la proporción de juegos ganados cuando se conocía la proporción de anotaciones de campo hechas por el equipo, la proporción de tiros de tres puntos hechas por el equipo contrario y la cantidad de recuperaciones realizadas por el equipo contrario. a. Emplee la prueba F para determinar la significancia global de la relación. Empleando como nivel de significancia 0.05, ¿cuál es la conclusión? b. Emplee la prueba t para determinar la significancia de cada una de las variables independientes. Empleando como nivel de significancia 0.05, ¿cuál es la conclusión?
Uso de la ecuación de regresión estimada para estimaciones y predicciones Los procedimientos empleados en la regresión múltiple para estimar el valor medio de y y para predecir el valor de un solo valor de y son similares a los empleados en el análisis de regresión para una sola variable independiente. Recuérdese, primero, que en el capítulo 14 se mostró que la estimación puntual del valor esperado de y para un valor dado de x y la estimación puntual de un solo valor de y es la misma. En ambos casos se usó como estimación puntual ŷ b0 b1x. En la regresión múltiple se emplea el mismo procedimiento, es decir, los valores dados de x1, x2, . . ., xp se sustituyen en la ecuación de regresión y como estimación puntual se emplea el correspondiente valor de ŷ. Supóngase que en el ejemplo de Butler Truking se desea usar la ecuación de regresión estimada con x1 (millas recorridas) y x2 (número de entregas) para obtener dos estimaciones por intervalo: 1. Un intervalo de confianza para la media del tiempo de recorrido de todos los camiones que recorren 100 millas y hacen dos entregas. 2. Un intervalo de predicción para el tiempo de recorrido de un determinado camión que recorre 100 millas y hace dos entregas. Utilizando la ecuación de regresión estimada ŷ 0.869 0.0611x1 0.923x2 con x1 100 y x2 2, se obtiene y 0.869 0.0611(100) 0.923(2) 7.09 ^
Por lo tanto, en ambos casos, la estimación puntual del tiempo de recorrido es aproximadamente 7 horas. Para obtener las estimaciones por intervalo para el valor medio de y y para un solo valor de y se emplean procedimientos similares a los empleados en el análisis de regresión con una sola variable. Las fórmulas que se necesitan quedan fuera del alcance de este libro, sin embargo, los paquetes de software para el análisis de regresión múltiple suelen proporcionar intervalos de confianza, una vez que los valores x1, x2, . . ., xp hayan sido especificados por el usuario. En la tabla 15.4 se presentan los intervalos de confianza y de predicción para algunos valores de x1 y x2 del ejemplo de Butler Trucking; estos valores se obtuvieron empleando Minitab. Obsérvese que las estimaciones por intervalo para un solo valor de y proporcionan valores más amplios que las estimaciones por intervalo para el valor esperado de y. Esta diferencia refleja simplemente el hecho de que dados los valores x1 y x2, se puede estimar con mayor precisión el tiempo medio de recorrido de todos los camiones, que predecir el tiempo medio de recorrido de un determinado camión.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 648
648
Capítulo 15
TABLA 15.4
Regresión múltiple
INTERVALOS DE 95% DE CONFIANZA Y DE PREDICCIÓN PARA EL EJEMPLO DE BUTLER TRUCKING
Valor de x1
Valor de x2
50 50 50 100 100 100
2 3 4 2 3 4
Intervalo de confianza Límite Límite inferior superior 3.146 4.127 4.815 6.258 7.385 8.135
4.924 5.789 6.948 7.926 8.645 9.742
Intervalo de predicción Límite Límite inferior superior 2.414 3.368 4.157 5.500 6.520 7.362
5.656 6.548 7.607 8.683 9.510 10.515
Ejercicios
Métodos 27. En el ejercicio 1 se presentó la siguiente ecuación de regresión estimada basada en 10 observaciones. y 29.1270 0.5906x1 0.4980x2 ^
a. b.
Auto examen
Obtenga una estimación puntual del valor medio de y para x1 180 y x2 310. Obtenga una estimación puntual para un solo valor de y siendo x1 180 y x2 310.
28. Véanse los datos del ejercicio 2. La ecuación de regresión estimada para estos datos es ŷ 18.4 2.01x1 4.74x 2 a. b.
Obtenga un intervalo de 95% de confianza para el valor medio de y cuando x1 45 y x2 15. Obtenga un intervalo de predicción de 95% para el valor de y cuando x1 45 y x2 15.
Aplicaciones
Auto examen
29. En el ejercicio 5, el propietario de Showtime Movie Theater, Inc. empleó el análisis de regresión múltiple para predecir el ingreso bruto (y) en función de la publicidad en televisión (x1) y de la publicidad en periódicos (x2). La ecuación de regresión estimada fue ŷ 83.2 2.29x1 1.30x 2 a.
archivo CD en Boats
¿Cuál será el ingreso bruto esperado en una semana en la que se gastan $3500 en publicidad en televisión (x1 3.5) y $1800 en publicidad en periódicos (x2 1.8)? b. Dé un intervalo de 95% de confianza para el ingreso medio de todas las semanas en las que los gastos sean los indicados en el inciso a). c. Dé un intervalo de predicción de 95% para la media del ingreso de una semana en las que los gastos sean los indicados en el inciso a). 30. En el ejercicio 9 se obtuvo una ecuación de regresión estimada que relacionaba la máxima velocidad de una lancha con su manga y sus caballos de fuerza. a. Dé un intervalo de 95% de confianza para la media de la velocidad máxima de una lancha cuya manga sea 85 y cuyo motor tenga 330 caballos de fuerza.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 649
15.7
649
Variables cualitativas independientes
b.
La manga de la Svfara SV 609 es de 85 pulgadas y su motor tiene 330 caballos de fuerza. Dé un intervalo de 95% de confianza para la media de la velocidad máxima de la Svfara 609.
31. La sección “Guía para el usuario” del sitio en la Red de la revista Car and Driver proporciona información sobre pruebas viales (road test) de automóviles, camiones, SUV (acrónimo en inglés de Sport Utility Vehicle) y vans. Abajo se presentan las puntuaciones generales para calidad general, modelo de vehículo, frenado, manejo, economía de combustible, confort interior, aceleración, confiabilidad, ajuste y terminado, transmisión dadas a diversos vehículos empleando una escala del 1 (lo peor) a 10 (lo mejor). Aquí se presenta una parte de los datos de 14 automóviles Deportivos/GT (www.caranddriver.com, 7 de enero de 2004).
Deportivos/GT
archivo CD en SportsCar
Acura 3.2CL Acura RSX Audi TT BMW 3-Series/M3 Chevrolet Corvette Ford Mustang Honda Civic Si Infiniti G35 Mazda RX-8 Mini Cooper Mitsubishi Eclipse Nissan 350Z Porsche 911 Toyota Celica
a. b.
c. d. e.
15.7 Las variables independientes pueden ser cualitativas o cuantitativas.
General
Manejo
Confiabilidad
Ajuste y terminado
7.80 9.02 9.00 8.39 8.82 8.34 8.92 8.70 8.58 8.76 8.17 8.07 9.55 8.77
7.83 9.46 9.58 9.52 9.64 8.85 9.31 9.34 9.79 10.00 8.95 9.35 9.91 9.29
8.17 9.35 8.74 8.39 8.54 8.70 9.50 8.96 8.96 8.69 8.25 7.56 8.86 9.04
7.67 8.97 9.38 8.55 7.87 7.34 7.93 8.07 8.12 8.33 7.36 8.21 9.55 7.97
Dé una ecuación de regresión estimada usando manejo, confiabilidad, y ajuste y terminado para predecir la calidad general. Otro de los automóviles deportivos/GT evaluados por Car and Driver es el Honda Accord. Las evaluaciones de manejo, confiabilidad, y ajuste y terminado dadas a este automóvil fueron 8.28, 9.06 y 8.07, respectivamente. Estime la evaluación general dada a este automóvil. Dé un intervalo de 95% de confianza para la calidad general de todos los automóviles deportivos y GT con las características enumeradas en el inciso a). Dé un intervalo de predicción de 95% para la calidad general del Honda Accord descrito en el inciso b). La evaluación general dada por Car and Driver para el Honda Accord fue 8.65. Compare esta evaluación con las estimaciones obtenidas en los incisos b) y d).
Variables cualitativas independientes En los ejemplos considerados hasta ahora, las variables han sido variables independientes cuantitativas como, por ejemplo, población de estudiantes, distancia recorrida y número de entregas. Sin embargo, en muchas situaciones, se tiene que trabajar con variables independientes cualitativas como género (masculino o femenino), modo de pago (efectivo, tarjeta de crédito, cheque), etc. En esta sección, el objetivo es mostrar cómo se emplean las variables cualitativas en el análisis de regresión. Para ilustrar el uso e interpretación de las variables independientes cualitativas se empleará un problema de Johnson Filtration, Inc.
Un ejemplo: Johnson Filtration, Inc. Johnson Filtration Inc. da servicio de mantenimiento a los sistemas de filtración en el sur de Florida. Los clientes llaman a Johnson Filtration, Inc. solicitando un servicio de mantenimiento para sus sistemas de filtración de agua para estimar el tiempo que se requerirá para el servicio y el
15Ander(624-692).qxd 2/29/08 11:06 AM Page 650
650
Capítulo 15
TABLA 15.5
Regresión múltiple
DATOS PARA EL EJEMPLO DE JOHNSON FILTRATION
Solicitud de servicio
Meses transcurridos desde el último servicio
1 2 3 4 5 6 7 8 9 10
2 6 8 3 2 7 9 8 4 6
Tipo de reparación
Tiempo en horas necesario para la reparación
eléctrico mecánico eléctrico mecánico eléctrico eléctrico mecánico mecánico eléctrico eléctrico
2.9 3.0 4.8 1.8 2.9 4.9 4.2 4.8 4.4 4.5
costo del mismo, los administradores de Johnson desean poder predecir este tiempo para cada solicitud de servicio. Por lo tanto, el tiempo, en horas, requerido para la reparación es la variable dependiente. Se cree que el tiempo requerido para una reparación está relacionado con dos factores, meses transcurridos desde el último servicio de mantenimiento y tipo del problema (mecánico o eléctrico). En la tabla 15.5 se presentan los datos correspondientes a una muestra de 10 solicitudes de servicio. Sea y el tiempo, en horas, necesario para la reparación y x1 los meses transcurridos desde el último mantenimiento. El modelo de regresión en el que sólo se usa x1 para predecir y es y β0 β1x1 Empleando Minitab para obtener la ecuación de regresión estimada se tienen los resultados que se presentan en la figura 15.7. La ecuación de regresión estimada es ŷ 2.15 .304x1
(15.16)
Empleando como nivel de significancia 0.05, el valor-p para la prueba t (o F), que es 0.016, indica que los meses transcurridos desde el último mantenimiento están relacionados significantemente con el tiempo que se requiere para la reparación. R-sq 53.4% indica que x1 explica sólo el 53.4% de la variabilidad en el tiempo que se requiera para una reparación. FIGURA 15.7
Los nombres de las variables Months (meses) y Time (tiempo) fueron ingresados en la hoja de cálculo como títulos de las columnas; por tanto, x1 Months y y Time.
RESULTADOS DE MINITAB PARA EL PROBLEMA DE JOHNSON FILTRATION EMPLEANDO COMO VARIABLE INDEPENDIENTE (x1) EL NÚMERO DE MESES DESDE EL ÚLTIMO SERVICIO The regression equation is Time = 2.15 + 0.304 Months Predictor Constant Months S = 0.7810
Coef 2.1473 0.3041
SE Coef 0.6050 0.1004
R-sq = 53.4%
T 3.55 3.03
p 0.008 0.016
R-sq(adj) = 47.6%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 8 9
SS 5.5960 4.8800 10.4760
MS 5.5960 0.6100
F 9.17
p 0.016
15Ander(624-692).qxd 2/29/08 11:06 AM Page 651
15.7
TABLA 15.6
archivo CD en Johnson
651
Variables cualitativas independientes
DATOS PARA EL EJEMPLO DE JOHNSON FILTRATION INDICANDO EL TIPO DE REPARACIÓN POR MEDIO DE UNA VARIABLE FICTICIA (x2 = 0 PARA FALLA MECÁNICA; x2 = 1 PARA FALLA ELÉCTRICA)
Cliente
Meses transcurridos desde el último mantenimiento (x1)
Tipo de reparación (x2 )
Tiempo en horas necesarias para la reparación ( y)
1 2 3 4 5 6 7 8 9 10
2 6 8 3 2 7 9 8 4 6
1 0 1 0 1 1 0 0 1 1
2.9 3.0 4.8 1.8 2.9 4.9 4.2 4.8 4.4 4.5
Para incorporar en el modelo el tipo de reparación, se define la variable siguiente. x2
再
0 si el tipo de reparación es mecánica 1 si el tipo de reparación es eléctrica
En el análisis de regresión a x2 se le llama variable ficticia o variable indicadora. Empleando esta variable ficticia, el modelo de regresión múltiple se expresa como sigue. y β0 β1x1 β2 x2 En la tabla 15.6 se presentan los datos de la tabla 15.5, incluyendo los valores de la variable ficticia. Con Minitab y los datos de la tabla 15.6 se obtienen estimaciones para los parámetros del modelo. En el resultado de Minitab de la figura 15.8 se indica que la ecuación de regresión múltiple estimada es y 0.93 0.388x1 1.26x2 ^
(15.17)
Empleando 0.05 como nivel de significancia, el valor-p correspondiente al estadístico de prueba F (F 21.36) es 0.001, lo cual indica que la relación de regresión es significativa. En la figura 15.8, en la parte de los resultados de Minitab que corresponde a la prueba t, se observa que tanto meses transcurridos desde el último servicio (valor-p 0.000) como tipo de reparación (valor-p 0.005) son estadísticamente significativos. Además, R-sq 85.9% y R-sq(adj) 81.9% indican que la ecuación de regresión estimada explica adecuadamente la variabilidad en el tiempo necesitado para la reparación. Por lo tanto, la ecuación 15.17 sí es útil para estimar el tiempo necesario para la reparación de las diversas solicitudes de servicio.
Interpretación de los parámetros La ecuación de regresión múltiple para el ejemplo de Johnson Filtration es E( y) β0 β1x1 β2 x 2
(15.18)
Para entender cómo interpretar los parámetros β0, β1, y β2, cuando hay una variable cualitativa, considérese el caso en que x2 0 (reparación mecánica). Usando E (y | mecánica) para denotar la media o valor esperado del tiempo necesario para una reparación dado que se trata de una reparación mecánica, se tiene E( y mecánica) β0 β1x1 β2(0) β0 β1x1
(15.19)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 652
652
Capítulo 15
Regresión múltiple
FIGURA 15.8
Los nombres de las variables Months (meses) y Time (tiempo) que aparecen en los resultados de Minitab fueron ingresados en la hoja de cálculo de Minitab como títulos de las columnas; por tanto, x1 Months, x2 Type (tipo) y y Time.
RESULTADOS DE MINITAB PARA EL EJEMPLO DE JOHNSON FILTRATION TENIENDO MESES DESDE EL ÚLTIMO SERVICIO (x1) Y TIPO DE REPARACIÓN (x2) COMO VARIABLES INDEPENDIENTES
The regression equation is Time = 0.930 + 0.388 Months + 1.26 Type Predictor Constant Months Type S = 0.4590
Coef 0.9305 0.38762 1.2627
SE Coef 0.4670 0.06257 0.3141
R-sq = 85.9%
T 1.99 6.20 4.02
p 0.087 0.000 0.005
R-sq(adj) = 81.9%
Analysis of Variance SOURCE Regression Residual Error Total
DF 2 7 9
SS 9.0009 1.4751 10.4760
MS 4.5005 0.2107
F 21.36
p 0.001
De manera similar, en el caso de una reparación eléctrica (x2 1), se tiene E( y eléctrica) β0 β1x1 β2(1) β0 β1x1 β2 ( β0 β2) β1x1
(15.20)
Comparando las ecuaciones (15.19) y (15.20) se ve que la media del tiempo requerido para hacer una reparación es función lineal de x1 tanto cuando se trata de reparaciones mecánicas como de reparaciones eléctricas. La pendiente en ambas ecuaciones es β 1, pero la intersección con el eje y varia. En la ecuación (15.19), para las reparaciones mecánicas, la intersección con el eje y es β0 y en la ecuación (15.20), la ecuación para reparaciones eléctricas, la intersección es (β0 β 2 ). La interpretación de β 2 es que indica la diferencia entre la media del tiempo que se requiere para una reparación eléctrica y la media del tiempo que se requiere para una reparación mecánica. Si β2 es positiva la media del tiempo necesario para una reparación eléctrica será mayor que para una reparación mecánica.; si β 2 es negativa la media del tiempo requerido para una reparación eléctrica será menor que para una reparación mecánica. Por último, si β 2 0, no hay diferencia entre las medias del tiempo que necesita para reparaciones eléctricas y mecánicas y el tipo de reparación no está relacionado con el tiempo necesario para hacer una reparación. Empleando la ecuación de regresión múltiple estimada ŷ 0.93 0.388x1 1.26x 2 , se ve que 0.93 es la estimación de β0 y la estimación de β 2 es 1.26. Por lo tanto, cuando x 2 0 (reparación mecánica) y 0.93 0.388x1 ^
(15.21)
y cuando x 2 1 (reparación eléctrica) y 0.93 0.388x1 1.2(1) ^
(15.22)
2.19 0.388x1 De esta manera, el uso de una variable ficticia proporciona dos ecuaciones que sirven para predecir el tiempo requerido para una reparación, una ecuación corresponde a las reparaciones me-
15Ander(624-692).qxd 2/29/08 11:06 AM Page 653
15.7
653
Variables cualitativas independientes
FIGURA 15.9
DIAGRAMA DE DISPERSIÓN
y E
5
Tiempo para la reparación (horas)
E 4
E, M
E
M
o)
tric
x1
388
3
∧
. 9+
y=
2.1 E, E
2
93
. y=
+
M
)
ico
n ecá
x1
∧
éc (el
8 .38
(m M
1
M = reparación mecánica E = reparación eléctrica
0
1
2
3
4
5
6
7
8
9
10
x1
Meses desde el último servicio
cánicas y la otra a las reparaciones eléctricas. Además, como b2 = 1.26, se sabe que, en promedio, en las reparaciones eléctricas se necesitan 1.26 horas más que en las reparaciones mecánicas. En la figura 15.9 se presenta una gráfica con los datos de la tabla 15.6. El tiempo de reparación, en horas, se ha representado en el eje vertical y los meses transcurridos desde el último servicio se han representado en el eje horizontal. Los puntos de la gráfica que corresponden a una reparación eléctrica se han indicado con una E y los que corresponden a una reparación mecánica con una M. En esta gráfica se han representado también las ecuaciones (15.21) y (15.22) con objeto de mostrar gráficamente las dos ecuaciones que sirven para predecir el tiempo que se requerirá para una reparación mecánica y para una reparación eléctrica.
Variables cualitativas más complejas
Para modelar una variable cualitativa que tenga k niveles se requieren k 1 variables ficticias. Se debe ser cuidadoso al definir e interpretar variables ficticias.
En el caso del ejemplo de Johnson Filtration, como la variable cualitativa tenía dos niveles (mecánico y eléctrico), fue fácil definirla empleando cero para indicar una reparación mecánica y uno para indicar una reparación eléctrica. Sin embargo, cuando una variable cualitativa tiene más de dos niveles, habrá que tener cuidado tanto al definir como al interpretar estas variables ficticias. Como se verá a continuación, si una variable ficticia tiene k niveles, se necesitan k – 1 variables ficticias, cada una de las cuales tomará el valor 0 o 1. Supóngase, por ejemplo, que un fabricante de fotocopiadoras divide un estado en tres regiones de ventas A, B y C. Sus gerentes desean emplear el análisis de regresión para predecir las ventas semanales. Empleando como variable dependiente el número de fotocopiadoras vendidas, están considerando varias variables independientes (el número de vendedores, gastos en publicidad, etc.). Supóngase que los gerentes piensan que la región de ventas puede ser también un factor importante en la predicción del número de fotocopiadoras vendidas. Como región es una
15Ander(624-692).qxd 2/29/08 11:06 AM Page 654
654
Capítulo 15
Regresión múltiple
variable cualitativa que tiene tres niveles, A, B y C, para representar la región de ventas se necesitarán 3 1 2 variables ficticias. Cada variable tomará los valores 0 o 1.
再 再
1 si la región de ventas es B 0 si no es así 1 si la región de ventas es C x2 0 si no es así x1
De acuerdo con esta definición, para x1 y x2 se tienen los valores siguientes.
Región
x1
x2
A B C
0 1 0
0 0 1
En las observaciones correspondientes a la región A se tendrá x1 0, x2 0; en las observaciones correspondientes a la región B se tendrá x1 1, x2 0, y en las observaciones correspondientes a la región C se tendrá x1 0, x2 1. La ecuación de regresión que relaciona el valor esperado del número de fotocopiadoras vendidas E(y), con las variables ficticias se expresa como sigue. E( y) β0 β1x1 β2 x 2 Para interpretar los parámetros β0, β1, y β 2¸ considérense las siguientes tres variaciones de la ecuación de regresión. E( y región A) β0 β1(0) β2(0) β0 E( y región B) β0 β1(1) β2(0) β0 β1 E( y región C) β0 β1(0) β2(1) β0 β2 Por lo tanto, β0¸ es la media o valor esperado de las ventas en la región A; β1 es la diferencia entre la media del número de unidades vendidas en la región B y la media del número de unidades vendidas en la región A, y β2 es la diferencia entre la media del número de unidades vendidas en la región C y la media del número de unidades vendidas en la región A. Se necesitaron dos variables ficticias debido a que la región de ventas es una variable cualitativa que tiene tres niveles. Sin embargo, la asignación que se hizo al usar x1 0, x2 0 para identificar la región A, x1 1, x2 0 para identificar la región B y x1 0, x2 1 para identificar la región C fue arbitraria. De igual manera se podría haber elegido, por ejemplo, x1 1, x2 0 para identificar la región A, x1 0, x2 0 para identificar la región B y x1 0, x2 1 para identificar la región C. En ese caso, β1 se habría interpretado como la media de la diferencia entre las regiones A y B, y β2 como la media de la diferencia entre las regiones C y B. Es importante recordar que en el análisis de regresión múltiple, cuando una variable cualitativa tiene k niveles, se requieren k 1 variables ficticias. Entonces, si en el ejemplo de las regiones de ventas hubiera una cuarta región, D, se necesitarían tres variables ficticias. Por ejemplo las tres variables ficticias x1
再
1 si la región es B 0 si no es así
x2
再
1 si la región es C 0 si no es así
x3
再
1 si la región es D 0 si no es así
15Ander(624-692).qxd 2/29/08 11:06 AM Page 655
15.7
655
Variables cualitativas independientes
Ejercicios
Métodos
Auto examen
32. Considere un estudio de regresión en el que intervienen una variable dependiente y, una variable independiente cuantitativa x1 y una variable cualitativa de dos niveles (nivel 1 y nivel 2). a. Dé la ecuación de regresión múltiple que relaciona x1 y la variable cualitativa con y. b. ¿Cuál es el valor esperado de y que corresponde al nivel 1 de la variable cualitativa? c. ¿Cuál es el valor esperado de y que corresponde al nivel 2 de la variable cualitativa? d. Interprete los parámetros de la ecuación de regresión. 33. Considere un estudio de regresión en el que intervienen una variable dependiente y, una variable independiente cuantitativa x1 y una variable cualitativa de tres niveles (nivel 1, nivel 2 y nivel 3). a. ¿Cuántas variables ficticias se requieren para representar la variable cualitativa? b. Dé una ecuación de regresión múltiple que relacione x1 y la variable cualitativa con y. c. Interprete los parámetros de la ecuación de regresión.
Aplicaciones
Auto examen
34. El administrador propuso el siguiente modelo de regresión para predecir las ventas en un punto de venta de comida rápida. y β 0 β 1x 1 β 2 x 2 β 3 x 3 donde x1 número de competidores a no más de una milla x2 población a no más de una milla (en miles) x3
再
1 si tiene ventanilla para conductores 0 si no es así
y ventas (en miles de $) Se obtuvo la siguiente ecuación de regresión estimada con los datos de 20 puntos de venta. ŷ 10.1 4.2x1 6.8x2 15.3x3 a. b. c.
¿Cuál es la cantidad esperada de ventas atribuible a la ventana para conductores? Pronostique las ventas de un negocio que tiene dos competidores y una población de 8000 a no más de una milla y ventana para los conductores. Pronostique las ventas de un negocio que tiene un competidor y una población de 3000 a no más de una milla y ventana para los conductores.
35. Véase el problema de Johnson Filtration presentado en esta sección. Supóngase que además de la información sobre los meses transcurridos desde el último servicio y de si se trata de una reparación mecánica o eléctrica, los administradores presentan una lista con las personas que realizaron las reparaciones. A continuación se presentan los nuevos datos.
archivo CD en Repair
Tiempo en horas requerido para la reparación
Meses desde el último servicio
Tipo de reparación
Persona que realiza la reparación
2.9 3.0 4.8
2 6 8
eléctrica mecánica eléctrica
Dave Newton Dave Newton Bob Jones (continúa)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 656
656
Capítulo 15
Regresión múltiple
Tiempo en horas requerido para la reparación
Meses desde el último servicio
Tipo de reparación
Persona que realiza la reparación
1.8 2.9 4.9 4.2 4.8 4.4 4.5
3 2 7 9 8 4 6
mecánica eléctrica eléctrica mecánica mecánica eléctrica eléctrica
Dave Newton Dave Newton Bob Jones Bob Jones Bob Jones Bob Jones Dave Newton
a.
b. c.
d.
Por ahora ignore los meses transcurridos desde el último servicio (x1) y la persona que realizó la reparación. Obtenga la ecuación de regresión lineal simple estimada para predecir el tiempo que se requiere para la reparación (y) dado el tipo de reparación (x2). Recuerde que x2 0 si se trata de una reparación mecánica, y x2 1 si se trata de una reparación eléctrica. ¿Proporciona la ecuación obtenida en el inciso a) un buen ajuste a los datos observados? Explique. Por ahora ignore los meses transcurridos desde el último servicio y el tipo de reparación. Obtenga la ecuación de regresión lineal simple estimada para predecir el tiempo necesario para la reparación dada la persona que realizó la reparación. Sea x3 0 si la reparación fue hecha por Bob Jones, y x3 1 si la reparación fue hecha por Dave Newton. ¿Proporciona la ecuación obtenida en el inciso c) un buen ajuste a los datos observados? Explique.
36. Este problema es una extensión del ejercicio 35. a. Obtenga la ecuación de regresión estimada que permita predecir el tiempo que se requiere para una reparación dados los meses transcurridos desde la última reparación, el tipo de reparación y la persona que realizó la reparación. b. Empleando como nivel de significancia 0.05, realice una prueba para ver si la ecuación de regresión estimada obtenida en el inciso a) representa una relación significativa entre las variables independientes y la variable dependiente. c. ¿Es estadísticamente significativo agregar la variable x3, la persona que realizó la reparación? Use α 0.05. ¿Qué explicación puede dar para los resultados observados? 37. La Liga nacional de futbol americano de Estados Unidos (National Footbal League) evalúa a sus prospectos con una escala que va del 5 al 9. Estas evaluaciones se interpretan como sigue: 8 – 9 deberá empezar el año próximo; 7.0 – 7.9 deberá empezar; 6.0 – 6.9 servirán de respaldo al equipo, y 5.0 – 5.9 pueden formar parte del club y contribuir. En la tabla siguiente se da posición, peso, tiempo en segundos para correr 40 yardas y la evaluación dada por la NFL a 25 prospectos (USA Today, 14 de abril de 2000). a. Dé una variable ficticia para la posición de los jugadores.
archivo CD en Football
Cosey Coleman Travis Claridge Kaulana Noa Leander Jordan Chad Clifton Manula Savea Ryan Johanningmeir Mark Tauscher Blaine Saipaia Richard Mercier Damion McIntosh
Posición
Peso (libras)
Tiempo (segundos)
Evaluación
Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia
322 303 317 330 334 308 310 318 321 295 328
5.38 5.18 5.34 5.46 5.18 5.32 5.28 5.37 5.25 5.34 5.31
7.4 7.0 6.8 6.7 6.3 6.1 6.0 6.0 6.0 5.8 5.3
15Ander(624-692).qxd 2/29/08 11:06 AM Page 657
15.7
657
Variables cualitativas independientes
Jeno James Al Jackson Chris Samuels Stockar McDougle Chris McIngosh Adrian Klemm Todd Wade Marvel Smith Michael Thompson Bobby Williams Darnell Alford Terrance Beadles Tutan Reyes Greg Robinson-Ran
b. c.
d. e. f.
Posición
Peso (libras)
Tiempo (segundos)
Evaluación
Guardia Guardia Tackle Tackle Tackle Tackle Tackle Tackle Tackle Tackle Tackle Tackle Tackle Tackle
320 304 325 361 315 307 326 320 287 332 334 312 299 333
5.64 5.20 4.95 5.50 5.39 4.98 5.20 5.36 5.05 5.26 5.55 5.15 5.35 5.59
5.0 5.0 8.5 8.0 7.8 7.6 7.3 7.1 6.8 6.8 6.4 6.3 6.1 6.0
Obtenga una ecuación de regresión estimada que muestre la relación entre la evaluación y posición, peso y tiempo requerido para correr 40 yardas. Empleando como nivel de significancia 0.05, pruebe si la ecuación de regresión estimada obtenida en el inciso b) indica que existe una relación significativa entre las variables independientes y la variable dependiente. ¿Proporciona la ecuación de regresión estimada un buen ajuste a los datos observados? Explique. ¿Es la posición un factor significativo en la evaluación de los jugadores? Use α 0.05. Explique. Suponga que hay un nuevo prospecto de tackle que pesa 300 libras y corre 40 yardas en 5.1 segundos. Utilice la ecuación de regresión estimada obtenida en el inciso b) para estimar la evaluación de este jugador.
38. Un estudio realizado a lo largo de 10 años por la American Heart Association proporcionó datos sobre la relación que tienen la edad, la presión sanguínea y el fumar sobre el riesgo de sufrir un infarto. Los datos que se dan a continuación se obtuvieron como parte de este estudio. El riesgo se interpreta como la probabilidad (multiplicada por 100) de que el paciente sufra un infarto en los próximos 10 años. Para fumar, defina una variable ficticia que tome el valor 1 si la persona es fumadora y el valor 0 si no es fumadora.
archivo CD en Stroke
Riesgo
Edad
Presión
Fumador
12 24 13 56 28 51 18 31 37 15 22 36 15 48 15 36 8 34 3 37
57 67 58 86 59 76 56 78 80 78 71 70 67 77 60 82 66 80 62 59
152 163 155 177 196 189 155 120 135 98 152 173 135 209 199 119 166 125 117 207
No No No Sí No Sí Sí No Sí No No Sí Sí Sí No Sí No Sí No Sí
15Ander(624-692).qxd 2/29/08 11:06 AM Page 658
658
Capítulo 15
a. b. c.
15.8
Regresión múltiple
Obtenga la ecuación de regresión estimada que relaciona el riesgo de infarto con la edad, la presión sanguínea y el fumar o no fumar. ¿Es el fumar un factor significativo para el riesgo de infarto? Explique. Use α = 0.05. ¿Cuál es la probabilidad de que Art Apeen sufra un infarto en los próximos 10 años, si tiene 68 años, fuma y su presión sanguínea es 175? ¿Qué recomendará el médico hacer a este paciente?
Análisis residual En el capítulo 14 se indicó que los residuales estandarizados suelen emplearse en las gráficas de residuales y en la identificación de observaciones atípicas. A continuación se presenta la fórmula general para obtener el residual estandarizado de la observación i.
RESIDUAL ESTANDARIZADO DE LA OBSERVACIÓN i
yi ŷi syi ŷ i
(15.23)
donde syi ŷi desviación estándar del residual i La fórmula general para obtener la desviación estándar del residual i está definida como se indica a continuación.
DESVIACIÓN ESTÁNDAR DEL RESIDUAL i
syi ŷi s 兹1 hi
(15.24)
donde s error estándar de estimación hi influencia de la observación i Como se dijo en el capítulo 14, la influencia de una observación está determinada por qué tan lejos de sus medias están los valores de las variables independientes. En el análisis de regresión múltiple, calcular hi y syi ŷi, y por lo tanto el residual estandarizado de la observación i es muy complicado como para hacerlo a mano. Sin embargo, los residuales estandarizados se obtienen fácilmente como parte de los resultados de los paquetes de software para estadística. En la tabla 15.7 se presentan valores pronosticados, residuales y residuales estandarizados empleando los datos del ejemplo de Butler Trucking presentado previamente en este capítulo; estos valores se obtuvieron empleando Minitab. Los valores pronosticados que aparecen en la tabla están basados en la ecuación de regresión estimada ŷ 0.869 0.0611x1 0.923x2. Los residuales estandarizados y los valores pronosticados de y de la tabla 15.7 se emplearon en la figura 15.10, la gráfica de residuales estandarizados para el ejemplo de regresión múltiple de Butler Trucking. En esta gráfica de residuales estandarizados no se observa ninguna anormalidad. Además, todos los residuales estandarizados se encuentran entre 2 y 2; por lo tanto no hay ninguna razón para cuestionar la suposición de que el término del error esté distribuido normalmente. Así, se concluye que las suposiciones del modelo son razonables.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 659
15.8
659
Análisis residual
TABLA 15.7
RESIDUALES Y RESIDUALES ESTANDARIZADOS CORRESPONDIENTES AL ANÁLISIS DE REGRESIÓN DE BUTLER TRUCKING.
Millas recorridas (x1)
Tiempo de Valor recorrido pronosticado ( y) ( ŷ)
Entregas (x2 )
100 50 100 100 50 80 75 65 90 90
4 3 4 2 2 2 3 4 3 2
9.3 4.8 8.9 6.5 4.2 6.2 7.4 6.0 7.6 6.1
8.93846 4.95830 8.93846 7.09161 4.03488 5.86892 6.48667 6.79875 7.40369 6.48026
Residual ( y ⴚ ŷ)
Residual estandarizado
0.361541 0.158304 0.038460 0.591609 0.165121 0.331083 0.913331 0.798749 0.196311 0.380263
0.78344 0.34962 0.08334 1.30929 0.38167 0.65431 1.68917 1.77372 0.36703 0.77639
Para determinar si la distribución de parece ser normal, puede emplearse también una gráfica de probabilidad normal. En la sección 14.8 se discutió el procedimiento y la interpretación de una gráfica de probabilidad normal. Ese mismo procedimiento es adecuado para la regresión múltiple. Para obtener la grafica de probabilidad normal también se hace uso de un paquete de software para estadística que realice los cálculos.
Detección de observaciones atípicas Una observación atípica es una observación que es inusual en relación con el resto de los datos; en otras palabras, una observación atípica no sigue el patrón del resto de los datos. En el capítulo 14 se mostró un ejemplo en el que había una observación atípica y se vio el empleo de los residuales estandarizados para detectar observaciones atípicas. Minitab clasifica una observación FIGURA 15.10
GRÁFICA DE RESIDUALES ESTANDARIZADOS EMPLEANDO EL EJEMPLO DE BUTLER TRUCKING
Residuales estandarizados
+2
+1
0
–1
–2 ∧
y 4
5
6
7
8
9
15Ander(624-692).qxd 2/29/08 11:06 AM Page 660
660
Capítulo 15
Regresión múltiple
como observación atípica si el valor de su residual estandarizado es menor a 2 o mayor a 2. Aplicando esta regla a los residuales estandarizados del ejemplo de Butler Trucking (tabla 15.7), en este conjunto de datos no se detecta ninguna observación atípica. En general, la presencia de una o más observaciones atípicas en un conjunto de datos tiende a incrementar s, el error estándar de estimación y, por lo tanto, a incrementar sy ŷi, la desviación estándar del residual i. Dado que syi ŷi aparece como denominador en la fórmula (15.23) del residual estandarizado, el tamaño del residual estandarizado disminuirá a medida que s aumente. Esto da como resultado que aún cuando un residual sea inusualmente grande, el denominador de la fórmula (15.23), que será grande, hará que la regla del residual estandarizado falle para la identificación de una observación como observación atípica. Es posible sortear esta dificultad empleando una forma de los residuales estandarizados conocida como residuales estudentizados.
Residuales estudentizados eliminados y observaciones atípicas Supóngase que del conjunto de datos se elimina la observación i y que de las n 1 observaciones restantes se obtiene una nueva ecuación de regresión estimada. Sea s(i) el error estándar de estimación obtenido del conjunto de datos en los que se ha eliminado la observación i. Si se calcula la desviación estándar del residual i usando s(i) en lugar de s y después se calcula el residual estandarizado de la observación i empleando el nuevo valor de syi ŷi, al residual estandarizado que se obtiene se le llama residual eliminado estudentizado. Si la observación i es una observación atípica, s(i) será menor a s. Por lo tanto, el valor absoluto del residual eliminado estudentizado i será mayor que el valor absoluto del residual estandarizado. De esta manera, los residuales eliminados estudentizados pueden detectar observaciones atípicas que los residuales estandarizados no detectan. Muchos de los paquetes de software para estadística proporcionan una opción para obtener residuales eliminados estudentizados. Empleando Minitab se obtuvieron los residuales eliminados estudentizados para el ejemplo de Butler Trucking; los resultados obtenidos se presentan en la tabla 15.8. Para determinar si los residuales eliminados estudentizados indican la presencia de observaciones atípicas se emplea la distribución t. Recuérdese que p denota el número de variables independientes y n el número de observaciones. Por lo tanto, si se elimina la observación i, el número de observaciones en el nuevo conjunto de datos es n – 1; en este caso, la suma de cuadrados del error tiene (n 1) p 1 grados de libertad. Como en el ejemplo de Butler Trucking n 10 y p 2, los grados de libertad para la suma de cuadrados del error es 9 2 1 6. Empleando como nivel de significancia 0.05, en la distribución t (tabla 2 del apéndice B) para seis grados de libertad se obtiene, t0.025 2.337. Se concluye que la observación i es una observación atípica si el residual eliminado estudentizado es menor a 2.447 o mayor a 2. 447. En la tabla 15.8 se observa que los residuales eliminados estudentizados no se encuentran fuera de estos límites; por lo tanto se concluye que en este conjunto de datos no hay observaciones atípicas. TABLA 15.8
RESIDUALES ELIMINADOS ESTUDENTIZADOS CORRESPONDIENTES AL EJEMPLO DE BUTLER TRUCKING
Millas recorridas (x1) 100 50 100 100 50 80 75 65 90 90
Entregas (x2) 4 3 4 2 2 2 3 4 3 2
Tiempo recorrido Residual ( y) estandarizado 9.3 4.8 8.9 6.5 4.2 6.2 7.4 6.0 7.6 6.1
0.78344 0.34962 0.08334 1.30929 0.38167 0.65431 1.68917 1.77372 0.36703 0.77639
Residual eliminado estudentizado 0.75939 0.32654 0.07720 1.39494 0.35709 0.62519 2.03187 2.21314 0.34312 0.75190
15Ander(624-692).qxd 2/29/08 11:06 AM Page 661
15.8
661
Análisis residual
TABLA 15.9
INFLUENCIA Y DISTANCIA DE COOK CORRESPONDIENTES AL EJEMPLO DE BUTLER TRUCKING
Millas recorridas (x1) 100 50 100 100 50 80 75 65 90 90
Entregas (x2 )
Tiempo de recorrido ( y)
Influencia (hi )
D Cook (Di )
4 3 4 2 2 2 3 4 3 2
9.3 4.8 8.9 6.5 4.2 6.2 7.4 6.0 7.6 6.1
0.351704 0.375863 0.351704 0.378451 0.430220 0.220557 0.110009 0.382657 0.129098 0.269737
0.110994 0.024536 0.001256 0.347923 0.036663 0.040381 0.117562 0.650029 0.006656 0.074217
Observaciones influyentes En la sección 14.9 se vio cómo se puede usar la influencia de una observación para identificar observaciones cuyo valor de la variable independiente puede tener una influencia fuerte en los resultados de la regresión. Como se indicó al hablar de los residuales estandarizados, la influencia de una observación, que se denota hi, mide qué tan lejos de sus medias se encuentran los valores de las variables independientes. Los valores de la influencia se pueden obtener como parte de los resultados que proporcionan los paquetes de software para estadística. Minitab calcula los valores de la influencia y para detectar observaciones influyentes emplea la regla hi 3( p 1)/n. En el ejemplo de Butler Trucking como hay p = 2 variables independientes y n 10 observaciones, el valor crítico para la influencia es 3(2 1)/10 0.9. En la tabla 15.9 se presentan los valores de la influencia correspondientes al ejemplo de Butler Trucking obtenidos con Minitab. Como ninguno de los valores hi es mayor a 0.9, en este conjunto de datos no se detectan observaciones influyentes.
Uso de la medida de la distancia de Cook para identificar observaciones influyentes
TABLA 15.10 CONJUNTO DE DATOS QUE ILUSTRAN EL PROBLEMA POTENCIAL QUE EXISTE USANDO EL CRITERIO DE LA INFLUENCIA xi
yi
Influencia hi
1 1 2 3 4 4 5 15
18 21 22 21 23 24 26 39
0.204170 0.204170 0.164205 0.138141 0.125977 0.125977 0.127715 0.909644
Un problema que puede presentarse al usar la influencia para identificar observaciones influyentes es que puede que se identifique una observación como una observación que tiene una gran influencia sin que necesariamente sea influyente en términos de la ecuación de regresión estimada que se obtiene. Por ejemplo, en la tabla 15.10 se presenta un conjunto de datos que consta de 10 observaciones y sus correspondientes valores de influencia (obtenidos usando Minitab). Como la influencia de la última observación es 0.91 0.75 (el valor de influencia crítico), se identificará a esta observación como una observación influyente. Sin embargo antes de aceptar una conclusión final, considérese la situación desde una perspectiva diferente. En la figura 15.11 se presenta el diagrama de dispersión que corresponde al conjunto de datos de la tabla 15.10. Empleando Minitab se obtuvo a partir de estos datos la ecuación de regresión estimada siguiente. ŷ 18.2 1.39x La línea recta que se observa en la figura 15.11 es la gráfica de esta ecuación. Ahora, si de este conjunto de datos se elimina la observación x 15, y 39 y con las siete observaciones restantes se obtiene una nueva ecuación, la nueva ecuación de regresión estimada es ŷ 18.1 1.42x Se observa que en la nueva ecuación la intersección con el eje y y la pendiente no tienen valores significativamente diferentes a los de la ecuación en la que se usan todos los datos. A pesar de
15Ander(624-692).qxd 2/29/08 11:06 AM Page 662
662
Capítulo 15
FIGURA 15.11
Regresión múltiple
DIAGRAMA DE DISPERSIÓN OBTENIDO CON LOS DATOS DE LA TABLA 15.10 y 40
La ecuación de regresión estimada usando todos los datos es ^ y = 18.2 + 1.39x
35
30
Nota: Si se elimina el punto (15, 39), la ecuación de regresión estimada es y^ = 18.1 + 1.42x
25
20
15
0
5
10
15
x
que con el criterio de la influencia se identificó a la octava observación con observación influyente, es claro que esta observación tiene poca influencia en los resultados. Por lo tanto, hay casos en los que emplear únicamente la influencia para identificar las observaciones influyentes puede llevar a conclusiones erróneas. En la medida de la distancia de Cook se utiliza tanto la influencia de la observación i, hi , como el residual de la observación i, ( yi ŷi), para determinar si una observación es influyente. MEDIDA DE LA DISTANCIA DE COOK
Di
( yi ŷi )2 hi ( p 1)s2 (1 hi )2
冤
冥
donde Di medida de la distancia de Cook para la observación i yi ŷi residual de la observación i hi influencia de la observación i p número de variables independientes s error estándar de estimación
(15.25)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 663
15.8
663
Análisis residual
Si el residual o la influencia es grande, la medida de la distancia de Cook será grande e identificará una observación influyente. Como regla general se acepta que si Di 1 la observación i es influyente y debe ser analizada con más detenimiento. En la última columna de la tabla 15.9 se presentan las medidas de la distancia de Cook correspondientes al problema Butler Trucking obtenidas con Minitab. La observación con mayor influencia es la observación 8, para la que Di 0.650029. Aplicando la regla Di 1 se ve que no hay por qué preocuparse acerca de la presencia de observaciones influyentes en el conjunto de datos de Butler Trucking. NOTAS Y COMENTARIOS 1. Los procedimientos para la detección de observaciones atípicas o de observaciones influyentes permiten estar alerta acerca de los efectos potenciales que algunas observaciones puedan tener en los resultados de la regresión. Cada observación atípica u observación influyente justifica un examen cuidadoso. Si se encuentran errores en los datos, se pueden corregir los errores y repetir el análisis de regresión. En general, las observaciones atípicas y las observaciones influyentes no deben ser eliminadas del conjunto de datos a menos que haya una evidencia clara que indique que no provienen de elementos de la población en estudio y que no tenían que ser incluidos en el conjunto de datos original
2. Para determinar si el valor de una medida de la distancia de Cook Di es lo suficientemente grande como para concluir que la observación i es influyente, también puede compararse el valor de Di con el percentil 50 de una distribución F (denotado F0.50) con p 1 grados de libertad en el numerador y n p 1 grados de libertad en el denominador. Para esta prueba se necesita contar con tablas F a un nivel de significancia de 0.50. La regla práctica dada antes (Di 1) se basa en el hecho de que en muchos de los casos los valores en la tabla son cercanos a 1.
Ejercicios
Métodos
Auto examen
39. A continuación se dan datos para las variables x y y.
a. b. c.
xi
1
2
3
4
5
yi
3
7
5
11
14
Obtenga una ecuación de regresión estimada para estos datos. Grafique los residuales estandarizados contra ŷ . ¿Parece haber alguna observación atípica en este conjunto de datos? Explique. Calcule los residuales eliminados estudentizados de estos datos. Empleando como nivel de significancia 0.05, ¿puede clasificarse cualquiera de estas observaciones como observación atípica? Explique.
40. A continuación se dan datos para las variables x y y.
a. b.
c. d.
xi
22
24
26
28
40
yi
12
21
31
35
70
Obtenga una ecuación de regresión estimada para estos datos. Calcule los residuales eliminados estudentizados de estos datos Empleando como nivel de significancia 0.05, ¿puede clasificarse cualquiera de estas observaciones como observación atípica? Explique. Calcule los valores de influencia de estos datos. ¿Parece haber alguna observación influyente en estos datos? Explique. Calcule la medida de la distancia de Cook de estos datos. ¿Es alguna de las observaciones una observación influyente? Explique.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 664
664
Capítulo 15
Regresión múltiple
Aplicaciones
Auto examen
41. En el ejercicio 5 se presentaron los datos siguientes sobre el ingreso semanal bruto y publicidad tanto en televisión como en periódicos de Showtime Movie Theater.
Ingreso semanal bruto (en miles de $)
Publicidad en televisión (en miles $)
Publicidad en periódicos (en miles de $)
96 90 95 92 95 94 94 94
5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0
1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5
archivo CD en Showtime
a. b. c. d.
Dé una ecuación de regresión estimada que relacione el ingreso semanal bruto con los gastos en publicidad en televisión y periódicos. Grafique los residuales estandarizados contra ŷ . ¿Respalda la gráfica de residuales las suposiciones acerca de ? Explique. Revise que no haya observaciones atípicas en estos datos. ¿A qué conclusión llega? ¿Hay alguna observación influyente?
42. En los datos siguientes se presenta peso en vacío, caballos de fuerza y velocidad en ¹⁄₄ de milla de 10 automóviles deportivos y GT. Supóngase que se tiene también el precio de cada uno de estos automóviles. Todo el conjunto de datos es el siguiente.
Automóvil deportivo y GT
archivo CD en Auto2
Accura Integra Type R Accura NSX-T BMW Z3 2.8 Chevrolet Camaro Z28 Chevrolet Corvette Convertible Dodge Viper RT/10 Ford Mustang GT Honda Prelude Type SH Mercedes-Benz CLK320 Mercedes-Benz SLK230 Mitsubishi 3000GT VR-4 Nissan 240SX SE Pontiac Firebird Trans Am Porsche Boxster Toyota Supra Turbo Volvo C70
a. b. c. d.
Precio (miles de $)
Peso en vacío (lb)
Caballos de fueza (lb)
Velocidad en ¹⁄₄ de milla (mph)
25 035 93 758 40 900 24 865 50 144 69 742 23 200 26 382 44 988 42 762 47 518 25 066 27 770 45 560 40 989 41 120
2577 3066 2844 3439 3246 3319 3227 3042 3240 3025 3737 2862 3455 2822 3505 3285
195 290 189 305 345 450 225 195 215 185 320 155 305 201 320 236
90.7 108.0 93.2 103.2 102.1 116.2 91.7 89.7 93.0 92.3 99.0 84.6 103.2 93.2 105.0 97.0
Obtenga la ecuación de regresión estimada en la que se emplee precio y caballos de fuerza para predecir la velocidad en ¹⁄₄ de milla. Grafique los residuales estandarizados contra ŷ . ¿Respalda la gráfica de residuales las suposiciones respecto a ? Explique. Verifique si hay observaciones atípicas. ¿A qué conclusión llega? ¿Hay alguna observación influyente? Explique.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 665
15.9
archivo CD en LPGA
15.9
Regresión logística
665
43. La Ladies Professional Golfers Association (LPGA) lleva estadísticas sobre el desempeño y los ingresos de sus miembros en el LPGA Tour. En el archivo titulado LPGA del disco compacto se presentan las estadísticas de fin de año sobre el desempeño de las 30 jugadoras que tuvieron los mejores ingresos en el LPGA Tour del 2005 (www.lpga.com, 2006). Earnings (ingresos) ($1000) son los ingresos totales en miles de dólares; Scoring Avg es el n promedio de golpes en todo el evento; Greens in Reg. es el porcentaje de las veces que un jugador logra un green en regulación, y Putting Avg es el promedio de putts por green en regulación. Un green se considera en regulación cuando se alcanza en dos golpes menos que el par del hoyo a. Obtenga una ecuación de regresión estimada que sirva para obtener Scoring Avg conociendo Greens en Reg. y Putting Avr. b. Grafique los residuales estandarizados contra ŷ. ¿Confirma esta gráfica de residuales las suposiciones hechas acerca de ? c. Verifique si existen observaciones atípicas. ¿A qué conclusión llega? d. ¿Hay alguna observación influyente? Explique.
Regresión logística En muchas de las aplicaciones de la regresión la variable dependiente asume sólo dos valores discretos. Por ejemplo, en un banco suele necesitarse una ecuación de regresión estimada para predecir si a una persona se le aprobará su solicitud de tarjeta de crédito. A esta variable dependiente pueden dársele los valores y 1 si la solicitud de tarjeta de crédito es aprobada, y y 0 si es rechazada. Con la regresión logística, dado un conjunto particular de valores de las variables independientes elegidas, se estima la probabilidad de que el banco apruebe la solicitud de tarjeta de crédito. A continuación se considera una aplicación de la regresión logística. La empresa Simmons Stores va a realizar una promoción por correo. Simmons Stores es una cadena nacional de ropa para dama. Ha mandado imprimir 5000 costosos catálogos de venta a cuatro colores y en cada catálogo incluye un cupón de $50 de descuento en la compra de $200 o más. Como este catálogo es costoso, Simmons desea enviarlo sólo a aquellos clientes que tengan mayor probabilidad de usar el cupón. Los gerentes consideran que la cantidad gastada anualmente por el cliente en las tiendas Simmons, así como si posee o no una tarjeta de crédito de Simmons son dos variables que pueden servir para predecir si ese cliente usará el cupón. Simmons realiza un estudio piloto usando una muestra aleatoria de 50 clientes con tarjeta de crédito de Simmons y 50 clientes sin tarjeta de crédito de la empresa. Simmons envió los catálogos a cada uno de estos 100 clientes elegidos. Al final del periodo de prueba, Simmons anota si los clientes han hecho uso o no del cupón. En la tabla 15.11 se presentan los datos muestrales de las 10 primeras personas que recibieron el catálogo. En esta tabla se da: cantidad, en miles de dólares, gastada por el cliente en las tiendas Simmons durante el año anterior; información sobre si tiene o no tarjeta de crédito de Simmons, codificada como 1 si el cliente tiene tarjeta de crédito de Simmons y 0 si no la tiene. En la columna correspondiente al cupón, 1 significa el cliente usó el cupón y 0 significa no lo usó. Para ayudar a Simmons a predecir si las personas que reciban el catálogo usarán o no el cupón, se podría pensar en construir, con los datos de la tabla 15.11, un modelo de regresión múltiple. Las variables independientes serían cantidad gastada anualmente en Simmons Stores y tarjeta de crédito, y la variable dependiente sería cupón. Sin embargo, el modelo común de regresión múltiple no se puede emplear debido a que la variable dependiente sólo puede tomar los valores 0 y 1. Con este ejemplo se ilustra el tipo de situación para la cual fue creada la regresión logística. A continuación se verá el empleo de la regresión logística para ayudar a Simmons Stores a pronosticar qué tipo de clientes es más probable que aprovechen esta promoción.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 666
666
Capítulo 15
TABLA 15.11
archivo CD en Simmons
Regresión múltiple
DATOS MUESTRALES DE SIMMONS STORES
Cliente
Gastos anual (miles de $)
Tarjeta de Simmons
Cupón
1 2 3 4 5 6 7 8 9 10
2.291 3.215 2.135 3.924 2.528 2.473 2.384 7.076 1.182 3.345
1 1 1 0 1 0 0 0 1 0
0 0 0 0 0 1 0 0 1 0
Ecuación de regresión logística La regresión logística se parece en muchos aspectos a la regresión común. Se necesita una variable dependiente y y una o varias variables independientes. En el análisis de regresión múltiple, a la media o valor esperado de y se le conoce como la ecuación de regresión múltiple. E( y) β0 β1x1 β2 x 2 . . . βp xp
(15.26)
En la regresión logística, tanto la teoría como la práctica estadística han demostrado que la relación existente entre E(y) y x1, x 2 , . . . , xp, queda descrita mediante la siguiente ecuación no lineal.
ECUACIÓN DE REGRESIÓN LOGÍSTICA
e β0 β1x1 β2 x 2 βp xp ... 1 e β0 β1x1 β2 x 2 βp xp ...
E( y)
(15.27)
Como los dos valores de la variable dependiente y son 0 y 1, el valor de E(y) en la ecuación (15.27) dará la probabilidad de que y 1 para un conjunto dado de valores de las variables independientes x1, x2, . . ., xp. Como E(y) se interpreta como una probabilidad, la ecuación de regresión logística suele expresarse de la manera siguiente.
INTERPRETACIÓN DE E(y) COMO PROBABILIDAD EN LA REGRESIÓN LOGÍSTICA
E( y) P( y 1冷x1, x 2, . . . , x p )
(15.28)
Para entender mejor las características de la ecuación de regresión logística, supóngase que en el modelo se tiene sólo una variable independiente x y que los valores de los parámetros del modelo son β0 7 y β1 3. La ecuación de regresión logística correspondiente a estos valores de los parámetros es E( y) P( y 1冷x)
e β0 β1x e 7 3x 1 e β0 β1x 1 e 7 3x
(15.29)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 667
15.9
667
Regresión logística
ECUACIÓN DE REGRESIÓN LOGÍSTICA EN LA QUE β0 7 Y β1 3
FIGURA 15.12
1.0
E(y)
0.8
0.6
0.4
0.2
0.0 0
1
2
3
4
5
Variable independiente (x)
En la figura 15.12 se muestra la gráfica de la ecuación (15.29). Obsérvese que la gráfica tiene forma de S. El valor de E(y) va desde 0 hasta 1, aproximándose gradualmente a 1 a medida que el valor de x aumenta, y a 0 a medida que el valor de x disminuye. Obsérvese también que el valor de E(y), que representa probabilidad, aumenta rápidamente al aumentar x de 2 a 3. El hecho de que los valores de E(y) vayan de 0 a 1 y que la curva tenga forma de S hacen que la ecuación (15.29) sea ideal para modelar la probabilidad de que la variable dependiente sea igual a 1.
Estimación de la ecuación de regresión logística En la regresión lineal simple y en la regresión múltiple se emplea el método de mínimos cuadrados para calcular las estimaciones b0, b1, . . .., bp, de los parámetros β0, β1, . . . , βp del modelo. Debido a la forma no lineal de la ecuación de regresión logística, el método para calcular estas estimaciones es más complejo y queda fuera del alcance de este libro. Para obtener estas estimaciones se empleará un paquete de software. La ecuación de regresión logística estimada es
ECUACIÓN DE REGRESIÓN LOGÍSTICA ESTIMADA
e b0 b1x1 b2 x 2 bp xp ... 1 e b0 b1x1 b2 x 2 bp xp ...
ŷ estimación de P( y 1冷x1, x 2, . . . , xp )
(15.30)
Aquí ŷ es una estimación de la probabilidad de que y 1, para un determinado conjunto de valores de las variables independientes. Volviendo ahora al ejemplo de Simmons Stores, las variables en este estudio están definidas como sigue:
再
0 si el cliente no usó el cupón 1 si el cliente usó el cupón x1 cantidad anual gastada en Simmons Stores (en miles de $) 0 si el cliente no tiene tarjeta de crédito de Simmons x2 1 si el cliente tiene tarjeta de crédito de Simmons y
再
15Ander(624-692).qxd 2/29/08 11:06 AM Page 668
668
Capítulo 15
Regresión múltiple
FIGURA 15.13
RESULTADOS DE LA REGRESIÓN LOGÍSTICA PARCIAL PARA EL PROBLEMA DE LAS TIENDAS SIMMONS
Logistic Regression Table En los resultados de Minitab x1 Spending (cantidad gastada) x 2 Card (tarjeta de crédito)
Predictor Constant Spending Card
Coef -2.1464 0.3416 1.0987
SE Coef 0.5772 0.1287 0.4447
Z -3.72 2.66 2.47
p 0.000 0.008 0.013
Odds Ratio 1.41 3.00
95% CI Lower Upper 1.09 1.25
1.81 7.17
Log-Likelihood = -60.487 Test that all slopes are zero: G = 13.628, DF = 2, P-Value = 0.001
Por lo tanto, se elige una ecuación de regresión logística con dos variables independientes. E( y) En el apéndice 15.3 se muestra cómo se usa Minitab para generar el resultado que se muestra en la figura 15.13.
e β0 β1x1 β2 x 2 1 e β0 β1x1 β2 x 2
(15.31)
Para calcular las estimaciones de los parámetros β0, β1, y β 2 del modelo se aplicó el procedimiento de regresión logística binaria de Minitab a los datos muestrales de la tabla 15.11. En la figura 15.13 se muestra parte de los resultados obtenidos. Como se ve, b0 2.1464, b1 0.3416 y b2 1.0987. Por lo tanto, la ecuación de regresión logística estimada es ŷ
e b0 b1x1 b2 x 2 e 2.1464 0.3416x1 1.0987x 2 1 e b0 b1x1 b2 x 2 1 e 2.1464 0.3416x1 1.0987x 2
(15.32)
Ahora usando la ecuación (15.32) se estima la probabilidad de que un determinado tipo de clientes use el cupón. Por ejemplo, para estimar la probabilidad de que los clientes que tienen un gasto anual de $2000 en Simmons Stores y que no tienen tarjeta de crédito de Simmons usen el cupón, en la ecuación (15.32) se sustituyen x1 2 y x2 0. ŷ
e 1
2.1464 0.3416(2) 1.0987(0)
e
2.1464 0.3416(2) 1.0987(0)
e 1
1.4632
e
1.4632
0.2315 1.2315
0.1880
Por lo tanto, la probabilidad estimada de que este tipo de clientes use el cupón es 0.19. De manera similar, la probabilidad de que aquellos clientes que tienen un gasto anual de $2000 en Simmons Stores y que tiene tarjeta de crédito de Simmons usen el cupón, se estima sustituyendo en la ecuación (15.32) x1 = 2 y x2 = 1. ŷ
e 1
2.1464 0.3416(2) 1.0987(1)
e
2.1464 0.3416(2) 1.0987(1)
e 1
0.3645
e
0.3645
0.6945 1.6945
0.4099
Por lo tanto, la probabilidad de que los clientes de este grupo usen el cupón es aproximadamente 0.41. Parece ser que los clientes que tienen tarjeta de crédito de Simmons son los que tienen mayor probabilidad de usar el cupón. Pero antes de llegar a una conclusión, es necesario evaluar la significancia estadística de este modelo.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 669
15.9
669
Regresión logística
Prueba de significancia La prueba de significancia en la regresión logística es similar a la prueba de significancia en la regresión múltiple. Primero se hace una prueba para probar la significancia global. En el ejemplo de Simmons Stores, las hipótesis para probar la significancia global son las siguientes: H0: β1 β2 0 Ha: Uno o los dos parámetros son distintos de cero La prueba de significancia global del modelo se basa en el valor del estadístico de prueba G. Si la hipótesis nula es verdadera, la distribución muestral de G es una distribución chi-cuadrada con grados de libertad igual al número de variables independientes en el modelo. El cálculo de G queda fuera del alcance de este libro, pero este valor de G y su correspondiente valor-p pueden obtenerse de los resultados de regresión logística binaria que da Minitab. En el último renglón de la figura 15.13 se encuentra que el valor de G es 13.628, sus grados de libertad son 2 y su correspondiente valor-p es 0.001. Por lo tanto, empleando cualquier nivel de significancia α 0.001, se rechazará la hipótesis nula y se concluirá que el modelo global es significativo. Una vez que la prueba G ha indicado que sí existe una significancia global, para determinar si la contribución de cada una de las variables independientes al modelo es significativa, se suele realizar una prueba z. Para cada una de las variables independientes xi las hipótesis son H0: βi 0 Ha: βi 0 Si la hipótesis nula es verdadera, el valor del coeficiente estimado dividido entre su error estándar seguirá una distribución de probabilidad normal estándar. En los resultados de Minitab, en la columna que tiene como título Z se presentan los valores de zi bi / sbi correspondientes a cada uno de los coeficientes estimados, y en la columna que tiene como título p se encuentran sus valores –p correspondientes. Supóngase que en el modelo de Simmons se emplea α 0.05 para probar la significancia de las variables independientes. Para la variable independiente x1, el valor z es 2.66 y su correspondiente valor-p es 0.008. Por lo tanto, para el nivel de significancia 0.05 se rechaza H0: β1 0. De la misma manera se rechaza H0: β 2 0 dado que el valor-p correspondiente a z 2.47 es 0.013. Por lo tanto, empleando como nivel de significancia 0.05, ambas variables son estadísticamente significativas.
Uso en la administración Ya se describió cómo obtener la ecuación de regresión logística estimada y cómo probar su significancia. Ahora se usará esto para hacer una recomendación para la decisión que tienen que tomar en Simmons Stores respecto a la promoción con su catálogo. Ya se calcularon P( y 1兩x1 2, x 2 1) 0.4099 y P( y 1兩x1 2, x 2 0) 0.1880. De acuerdo con estas probabilidades, se ve que entre aquellos clientes que cuyo gasto anual en Simmons Stores es de $2000, los clientes que tienen tarjeta de crédito de Simmons tienen mayor probabilidad de hacer uso del cupón. En la tabla 15.12 se presentan las probabilidades estimadas correspondientes a clientes, tanto con tarjeta de crédito como sin tarjeta de crédito de Simmons, cuyos desembolsos anuales en Simmons Stores son desde $1000 hasta $7000. ¿Cómo puede Simmons emplear esta información para elegir los clientes a los que dirigirá la nueva promoción? Supóngase que Simmons desea enviar este catálogo promocional únicamente a clientes cuya probabilidad de hacer uso del cupón sea 0.40 o mayor. Empleando las probabilidades estimadas que aparecen en la tabla 15.12 la estrategia en esta promoción de Simmons sería: Clientes que tienen tarjeta de crédito de Simmons: Enviar el catálogo a todos los clientes que durante el pasado año hayan gastado $2000 o más.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 670
670
Capítulo 15
TABLA 15.12
Regresión múltiple
PROBABILIDADES ESTIMADAS PARA SIMMONS STORES
Tarjeta de crédito
Sí No
$1000
$2000
Cantidad anual gastada $3000 $4000 $5000
0.3305
0.4099
0.4943
0.5790
0.6593
0.7314
0.7931
0.1413
0.1880
0.2457
0.3143
0.3921
0.4758
0.5609
$6000
$7000
Clientes sin tarjeta de crédito de Simmons: Enviar el catálogo a todos los clientes que durante el pasado año hayan gastado $6000 o más. Sin embargo, observando con más detenimiento las probabilidades estimadas se ve que la probabilidad de que usen el cupón aquellos clientes sin tarjeta de crédito de Simmons que gastaron $5000 en Simmons en un año, es 0.3921. Por lo tanto, será conveniente que Simmons reconsidere su estrategia e incluya en ella a aquellos clientes que no tienen tarjeta de crédito pero que gasten en Simmons $5000 o más en un año.
Interpretación de la ecuación de regresión logística Para interpretar una ecuación de regresión se necesita relacionar las variables independientes de la ecuación con la cuestión de negocios a la que se trató de responder con esa ecuación. En la regresión logística, debido a que la ecuación de regresión logística no es lineal, es difícil interpretar directamente la relación entre las variables independientes y la probabilidad de que y 1. Sin embargo, se ha demostrado que esta relación se puede interpretar indirectamente empleando un concepto llamado cociente de posibilidades (en inglés, odds ratio). Las posibilidades a favor de que ocurra un evento se definen como la probabilidad de que ocurra el evento, dividida entre la probabilidad de que no ocurra el evento. En la regresión logística el evento de interés es siempre y 1. Dado un determinado conjunto de valores de las variables independientes, las posibilidades a favor de y 1 se calculan como sigue: odds
P( y 1冷x1, x 2, . . . , x p) P( y 0冷x1, x 2, . . . , x p)
P( y 1冷x1, x 2, . . . , x p) 1 P( y 1冷x1, x 2, . . . , x p)
(15.33)
El cociente de posibilidades mide el efecto que tiene sobre estas posibilidades el aumento en una unidad de una sola de las variables independientes. El cociente de posibilidades es la probabilidad de que y = 1 cuando una de las variables independientes es incrementada en una unidad (odds1) dividida entre las posibilidades de que y 1 cuando no ha habido cambio en los valores de las variables independientes (odds0). COCIENTE DE POSIBILIDADES
Cociente de posibilidades
odds1 odds0
(15.34)
Por ejemplo, supóngase que se desean comparar las posibilidades de que use el cupón un cliente que gasta $2000 anuales y tiene tarjeta de crédito de Simmons (x1 2 y x2 1) con las posibilidades de que use el cupón un cliente que gasta $2000 anuales y no tiene tarjeta de crédito de Simmons (x1 2 y x2 0). Lo que interesa es interpretar el efecto que tiene un incremento de la variable independiente x2 en una unidad. En este caso odds1
P( y 1冷x1 2, x 2 1) 1 P( y 1冷x1 2, x 2 1)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 671
15.9
671
Regresión logística
y odds0
P( y 1冷x1 2, x 2 0) 1 P( y 1冷x1 2, x 2 0)
Como ya se demostró, la estimación de la probabilidad de que y = 1 cuando x1 = 2 y x2 = 1 es 0.4099 y la estimación de que y = 1 cuando x1 = 2 y x2 = 0 es 0.1880. Por lo tanto, 0.4099 0.6946 1 0.4099
estimación de odds1 y estimación de odds 0
0.1880 0.2315 1 0.1880
La estimación del cociente de posibilidades es Estimación del cociente de posibilidades
0.6946 3.00 0.2315
Por lo tanto, se puede concluir que las posibilidades estimadas de que usen el cupón los clientes que gastaron $2000 el año pasado y tienen tarjeta de crédito de Simmons son tres veces mayores que las posibilidades estimadas de que usen el cupón los clientes que gastaron $2000 el año pasado y no tienen tarjeta de crédito de Simmons. El cociente de posibilidades de cada una de las variables independientes se calcula manteniendo constantes todas las demás variables. Sin embargo, qué valores constantes se usen para todas las demás variables no tiene importancia. Por ejemplo, si se calcula el cociente de posibilidades para la variable tarjeta de crédito de Simmons (x2) empleando, como valor de la variable cantidad de gasto anual (x1), $3000 en lugar de $2000, el valor obtenido para el cociente de posibilidad estimado será el mismo (3.00). Por lo tanto, se concluye que las posibilidades estimadas de que use el cupón un cliente que tiene tarjeta de crédito de Simmons son tres veces mayores que las posibilidades estimadas de que use el cupón un cliente que no tiene tarjeta de crédito de Simmons. El cociente de posibilidades aparece en los resultados estándar de la regresión logística proporcionados por los paquetes de software para estadística. Refiérase a los resultados de Minitab que se presentan en la figura 15.13. En la columna titulada Odds Ratio aparecen los cocientes de posibilidad estimados correspondientes a cada una de las variables independientes. El cociente de posibilidad estimada para x1 es 1.41 y el cociente de posibilidad estimada para x2 es 3.00. Ya se indicó antes cómo interpretar el coeficiente de posibilidad estimada en el caso de la variable binaria independiente x2. Ahora se considerará la interpretación del cociente de posibilidades en el caso de la variable continua independiente x1. El valor 1.41 en la columna titulada Odds Ratio (cociente de posibilidades) de los resultados de Minitab indica que la posibilidad estimada de que use el cupón un cliente que gastó $3000 durante el año pasado es 1.41 veces mayor que la probabilidad estimada de que use el cupón un cliente que gastó $2000 durante el año pasado. Más aún, esta interpretación es correcta para cualquier cambio en una unidad de x1. Por ejemplo, las posibilidades estimadas de que use el cupón un cliente cuyo gasto anual el año pasado fue $5000 son 1.41 veces mayores que las probabilidades estimadas de que use el cupón un cliente cuyo gasto anual el año pasado fue $4000. Pero, supóngase que interesa la variación en las posibilidades cuando hay un incremento de más de una unidad en cualquiera de las variables independientes. Obsérvese que x1 toma valores desde 1 hasta 7. El cociente de posibilidades presentado en los resultados de Minitab no responde a esta pregunta. Para responder a esta pregunta es necesario explorar la relación entre el cociente de posibilidades y los coeficientes de regresión. Existe una relación única entre el cociente de posibilidades de una variable y su correspondiente coeficiente de regresión. Se puede demostrar que para toda variable independiente de una ecuación de regresión logística Cociente de posibilidades e βi
15Ander(624-692).qxd 2/29/08 11:06 AM Page 672
672
Capítulo 15
Regresión múltiple
Para ilustrar esta relación, empleando el ejemplo de Simmons Stores considérese la variable independiente x1. El cociente de posibilidades estimado para x1 es Cociente de posibilidades estimado e b1 e 0.3416 1.41 De manera similar, el cociente de posibilidades estimado para x2 es Cociente de posibilidades estimado e b 2 e1.0987 3.00 Esta relación entre el cociente de posibilidades y los coeficientes de las variables independientes facilitan el cálculo del cociente de posibilidades una vez obtenidas las estimaciones de los parámetros del modelo. Además, esto permite también investigar cambios en el cociente de posibilidades cuando hay cambios mayores o menores a una unidad en una de las variables continuas independientes. El cociente de posibilidades de una variable independiente representa la variación que hay en las posibilidades por una variación de una unidad en la variable independiente permaneciendo constantes todas las demás variables independientes. Supóngase que se desea conocer el efecto de una variación de más de una unidad, por ejemplo de c unidades. Supóngase que, en el ejemplo de Simmons, se quieren comparar las posibilidades de que use el cupón un cliente que gasta $5000 anuales (x1 5) con las posibilidades de que use el cupón un cliente que gasta $2000 anuales (x1 2). En este caso c 5 2 3 y el correspondiente cociente de posibilidades es e cb1
e3(0.3416)
e1.0248
2.79
Esto indica que las posibilidades estimadas de que usen el cupón los clientes cuyo gasto anual es de $5000 son 2.70 veces mayores que las posibilidades estimadas de que usen el cupón los clientes cuyo gasto anual es de $2000. En otras palabras, el cociente de posibilidades estimado para un aumento de $3000 en los gastos anuales es 2.79. En general, el cociente de posibilidades permite comparar las posibilidades de dos eventos diferentes. Si el cociente de posibilidades es 1, los dos eventos tienen las mismas posibilidades. Por lo tanto, si la variable independiente que se considera (como, por ejemplo, el estatus respecto a la tarjeta de crédito de Simmons) tiene efecto positivo sobre la probabilidad de que ocurra el evento el cociente de posibilidades correspondiente será mayor a 1. La mayor parte de los paquetes de software para estadística dan también un intervalo de confianza para el cociente de posibilidades. En la figura 15.13 los resultados de Minitab presentados proporcionan un intervalo de 95% de confianza para cada uno de los cocientes de posibilidades. Por ejemplo, la estimación puntual del cociente de posibilidad de x1 es 1.41 y el intervalo de 95% de confianza va de 1.09 a 1.81.Como el intervalo de confianza no contiene el valor 1, se concluye que x1 tiene un efecto significativo sobre el cociente de posibilidades estimado. De manera similar, el intervalo de 95% de confianza para el cociente de posibilidades de x2 va de 1.25 a 7.17. Como este intervalo tampoco contiene el valor 1, se puede concluir también que x2 tiene un efecto significativo sobre el cociente de posibilidades.
Transformación logit Entre las posibilidades a favor de y 1 y el exponente de e en la ecuación de regresión logística, se puede observar una interesante relación. Se puede demostrar que ln(odds) β0 β1x1 β2 x 2 . . . βp x p Esta ecuación indica que el logaritmo natural de las posibilidades a favor de y = 1 es función lineal de las variables independientes. A esta función lineal se le llama logit. Para denotar el logit se empleará la notación g(x1, x2, . . ., xp,). LOGIT
g(x1, x 2 , . . . , x p ) β0 β1x1 β2 x 2 . . . βp x p
(15.35)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 673
15.9
673
Regresión logística
Sustituyendo en la ecuación (15.27) β1 β1x1 β 2 x 2 . . . βp x p por g(x1, x2, . . ., xp,), la ecuación de regresión logística se puede expresar como E( y)
e g(x1, x 2,..., xp) 1 e g(x1, x 2,..., xp)
(15.36)
Una vez estimados los parámetros de la ecuación de regresión logística, se puede calcular una estimación del logit. Empleando ĝ(x1, x 2 , . . . , x p ) para denotar el logit estimado, se tiene LOGIT ESTIMADO
ĝ(x1, x 2 , . . . , x p ) b0 b1x1 b2 x 2 . . . bp x p
(15.37)
Por lo tanto, en términos del logit estimado, la ecuación de regresión estimada es e b0 b1x1 b2 x2 bp xp e ĝ(x1, x2,..., xp) ... 1 e b0 b1x1 b2 x2 bp xp 1 e ĝ(x1, x2,..., xp) ...
ŷ
(15.38)
En el ejemplo de Simmons Stores, el logit estimado es ĝ(x1, x 2) 2.1464 0.3416x1 1.0987x 2 y la ecuación de regresión estimada es ŷ
e ĝ(x1, x2) e 2.1464 0.3416x1 1.0987x2 ĝ(x1, x2) 1 e 1 e 2.1464 0.3416x1 1.0987x2
Por lo tanto, debido a la relación única que existe entre el logit estimado y la ecuación de regresión logística estimada, es posible calcular las probabilidades estimadas para Simmons Stores dividiendo e ĝ(x1, x 2) entre 1 e ĝ(x1, x 2). NOTAS Y COMENTARIOS 1. Debido a la relación única que existe entre los coeficientes estimados del modelo y los correspondientes cocientes de posibilidades, la prueba general de significancia basada en el estadístico G es también una prueba general de significancia para los cocientes de posibilidades. Además, la prueba z para la significancia de cada uno de los parámetros del modelo es también una prueba estadística para los correspondientes cocientes de posibilidades.
2. En la regresión simple y en la regresión múltiple, se usa el coeficiente de determinación para medir la bondad de ajuste. En la regresión logística no hay una sola medida que tenga una interpretación similar. El estudio de la bondad de ajuste queda fuera del alcance de esta introducción a la regresión logística.
Ejercicios
Aplicaciones
archivo CD en Simmons
44. Vaya al ejemplo de Simmons Stores presentado en esta sección. La variable dependiente es y =1 si el cliente usó el cupón y y 0 si no lo usó. Supóngase que la única información de que se dispone para predecir si un cliente usará o no el cupón es el estatus del cliente respecto a la posesión de una tarjeta de crédito de la empresa, que es x 1 si el cliente tiene tarjeta de crédito de Simmons y x 0 si no es así. a. Dé la ecuación de regresión logística que relaciona x y y. b. ¿Cuál es la interpretación de E(y) cuando x 0?
15Ander(624-692).qxd 2/29/08 11:06 AM Page 674
674
Capítulo 15
c. d.
e.
Regresión múltiple
Empleando los datos de Simmons presentados en la tabla 15.11, use Minitab para calcular el logit estimado. Empleando el logit estimado obtenido en el inciso c), obtenga una estimación de la probabilidad de que usen el cupón los clientes que no tienen tarjeta de crédito de Simmons y una estimación de la probabilidad de que usen el cupón los clientes que no tienen tarjeta de crédito de Simmons. De la estimación del cociente de posibilidades. ¿Cuál es su interpretación?
45. En la tabla 15.12 se proporcionaron estimaciones de las probabilidades de uso del cupón en la promoción mediante catálogo de Simmons Stores. Para cada combinación de valores de las variables independientes se obtuvo un valor diferente. a. Calcule las posibilidades de que use el cupón un cliente cuyo gasto anual en Simmons es de $4000 y que no tiene tarjeta de crédito de Simmons (x1 4, x2 0). b. Use la información de la tabla 15.12 y el inciso a) para calcular el cociente de posibilidades para la variable tarjeta de crédito de Simmons x2 0 manteniendo constantes los gastos anuales en x1 4. c. En el libro, el cociente de posibilidades para la variable tarjeta de crédito se calculó empleando la información presentada en la columna $2000 de la tabla 15.12. ¿Obtuvo, en el inciso b), la misma información para el valor del cociente de posibilidades? 46. El Community Bank desea aumentar la cantidad de clientes a los que les depositan directamente su nómina. El gerente está considerando una campaña que requerirá que cada gerente de sucursal llame a cada cliente que no reciba directamente su nómina. Como incentivo para aceptar recibir directamente su nómina, se les ofrecerá revisión gratuita de su cuenta durante dos años. Debido al tiempo y a los costos de esta campaña, el gerente desea que esta campaña se dirija a aquellos clientes que tengan la mayor probabilidad de aceptar recibir directamente su nómina. El gerente piensa que el saldo promedio mensual en la cuenta de cheques del cliente puede ser un predictor útil para determinar si un cliente aceptará o no recibir directamente su nómina. Para investigar la relación entre estas dos variables, Community Bank prueba la nueva campaña utilizando una muestra de cuentas de cheques de 50 clientes que actualmente no reciben directamente su nómina. En los datos muestrales se presenta el saldo mensual promedio en la cuenta de cheques (en miles de dólares) y si el cliente aceptó recibir directamente el depósito de su nómina (1 significa aceptó el depósito directo de su nómina y 0 significa el cliente no aceptó el depósito directo de su nómina). Estos datos se encuentran en el archivo Bank del disco compacto; a continuación se presenta parte de estos datos.
archivo CD en Bank
a. b. c.
Cliente
x ⴝ saldo mensual
y ⴝ depósito directo
1 2 3 4 5 6 7 8 . . . 48 49 50
1.22 1.56 2.10 2.25 2.89 3.55 3.56 3.65 . . . 18.45 24.98 26.05
0 0 0 0 0 0 0 1 . . . 1 0 1
Dé la ecuación de regresión logística que relaciona x y y. Empleando los datos de Community Bank, use Minitab para calcular la ecuación de regresión logística estimada. Realice una prueba de significancia empleando el estadístico de prueba G. Use α 0.05.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 675
15.9
675
Regresión logística
d. e.
f.
Estime la probabilidad de que los clientes cuyo saldo mensual promedio sea $1000 acepten recibir directamente el depósito de su nómina. Supóngase que Community Bank desea contactar únicamente a los clientes para los que la probabilidad de aceptar recibir directamente su nómina sea de 0.50 o mayor. ¿Cuál es el saldo promedio requerido para tener esta probabilidad? Dé la estimación del cociente de posibilidades. ¿Cuál es su interpretación?
47. En los últimos años en Lakeland Collage ha aumentado el porcentaje de estudiantes que abandonan sus estudios después del primer año. El año pasado, Lakeland Collage inició un programa voluntario de orientación para ayudar a los estudiantes de primer año a que se adapten a la vida del campus. Si Lakeland Collage demuestra que ese programa tiene resultados positivos, se considerará la posibilidad de que el programa sea obligatorio para todos los estudiantes de primer año. La administración de Lakeland Collage supone que los estudiantes que tienen GPA bajo son los que tienen mayor probabilidad de abandonar los estudios al final del primer año. Con objeto de investigar la relación de estas variables con la permanencia de los estudiantes en la escuela, Lakeland Collage tomó una muestra aleatoria de 100 estudiantes de primer año. Los datos se encuentran en el archivo Lakeland del disco compacto; a continuación se reproduce parte de esos datos.
Estudiante 1 2 3 4 5 6
archivo CD en Lakeland
. . . 98 99 100
GPA
Programa
Resultado
3.78 2.38 1.30 2.19 3.22 2.68 . . . 2.57 1.70 3.85
1 0 0 1 1 1 . . . 1 1 1
1 1 0 0 1 1 . . . 1 1 1
La variable dependiente toma el valor y 1 si el estudiante permanece en la escuela y y 0 si no es así. Las dos variables independientes son x 1 GPA al final del primer semestre x2 a. b. c. d. e. f.
g. h.
再
0 si el estudiante participa en el programa de orientación 1 si el estudiante no participa en el programa de orientación
Dé la ecuación de regresión logística que relaciona x1 y x2 con y. Dé la interpretación de E(y) cuando x2 = 0. Use las dos variables independientes y Minitab para calcular el logit estimado. Realice una prueba de significancia global empleando α = 0.05. Empleando α 0.05, determine si cada una de las variables independientes son significativas. Use el logit estimado del inciso c) para obtener una estimación de la probabilidad de que un estudiante cuyo GPA es 2.5 y que no participó en el programa de orientación permanezca en la escuela. ¿Cuál es la estimación de esta probabilidad para un estudiante cuyo GPA es 2.5 y que sí participó en el programa de orientación? Dé la estimación del cociente de posibilidades para el programa de orientación. Interprételo. ¿Recomendaría convertir el programa de orientación en un programa obligatorio? ¿Por qué sí o por qué no?
48. Consumer Report le realizó una prueba de sabor a 19 marcas de chocolates. En los datos a continuación se da el precio por porción, en base al tamaño de porción de la FDA que es de 1.4 onzas, así como una evaluación de la calidad de los 19 chocolates tomados para la prueba (Consumer Report, febrero 2002).
15Ander(624-692).qxd 2/29/08 11:06 AM Page 676
676
Capítulo 15
Regresión múltiple
Fabricante Bernard Callebaut Candinas Fannie May Godiva Hershey’s L.A. Burdick La Maison du Chocolate Leonidas Lindt Martine’s Michael Recchiuti Neuchatel Neuchatel Sugar Free Richard Donnelly Russell Stover See’s Teuscher Lake of Zurich Whitman’s Whitman’s Sugar Free
archivo CD en Chocolate
Precio
Evaluación
3.17 3.58 1.49 2.91 0.76 3.70 5.08 2.11 2.20 4.76 7.05 3.36 3.22 6.55 0.70 1.06 4.66 0.70 1.21
muy bueno excelente bueno muy bueno bueno muy bueno excelente muy bueno bueno excelente muy bueno bueno bueno muy bueno bueno muy bueno muy bueno regular regular
Suponga que desea determinar si los productos que son más caros son mejor evaluados. Para los propósitos de este ejercicio, emplee la siguiente variable binaria dependiente. y = 1 si la evaluación de la calidad fue excelente o muy buena y y = 0 si la evaluación de la calidad fue buena o regular. a. b. c.
d.
Dé la ecuación de regresión logística que relaciona x = precio por porción con y. Use Minitab para calcular el logit estimado. Use el logit estimado que obtuvo en el inciso b) para obtener una estimación de la probabilidad de que la evaluación de un chocolate cuyo precio por porción es $4.00 sea muy bueno o excelente. Dé la estimación del cociente de posibilidades. Dé su interpretación.
Resumen En este capítulo se presentó la regresión múltiple como extensión del análisis de regresión lineal simple presentado en el capítulo 14. El análisis de regresión múltiple permite entender cómo está relacionada una variable dependiente con dos o más variables independientes. La ecuación de regresión E( y) β0 β1x1 β 2x 2 . . . βp x p indica que el valor esperado o valor medio de la variable dependiente y está relacionado con los valores de las variables independientes x1¸ x2¸ . .., xp. Para obtener la ecuación de regresión estimada ŷ b0 b1x1 b2x 2 . . . bp x p se emplean los datos muestrales y el método de mínimos cuadrados. En efecto b1¸ b2¸ . . ., bp son estadísticos muestrales que se emplean para estimar los parámetros desconocidos β0, β1, β2, . . . , βp del modelo. Para hacer énfasis en el hecho de que los paquetes de software para estadística son los únicos medios realistas para realizar los numerosos cálculos que se requieren en el análisis de regresión múltiple, a lo largo de todo el capítulo se emplearon las impresiones de computadora. El coeficiente de determinación múltiple se presentó como una medida de la bondad de ajuste de la ecuación de regresión estimada. Este coeficiente determina la proporción de la variación en y que puede ser explicada por la ecuación de regresión estimada. El coeficiente de determinación múltiple ajustado es una medida similar de bondad de ajuste que se adapta al número de variables independientes evitando, de esta manera, sobreestimar el efecto de la adición de más variables independientes. Como un medio para determinar estadísticamente si la relación entre las variables era significativa se presentaron una prueba F y una prueba t. La prueba F sirve para determinar si existe
15Ander(624-692).qxd 2/29/08 11:06 AM Page 677
Glosario
677
una relación global significativa entre la variable dependiente y el conjunto de todas las variables independientes. La prueba t se usa para determinar si existe una relación significativa entre la variable dependiente y una determinada variable independiente del modelo de regresión. Se trató la relación entre las variables independientes, a lo cual se le llama multicolinearidad. En la sección sobre variables cualitativas independientes se mostró el uso de variables ficticias para incorporar datos cualitativos en el análisis de regresión múltiple. En la sección sobre análisis residual se mostró el uso del análisis residual para confirmar las suposiciones del modelo, detectar observaciones atípicas e identificar observaciones influyentes. Se estudiaron los residuales estandarizados, la influencia, los residuales eliminados estudentizados y la medida de la distancia de Cook. El capítulo se concluyó con una sección sobre el uso de la regresión logística para modelar situaciones en las que la variable dependiente sólo puede asumir dos valores.
Glosario Análisis de regresión múltiple Análisis de regresión en el que hay dos o más variables independientes. Modelo de regresión múltiple Ecuación matemática que describe cómo está relacionada la variable dependiente y con las variables independientes x1, x2, . . ., xp y con el término del error . Ecuación de regresión múltiple Ecuación matemática que relaciona el valor esperado o valor medio de la variable dependiente con los valores de las variables independientes. Es decir E( y) β0 β1x1 β 2 x 2 . . . βp x p. Ecuación de regresión múltiple estimada Estimación de la ecuación de regresión múltiple que se basa en datos muestrales y en el método de mínimos cuadrados; es ŷ b0 b1x1 b2 x 2 . . . bp x p. Método de mínimos cuadrados Método empleado para obtener la ecuación de regresión estimada. Mediante este método se minimiza la suma de los cuadrados de los residuales (la desviación (diferencia) que existe entre los valores observados de la variable dependiente, yi, y los valores estimados de la variable dependiente ŷi ) Coeficiente de determinación múltiple Medida de la bondad de ajuste de la ecuación de regresión múltiple estimada. Se puede interpretar como la proporción en la variabilidad de la variable dependiente que es explicada por la ecuación de regresión estimada. Coeficiente de determinación múltiple ajustado Medida de la bondad de ajuste de la ecuación de regresión múltiple estimada, pero modifica de acuerdo con el número de variables independientes en el modelo para evitar, de esta manera, sobreestimar el efecto que tiene agregar más variables independientes. Multicolinealidad Término usado para describir la correlación entre las variables independientes. Variable cualitativa independiente Variable independiente con datos cualitativos. Variable ficticia Variable usada para modelar el efecto de las variables cualitativas independientes. Las variables ficticias sólo toman los valores cero y uno. Influencia Mide qué tan lejos de su media se encuentran los valores de las variables independientes. Observación atípica Observación que se sale del patrón que sigue el resto de las observaciones. Residuales eliminados estudentizados Residuales estandarizados que se basan en un error estándar de estimación corregido que se obtuvo al eliminar la observación i del conjunto de datos y realizar después el análisis de regresión y los cálculos. Observación influyente Observación que tiene una gran influencia en los resultados de la regresión. Medida de la distancia de Cook Medida de la influencia de una observación que se basa tanto en la influencia (leverage) de la observación i como en el residual de la observación i. Ecuación de regresión logística Ecuación matemática que relaciona E(y), la probabilidad de que y 1, con los valores de las variables independientes; es decir E( y) P( y 1兩x1, x2, . . . , xp) ... e β0 β1x1 β2 x2 βp xp β0 β1x1 β2 x 2 . . . βp xp . 1 e
15Ander(624-692).qxd 2/29/08 11:06 AM Page 678
678
Capítulo 15
Regresión múltiple
Ecuación de regresión logística estimada Estimación de la ecuación de regresión logística que se basa en datos muestrales; es decir ŷ estimación de P( y 1兩x1, x2, . . . , xp ) ...
eb0 b1x1 b2x2 bp xp . ... 1 eb0 b1x1 b2x2 bp xp Posibilidades a favor de la ocurrencia de un evento Probabilidad de que ocurra el evento entre la probabilidad de que no ocurra el evento. Cociente de posibilidades El cociente que se obtiene al dividir la posibilidad de que y 1 dado que una de las variables independientes aumentó en una unidad (odds1) entre la posibilidad de que y = 1 dado que no hay ninguna variación en los valores de las variables independientes (odds0); es decir, cociente de posibilidades (odds ratio) (odds1)/(odds0). Logit Logaritmo natural de las posibilidades a favor de y 1; es decir g(x1, x2, . . . , xp) β0 β1x1 β 2 x 2 . . . βp x p. Logit estimado Estimación del logit basada en datos muestrales; es decir ĝ(x1, x2, . . . , xp) b0 b1x1 b2 x 2 . . . bp x p.
Fórmulas clave Modelo de regresión múltiple y β0 β1x1 β2 x 2 . . . βp xp
(15.1)
Ecuación de regresión múltiple E( y) β0 β1x1 β2 x 2 . . . βp xp
(15.2)
Ecuación de regresión múltiple estimada ŷ b0 b1x1 b2 x2 . . . bp xp
(15.3)
Criterio de mínimos cuadrados min 兺( yi ŷi )2
(15.4)
STC SCR SCE
(15.7)
Relación entre STC, SCR y SCE
Coeficiente de determinación múltiple R2
SCR STC
(15.8)
Coeficiente de determinación múltiple ajustado R 2a 1 (1 R 2)
n 1 n p 1
(15.9)
Cuadrado medio debido a la regresión SCR CMR p
(15.12)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 679
679
Fórmulas clave
Cuadrado medio debido al error CME
SCE n p 1
(15.13)
Estadístico de prueba F F
CMR CME
(15.14)
Estadístico de prueba t b t si bi
(15.15)
Residual estandarizado de la observación i yi ŷi syi ŷi
(15.23)
syi ŷi s 兹1 hi
(15.24)
Desviación estándar del residual i
Medida de la distancia de Cook Di
( yi ŷi )2 hi 2 ( p 1)s (1 hi )2
冤
冥
(15.25)
Ecuación de regresión logística e β0 β1x1 β2 x 2 βp xp ... 1 e β0 β1x1 β2 x 2 βp xp ...
E( y)
(15.27)
Ecuación de regresión logística estimada e b0 b1x1 b2 x 2 bp xp ... 1 e b0 b1x1 b2 x 2 bp xp ...
ŷ estimación de P( y 1冷x1, x 2, . . . , xp )
(15.30)
Cociente de posibilidades (odds ratio) Cociente de posibilidades (Odds ratio)
odds1 odds0
(15.34)
Logit g(x1, x 2 , . . . , x p ) β0 β1x1 β2 x 2 . . . βp x p
(15.35)
ĝ(x1, x 2 , . . . , x p ) b0 b1x1 b2 x 2 . . . bp x p
(15.37)
Logit estimado
15Ander(624-692).qxd 2/29/08 11:06 AM Page 680
680
Capítulo 15
Regresión múltiple
Ejercicios complementarios 49. El departamento de admisión de Clearwater Collage obtuvo la siguiente ecuación de regresión estimada en la que relaciona el promedio final obtenido en la universidad (GPA) con la puntuación del estudiante en el área de matemáticas del examen de admisión a la universidad (SAT) y con su promedio final (GAP) en bachillerato. y 1.41 0.0235x1 0.00486x2 ^
donde x1 promedio final en el bachillerato x2 puntuación en el área de matemáticas admisión (SAT) y promedio final en la universidad a. b.
Interprete los coeficientes de esta ecuación de regresión estimada. Estime el promedio final (GPA) en la universidad de un estudiante cuyo promedio en el bachillerato sea 84 y cuya puntuación en el área de matemáticas del examen de admisión (SAT) es 540.
50. El director de personal de Electronics Associates obtuvo la siguiente ecuación de regresión estimada que relaciona la puntuación obtenida por un empleado en un examen sobre su satisfacción con el trabajo con la antigüedad y el salario del empleado. ŷ 14.4 8.69x1 13.5x2 donde x1 antigüedad (años) x2 salario (dólares) y puntuación en el examen sobre satisfacción con el trabajo (puntuaciones más altas corresponden a mayor satisfacción con el trabajo) a. b.
Interprete los coeficientes de esta ecuación de regresión estimada. Estime la puntuación obtenida en el examen sobre satisfacción con el trabajo que tendrá un empleado cuya antigüedad es de cuatro años y que gana $6.50 por hora.
51. A continuación se presentan los resultados, incompletos, obtenidos con un paquete de software para un análisis de regresión. The regression equation is Y = 8.103 + 7.602 X1 + 3.111 X2 Predictor Constant X1 X2 S = 3.335
Coef _______ _______ _______
SE Coef 2.667 2.105 0.613
R-sq = 92.3%
T _____ _____ _____
R-sq(adj) = _____%
Analysis of Variance SOURCE Regression Residual Error Total
DF ______ 12 ______
SS 1612 ______ ______
MS ______ ______
F _____
15Ander(624-692).qxd 2/29/08 11:06 AM Page 681
681
Ejercicios complementarios
a. b. c. d.
Calcule los cocientes t adecuados Pruebe la significancia de β1 y β 2 empleando α 0.05. Calcule las cantidades que faltan en las columnas DF, SS y MS. Calcule R 2a.
52. En el ejercicio 49, se vio que el departamento de admisión de Clearwater Collage obtuvo la siguiente ecuación de regresión estimada en la que relacionaba el promedio final obtenido en la universidad (GPA) con la puntuación de un estudiante en el área de matemáticas del examen de admisión a la universidad (SAT) y con su promedio final (GAP) en bachillerato. ŷ
1.41 0.0235x1 0.00486x2
donde x1 promedio final en el bachillerato x2 puntuación en el área de matemáticas del examen de admisión (SAT) y promedio final en la universidad A continuación se presentan los resultados, incompletos, obtenidos con Minitab.
The regression equation is Y = -1.41 + .0235 X1 + .00486 X2 Predictor Constant X1 X2
Coef -1.4053 0.023467 ______
SE Coef 0.4848 0.008666 0.001077
S = 0.1298
R–sq = ______
T _____ _____ _____
R–sq(adj) = ______
Analysis of Variance SOURCE Regression Residual Error Total
a. b. c. d.
DF _____ _____ 9
SS 1.76209 _______ 1.88000
MS _____ _____
F _____
Calcule las cantidades faltantes en estos resultados. Calcule F y empleando como nivel de significancia a = 0.05 pruebe si existe una relación significativa. ¿Proporciona la ecuación de regresión estimada un buen ajuste a los datos? Explique. Use la prueba t y α 0.05 para probar H0: β1 0 y H0: β 2 0.
53. En el ejercicio 50 se vio que el director de personal de Electronics Associates obtuvo la siguiente ecuación de regresión estimada que relacionaba la puntuación obtenida por un empleado en un examen sobre su satisfacción con el trabajo con la antigüedad y el salario del empleado. ŷ 14.4 8.69x1 13.5x2 donde x1 antigüedad (años) x2 salario (dólares) y puntuación en el examen sobre satisfacción con el trabajo (puntuaciones más altas corresponden a mayor satisfacción con el trabajo)
15Ander(624-692).qxd 2/29/08 11:06 AM Page 682
682
Capítulo 15
Regresión múltiple
A continuación se presentan los resultados, incompletos, obtenidos con Minitab The regression equation is Y = 14.4 – 8.69 X1 + 13.52 X2 Predictor Constant X1 X2
Coef 14.448 ______ 13.517
SE Coef 8.191 1.555 2.085
S = 3.773
R–sq = ______%
T 1.76 _____ _____
R–sq(adj) = ______%
Analysis of Variance SOURCE Regression Residual Error Total
a. b. c. d.
DF 2 _____ 7
SS ______ 71.17 720.0
MS _____ _____
F _____
Calcule las cantidades faltantes en estos resultados. Calcule F y empleando como nivel de significancia 0.05 pruebe si la relación es significativa. ¿Proporciona la ecuación de regresión estimada un buen ajuste a los datos? Explique. Use la prueba t y α 0.05 para probar H0: β1 0 y H0: β 2 0.
54. La revista SmartMoney evaluó 65 zonas metropolitanas para determinar si el valor de las casas (home values) estaba cambiando (are headed). La puntuación para una ciudad ideal era 100 y significaba que todos los factores medidos eran tan favorables como era posible. Zonas cuya puntuación era 60 o más, eran zonas en las que era posible una revalorización de los precios; zonas cuya puntuación era menor a 50 eran zonas que podrían ver una disminución en el valor de la vivienda. Dos de los factores evaluados fueron resistencia a la recesión y accesibilidad de la zona. Estos dos factores se evaluaron empleando una escala de 0 (evaluación más baja) a 10 (evaluación más alta). A continuación se presentan los datos obtenidos en una muestra de 20 ciudades evaluadas por SmartMoney (SmartMoney, febrero de 2002).
Área metropolitana
archivo CD en HomeValue
Tucson Fort Worth San Antonio Richmond Indianapolis Philadelphia Atlanta Phoenix Cincinnati Miami Hartford Birmingham San Diego Raleigh Oklahoma City Orange County Denver Los Ángeles Detroit Nueva Orleáns
Resistencia a la recesión
Accesibilidad
Puntuación
10 10 6 8 4 0 2 4 2 6 0 0 8 2 1 4 4 0 0 0
7 7 8 6 8 10 6 5 7 5 7 8 2 7 6 2 4 7 5 5
70.7 68.5 65.5 63.6 62.5 61.9 60.7 60.3 57.0 56.5 56.2 55.7 54.6 50.9 49.6 49.1 48.6 45.7 44.3 41.2
15Ander(624-692).qxd 2/29/08 11:06 AM Page 683
683
Ejercicios complementarios
a.
b. c.
Dé una ecuación de regresión estimada que sirva para dar la puntuación conociendo la resistencia a la recesión. Empleando como nivel de significancia 0.05, pruebe la significancia de la relación ¿Proporciona la ecuación obtenida en el inciso a) un buen ajuste a los datos? Explique. Obtenga una ecuación de regresión estimada que sirva para predecir la puntuación a partir de la resistencia a la recesión y la accesibilidad. Empleando como nivel de significancia 0.05 pruebe la significancia global.
55. Consumer Reports examinó ampliamente y presentó las evaluaciones de 24 caminadoras. A cada caminadora se le dio una calificación general que se basaba principalmente en su facilidad de uso, ergonomía, gama de ejercicio y calidad. En general, una mejor calificación corresponde a un mejor funcionamiento. En la información a continuación se presenta el precio, la evaluación de la calidad y la puntuación general de las 24 caminadoras (Consumer Reports, febrero de 2006).
Marca y modelo
archivo CD en Treadmills
Landice L7 NordicTrack S3000 SportsArt 3110 Precor True Z4 HRC Vision Fitness T9500 Precor M 9.31 Vision Fitness T9200 Star Trac TR901 Trimline T350HR Schwinn 820p Bowflex 7-Series NordicTrack S1900 Horizon Fitness PST8 Horizon Fitness 5.2T Evo by Smooth Fitness FX30 ProForm 1000S Horizon Fitness CST4.5 Keys Fitness 320t Smooth Fitness 7.1HR Pro NordicTrack C2300 Spirit Inspire ProForm 750 Image 19.0 R
a. b. c.
Precio
Calidad
Calificación
2900 3500 2900 3500 2300 2000 3000 1300 3200 1600 1300 1500 2600 1600 1800 1700 1600 1000 1200 1600 1000 1400 1000 600
Excelente Muy buena Excelente Excelente Excelente Excelente Excelente Muy buena Muy buena Muy buena Muy buena Excelente Muy buena Muy buena Muy buena Muy buena Muy buena Muy buena Muy buena Muy buena Bueno Muy buena Buena Buena
86 85 82 81 81 81 79 78 72 72 69 83 83 82 80 75 75 74 73 73 70 70 67 66
Con estos datos obtenga una ecuación de regresión estimada que sirva para estimar la calificación general cuando se conoce el precio. Use α 0.05 para probar la significancia general. Para incorporar el efecto de la calidad, una variable cualitativa de tres niveles, se emplearon dos variables ficticias. Calidad-E y Calidad-MB. Cada variable toma los valores 0 y 1 como sigue. Calidad-E Calidad-MB
再 再
1 si evaluación de la calidad es excelente 0 si no es así 1 si evaluación de la calidad es muy buena 0 si no es así
Obtenga una ecuación de regresión estimada que sirva para estimar la puntuación general cuando se conoce el precio y la evaluación de la calidad.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 684
684
Capítulo 15
d. e. f. g. h.
Regresión múltiple
Empleando α 0.10 pruebe la significancia general de la ecuación de regresión estimada obtenida en el inciso c). Use la prueba t para determinar la significancia de cada una de las variables independientes de la ecuación de regresión estimada obtenida en el inciso c). Use α = 0.10. Dé la gráfica de los residuales estandarizados. ¿Parece razonable la forma de la gráfica de residuales? ¿Hay en estos datos alguna observación atípica o alguna observación influyente? Estime la calificación general dada a una caminadora cuyo precio es $2000 y que como evaluación de su calidad obtuvo buena. ¿Cuánto varía esta estimación si la evaluación de la calidad es muy buena? Explique.
56. La Fuel Economy Guide (guía de economía de combustible) del Departamento de energía de Estados Unidos proporciona datos sobre el rendimiento del combustible en automóviles y camiones. A continuación se presenta una parte de los datos obtenidos para 35 camiones furgonetas estándar producidos por Chevrolet y General Motors (www.fueleconomy.gov, 21 de marzo de 2003). En la columna titulada tracción se indica si el vehículo tiene tracción en dos ruedas (2WD) o tracción en cuatro ruedas (4WD). En la columna titulada desplazamiento se da el desplazamiento del motor en litros, en la columna titulada cilindros se especifica la cantidad de cilindros que tiene el motor, y en la columna titulada transmisión se indica si la furgoneta tiene transmisión automática o manual. En la columna titulada ciudad mpg se da el rendimiento de combustible en ciudad, en millas por galón (mpg).
Camión
archivo CD en FuelEcon
1 2 3 4 5 . . . 32 33 34 35
a.
b.
c. d.
e.
Nombre C1500 Silverado C1500 Silverado C1500 Silverado C1500 Silverado C1500 Silverado . . . K1500 Sierra K1500 Sierra Sonoma Sonoma
Tracción Desplazamiento Cilindros 2WD 2WD 2WD 2WD 2WD . . . 4WD 4WD 4WD 4WD
4.3 4.3 4.8 4.8 5.3 . . . 5.3 5.3 4.3 4.3
6 6 8 8 8 . . . 8 8 6 6
Transmisión
Ciudad MPG
Auto Manual Auto Manual Auto . . . Auto Auto Auto Manual
15 15 15 16 11 . . . 15 15 17 15
Dé una ecuación de regresión estimada que sirva para predecir el consumo de combustible en la ciudad cuando se conoce el desplazamiento del motor. Haga una prueba de significancia empleando α 0.05. Agregue la variable ficticia Tracción4, que toma el valor 0 si la furgoneta tiene tracción en dos ruedas y 1 si tiene tracción en cuatro ruedas. Obtenga una ecuación de regresión estimada que sirva para predecir el consumo de combustible en ciudad cuando se conoce el desplazamiento del motor y el valor de la variable ficticia Tracción4. Use α 0.05 para determinar si la variable ficticia agregada en el inciso b) es significativa. Agregue la variable ficticia OchoCil, que toma el valor 0 si la furgoneta tiene motor de seis cilindros y el valor 1 si la furgoneta tiene motor de ocho cilindros. Obtenga la ecuación de regresión estimada que sirva para predecir el rendimiento de combustible en ciudad cuando se conoce el desplazamiento del motor y el valor de las variables ficticias Tracción4 y OchoCil. Pruebe la significancia global y la significancia de cada una de las variables en la ecuación obtenida en el inciso d). Use α 0.05.
57. En el mercado actual se ofrece una amplia variedad de vehículos utilitarios deportivos o SUV (acrónimo en inglés de Sport Utility Vehicle) y de pickups. Para muchos de los compradores es un factor importante el valor de reventa del vehículo. En la tabla siguiente se presenta el valor de reventa (%) después de dos años y se sugiere el precio de 10 SUV, de 10 pickups pequeñas y de 10 pickups grandes (Kipkinger’s New Cars & Truckers 2000 Buyer’s Guide).
15Ander(624-692).qxd 2/29/08 11:06 AM Page 685
Caso problema 1
685
Consumer Research, Inc.
Tipo de vehículo
archivo CD en Trucks
Chevrolet Blazer LS Ford Explorer Sport GMC Yukon XL 1500 Honda CR-V Isuzu VehiCross Jeep Cherokee Limited Mercury Mountaineer Nissan Pathfinder XE Toyota 4Runner Toyota RAV4 Chevrolet S-10 Extended Cab Dodge Dakota Club Cab Sport Ford Ranger XLT Regular Cab Ford Ranger XLT Supercab GMC Sonoma Regular Cab Isuzu Hombre Spacecab Mazda B4000 SE Cab Plus Nissan Frontier XE Regular Cab Toyota Tacoma Xtracab Toyota Tacoma Xtracab V6 Chevrolet K2500 Chevrolet Silverado 2500 Ext Dodge Ram 1500 Dodge Ram Quad Cab 2500 Dodge Ram Regular Cab 2500 Ford F150 XL Ford F-350 Super Duty Crew Cab XL GMC New Sierra 1500 Ext Cab Toyota Tundra Access Cab Limited Toyota Tundra Regular Cab
a.
b. c. d.
Caso problema 1
utilitario deportivo utilitario deportivo utilitario deportivo utilitario deportivo utilitario deportivo utilitario deportivo utilitario deportivo utilitario deportivo utilitario deportivo utilitario deportivo pickup pequeña pickup pequeña pickup pequeña pickup pequeña pickup pequeña pickup pequeña pickup pequeña pickup pequeña pickup pequeña pickup pequeña pickup grande pickup grande pickup grande pickup grande pickup grande pickup grande pickup grande pickup grande pickup grande pickup grande
Precio sugerido ($)
Valor de reventa (%)
19 495 20 495 26 789 18 965 30 186 25 745 29 895 26 919 22 418 17 148 18 847 16 870 18 510 20 225 16 938 18 820 23 050 12 110 18 228 19 318 24 417 24 140 17 460 32 770 23 140 22 875 34 295 27 089 25 605 15 835
55 57 67 65 62 57 59 54 55 55 46 53 48 55 44 41 51 51 49 50 60 64 54 63 59 58 64 68 53 58
Obtenga la ecuación de regresión estimada que sirva para predecir el valor de reventa conociendo el precio sugerido. Pruebe la significancia de la relación empleando como nivel de significancia 0.05. ¿Proporciona la ecuación de regresión estimada obtenida en el inciso a) un buen ajuste a los datos? Explique. Obtenga la ecuación de regresión estimada que sirva para predecir el valor de reventa conociendo el precio sugerido y el tipo de vehículo. Emplee la prueba F para determinar la significancia de los resultados de la regresión. ¿A qué conclusión se llega empleando 0.05 como nivel de significancia?
Consumer Research, Inc. Consumer Research, Inc., es una empresa que realiza estudios para otras empresas sobre las actitudes y el comportamiento de los consumidores. En un estudio, el cliente solicitó un estudio sobre las características de los consumidores que pueden servir para predecir los montos que cargan a sus tarjetas de crédito. De una muestra de 50 consumidores se obtuvieron datos sobre ingreso anual, tamaño de la familia, y cargos anuales hechos las tarjetas de crédito. Los datos que se presentan a continuación se encuentran en el archivo Consumer del disco compacto que se distribuye con el libro.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 686
686
Capítulo 15
Regresión múltiple
Ingreso Tamaño de Monto de (miles de $) la familia los cargos ($)
archivo CD en Consumer
54 30 32 50 31 55 37 40 66 51 25 48 27 33 65 63 42 21 44 37 62 21 55 42 41
3 2 4 5 2 2 1 2 4 3 3 4 1 2 3 4 6 2 1 5 6 3 7 2 7
4016 3159 5100 4742 1864 4070 2731 3348 4764 4110 4208 4219 2477 2514 4214 4965 4412 2448 2995 4171 5678 3623 5301 3020 4828
Ingreso Tamaño de Monto de (miles de $) la familia los cargos ($) 54 30 48 34 67 50 67 55 52 62 64 22 29 39 35 39 54 23 27 26 61 30 22 46 66
6 1 2 5 4 2 5 6 2 3 2 3 4 2 1 4 3 6 2 7 2 2 4 5 4
5573 2583 3866 3586 5037 3605 5345 5370 3890 4705 4157 3579 3890 2972 3121 4183 3730 4127 2921 4603 4273 3067 3074 4820 5149
Reporte administrativo 1. Usando los métodos de la estadística descriptiva dé un resumen de estos datos. Haga un comentario sobre sus hallazgos. 2. Obtenga ecuaciones de regresión estimada, usando como variable independiente, primero, el ingreso anual y después, el tamaño de la familia. ¿Cuál de estas variables es mejor predictor de los cargos a las tarjetas de crédito? Analice sus hallazgos. 3. Obtenga una ecuación de regresión estimada en la que ingreso anual y tamaño de la familia sean las variables independientes. Analice sus hallazgos. 4. ¿Cuál es el monto del cargo anual en tarjetas de crédito que se puede predecir para un hogar de tres personas con ingreso anual de $4000? 5. Analice la necesidad de agregar otras variables independientes al modelo. ¿Qué variables sería útil agregar al modelo?
Caso problema 2
Predicción de la puntuación en un examen Con objeto de predecir cómo se clasificarán los distritos escolares al considerar la pobreza y otras medidas relacionadas con el ingreso, The Cincinnati Enquirer reunió datos del Servicio de Administración de la Educación del Departamento de Educación de Ohio y del Departamento de Impuestos de Ohio (The Cincinnati Enquirer, 30 de noviembre de 1997). Primero, a principios de 1996, este periódico obtuvo datos sobre las calificaciones de aprobación en matemáticas, lectura, ciencias, escritura y civismo para alumnos de cuarto, noveno y doceavo grados. Combinando estos datos, el periódico calculó el porcentaje total de estudiantes que aprobaba los exámenes en cada distrito.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 687
Caso problema 3
687
Aportaciones de los alumnos
Se registró también el porcentaje de estudiantes del distrito escolar que recibía Apoyo para menores dependientes (o Aid for Dependent Children, ADC), el porcentaje de quienes calificaron para recibir almuerzos gratis o de precio reducido, así como el ingreso familiar mediano. Una fracción de los datos registrados para los 608 distritos escolares es la siguiente. (El conjunto completo de datos está disponible en el CD que acompaña al libro en el archivo llamado Enquirer).
Posición Distrito escolar
archivo CD en Enquirer
1 2 3 4 5 6 7 8 9 10 . . .
Ottawa Hills Local Wyoming City Oakwood City Madeira City Indian Hill Ex Vill Solon City Chagrin Falls Ex Vill Mariemont City Upper Arlington City Granville Ex Vill . . .
% de % con Condado aprobados ADC Lucas Hamilton Montgomery Hamilton Hamilton Cuyahoga Cuyahoga Hamilton Franklin Licking . . .
93.85 93.08 92.92 92.37 91.77 90.77 89.89 89.80 89.77 89.22 . . .
0.11 2.95 0.20 1.50 1.23 0.68 0.47 3.00 0.24 1.14 . . .
% con almuerzo gratis
Ingreso mediano ($)
0.00 4.59 0.38 4.83 2.70 2.24 0.44 2.97 0.92 0.00 . . .
48 231 42 672 42 403 32 889 44 135 34 993 38 921 31 823 38 358 36 235 . . .
Los datos se han ordenado de acuerdo a los porcentajes en la columna % de aprobados, que son los porcentajes totales de estudiantes que aprueban los exámenes. Los datos en la columna titulada % con ADC son los porcentajes de estudiantes, de cada distrito escolar, que reciben ADC, y los datos en la columna cuyo encabezado es % con almuerzo gratis son los porcentajes de estudiantes acreedores de almuerzo gratuito o a precio reducido. En la columna cuyo encabezado es ingreso mediano, se da el ingreso mediano por familia en cada distrito. Para cada uno de los distritos escolares se da también el condado en el que ubica el distrito escolar. Obsérvese que hay casos en los que en la columna % de almuerzo gratuito aparece un 0, esto indica que ese distrito no participa en el programa de almuerzo gratuito.
Reporte administrativo Analice este conjunto de datos empleando los métodos presentados en este capítulo y en los capítulos anteriores. Presente un resumen de su análisis comprendiendo los resultados estadísticos clave, las conclusiones, y las recomendaciones en un reporte administrativo. Incluya todo material técnico que considere sea adecuado en un apéndice.
Caso problema 3
Aportaciones de los alumnos Las donaciones de los exalumnos son una importante fuente de ingresos para las universidades. Si los administradores pudieran determinar los factores que influyen sobre el aumento de la cantidad de alumnos que hacen donaciones, podrían poner en marcha políticas que llevarían a ganancias mayores. Las investigaciones indican que los estudiantes más satisfechos con la relación con sus profesores tienen más probabilidad de titularse, lo que a su vez lleva al aumento de la cantidad de alumnos que hagan donaciones. En la tabla 15.13 se muestran datos de 48 universidades de Estados Unidos (American’s Best Collage, edición del año 2000). La columna titulada “tasa de titulados” da el porcentaje de alumnos titulados, de los inicialmente inscritos. La columna que tiene como título “% de grupos con menos de 20” da muestra el porcentaje de grupos con menos de 20 alumnos. La columna que tiene como título “Tasa de estudiantes/facultad” da la cantidad total de estudiantes inscritos, dividida entre la cantidad de facultades. Por último, la co-
15Ander(624-692).qxd 2/29/08 11:06 AM Page 688
688
Capítulo 15
TABLA 15.13
Regresión múltiple
DATOS DE 48 UNIVERSIDADES NACIONALES (DE ESTADOS UNIDOS)
Estado
archivo CD en Alumni
Boston College Brandeis University Brown University California Institute of Technology Carnegie Mellon University Case Western Reserve Univ. College of William and Mary Columbia University Cornell University Dartmouth College Duke University Emory University Georgetown University Harvard University Johns Hopkins University Lehigh University Massachusetts Inst. of Technology New York University Northwestern University Pennsylvania State Univ. Princeton University Rice University Stanford University Tufts University Tulane University U. of California–Berkeley U. of California–Davis U. of California–Irvine U. of California–Los Angeles U. of California–San Diego U. of California–Santa Barbara U. of Chicago U. of Florida U. of Illinois–Urbana Champaign U. of Michigan–Ann Arbor U. of North Carolina–Chapel Hill U. of Notre Dame U. of Pennsylvania U. of Rochester U. of Southern California U. of Texas–Austin U. of Virginia U. of Washington U. of Wisconsin–Madison Vanderbilt University Wake Forest University Washington University–St. Louis Yale University
MA MA RI CA PA OH VA NY NY NH NC GA DC MA MD PA MA NY IL PA NJ TX CA MA LA CA CA CA CA CA CA IL FL IL MI NC IN PA NY CA TX VA WA WI TN NC MO CT
% de Tasa de Tasa de Tasa de grupos con estudiantes/ alumnos titulados menos de 20 facultad que donan 85 79 93 85 75 72 89 90 91 94 92 84 91 97 89 81 92 72 90 80 95 92 92 87 72 83 74 74 78 80 70 84 67 77 83 82 94 90 76 70 66 92 70 73 82 82 86 94
39 68 60 65 67 52 45 69 72 61 68 65 54 73 64 55 65 63 66 32 68 62 69 67 56 58 32 42 41 48 45 65 31 29 51 40 53 65 63 53 39 44 37 37 68 59 73 77
13 8 8 3 10 8 12 7 13 10 8 7 10 8 9 11 6 13 8 19 5 8 7 9 12 17 19 20 18 19 20 4 23 15 15 16 13 7 10 13 21 13 12 13 9 11 7 7
25 33 40 46 28 31 27 31 35 53 45 37 29 46 27 40 44 13 30 21 67 40 34 29 17 18 7 9 13 8 12 36 19 23 13 26 49 41 23 22 13 28 12 13 31 38 33 50
15Ander(624-692).qxd 2/29/08 11:06 AM Page 689
Caso problema 4
Predicción del porcentaje de triunfos de la NFL
689
lumna que tiene como título “Tasa de alumnos que donan” da el porcentaje de alumnos que han hecho alguna donación a la universidad.
Reporte administrativo 1. Resuma estos datos empleando los métodos de la estadística descriptiva. 2. Obtenga una ecuación de regresión estimada que sirva para predecir la tasa de donaciones de los alumnos dada la cantidad de alumnos que se titulan. Analice sus hallazgos. 3. Obtenga una ecuación de regresión estimada que sirva para predecir la tasa de donaciones de los alumnos empleando los datos proporcionados. 4. ¿Qué conclusiones y recomendaciones puede obtener de su análisis?
Caso problema 4
archivo CD en NFLStats
Predicción del porcentaje de triunfos de la NFL En la liga nacional de futbol americano de Estados Unidos se da seguimiento a diversos datos de desempeño tanto del equipo como de los jugadores (www.nfl.com). En el archivo titulado NLFStats del disco compacto se presentan algunos de los datos de fin de año de la temporada del 2005 de la NFL. Cada renglón corresponde a los datos de un equipo de la NFL, y los equipos aparecen de acuerdo a su porcentaje de juegos ganados. A continuación se da la descripción de los datos. WinPct DefYds/G RushYds/G PassYds/G FGPct TakeInt TakeFum GiveInt GiveFum
Porcentaje de juegos ganados Promedio de yardas permitidas por la defensiva del juego Promedio de yardas por carrera Promedio de yardas por aire por juego Porcentaje de goles de campo TakeInt Intercepciones obtenidas; total de intercepciones obtenidas por la defensa del equipo TakeFun Balones sueltos obtenidos; total de balones recuperados por la defensa del equipo GiveInt Intercepciones otorgadas; total de intercepciones hechas por la ofensiva del equipo GiveFun Balones sueltos perdidos; total de balones perdidos por la defensa del equipo
Reporte administrativo 1. Resuma los datos empleando los métodos de la estadística descriptiva. Haga un comentario sobre sus hallazgos. 2. Obtenga una ecuación de regresión estimada que sirva para predecir WinPCT usando DefYds/G, RushYds/G, PassYds/G y FGPct. Analice sus hallazgos. 3. En la ecuación de regresión estimada obtenida en el inciso 2), elimine todas las variables independientes que no sean significativas y obtenga otra ecuación de regresión estimada que sirva para predecir WinPct. Use α = 0.05. 4. Algunos analistas de futbol americano consideran que las pérdidas de balón son uno de los factores más importantes para determinar el éxito de un equipo. Si Takeaways TakeInt TakeFum y Giveayaws = GiveInt GiveFum, sea NetDiff Takeaways Giveaways. Obtenga una ecuación de regresión estimada que sirva para predecir WinPct empleando NetDiff. Compare estos resultados con la ecuación de regresión estimada obtenida en el inciso 3). 5. Obtenga una ecuación de regresión estimada que permita predecir WinPct usando todos los datos proporcionados.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 690
690
Capítulo 15
Apéndice 15.1
archivo CD en Butler
Regresión múltiple con Minitab En la sección 15.2 se vio la solución a problemas de regresión múltiple mediante paquetes de software mediante los resultados dados por Minitab al problema de la empresa Butler Trucking. En este apéndice se describen los pasos requeridos para que Minitab genere esos resultados. Primero, es necesario ingresar los datos en una hoja de cálculo de Minitab. Las millas recorridas se ingresan en la columna C1, el número de entregas se ingresan en la columna C2 y el tiempo de recorrido (en horas) en la columna C3. Los nombres de las variables, Miles (millas), Deliveries (entregas) y Time (tiempo) se ingresan como encabezados de estas columnas. En la explicación siguiente se hará referencia a los datos empleando los nombres de las variables o los identificadores de las columnas C1, C2 y C3. A continuación se describen los pasos a seguir con Minitab para obtener los resultados de regresión que se presentan en la figura 15.4. Paso 1. Paso 2. Paso 3. Paso 4.
Apéndice 15.2
archivo CD en Butler
Regresión múltiple
Seleccionar el menú Stat Seleccionar el menú Regression Elegir Regression Cuando aparezca el cuadro de diálogo Regression Ingresar Time en la caja Response Ingresar Miles y Deliveries en el cuadro Predictors Clic en OK
Regresión múltiple con Excel En la sección 15.2 se vio la solución a problemas de regresión múltiple empleando paquetes de software mediante los resultados dados por Minitab al problema de la empresa Butler Trucking. En este apéndice se describe el uso de la herramienta de regresión de Excel para obtener la ecuación de regresión estimada para el problema de Butler Trucking. A medida que se describen los pasos a seguir consúltese la figura 15.14. Primero, en las celdas A1:D1 de la hoja de cálculo se ingresan los rótulos Recorrido, Millas, Entregas y Tiempo, y en las celdas B2:D11 se ingresan los datos muestrales. En las celdas A2:A11, los números 1-10 sirven para identificar cada observación. Los pasos siguientes describen cómo emplear la herramienta de regresión para el análisis de regresión múltiple. Paso 1. Paso 2. Paso 3. Paso 4.
Seleccionar el menú Herramientas Elegir Análisis de datos Elegir Regresión en la lista Funciones para análisis Cuando aparezca el cuadro de diálogo Regresión Ingresar D1:D11 en el cuadro Rango Y de entrada Ingresar B1:C11 en el cuadro Rango X de entrada Seleccionar Rótulos Seleccionar Nivel de confianza Ingresar 99 en el cuadro Nivel de confianza Seleccionar Rango de salida Ingresar A13 en el cuadro Rango de salida (para identificar la esquina superior izquierda de la de la hoja de cálculo en donde aparecerán los resultados) Clic en Aceptar
En los resultados de Excel que se presentan en la figura 15.14, el rótulo para la variable independiente x1 es Millas (ver celda A30) y el rótulo para la variable independiente x2 es Entregas (ver celda A31). La ecuación de regresión estimada es y 0.8687 0.0611x1 0.9234x2 ^
15Ander(624-692).qxd 2/29/08 11:06 AM Page 691
Apéndice 15.3 FIGURA 15.14
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
691
Regresión logística con Minitab
RESULTADOS DADOS POR EXCEL AL PROBLEMA DE BUTLER TRUCKING CON DOS VARIABLES INDEPENDIENTES
A Assignment
B Miles 100 50 100 100 50 80 75 65 90 90
1 2 3 4 5 6 7 8 9 10
C Deliveries 4 3 4 2 2 2 3 4 3 2
D Time 9.3 4.8 8.9 6.5 4.2 6.2 7.4 6 7.6 6.1
E
F
G
H
I
J
SUMMARY OUTPUT Regression Statistics Multiple R 0.9507 R Square 0.9038 Adjusted R Square 0.8763 Standard Error 0.5731 Observations 10 ANOVA df Regression Residual Total
Intercept Miles Deliveries
2 7 9
SS MS F Significance F 21.6006 10.8003 32.8784 0.0003 2.2994 0.3285 23.9
Coefficients Standard Error -0.8687 0.9515 0.0611 0.0099 0.9234 0.2211
t Stat P-value Lower 95% Upper 95% Lower 99.0% Upper 99.0% -0.9129 0.3916 -3.1188 1.3813 -4.1986 2.4612 6.1824 0.0005 0.0378 0.0845 0.0265 0.0957 4.1763 0.0042 0.4006 1.4463 0.1496 1.6972
Obsérvese que el uso de la herramienta de regresión de Excel para la regresión múltiple es casi igual a su uso para regresión lineal simple. La principal diferencia es que en el caso de la regresión múltiple se requiere un rango mayor de celdas para identificar las variables independientes.
Apéndice 15.3
archivo CD en Simmons
Regresión logística con Minitab Minitab le llama a la regresión logística con una sola variable independiente que puede tomar los valores 0 y 1, Regresión Logística Binaria (Binary Logistic Regresion). En este apéndice se describen los pasos que se requieren en el procedimiento de regresión logística binaria de Minitab para generar los resultados presentados en la figura 15.13 para el problema de Simmons. Primero, en una hoja de cálculo de Minitab deben ingresarse los datos. Las cantidades (en miles de $) que gastaron los clientes en las tiendas Simmons se ingresan en la columna C2, los datos sobre la tarjeta de crédito (1 si tienen tarjeta de crédito de Simmons; 0 si no es así) se ingresan en la columna C3 y el dato sobre el uso del cupón (1 si el cliente usó el cupón; 0 si no fue así) se ingresan en la columna C4. Los nombres de las variables Spending (gasto) Card (tarjeta) y Coupon (cupón) se ingresan en la hoja de cálculo como encabezados de las columnas. En la explicación siguiente se hará referencia a los datos empleando los nombres de las variables o los identificadores de las columnas C2, C3 y C4. Mediante los pasos siguientes se generarán los resultados de la regresión logística.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 692
692
Capítulo 15
Paso 1. Paso 2. Paso 3. Paso 4.
Regresión múltiple
Seleccionar el menú Stat Seleccionar el menú Regression Elegir Binary Logistic Regression Cuando aparezca el cuadro de diálogo Binary Logistic Regression Ingresar Coupon en el cuadro Response Ingresar Spending y Card en el cuadro Model Clic en OK
La información presentada en la figura 15.13 aparecerá como parte de los resultados.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 693
CAPÍTULO
16
Análisis de regresión: construcción de modelos CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: LA EMPRESA MONSANTO 16.1 EL MODELO LINEAL GENERAL Modelado de relaciones curvilíneas Interacción Transformaciones a la variable dependiente Modelos no lineales que son intrínsecamente lineales 16.2 DETERMINACIÓN DE CUÁNDO AGREGAR O QUITAR VARIABLES Caso general Uso del valor-p
16.3 ANÁLISIS DE UN PROBLEMA MAYOR 16.4 PROCEDIMIENTOS DE ELECCIÓN DE VARIABLES Regresión por pasos Selección hacia adelante Eliminación hacia atrás Regresión de los mejores subconjuntos Elección final 16.5 MÉTODO DE REGRESIÓN MÚLTIPLE PARA EL DISEÑO DE EXPERIMENTOS 16.6 AUTOCORRELACIÓN Y LA PRUEBA DE DURBIN-WATSON
16Ander(693-743).qxd 2/29/08 10:28 AM Page 694
694
Capítulo 16
LA ESTADÍSTICA
Análisis de regresión: construcción de modelos
en LA PRÁCTICA
LA EMPRESA MONSANTO* SAN LUIS MISSOURI
Las raíces de Monsanto se remontan a una inversión de $500 de un empresario y a un polvoriento almacén a orillas del Mississippi, donde en 1901 John F. Queeney empezó con la fabricación de sacarina. En la actualidad, Monsanto es una de las mayores empresas químicas de Estados Unidos, produce más de mil productos que van desde productos químicos industriales hasta canchas sintéticas para deportes que se emplean en los estadios modernos. Monsanto es una empresa mundial que cuenta con fábricas, laboratorios, centros técnicos y operaciones de marketing en 65 países. La división de nutrición química de Monsanto fabrica y comercializa un suplemento de metionina que se usa en alimento para ganado, cerdos y aves de corral. Como en la cría de aves de corral se trabaja con volúmenes altos y márgenes de ganancias reducidos, se necesitan alimentos rentables y con el mayor valor nutricional posible. El alimento de composición óptima es el que produce un crecimiento rápido y un alto peso corporal final con una determinada ingestión de alimento. La industria química trabaja en estrecha colaboración con los criadores de aves de corral para optimizar los alimentos. Por último, el éxito depende de mantener bajo el costo de las aves de corral en comparación con el costo de la carne de res y de otros productos de carne. Para modelar la relación entre peso corporal y y cantidad de metionina x adicionada al alimento para aves de corral, los investigadores de Monsanto emplearon el análisis de regresión. Al principio se obtuvo la siguiente ecuación de regresión lineal estimada. ŷ
0.21
0.42x
Esta ecuación estimada de regresión resultó estadísticamente significativa; sin embargo, de acuerdo con el análisis de residuales una relación curvilínea parecía ser un modelo más adecuado para la relación entre peso corporal y metionina. *Los autores agradecen a James R. Ryland y a Robert M. Schisla, especialistas en investigación de Monsanto Nutrition Chemical Division, por proporcionar este artículo para La estadística en la práctica.
Los investigadores de Monsanto emplearon el análisis de regresión para obtener un alimento de composición óptima para los criadores de aves de corral. © PhotoDisc/Getty Images.
Al continuar con las investigaciones encontraron que aunque cantidades pequeñas de metionina tendían a hacer aumentar el peso corporal, en cierto punto el peso corporal se estabilizaba y un aumento en la cantidad de metionina tenía poco o ningún efecto. Peor aún, cuando la cantidad de metionina era mayor que el requerimiento nutrimental, el peso corporal tendía a disminuir. Para modelar la relación curvilínea entre peso corporal y metionina se empleó la siguiente ecuación estimada de regresión múltiple. ŷ
1.89
1.32x
0.506 x 2
Al aplicar la regresión, los investigadores de Monsanto pudieron encontrar la cantidad óptima de metionina que debía usarse en los productos alimenticios para aves de corral. En este capítulo el estudio del análisis de regresión se ampliará a la obtención de modelos curvilíneos como el usado por los investigadores de Monsanto. Se describirán, además, diversas herramientas que sirven para determinar cuáles son las variables independientes que conducen a una mejor ecuación estimada de regresión.
La construcción de modelos es el proceso que consiste en obtener una ecuación estimada de regresión que describa la relación entre una variable dependiente y una o diversas variables independientes. Lo más importante en la construcción de un modelo es hallar la forma funcional adecuada para la relación y seleccionar las variables independientes que se deban incluir en el modelo. En la sección 16.1 se presenta el concepto de modelo lineal general que establece el marco para la construcción de modelos. En la sección 16.2, en la que se presentan las bases para procedimientos más sofisticados que emplean paquetes de software, se enseña un procedimiento
16Ander(693-743).qxd 2/29/08 10:28 AM Page 695
16.1
695
El modelo lineal general
general para determinar cuándo agregar o eliminar variables independientes. En la sección 16.3 se considera un problema más grande de regresión en el que intervienen ocho variables independientes y 25 observaciones; este problema sirve para ilustrar los procedimientos de selección de variables presentados en la sección 16.4, que comprenden la regresión por pasos, el procedimiento de selección hacia adelante, el procedimiento de eliminación hacia atrás y el mejor subconjunto de regresión. En la sección 16.5 se muestra cómo el análisis de regresión múltiple proporciona otro método para la solución de problemas de diseño experimental, y en la sección 16.6 se muestra el uso de la prueba Durbin-Watson para detectar correlación serial o autocorrelación.
16.1
El modelo lineal general Suponga que se obtienen los datos de una variable independiente y y de k variables independientes x1, x2, . . . , xk. El objetivo es obtener, con estos datos, la ecuación estimada de regresión que mejor exprese la relación entre la variable dependiente y las independientes. Como marco general para el desarrollo de relaciones más complejas entre las variables independientes, se introduce el concepto de modelo lineal general con p variables independientes.
Si el modelo de regresión se puede expresar en la forma de la ecuación (16.1), entonces se aplica el procedimiento estándar de regresión múltiple descrito en el capítulo 15.
TABLA 16.1 DATOS DEL EJEMPLO DE REYNOLDS ..
Antiguedad en meses 41 106 76 10 22 12 85 111 40 51 9 12 6 56 19
Balanzas vendidas 375 296 317 376 162 150 367 308 189 235 83 112 67 325 189
archivo CD en Reynolds
MODELO LINEAL GENERAL
y β0 β1z1 β2 z 2 . . . βp zp
(16.1)
En la ecuación (16.1), cada una de las variables independientes zj (donde j 1, 2, . . . , p) es función de x1, x2, . . . , xk (las variables para las que se obtuvieron los datos). En algunos casos cada zj puede ser función de una sola variable x. El caso más sencillo es cuando sólo se obtienen datos de una variable x1 y se quiere estimar y por medio de una relación lineal. En este caso z1 x1 y la ecuación (16.1) se convierte en y β0 β1x1
(16.2)
La ecuación (16.2) es el modelo de regresión lineal simple presentado en el capítulo 14, con la única diferencia de que a la variable independiente se le ha llamado x1 en lugar de x. En la literatura sobre modelos estadísticos, a este modelo se le llama modelo simple de primer orden con una variable predictora.
Modelado de relaciones curvilíneas Con la ecuación (16.1) también se pueden modelar relaciones más complejas. Para ilustrar esto se verá un problema que se le presentó a la empresa Reynolds, Inc., fabricante de balanzas industriales y de equipo para laboratorio. Los gerentes de Reynolds desean investigar la relación que existe entre la antigüedad de sus vendedores y el número de balanzas electrónicas para laboratorio que venden. En la tabla 16.1 se presenta el número de balanzas vendidas por cada uno de 15 vendedores elegidos aleatoriamente y la antigüedad que tiene cada uno de ellos en la empresa. En la figura 16.1 se presenta el diagrama de dispersión de estos datos. En el diagrama de dispersión se observa que es posible que exista una relación curvilínea entre antigüedad de un empleado y número de balanzas que vende. Antes de considerar cómo obtener una relación curvilínea para este problema de Reynolds, se analizarán los resultados de Minitab que se presentan en la figura 16.2 y que corresponden a un modelo simple de primer orden; la ecuación estimada de regresión es Sales (Ventas) 111 2.38 Months (Meses) donde Sales (Ventas) número de balanzas electrónicas para laboratorio vendidas Months (Meses) antigüedad del vendedor, en meses
16Ander(693-743).qxd 2/29/08 10:28 AM Page 696
Capítulo 16
FIGURA16.1
Análisis de regresión: construcción de modelos
DIAGRAMA DE DISPERSIÓN PARA EL EJEMPLO DE REYNOLDS
400
Balanzas vendidas
696
300
200
100
0
20
40 60 80 Antigüedad en meses
100
120
La figura 16.3 es la gráfica de residuales estandarizados correspondiente. Aunque los resultados de Minitab indican que la relación sí es significativa (valor-p 0.000) y que una relación lineal explica un porcentaje grande de la variabilidad en las ventas (R-sq 78.1%), la gráfica de residuales estandarizados sugiere que se necesita una relación curvilínea. Para obtener una relación curvilínea, en la ecuación (16.1) se hace z1 x1 y z2 x 21, así resulta el modelo y β0 β1x1 β2 x 21
(16.3)
A este modelo se le llama modelo de segundo orden con una variable predictora. Para proporcionar la ecuación estimada de regresión correspondiente a este modelo de segundo orden, Minitab FIGURA 16.2
RESULTADOS DE MINITAB PARA EL EJEMPLO DE REYNOLDS: MODELO DE PRIMER ORDEN. The regression equation is Sales = 111 + 2.38 Months Predictor Constant Months S = 49.52
Coef 111.23 2.3768
SE Coef 21.63 0.3489
R-sq = 78.1%
T 5.14 6.81
p 0.000 0.000
R-sq(adj) = 76.4%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 13 14
SS 113783 31874 145657
MS 113783 2452
F 46.41
p 0.000
16Ander(693-743).qxd 2/29/08 10:28 AM Page 697
16.1
FIGURA 16.3
697
El modelo lineal general
GRÁFICA DE RESIDUALES ESTANDARIZADOS DEL EJEMPLO DE REYNOLDS: MODELO DE PRIMER ORDEN
Residuales estandarizados
1.2
0.0
1.2
150
200
250
300
350
ˆy
necesita los datos originales de la tabla 16.1, así como los datos que corresponden a la segunda variable dependiente que se agrega, que es el cuadrado de los meses de antigüedad que tiene el empleado en la empresa. En la figura 16.4 se presentan los resultados de Minitab correspondientes al modelo de segundo orden; la ecuación estimada de regresión es Los datos de la variable independiente MonthsSq se obtienen al elevar al cuadrado los valores de Months.
Sales (Ventas)
45.3
6.34 Months (Meses)
0.0345 MonthsSq (Meses al cuadrado)
donde MonthsSq
cuadrado del número de meses que ha trabajado el vendedor en la empresa
La figura 16.5 es la gráfica de residuales estandarizados correspondiente. En esta gráfica se observa que el patrón curvilíneo anterior ha desaparecido. Al emplear como nivel de significancia 0.05, los resultados de Minitab indican que el modelo general es significativo (el valor-p para la prueba F es 0.000); observe también que el valor-p correspondiente al cociente-t de MonthsSq (valor-p 0.002) es menor que 0.05, por lo que se puede concluir que la adición de MonthsSq al modelo es significativa. Como el valor de R-sq(adj) es 88.6%, se puede estar satisfecho con el ajuste que proporciona esta ecuación estimada de regresión. Lo más importante, sin embargo, es ver lo fácil que es tratar las relaciones curvilíneas en el análisis de regresión. Es claro que por medio de la ecuación (16.1) se pueden modelar muchos tipos de relaciones. Las técnicas de regresión con las que se ha estado trabajando son técnicas que definitivamente no están limitadas a relaciones lineales. En el análisis de regresión múltiple, la palabra lineal en el término “modelo lineal general” se refiere únicamente al hecho de que β0 , β1, . . . , βp, tienen, todos, exponente 1; no implica que la relación entre y y las xi sea lineal. Es más, en esta sección se ha visto un ejemplo del uso de la ecuación (16.1) para modelar una relación curvilínea.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 698
698
Capítulo 16
FIGURA 16.4
Análisis de regresión: construcción de modelos
RESULTADOS DE MINITAB PARA EL EJEMPLO DE REYNOLDS: MODELO DE SEGUNDO ORDEN The regression equation is Sales = 45.3 + 6.34 Months - 0.0345 MonthsSq Predictor Constant Months MonthsSq S = 34.45
Coef 45.35 6.345 -0.034486
SE Coef 22.77 1.058 0.008948
R-sq = 90.2%
T 1.99 6.00 -3.85
p 0.070 0.000 0.002
R-sq(adj) = 88.6%
Analysis of Variance SOURCE Regression Residual Error Total
FIGURA 16.5
DF 2 12 14
SS 131413 14244 145657
MS 65707 1187
F 55.36
p 0.000
GRÁFICA DE RESIDUALES ESTANDARIZADOS PARA EL EJEMPLO DE REYNOLDS: MODELO DE SEGUNDO ORDEN
Residuales estandarizados
1.2
0.0
1.2
100
150
200
250
300
350
ˆy
16Ander(693-743).qxd 2/29/08 10:28 AM Page 699
16.1
699
El modelo lineal general
Interacción Si el conjunto de datos original consta de observaciones para y y para dos variables independientes x1 y x2, y en la ecuación (16.1) se pone z1 x1, z2 x2, z3 x 21, z4 x 22 y z5 x1x2 se puede obtener un modelo de segundo orden con dos variables predictoras. El modelo resultante es y β0 β1x1 β2 x 2 β3 x 21 β4 x 22 β5 x1x 2
(16.4)
En este modelo de segundo orden, la variable z5 x1x2 se agrega para tomar en cuenta el posible efecto que pueda tener la acción conjunta de las dos variables. A este tipo de efecto se le llama interacción. Para ver un ejemplo de interacción y de lo que significa, se revisará el estudio de regresión realizado por Tyler Personal Care para un nuevo champú. Se pensó que los dos factores que tenían más influencia sobre las ventas eran el precio de venta por unidad y gasto en publicidad. Para investigar el efecto de estas dos variables sobre las ventas, se formaron parejas con los precios $2.00, $2.50 y $3.00 y los gastos en publicidad $50 000 y $100 000 en 24 mercados de prueba. En la tabla 16.2 se presentan las unidades vendidas (en miles). En la tabla 16.3 se resumen estos datos. Observe que las ventas medias muestrales correspondientes al precio $2.00 y al gasto en publicidad $50 000 son 461 000 unidades y que las ventas medias muestrales correspondientes al precio $2.00 y al gasto en publicidad $100 000 son 808 000 unidades. Por tanto, cuando el precio se mantiene constante en $2.00, la diferencia en ventas medias entre los gastos en publicidad de $50 000 y de $100 000 es 808 000 461 000 347 000 unidades. Cuando el precio del producto es $2.50, la diferencia en las ventas medias es 646 000 364 000 282 000 unidades. Por último, cuando el precio es $3.00 la diferencia en las ventas medias es 375 000 332 000 43 000 unidades. Es claro que la diferencia en ventas medias entre gastos en publicidad de $50 000 y de $100 000 depende del precio del producto. En otras palabras, a precios de venta más elevados, el efecto del aumento en los gastos en publicidad disminuye. Estas observaciones hacen evidente la interacción entre las variables precio y gasto en publicidad. Para proporcionar otra perspectiva de la interacción, en la figura 16.6 se muestran las ventas medias muestrales correspondientes a las seis combinaciones precio-gasto en publicidad. En esta gráfica también se muestra que el efecto de los gastos en publicidad sobre las ventas medias de-
TABLA 16.2
Precio
archivo CD en Tyler
$2.00 $2.50 $3.00 $2.00 $2.50 $3.00 $2.00 $2.50 $3.00 $2.00 $2.50 $3.00
DATOS DEL EJEMPLO TYLER PERSONAL CARE Gastos en publicidad ($ miles)
Ventas (en miles)
50 50 50 50 50 50 50 50 50 50 50 50
478 373 335 473 358 329 456 360 322 437 365 342
Precio
Gasto en publicidad ($ miles)
Ventas (en miles)
$2.00 $2.50 $3.00 $2.00 $2.50 $3.00 $2.00 $2.50 $3.00 $2.00 $2.50 $3.00
100 100 100 100 100 100 100 100 100 100 100 100
810 653 345 832 641 372 800 620 390 790 670 393
16Ander(693-743).qxd 2/29/08 10:28 AM Page 700
Capítulo 16
TABLA 16.3
Análisis de regresión: construcción de modelos
VENTAS UNITARIAS MEDIAS EN EL EJEMPLO DE TYLER PERSONAL CARE Precio
Gasto en publicidad
$50 000 $100 000
$2.00
$2.50
$3.00
461
364
332
808
646
375
Ventas medias de 808 000 unidades cuando el precio = $2.00 y el gasto en publicidad = $100 000
FIGURA 16.6
VENTAS UNITARIAS MEDIAS (EN MILES) COMO FUNCIÓN DEL PRECIO DE VENTA Y DEL GASTO EN PUBLICIDAD
900
$100 000 800
Ventas unitarias medias (en miles)
700
700
600
$100 000
La diferencia es 808 – 461 = 347
La diferencia es 646 – 364 = 282
500
$50 000 400 $50 000 300
2.00
2.50 Precio de venta ($)
$100 000 La diferencia es 375 – 332 = 43 $50 000
3.00
16Ander(693-743).qxd 2/29/08 10:28 AM Page 701
16.1
701
El modelo lineal general
pende del precio del producto; una vez más se ve el efecto de la interacción. Cuando hay interacción entre dos variables, no se puede estudiar el efecto de una de las variables sobre la respuesta y independientemente de la otra variable. En otras palabras, sólo es posible obtener conclusiones claras si se considera el efecto conjunto que tienen las dos variables sobre la respuesta. Para tomar en cuenta el efecto de la interacción, se usará el siguiente modelo de regresión y β0 β1x1 β2 x 2 β3 x1x 2
(16.5)
donde y ventas unitarias (en miles) x1 precio ($) x 2 gastos en publicidad ($ miles) Observe que la ecuación (16.5) refleja la creencia de Tyler de que el número de unidades vendidas depende linealmente del precio de venta y de los gastos en publicidad (representados por los términos β1x1 y β2x2) y de que existe interacción entre las dos variables (representada por el término β3x1x2). Para obtener una ecuación estimada de regresión, se empleó un modelo lineal general con tres variables independientes (z1, z2 y z3). y β0 β1z1 β2 z 2 β3 z3
(16.6)
donde z1 x1 z2 x2 z3 x1x 2 En la figura 16.7 se presentan los resultados de Minitab correspondientes al modelo de interacción para el ejemplo de Tyler Personal Care. La ecuación estimada de regresión que se obtiene es Sales (Ventas) 276 175 Price (Precio) 19.7 AdvExp (GastPubl) 6.08 PriceAdv (PrecioPubl) donde Los datos de la variable independiente PriceAdv se obtienen multiplicando cada precio por el correspondiente valor de AdvExp.
Sales (Ventas) = ventas unitarias (miles) Price (Precio) = precio del producto ($) AdvExp (GastPubl) = gastos en publicidad ($ miles) PriceAdv (PrecioPubl) = término de la interacción (precio multiplicado por publicidad) Como el modelo es significativo (el valor-p en la prueba F es 0.000) y como el valor-p correspondiente a la prueba t para PriceAdv es 0.000, se concluye que la interacción es significativa dado el efecto lineal del precio del producto y de los gastos en publicidad. Por tanto, los resultados de la regresión indican que el efecto de gastos en publicidad sobre las ventas depende del precio.
Transformaciones a la variable dependiente Al mostrar el uso del modelo lineal general para modelar diversas relaciones que puede haber entre las variables independientes y la variable dependiente, se ha concentrado la atención en transformaciones a una o varias de las variables independientes. Con frecuencia vale la pena utilizar
16Ander(693-743).qxd 2/29/08 10:28 AM Page 702
702
Capítulo 16
FIGURA 16.7
Análisis de regresión: construcción de modelos
RESULTADOS DE MINITAB PARA EL EJEMPLO DE TYLER PERSONAL CARE The regression equation is Sales = - 276 + 175 Price + 19.7 AdvExpen - 6.08 PriceAdv Predictor Constant Price Adver PriceAdv S = 28.17
Coef -275.8 175.00 19.680 -6.0800
SE Coef 112.8 44.55 1.427 0.5635
R-sq = 97.8%
T -2.44 3.93 13.79 -10.79
p 0.024 0.001 0.000 0.000
R-sq(adj) = 97.5%
Analysis of Variance SOURCE Regression Residual Error Total
TABLA 16.4
RENDIMIENTO EN MILLAS POR GALÓN Y PESOS DE 12 AUTOMÓVILES Millas por galón
Pesos 2289 2113 2180 2448 2026 2702 2657 2106 3226 3213 3607 2888
28.7 29.2 34.2 27.9 33.3 26.4 23.9 30.5 18.1 19.5 14.3 20.9
archivo CD en MPG
DF 3 20 23
SS 709316 15875 725191
MS 236439 794
F 297.87
p 0.000
transformaciones a la variable dependiente y. Para dar un ejemplo de un caso en el que puede ser útil transformar la variable dependiente, considere los datos de la tabla 16.4, en las que se muestran rendimientos en millas por galón y pesos de 12 automóviles. El diagrama de dispersión de la figura 16.8 indica que entre estas dos variables existe una relación lineal negativa. Por tanto, se usa un modelo simple de primer orden para relacionar estas dos variables. En la figura 16.9 se presentan los resultados que proporciona Minitab; la ecuación estimada de regresión es MPG 56.1 0.0116 Weight donde MPG = rendimiento en millas por galón Weight (Peso) = peso del automóvil dado en libras El modelo es significativo (el valor-p en la prueba F es 0.000) y el ajuste es muy bueno (R-sq = 93.5%). Sin embargo, en la figura 16.9 se ve que la observación 3 ha sido identificada como una observación cuyo residual estandarizado es grande. La figura 16.10 es la gráfica de los residuales estandarizados correspondientes al modelo de primer orden. Su forma no parece ser la de la banda horizontal que se esperaría observar si las suposiciones acerca del término del error fueran válidas. La variabilidad de los residuales parece aumentar a medida que aumenta el valor de ŷ. En otras palabras, se observa la forma de cuña que, como se dijo en los capítulos 14 y 15, indica una varianza que no es constante. Si las suposiciones para el modelo de esta prueba no parecen satisfacerse, entonces no se justifica sacar conclusiones acerca de la significancia estadística de la ecuación estimada de regresión que se obtiene. El problema de una varianza no constante suele corregirse al transformar la variable dependiente a otra escala. Por ejemplo, si se trabaja con el logaritmo de la variable dependiente en lugar de la variable dependiente original, los valores de la variable dependiente se comprimirán (estarán más cercanos unos a otros) y con esto disminuirán los efectos de la varianza no constante. La mayor parte de los paquetes de software para estadística proporcionan la posibilidad de aplicar transformaciones logarítmicas mediante logaritmos base 10 (logaritmos comunes) o lo-
16Ander(693-743).qxd 2/29/08 10:28 AM Page 703
16.1
703
El modelo lineal general
FIGURA 16.8
DIAGRAMA DE DISPERSIÓN DE LOS DATOS DEL EJEMPLO DEL RENDIMIENTO EN MILLAS POR GALÓN 35.0
Millas por galón
28.0
21.0
14.0
7.0
0 2000
FIGURA 16.9
2200
2400
2600
2800 3000 3200 Peso (libras)
3400
3600
3800
RESULTADOS DE MINITAB PARA EL EJEMPLO DEL RENDIMIENTO EN MILLAS POR GALÓN
The regression equation is MPG = 56.1 - 0.0116 Weight Predictor Constant Weight S = 1.671
Coef 56.096 -0.0116436
SE Coef 2.582 0.0009677
R-sq = 93.5%
T 21.72 -12.03
p 0.000 0.000
R-sq(adj) = 92.9%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 10 11
SS 403.98 27.91 431.88
Unusual Observations Obs Weight MPG Fit 3 2180 34.200 30.713
MS 403.98 2.79
SE Fit 0.644
F 144.76
p 0.000
Residual 3.487
St Resid 2.26R
R denotes an observation with a large standardized residual.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 704
704
Capítulo 16
Residuales estandarizados
FIGURA 16.10
Análisis de regresión: construcción de modelos
GRÁFICA DE LOS RESIDUALES ESTANDARIZADOS CORRESPONDIENTES AL EJEMPLO DEL RENDIMIENTO EN MILLAS POR GALÓN
1.5
0.0
1.5
ˆy 14.0
17.5
21.0
24.5
28.0
31.5
garitmos base e 2.71828... (logaritmos naturales). Aquí se empleará la transformación a logaritmos naturales de los datos de millas por galón y se desarrollará la ecuación estimada de regresión que relaciona el peso con el logaritmo natural de las millas por galón. En la figura 16.11 se muestra la ecuación de regresión que se obtiene al emplear el logaritmo natural de millas por galón como variable dependiente; esta ecuación aparece rotulada como LogeMPG. En la figura 16.12 se presenta la gráfica de los correspondientes residuales estandarizados. Al observar la gráfica de residuales de la figura 16.12, se ve que la forma de cuña ha desaparecido. Además, ninguna de las observaciones ha sido identificada como una observación cuyo
FIGURA 16.11
RESULTADOS DE MINITAB PARA EL EJEMPLO DEL RENDIMIENTO EN MILLAS POR GALÓN: TRANSFORMACIÓN LOGARÍTMICA The regression equation is LogeMPG = 4.52 -0.000501 Weight Predictor Constant Weight
Coef 4.52423 -0.00050110
S = 0.06425
SE Coef 0.09932 0.00003722
R-sq = 94.8%
T 45.55 -13.46
p 0.000 0.000
R-sq(adj) = 94.2%
Analysis of Variance SOURCE Regression Residual Error Total
DF 1 10 11
SS 0.74822 0.04129 0.78950
MS 0.74822 0.00413
F 181.22
p 0.000
16Ander(693-743).qxd 2/29/08 10:28 AM Page 705
16.1
FIGURA 16.12
705
El modelo lineal general
GRÁFICA DE RESIDUALES ESTANDARIZADOS DEL EJEMPLO DEL RENDIMIENTO EN MILLAS POR GALÓN: TRANSFORMACIÓN LOGARÍTMICA
Residuales estandarizados
1.2
0.0
1.2
2.70
2.85
3.00
3.15
3.30
3.45
ŷ
residual estandarizado sea grande. El modelo en el que se emplea como variable dependiente el logaritmo de las millas por galón es estadísticamente significativo y proporciona un ajuste excelente a los datos observados. Por tanto, se recomendará usar la ecuación estimada de regresión LogeMPG
4.52
0.000501 Weight (Peso)
Para estimar el rendimiento en millas por galón de un automóvil que pese 2 500 libras, se obtiene primero una estimación del logaritmo del rendimiento de millas por galón. LogeMPG 4.52 0.000501(2500) 3.2675 La estimación de las millas por galón se obtiene al hallar el número cuyo logaritmo natural es 3.2675. Al emplear una calculadora con función exponencial o elevar e a la potencia 3. 2675, se obtienen 26.2 millas por galón. Otro método para problemas con varianza no constante es usar como variable dependiente 1/y, en lugar de y. A este tipo de transformación se le llama transformación recíproca. Por ejemplo, si la variable dependiente se mide en millas por galón, la transformación recíproca dará como resultado una nueva variable dependiente cuyas unidades serán 1/(millas por galón) o galones por milla. No hay manera de determinar qué transformación funcionará mejor, si una transformación logarítmica o una transformación recíproca, si no es probándolas.
Modelos no lineales que son intrínsecamente lineales A los modelos que tienen parámetros (β0, β1, . . . , βp ) con exponentes distintos a 1 se les conoce como modelos no lineales. Sin embargo, en el caso de modelos exponenciales, se puede realizar una transformación de las variables que permita realizar el análisis de regresión mediante la
16Ander(693-743).qxd 2/29/08 10:28 AM Page 706
706
Capítulo 16
Análisis de regresión: construcción de modelos
ecuación (16.1), el modelo lineal general. En el modelo general exponencial se tiene la siguiente ecuación de regresión E( y) β0 β x1
(16.7)
Este modelo es adecuado cuando la variable dependiente y aumenta o disminuye en un porcentaje constante, en lugar de en una cantidad fija, a medida que x aumenta. Por ejemplo, suponga que las ventas y de un producto se relacionan con los gastos en publicidad x (en miles de dólares) de acuerdo con el siguiente modelo exponencial. E( y) 500(1.2)x Por tanto, para x 1, E(y) = 500(1.2)1 = 600; para x 2, E(y) = 500(1.2)2 720; para x 3, E(y) 500(1.2)3 = 864. Observe, que en este caso, E(y) no aumenta en una cantidad constante, sino en un porcentaje constante; el porcentaje de aumento es 20%. Al sacar logaritmos a ambos lados de la ecuación (16.7) se puede transformar este modelo no lineal en un modelo lineal. log E( y) log β0 x log β1
(16.8)
Ahora, si y log E( y), β 0 log β0, y β 1 log β1, la ecuación (16.8) se expresa como y β 0 β 1x Ahora es claro que se puede emplear la fórmula de la regresión lineal simple para obtener estimaciones de β 0 y de β 1. Al denotar estas estimaciones como b 0 y b 1 se obtiene la siguiente ecuación estimada de regresión. ŷ b 0 b 1x
(16.9)
Para obtener predicciones para la variable dependiente original y dado un valor de x, primero se sustituye el valor de x en la ecuación (16.9) y se calcula ŷ . El antilogaritmo de ŷ será la predicción de y o el valor esperado de y. Muchos modelos no lineales pueden ser transformados a un modelo lineal equivalente. Sin embargo, tales modelos han tenido pocas aplicaciones en el comercio y la economía. Además, los fundamentos matemáticos para el estudio de tales modelos quedan fuera del alcance de este libro.
Ejercicios
Métodos
Auto examen
1. Considere los datos siguientes para las variables x y y.
a. b. c.
x
22
24
26
30
35
40
y
12
21
33
35
40
36
Con estos datos obtenga una ecuación estimada de regresión de la forma ŷ b0 b1x. Use los resultados del inciso a para probar si existe una relación significativa entre x y y. Use α 0.05 Obtenga el diagrama de dispersión de estos datos. ¿Este diagrama de dispersión sugiere una ecuación estimada de regresión de la forma ŷ b0 b1 x b2 x 2? Explique.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 707
16.1
707
El modelo lineal general
d. e. f.
Con estos datos obtenga una ecuación estimada de regresión de la forma ŷ b0 b1x b2 x 2 Remítase al inciso d. ¿La relación entre x, x2 y y es significativa? Use α 0.05 Prediga el valor de y para x 25.
2. Considere los datos siguientes para las variables x y y.
a. b. c.
x
9
32
18
15
26
y
10
20
21
16
22
Con estos datos obtenga una ecuación estimada de regresión de la forma ŷ b0 + b1x. Presente un comentario sobre lo adecuado de esta ecuación para predecir y. Con estos datos obtenga una ecuación estimada de regresión de la forma ŷ b0 b1x b2 x 2. Dé un comentario sobre lo adecuado de esta relación para predecir y. Prediga el valor de y para x 20.
3. Considere los datos siguientes para las variables x y y.
a. b. c. d.
x
2
3
4
5
7
7
7
8
9
y
4
5
4
6
4
6
9
5
11
¿Parece haber una relación lineal entre x y y? Explique. Obtenga la ecuación estimada de regresión que relaciona x y y. Dada la ecuación estimada de regresión obtenida en el inciso b, grafique los residuales estandarizados contra ŷ . ¿Las suposiciones del modelo parecen satisfacerse? Explique. Realice una transformación logarítmica de la variable dependiente y. Obtenga una ecuación estimada de regresión, emplee la variable dependiente transformada. ¿Las suposiciones del modelo parecen satisfacerse cuando se usa una variable dependiente transformada? En este caso, ¿la transformación recíproca funciona mejor? Explique.
Aplicaciones 4. El departamento de autopistas estudia la relación entre flujo de tráfico y velocidad. Se considera que el modelo siguiente es el adecuado. y β 0 β 1x donde y flujo de tráfico en vehículos por hora x velocidad de los vehículos en millas por hora Los siguientes datos fueron recolectados durante “horas pico” en las seis principales autopistas que salen de la ciudad.
a. b.
Flujo de tráfico ( y)
Velocidad de los vehículos (x)
1256 1329 1226 1335 1349 1124
35 40 30 45 50 25
Obtenga con estos datos una ecuación estimada de regresión. Use α 0.01 para probar la significancia de la relación.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 708
708
Capítulo 16
Auto examen
Análisis de regresión: construcción de modelos
5. Para continuar con el problema del ejercicio 4, se sugiere emplear la siguiente ecuación estimada de regresión curvilínea ŷ b0 b1x b2 x 2 a. b. c.
Use los datos del problema 4 para estimar los parámetros de esta ecuación estimada de regresión. Use α = 0.01 para probar la significancia de la relación. Estime el flujo de tráfico en vehículos por hora correspondiente a 38 millas por hora.
6. En un estudio sobre instalaciones para servicios de emergencia se investigó la relación entre el número de instalaciones y la distancia promedio a recorrer para dar el servicio de emergencia. En la tabla siguiente se presentan los datos obtenidos.
a. b. c.
Número de instalaciones
Distancia promedio (millas)
9 11 16 21 27 30
1.66 1.12 0.83 0.62 0.51 0.47
Trace el diagrama de dispersión de estos datos, considere la distancia promedio a recorrer como la variable dependiente. ¿Un modelo lineal simple será apropiado? Explique. Con estos datos obtenga la ecuación estimada de regresión que mejor explica la relación entre las dos variables.
7. Un factor importante al comprar un monitor para computadora es el campo de visión. Un monitor que tenga un campo de visión amplio permite tener una imagen aceptable con sólo girar ligeramente la cabeza y una persona de pie cerca del monitor logra ver claramente la imagen de la pantalla. Después de una revisión de monitores LCD de 19 pulgadas, PC World encontró que aunque todos los monitores probados aseguraban arcos de 170 grados —tanto horizontal como verticalmente— el rango real de los monitores iba de 108 a 167 grados. En la tabla siguiente se da el ángulo de visión horizontal de ocho monitores de 19 pulgadas y la evaluación dada por PC World con base en la calidad de la imagen, el precio y en las políticas de soporte técnico (PC World, febrero de 2003).
Monitor Samsung SyncMaster 191T ViewSonic VX900 Sceptre Technologies X9S-Naga Planar PL191M Dell UltraSharp 1900FP AOC LM914 KDS USA Radius Rad-9 NEC MultiSync LCD 1920NX Iiyama Pro Lite 4821DT-BK
archivo CD en Monitors
a. b. c.
Ángulo
Evaluación
167 159 126 108 153 123 118 123 119
86 82 81 81 81 81 80 80 80
Desarrolle un diagrama de dispersión de estos datos, emplee como variable independiente el ángulo de visión horizontal. ¿Un modelo de regresión lineal simple es apropiado? Obtenga una ecuación estimada de regresión que explique la relación entre estas dos variables.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 709
16.1
709
El modelo lineal general
8. Corvette, Ferrari y Jaguar fabricaron varios automóviles clásicos con un valor que aún sigue en aumento. En la tabla siguiente, basada en el sistema Martin de evaluación de automóviles de colección, se presenta la evaluación de su rareza (1-20) y el precio ($ miles) de 15 automóviles clásicos (www.businessweek.com, febrero de 2006).
archivo CD en ClassicCars
Año
Fabricante Modelo
1984 1956 1963 1978 1960-1963 1962-1964 1962 1967-1968 1968-1973 1962-1967 1969-1971 1971-1974 1951-1954 1950-1953 1956-1957
Chevrolet Chevrolet Chevrolet Chevrolet Ferrari Ferrari Ferrari Ferrari Ferrari Jaguar Jaguar Jaguar Jaguar Jaguar Jaguar
a.
b. c. d.
Evaluación
Corvette Corvette 265/225-hp Corvette coupe (340-bhp 4-speed) Corvette coupe Silver Anniversary 250 GTE 2+2 250 GTL Lusso 250 GTO 275 GTB/4 NART Spyder 365 GTB/4 Daytona E-type OTS E-type Series II OTS E-type Series III OTS XK 120 roadster (steel) XK C-type XKSS
18 19 18 19 16 19 18 17 17 15 14 16 17 16 13
Precio ($ miles) 1600 4000 1000 1300 350 2650 375 450 140 77.5 62 125 400 250 70
Dé el diagrama de dispersión de estos datos, emplee la evaluación de la rareza como variable independiente y el precio como variable independiente. ¿Es apropiado un modelo de regresión lineal simple? Obtenga una ecuación estimada de regresión simple en la cual las variables independientes sean x evaluación de la rareza y x2. Considere la relación no lineal dada por la ecuación (16.7). Use logaritmos para obtener una ecuación estimada de regresión para este modelo. ¿Cuál de las ecuaciones estimadas de regresión prefiere, la del inciso b o la del inciso c? Explique.
9. Casi en todo el sistema de trenes ligeros de Estados Unidos se usan vagones eléctricos que corren sobre vías construidas a nivel de la calle. De acuerdo con la Administración de Tránsito Federal de Estados Unidos, el tren ligero es uno de los medios de transporte más seguros, con una tasa de accidentes de 0.99 accidentes por cada millón de millas de pasajeros en comparación con 2.29 en los autobuses. En la tabla siguiente se presenta, para algunos de los sistemas de tren ligero de Estados Unidos, el número de millas de vía y el número de pasajeros, en miles, que utilizan el transporte público en un día entre semana.
Ciudad
archivo CD en LightRail
Los Ángeles San Diego Portland Sacramento San Jose San Francisco Philadelphia Boston Denver Salt Lake City
Millas
Pasajeros
22 47 38 21 31 73 69 51 17 18
70 75 81 31 30 164 84 231 35 28 (continúa)
16Ander(693-743).qxd 2/29/08 10:28 AM Page 710
710
Capítulo 16
Análisis de regresión: construcción de modelos
Ciudad Dallas Nueva Orleans San Luis Pittsburgh Buffalo Cleveland Newark
a. b.
c.
d. e.
16.2
Millas
Pasajeros
44 16 34 18 6 15 9
39 14 42 25 23 15 8
Dé el diagrama de dispersión de estos datos, emplee como variable independiente el número de millas de vía. ¿Es apropiado emplear un modelo de regresión lineal? Use un modelo de regresión lineal simple para obtener una ecuación estimada de regresión que sirva para predecir el número de pasajeros por día entre semana, dado que conoce el número de millas de vía. Construya una gráfica de residuales estandarizados. Con base en la gráfica de residuales estandarizados diga si el modelo de regresión lineal simple es apropiado. Realice una transformación logarítmica de la variable dependiente. Obtenga una ecuación estimada de regresión, emplee la variable dependiente transformada. ¿Las suposiciones del modelo al usar la variable dependiente transformada se satisfacen? Realice una transformación recíproca de la variable dependiente. Obtenga una ecuación estimada de regresión, emplee la variable dependiente transformada. ¿Cuál de las ecuaciones de regresión estimada recomienda? Explique.
Determinación de cuándo agregar o quitar variables En esta sección se mostrará el uso de la prueba F para determinar si es ventajoso agregar una o más variables independientes a un modelo de regresión múltiple. Esta prueba se basa en determinar la disminución del valor de la suma de cuadrados debidos al error al agregar una o más variables independientes al modelo. Primero se ilustrará el uso del modelo en el contexto del ejemplo de Butler Trucking. En el capítulo 15 se presentó el modelo de Butler Trucking para ilustrar el uso del análisis de regresión múltiple. Como recordará, los directivos de esta empresa deseaban obtener una ecuación estimada de regresión para predecir el tiempo total del recorrido diario de sus camiones repartidores, a partir de dos variables independientes: millas recorridas y número de entregas. Al usar como única variable independiente el número de millas recorridas x1, se obtuvo la siguiente ecuación estimada de regresión, mediante el método de mínimos cuadrados. ŷ
1.27
0.0678x1
En el capítulo 15 se mostró que la suma de cuadrados debidos al error con este modelo era: SCE = 8.029. Cuando se agregó al modelo otra variable independiente, número de entregas x2, se obtuvo la siguiente ecuación estimada de regresión. ŷ
0.869
0.0611x1
0.923x 2
La suma de cuadrados debidos al error en este modelo fue SCE = 2.299. Agregar x2 dio como resultado una reducción en el valor de SCE. La pregunta es: ¿La adición de la variable x2 conduce a una reducción significativa en el valor de la SCE? Se empleará la notación siguiente: SCE(x1) para denotar la suma de cuadrados debidos al error cuando x1 es la única variable independiente del modelo; SCE(x1, x2) para denotar la suma
16Ander(693-743).qxd 2/29/08 10:28 AM Page 711
16.2
711
Determinación de cuándo agregar o quitar variables
de cuadrados debidos al error, cuando tanto x1 como x2 son las variables del modelo, y así sucesivamente. Por tanto, la disminución del valor de la SCE que se obtuvo al adicionar x2 al modelo que sólo tenía como variable independiente a x1 es SCE(x1) SCE(x1, x2) 8.029 2.299 5.730 Para determinar si esta reducción es significativa se realiza una prueba F. El numerador del estadístico F es la disminución en el valor de SCE dividida entre la cantidad de variables independientes agregadas al modelo original. En este caso, sólo se agregó una variable, x2, por lo que el numerador del estadístico F es SCE(x1) SCE(x1, x 2) 5.730 1 Lo que se obtiene es una medida de la disminución de SCE por variable independiente añadida al modelo. El denominador del estadístico F es el cuadrado medio debido al error en el modelo que contiene todas las variables independientes. En el caso del ejemplo de Butler Trucking, esto corresponde al modelo que tiene tanto a x1 como a x2; por tanto p = 2 y CME
SCE (x1, x 2) 2.299 0.3284 n p 1 7
El siguiente estadístico F es la base para probar si la adición de x2 es estadísticamente significativa. SCE(x1) SCE(x1, x 2) 1 F SCE(x1, x 2) n p 1
(16.10)
El número de grados de libertad en el numerador de este estadístico F es igual al número de variables agregadas al modelo y el número de grados en el denominador es igual a n p 1. En el caso del problema de Butler Trucking se obtiene
F
5.730 1 2.299 7
5.730 0.3284
17.45
Si consulta la tabla 4 del apéndice B, se encuentra que para el nivel de significancia 0.05, F0.05 5.59, por lo que se puede rechazar la hipótesis de que x2 no sea estadísticamente significativa; en otras palabras, al agregar x2 al modelo en el que sólo se tiene como variable independiente x1, se obtiene una disminución significativa en la suma de los cuadrados debido al error. Cuando se desea probar la significancia de agregar sólo una variable independiente al modelo, el resultado que se obtiene con la prueba F que se acaba de describir, también se obtiene con la prueba t para la significancia de uno solo de los parámetros (descrita en la sección 15.4). El estadístico F que se acaba de calcular es el cuadrado del estadístico t que se usa para probar la significancia de un solo parámetro. Puesto que, cuando se agrega una sola variable independiente al modelo, la prueba t es equivalente a la prueba F, esto permite aclarar el uso adecuado de la prueba t para probar la significancia de uno de los parámetros. Si uno de los parámetros no es significativo, la variable correspondiente puede ser eliminada del modelo. Pero, si la prueba t indica que hay dos o más
16Ander(693-743).qxd 2/29/08 10:28 AM Page 712
712
Capítulo 16
Análisis de regresión: construcción de modelos
parámetros que no son significativos, nunca se debe eliminar del modelo más de una variable independiente, con base en la prueba t; cuando se elimina una variable, puede resultar que una segunda variable, que inicialmente no era significativa, se vuelva significativa. Ahora cabe considerar si la adición de más de una variable independiente –como conjunto– da como resultado que haya una reducción significativa de la suma de los cuadrados debidos al error.
Caso general Considere el siguiente modelo de regresión múltiple en el que intervienen q variables independientes, donde q p. y β0 β1x1 β2 x 2 . . . βq xq
(16.11)
Si a este modelo se le agregan las variables xq + 1, xq + 2, . . . , xp, se obtiene un modelo con p variables independientes. y β0 β1x1 β2 x 2 . . . βq xq βq 1xq 1 βq 2 xq 2 . . . βp xp
(16.12)
Para probar si la adición de xq + 1, xq + 2, . . . , xp, es estadísticamente significativa, las hipótesis nula y alternativa pueden plantearse como sigue. H0: βq 1 βq 2 . . . βp 0 Ha: Uno o más de los parámetros no es igual a cero El siguiente estadístico F aporta la base para probar si la adición de estas variables independientes es estadísticamente significativa. SCE(x1, x 2, . . . , xq) F
SCE(x1, x 2, . . . , xq, xq 1, . . . , xp) p q SCE(x1, x 2, . . . , xq, xq 1, . . . , xp) n
Muchos paquetes de software, como Minitab, proporcionan sumas de cuadrados que corresponden al orden en el que cada variable independiente entra al modelo; en tales casos se simplifican los cálculos de la prueba F para determinar si agregar o eliminar un conjunto de variables.
p
(16.13)
1
Este valor F calculado se compara con Fα , el valor en la tabla para p – q grados de libertad en el numerador y n – p – 1 grados de libertad en el denominador. Si F Fα se rechaza H0 y se concluye que el conjunto de variables independientes agregadas es estadísticamente significativo. Observe que si q 1 y p 2, la ecuación (16.13) se reduce a la ecuación (16.10). Para muchos estudiantes encontrar la ecuación (16.13) resulta un poco complicado. Para dar una descripción un poco más sencilla de este cociente F, al modelo que tiene la menor cantidad de variables independientes se le denomina modelo reducido y al modelo que tiene la mayor cantidad de variables independientes se le denomina modelo completo. Si SCE(reducido) denota la suma de los cuadrados debidos al error del modelo reducido y SCE(completo) denota la suma de los cuadrados debidos al error del modelo completo, el numerador de la ecuación (16.13) se expresa como SCE(reducido) SCE(completo) número de términos extra
(16.14)
Observe que “número términos extra” denota la diferencia entre el número de variables independientes en el modelo completo y el número de variables independientes en el modelo reducido. El denominador de la ecuación (16.13) es la suma de los cuadrados debidos al error en el modelo completo dividida entre los correspondientes grados de libertad; en otras palabras, el denomi-
16Ander(693-743).qxd 2/29/08 10:28 AM Page 713
16.2
713
Determinación de cuándo agregar o quitar variables
nador es el cuadrado medio debido al error en el modelo completo. Si se denota el cuadrado medio debido al error del modelo completo como CME(completo) se puede escribir SCE(reducido) SCE(completo) número de términos extra F CME(completo)
(16.15)
Para ilustrar el uso de este estadístico F, suponga que se tiene un problema de regresión que tiene 30 observaciones. En un modelo en el que intervienen las variables independientes x1, x2 y x3 la suma de los cuadrados debida al error es 150 y en un segundo modelo en el que las variables independientes son x1, x2, x3, x4 y x5, la suma de los cuadrados debida al error es 100. ¿La adición de las variables x4 y x5 produjo una reducción significativa de la suma de los cuadrados debida al error? Observe, primero, que el número de grados de libertad para STC es 30 1 29 y que el número de grados de libertad para la suma de cuadrados debida a la regresión para el modelo completo es cinco (el número de variables independientes en el modelo completo). Por tanto, los grados de libertad para la suma de los cuadrados debida al error en el modelo completo es 29 5 24, entonces CME(completo) 100/24 = 4.17. Así, el estadístico F es 150 100 2 F 6.00 4.17 Este valor F que se ha calculado se compara con el valor F que se encuentra en la tabla para dos grados de libertad en el numerador y 24 grados de libertad en el denominador. Para el nivel de significancia 0.05, en la tabla 4 del apéndice B se encuentra F0.05 3.40. Como F 6.00 es mayor que 3.40, se concluye que la adición de las variables x4 y x5 es estadísticamente significativa.
Uso del valor-p También puede usarse el criterio del valor-p para determinar si resulta ventajoso agregar una o más variables independientes a un modelo de regresión múltiple. En el ejemplo anterior se mostró cómo realizar la prueba F para determinar si la adición de dos variables independientes, x4 y x5, a un modelo con tres variables independientes, x1, x2 y x3, era estadísticamente significativo. En ese ejemplo el valor que se obtuvo para el estadístico F fue 6.00 y se concluyó (por comparación de F 6.00 con el valor crítico F0.05 3.40) que la adición de las variables x4 y x5 era significativa. El valor-p que corresponde a F 6.00 (2 grados de libertad en el numerador y 24 grados de libertad en el denominador) es 0.008. Como el valor-p 0.008 α 0.05, también se concluye que la adición de las dos variables independientes es significativa. Al emplear las tablas de la distribución F es difícil determinar directamente el valor-p, pero los paquetes de software como Minitab o Excel facilitan este cálculo.
NOTAS Y COMENTARIOS El cálculo del estadístico F también se basa en las sumas de cuadrados debida a la regresión. Para mostrar esta forma del estadístico F, se nota primero que SCE(reducido) STC SCR(reducido) SCE(completo) STC SCR(completo) Por tanto SCE(reducido) SCE(completo) [STC SCR(reducido)] [STC SCR(completo)] SCR(completo) – SCR(reducido)
16Ander(693-743).qxd 2/29/08 10:28 AM Page 714
714
Capítulo 16
Análisis de regresión: construcción de modelos
Así,
SCR(completo) SCR(reducido) F
número de términos extra CME(completo)
Ejercicios
Métodos 10. En un análisis de regresión en el que se emplearon 27 observaciones, se obtuvo la siguiente ecuación estimada de regresión. ŷ 25.2 5.5x1 a.
Para esta ecuación estimada de regresión STC 1 550 y SCE 520. Utilice α 0.05 y pruebe si x1 es significativa. Suponga que a este modelo le agrega las variables x2 y x3 y obtiene la ecuación de regresión siguiente. ŷ 16.3 2.3x1 12.1x 2 5.8x3
b.
Auto examen
Para esta ecuación estimada de regresión STC 1 550 y SCE 100. Use una prueba F y 0.05 como nivel de significancia para determinar si x2 y x3 contribuyen significativamente al modelo.
11. En un análisis de regresión en el que se emplearon 30 observaciones, se obtuvo la siguiente ecuación estimada de regresión. ŷ 17.6 3.8x1 2.3x 2 7.6x3 2.7x4 a.
Para esta ecuación estimada de regresión STC 1 805 y SCR 1 760. Con α 0.05, pruebe la significancia de la relación entre las variables. Suponga que de este modelo elimina las variables x1 y x4 y obtiene la siguiente ecuación estimada de regresión. ŷ 11.1 3.6x 2 8.1x3
b. c. d.
Para esta ecuación estimada de regresión STC 1 805 y SCR 1 705. Calcule SCE(x1, x2, x3 y x4) Calcule SCE(x2, x3) Use una prueba F y 0.05 como nivel de significancia para determinar si x1 y x4 contribuyen significativamente al modelo.
Aplicaciones
archivo CD en
LPGATour
12. La Ladies Professional Golfers Association (LPGA, por sus siglas en inglés) lleva estadísticas sobre el desempeño y las ganancias de sus miembros en la LPGA Tour. En el archivo titulado LPGA del disco compacto se presentan las estadísticas de fin de año sobre el desempeño de las 30 jugadoras que obtuvieron las mayores ganancias en la LPGA Tour de 2005 (www.lpga.com, 2006). Earnings (ganancias) ($ miles) son los ingresos totales en miles de dólares; Scoring Avg., es la puntuación promedio de una jugadora en todos los eventos; Greens in Reg., es el porcentaje de las veces que una jugadora llega al green en regulación; Putting Avg., es el promedio de putts hechos en el green en regulación, y Sand Saves es el porcentaje de veces que la jugadora
16Ander(693-743).qxd 2/29/08 10:28 AM Page 715
16.2
715
Determinación de cuándo agregar o quitar variables
logra “subir y bajar” (“up and down”) cuando se encuentra en un búnker de arena al lado del green. a. Obtenga una ecuación estimada de regresión que sirva para predecir Scoring Avg. dado Greens in Reg. b. Obtenga una ecuación estimada de regresión que sirva para predecir Scoring Avg. dados Greens in Reg., Putting Avg. y Sand Saves. c. Con un nivel de significancia 0.05 pruebe si las dos variables independientes agregadas en el inciso b, Putting Avg. y Sand Saves, contribuyen significativamente a la ecuación estimada de regresión obtenida en el inciso a. Explique.
archivo CD en LPGATour
13. Vaya al ejercicio 12. a. Obtenga una ecuación estimada de regresión que sirva para predecir Earnings, conociendo Putting Avg. b. Obtenga una ecuación estimada de regresión que sirva para predecir Earnings, conociendo Putting Avg. y Sand Saves. c. Emplee como nivel de significancia 0.05 y pruebe si las dos variables independientes agregadas en el inciso b, Putting Avg. y Sand Saves, contribuyen significativamente a la ecuación estimada de regresión obtenida en el inciso a. Explique. d. En general, puntuaciones más bajas llevan a ganancias más altas. Para investigar esta opción para predecir las Earnings, obtenga una ecuación estimada de regresión que sirva para predecir Earnings, Scoring Avg. ¿Preferiría emplear esta ecuación para predecir las ganancias (Earnings) o la ecuación obtenida en el inciso b? Explique. 14. En un estudio realizado a lo largo de 10 años por la American Heart Association se obtuvieron datos acerca de la relación entre edad, presión sanguínea y fumar con el riesgo a sufrir un infarto. Los datos que se presentan a continuación son parte de este estudio. El riesgo se interpreta como la probabilidad (multiplicada por 100) de que el paciente sufra un infarto en los próximos 10 años. Para la variable fumar, defina una variable ficticia que tome el valor 1 si la persona es fumadora y el valor 0 si no es fumadora.
archivo CD en Stroke
Riesgo
Edad
Presión
Fumador
12 24 13 56 28 51 18 31 37 15 22 36
57 67 58 86 59 76 56 78 80 78 71 70
152 163 155 177 196 189 155 120 135 98 152 173
0 0 0 1 0 1 1 0 1 0 0 1 (continúa)
16Ander(693-743).qxd 2/29/08 10:28 AM Page 716
716
Capítulo 16
a. b.
c.
Análisis de regresión: construcción de modelos
Riesgo
Edad
Presión
Fumador
15 48 15 36 8 34 3 37
67 77 60 82 66 80 62 59
135 209 199 119 166 125 117 207
1 1 0 1 0 1 0 1
Obtenga una ecuación estimada de regresión que sirva para predecir el riesgo de sufrir un infarto, dados edad y presión sanguínea. Considere la adición de dos variables independientes al modelo obtenido en el inciso a, una para la interacción entre edad y presión sanguínea y otra que indique si la persona es o no un fumador. Obtenga una ecuación estimada de regresión, emplee estas cuatro variables independientes. Emplee como nivel de significancia 0.05, realice una prueba para determinar si la adición de la variable de la interacción y la variable fumador contribuyen significantemente a la ecuación estimada de regresión obtenida en el inciso a.
15. La National Football League, NFL, evalúa a sus prospectos con una escala que va del 5 al 9. Estas evaluaciones se interpretan como sigue: 8-9 deberá empezar el año próximo; 7.0-7.9 deberá empezar; 6.0-6.9 servirán de respaldo al equipo y 5.0-5.9 pueden formar parte del club y contribuir. En la tabla siguiente se da posición, peso, tiempo en segundos para correr 40 yardas y la evaluación dada por la NFL a 40 prospectos (USA Today, 14 de abril de 2000).
archivo CD en NFL
Observación
Nombre
Posición
Peso
Tiempo
Evaluación
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
Peter Warrick Plaxico Burress Sylvester Morris Travis Taylor Laveranues Coles Dez White Jerry Porter Ron Dugans Todd Pinkston Dennis Northcutt Anthony Lucas Darrell Jackson Danny Farmer Sherrod Gideon Trevor Gaylor Cosey Coleman Travis Claridge Kaulana Noa Leander Jordan Chad Clifton Manula Savea Ryan Johanningmeir Mark Tauscher Blaine Saipaia Richard Mercier Damion McIntosh Jeno James
Receptor Receptor Receptor Receptor Receptor Receptor Receptor Receptor Receptor Receptor Receptor Receptor Receptor Receptor Receptor Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia Guardia
194 231 216 199 192 218 221 206 169 175 194 197 217 173 199 322 303 317 330 334 308 310 318 321 295 328 320
4.53 4.52 4.59 4.36 4.29 4.49 4.55 4.47 4.37 4.43 4.51 4.56 4.60 4.57 4.57 5.38 5.18 5.34 5.46 5.18 5.32 5.28 5.37 5.25 5.34 5.31 5.64
9.0 8.8 8.3 8.1 8.0 7.9 7.4 7.1 7.0 7.0 6.9 6.6 6.5 6.4 6.2 7.4 7.0 6.8 6.7 6.3 6.1 6.0 6.0 6.0 5.8 5.3 5.0
16Ander(693-743).qxd 2/29/08 10:28 AM Page 717
16.3
Observación
Nombre
Posición
Peso
Tiempo
Evaluación
28 29 30 31 32 33 34 35 36 37 38 39 40
Al Jackson Chris Samuels Stockar McDougle Chris McIngosh Adrian Klemm Todd Wade Marvel Smith Michael Thompson Bobby Williams Darnell Alford Terrance Beadles Tutan Reyes Greg Robinson-Ran
Guardia Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo Tackle ofensivo
304 325 361 315 307 326 320 287 332 334 312 299 333
5.20 4.95 5.50 5.39 4.98 5.20 5.36 5.05 5.26 5.55 5.15 5.35 5.59
5.0 8.5 8.0 7.8 7.6 7.3 7.1 6.8 6.8 6.4 6.3 6.1 6.0
a. b. c.
d.
16.3
717
Análisis de un problema mayor
Dé una variable ficticia para la posición de los jugadores. Obtenga una ecuación estimada de regresión que indique la relación entre evaluación y posición, peso y tiempo para correr 40 yardas. Emplee 0.05 como nivel de significancia, pruebe si la ecuación estimada de regresión obtenida en el inciso b representa una relación significante entre las variables independientes y la variable dependiente. ¿La posición es un factor significativo para la evaluación del jugador? Use α = 0.05. Explique.
Análisis de un problema mayor Al introducir el análisis de regresión múltiple, se usó ampliamente el ejemplo de Butler Trucking. Al explorar los conceptos fue una ventaja que este problema fuera pequeño. Sin embargo, este problema pequeño dificulta ilustrar algunas de las cuestiones relacionadas con la selección de variables que intervienen en la construcción de un modelo. Para dar un ejemplo de los procesos de selección de variables que se estudian en la sección siguiente, se introduce un conjunto de datos que consta de 25 observaciones con ocho variables independientes. El doctor David W. Cravens del departamento de marketing de la Texas Christian University otorgó el permiso para emplear estos datos. Por esta razón a este conjunto de datos se le llamará datos de Cravens.* Los datos de Cravens son de una empresa que tiene varios territorios de ventas, cada uno de los cuales le está asignado a un solo representante de ventas. Para determinar si diversas variables (independientes) predictoras podían explicar las ventas en cada uno de los territorios se realizó un análisis de regresión. A partir de una muestra de 25 territorios se obtuvieron los datos que se muestran en la tabla 16.5; en la tabla 16.6 se presenta la definición de las variables. Como paso preliminar se considerarán los coeficientes de correlación entre cada par de variables. En la figura 16.13 se presenta la matriz de correlación obtenida con Minitab. Observe que el coeficiente de correlación muestral entre Sales y Time es 0.623, entre Sales y Poten es 0.598 y así sucesivamente. Si observa los coeficientes de correlación entre las variables independientes, se dará cuenta de que la correlación entre Time y Accounts es 0.758; por tanto, si Accounts se usa como una de las variables independientes, Time no agregaría mucho poder explicatorio al modelo. Recuerde la prueba de la regla práctica que se vio en la sección 15.4, donde la multicolinealidad puede causar problemas si el valor absoluto del coeficiente de correlación muestral, entre cualesquiera dos de las variables independientes, es mayor que 0.7. Por tanto, siempre que sea posible, *Para más detalles ver David W. Cravens, Robert B. Woodruff y Joe C. Stamper, “An Analytical Approach for Evaluating Sales Territory Performance”, Journal of Marketing, 36 (enero, 1972): 31-37. Copyright © 1972 American Marketing Association.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 718
718
Capítulo 16
TABLA 16.5
Análisis de regresión: construcción de modelos
DATOS DE CRAVENS ..
Ventas Antiguedad Potencial
archivo CD en Cravens
3 669.88 3 473.95 2 295.10 4 675.56 6 125.96 2 134.94 5 031.66 3 367.45 6 519.45 4 876.37 2 468.27 2 533.31 2 408.11 2 337.38 4 586.95 2 729.24 3 289.40 2 800.78 3 264.20 3 453.62 1 741.45 2 035.75 1 578.00 4 167.44 2 799.97
43.10 108.13 13.82 186.18 161.79 8.94 365.04 220.32 127.64 105.69 57.72 23.58 13.82 13.82 86.99 165.85 116.26 42.28 52.84 165.04 10.57 13.82 8.13 58.44 21.14
74 065.1 58 117.3 21 118.5 68 521.3 57 805.1 37 806.9 50 935.3 35 602.1 46 176.8 42 053.2 36 829.7 33 612.7 21 412.8 20 416.9 36 272.0 23 093.3 26 878.6 39 572.0 51 866.1 58 749.8 23 990.8 25 694.9 23 736.3 34 314.3 22 809.5
GastPubl Participación Cambio 4 582.9 5 539.8 2 950.4 2 243.1 7 747.1 402.4 3 140.6 2 086.2 8 846.2 5 673.1 2 761.8 1 991.8 1 971.5 1 737.4 10 694.2 8 618.6 7 747.9 4 565.8 6 022.7 3 721.1 861.0 3 571.5 2 845.5 5 060.1 3 552.0
2.51 5.51 10.91 8.27 9.15 5.51 8.54 7.07 12.54 8.85 5.38 5.43 8.48 7.80 10.34 5.15 6.64 5.45 6.31 6.35 7.37 8.39 5.15 12.88 9.14
0.34 0.15 0.72 0.17 0.50 0.15 0.55 0.49 1.24 0.31 0.37 0.65 0.64 1.01 0.11 0.04 0.68 0.66 0.10 0.03 1.63 0.43 0.04 0.22 0.74
Cuentas
Trabajo
Evaluación
74.86 107.32 96.75 195.12 180.44 104.88 256.10 126.83 203.25 119.51 116.26 142.28 89.43 84.55 119.51 80.49 136.58 78.86 136.58 138.21 75.61 102.44 76.42 136.58 88.62
15.05 19.97 17.34 13.40 17.64 16.22 18.80 19.86 17.42 21.41 16.32 14.51 19.35 20.02 15.26 15.87 7.81 16.00 17.44 17.98 20.99 21.66 21.46 24.78 24.96
4.9 5.1 2.9 3.4 4.6 4.5 4.6 2.3 4.9 2.8 3.1 4.2 4.3 4.2 5.5 3.6 3.4 4.2 3.6 3.1 1.6 3.4 2.7 2.8 3.9
se evitará incluir a las dos variables, Time y Accounts, en el modelo. También el coeficiente de correlación muestral entre Change y Rating, que es 0.549, es elevado y merece ser considerado más cuidadosamente. Al observar los coeficientes de correlación muestrales entre Sales y cada una de las variables independientes se puede tener una rápida idea de cuáles de las variables independientes son, en sí mismas, buenos predictores. Se encuentra que el mejor predictor de Sales es Accounts, debiTABLA 16.6
DEFINICIÓN DE LAS VARIABLES EN LOS DATOS DE CRAVENS
Variable Ventas Antigüedad (Time) Potencial (Poten) GastPubl (AdvExp) Participación (Share) Cambio (Change) Cuentas (Accounts) Trabajo (Work) Evaluación (Rating)
Definición Total de ventas acreditadas al representante de ventas Antigüedad del empleado en meses Potencial de mercado: ventas industriales totales en unidades en el territorio de ventas* Gastos del territorio en publicidad Participación en el mercado: promedio ponderado de los últimos cuatro años Cambio, en los últimos cuatro años en participación en el mercado Número de cuentas asignadas a los representantes de ventas* Carga de trabajo: índice ponderado basado en compras anuales y concentración de cuentas Evaluación general del representante de ventas sobre ocho dimensiones de desempeño: una evaluación agregada en una escala del 1-7
*Estos datos fueron codificados para proteger la confidenciabilidad.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 719
16.3
FIGURA 16.13
Time Poten AdvExp Share Change Accounts Work Rating
719
Análisis de un problema mayor
COEFICIENTES DE CORRELACIÓN MUESTRAL DE LOS DATOS DE CRAVENS Sales 0.623 0.598 0.596 0.484 0.489 0.754 -0.117 0.402
Time
Poten
AdvExp
Share
Change
Accounts
0.454 0.249 0.106 0.251 0.758 -0.179 0.101
0.174 -0.211 0.268 0.479 -0.259 0.359
0.264 0.377 0.200 -0.272 0.411
0.085 0.403 0.349 -0.024
0.327 -0.288 0.549
-0.199 0.229
Work
-0.277
do a que su coeficiente de correlación muestral es el más alto (0.754). Recuerde que si sólo se tiene una variable independiente, el cuadrado del coeficiente de correlación muestral es el coeficiente de determinación. Por tanto, Accounts explica (0.754)2(100), o 56.85%, de la variabilidad en Sales. Las variables independientes que siguen en importancia son Time, Poten y AdvExp, cada una con un coeficiente de correlación muestral de 0.6, aproximadamente. Aun cuando existen problemas potenciales de multicolinealidad, se va a obtener una ecuación estimada de regresión con estas ocho variables. Con el paquete de software Minitab se obtienen los resultados que se presentan en la figura 16.14. El coeficiente de determinación ajustado para este modelo de regresión múltiple con ocho variables es 88.3%. Observe, sin embargo, que los valores-p de las pruebas t para cada uno de los parámetros indican que sólo Poten, AdvExp y Share son significativos a un nivel de significancia α 0.05, dado el efecto de todas las demás variables. Por tanto, se deseará investigar los resultados que se obtienen si se usan solamente estas tres
FIGURA 16.14
RESULTADOS DE MINITAB PARA EL MODELO CON OCHO VARIABLES INDEPENDIENTES
The regression equation is Sales = - 1508 + 2.01 Time + 0.0372 Poten + 0.151 AdvExp + 199 Share + 291 Change + 5.55 Accounts + 19.8 Work + 8 Rating Predictor Constant Time Poten AdvExp Share Change Accounts Work Rating S = 449.0
Coef 1507.8 2.010 0.037205 0.15099 199.02 290.9 5.551 19.79 8.2
SE Coef 778.6 1.931 0.008202 0.04711 67.03 186.8 4.776 33.68 128.5
R-sq = 92.2%
T -1.94 1.04 4.54 3.21 2.97 1.56 1.16 0.59 0.06
p 0.071 0.313 0.000 0.006 0.009 0.139 0.262 0.565 0.950
R-sq(adj) = 88.3%
Analysis of Variance SOURCE Regression Residual Error Total
DF 8 16 24
SS 38153568 3225984 41379552
MS 4769196 201624
F 23.65
p 0.000
16Ander(693-743).qxd 2/29/08 10:28 AM Page 720
720
Capítulo 16
FIGURA 16.15
Análisis de regresión: construcción de modelos
RESULTADOS DE MINITAB PARA EL MODELO CON TRES VARIABLES, POTEN, ADVEXP Y Share
The regression equation is Sales = - 1604 + 0.0543 Poten + 0.167 AdvExp + 283 Share Predictor Constant Poten AdvExp Share S = 545.5
Coef -1603.6 0.054286 0.16748 282.75
SE Coef 505.6 0.007474 0.04427 48.76
R-sq = 84.9%
T -3.17 7.26 3.78 5.80
p 0.005 0.000 0.001 0.000
R-sq(adj) = 82.7%
Analysis of Variance SOURCE Regression Residual Error Total
DF 3 21 24
SS 35130240 6249310 41379552
MS 11710080 297586
F 39.35
p 0.000
variables. En la figura 16.15 se muestran los resultados proporcionados por Minitab para la ecuación estimada de regresión con estas tres variables. Se ve que el coeficiente de determinación ajustado para esta ecuación estimada de regresión es 82.7%, el cual, aunque no es tan bueno como el de la ecuación estimada de regresión con ocho variables, es alto. ¿Cómo se puede encontrar una ecuación estimada de regresión que dé mejores resultados, dada la información de que se dispone? Una posibilidad es calcular todas las regresiones posibles. Es decir, obtener ocho ecuaciones estimadas de regresión con una sola variable (cada una de las cuales corresponde a una de las variables independientes), 28 ecuaciones estimadas de regresión con dos variables independientes (que es el número de combinaciones de ocho variables tomadas de dos en dos), y así sucesivamente. Para los datos de Cravens se necesitan, en total, 255 ecuaciones estimadas de regresión conteniendo una o más de las variables independientes. Con los excelentes paquetes de software de que se dispone en la actualidad, se pueden calcular todas estas regresiones. Sin embargo, hacerlo representa una gran cantidad de cálculos y requiere que se revise una gran cantidad de resultados de computadora, la mayor parte de los cuales corresponderán a modelos obviamente pobres. En lugar de hacer esto se prefiere seguir un método más sistemático para elegir el subconjunto de variables independientes que proporcione la mejor ecuación estimada de regresión. En la sección siguiente se presentan algunos de los métodos más conocidos.
16.4 Los procedimientos de selección de variables son especialmente útiles en las primeras etapas de la construcción de un modelo, pero no pueden sustituir la experiencia y el criterio del analista.
Procedimientos de elección de variables En esta sección se verán cuatro procedimientos de selección de variables: la regresión por pasos, la selección hacia adelante, la selección hacia atrás y la regresión del mejor subconjunto. Dado un conjunto de datos en el que hay varias variables independientes, estos procedimientos permiten determinar con qué variables independientes se obtiene el mejor modelo. Los tres primeros procedimientos son iterativos; en cada paso del procedimiento se agrega o se elimina una variable independiente y se evalúa el nuevo modelo. El procedimiento continúa hasta que un criterio de detención indica que el procedimiento ya no puede hallar un modelo mejor. El último procedimiento (mejores subconjuntos) no es un procedimiento que evalúe las variables de una en una, sino que evalúa modelos de regresión en los que intervienen distintos subconjuntos de variables independientes.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 721
16.4
Procedimientos de elección de variables
721
En los procedimientos regresión por pasos, selección hacia adelante y eliminación hacia atrás, en cada paso, el criterio para elegir una variable independiente para agregarla o eliminarla del modelo, se basa en el estadístico F presentado en la sección 16.2. Suponga, por ejemplo, que se desea considerar si agregar x2 a un modelo en el que interviene x1 o eliminar x2 de un modelo en el que intervienen x1 y x2. Para probar si la adición o la eliminación de x2 es estadísticamente significativa, las hipótesis nula y alternativa pueden establecerse como sigue: H0: β2 0 Ha: β2 0 En la sección 16.2 (ver ecuación (16.10)) se mostró que SCE(x1) F
SCE(x1, x 2) 1 SCE(x1, x 2) n p 1
es usado como criterio para determinar si la presencia de x2 en el modelo causa una reducción significativa de la suma de los cuadrados debidos al error. El valor-p correspondiente a este estadístico F es el criterio que se emplea para determinar si se debe agregar o eliminar una variable independiente del modelo de regresión. Para el rechazo se emplea la regla usual: rechazar H0 si valor-p α.
Regresión por pasos El procedimiento de regresión por pasos empieza por determinar en cada paso si alguna de las variables que ya se encuentran en el modelo debe ser eliminada. Para esto primero se calcula el estadístico F y el correspondiente valor-p para cada una de las variables independientes que intervienen en el modelo. Minitab le llama al nivel de significancia α que se emplea para determinar si una variable independiente debe ser eliminada del modelo Alpha to remove (Alpha para eliminar). Si el valor-p de alguna de las variables independientes es mayor que Alpha to remove, la variable independiente que tenga el mayor valor-p se elimina del modelo y el proceso de regresión por pasos empieza un nuevo paso. Si ninguna de las variables independientes puede ser eliminada del modelo, el procedimiento trata de ingresar otra variable independiente al modelo. Para hacer esto primero se calcula el estadístico F y el valor-p de cada variable independiente que no está en el modelo. Minitab le llama al nivel de significancia α que emplea para determinar si una variable independiente debe agregarse al modelo, Alpha to enter (Alpha para ingresar). La variable independiente que tiene el menor valor-p es ingresada al modelo siempre que su valor-p sea menor que Alpha to enter. Este procedimiento continúa de la misma forma hasta que no haya ninguna variable independiente que pueda ser eliminada o agregada al modelo. En la figura 16.16 se muestran los resultados obtenidos por Minitab con el procedimiento de regresión por pasos aplicado a los datos de Cravens, con 0.05 como Alpha to remove y 0.05 como Alpha to enter. Este procedimiento por pasos terminó en cuatro pasos. La ecuación estimada de regresión obtenida con el procedimiento de regresión por pasos de Minitab es Dado que los procedimientos de una en una variable no consideran todos los subconjuntos posibles de una cantidad dada de variables independientes, estos procedimientos no necesariamente eligen el modelo con el que se obtenga el valor mayor R-sq.
ŷ 1 441.93 9.2 Accounts (Cuentas) 0.175 AdvExp (GastPubl) 0.0382 Poten 190 Share (Participación)
En la figura 16.16, observe también que, después de cuatro pasos, s 兹CME se ha reducido de 881 en el mejor modelo con una variable [Cuentas (Accounts)] a 454. El valor de R-sq ha aumentado de 56.85 a 90.04% y el R-sq(adj) de la ecuación estimada de regresión recomendada es 88.05%. En resumen, en cada paso del procedimiento de regresión por pasos, lo primero que se considera es si alguna de las variables independientes puede ser eliminada del modelo que se tiene. Si
16Ander(693-743).qxd 2/29/08 10:28 AM Page 722
722
Capítulo 16
FIGURA 16.16
Análisis de regresión: construcción de modelos
RESULTADO DE LA REGRESIÓN POR PASOS DE MINITAB PARA LOS DATOS DE CRAVENS Alpha-to-Enter: 0.05
Alpha-to-Remove: 0.05
Response is Sales on 8 predictors, with N = 25 Step Constant
1 709.32
2 50.29
3 -327.24
4 -1441.93
Accounts T-Value P-Value
21.7 5.50 0.000
19.0 6.41 0.000
15.6 5.19 0.000
9.2 3.22 0.004
0.227 4.50 0.000
0.216 4.77 0.000
0.175 4.74 0.000
0.0219 2.53 0.019
0.0382 4.79 0.000
AdvExp T-Value P-Value Poten T-Value P-Value Share T-Value P-Value S R-Sq R-Sq(adj) C-p
190 3.82 0.001 881 56.85 54.97 67.6
650 77.51 75.47 27.2
583 82.77 80.31 18.4
454 90.04 88.05 5.4
ninguna de las variables independientes puede ser eliminada del modelo, el procedimiento verifica si alguna de las variables independientes que no intervienen en el modelo puede ser ingresada al modelo. Debido a la naturaleza del procedimiento de regresión por pasos, puede ser que una variable independiente sea ingresada al modelo en un paso, en un paso subsiguiente eliminada y después ingresada al modelo en un paso posterior. El procedimiento se detiene cuando no hay ya ninguna variable independiente que pueda ser eliminada del modelo ni agregada al modelo.
Selección hacia adelante En el procedimiento de selección hacia adelante se empieza sin ninguna variable independiente y se van agregando variables de una en una con el mismo procedimiento que se usa en la regresión por pasos para determinar si una variable independiente debe ser ingresada al modelo. Pero, en el procedimiento de selección hacia adelante no se permite que se elimine del modelo una variable que ha sido ingresada. El procedimiento se detiene cuando el valor-p de cada una de las variables independientes que no están en el modelo es mayor que Alpha to enter. La ecuación estimada de regresión obtenida mediante el procedimiento de selección hacia adelante de Minitab es ŷ 1 441.93 9.2 Accounts (Cuentas) 0.175 AdvExp (GastPubl) 0.0382 Poten 190 Share (Participación)
Por tanto, en el caso de los datos de Cravens, con el procedimiento de selección hacia adelante (con 0.05 como Alpha to enter) se llega a la misma ecuación estimada de regresión que con el procedimiento por pasos.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 723
16.4
Procedimientos de elección de variables
723
Eliminación hacia atrás En el procedimiento de eliminación hacia atrás se empieza con un modelo en el que se incluyen todas las variables independientes. Después, de una en una, se van eliminando variables independientes mediante el mismo procedimiento que en la regresión por pasos. Sin embargo, en el procedimiento de eliminación hacia atrás no se permite que una variable que ya ha sido eliminada vuelva a ser ingresada al modelo. El procedimiento se detiene cuando ninguna de las variables independientes del modelo tenga un valor-p mayor que Alpha to remove. La ecuación estimada de regresión obtenida con el procedimiento de eliminación hacia atrás de Minitab aplicado a los datos de Cravens (con 0.05 como Alpha to remove) es ŷ 1 312 3.8 Time (Antigüedad) 0.0444 Potencial 0.152 AdvExp (GastPubl) 259 Share (participación)
La selección hacia adelante y la eliminación hacia atrás pueden llevar a modelos distintos.
Al comparar la ecuación estimada de regresión obtenida mediante el procedimiento de eliminación hacia atrás con la ecuación estimada de regresión obtenida con el procedimiento de selección hacia adelante, se ve que hay tres variables independientes comunes a los dos procedimientos: AdvExp, Poten y Share. Pero, en el procedimiento de eliminación hacia atrás se incluyó Time en lugar de Accounts. La selección hacia adelante y la eliminación hacia atrás son dos extremos en la construcción de modelos; en el procedimiento de selección hacia adelante se empieza sin ninguna variable independiente en el modelo y, una por una, se van agregando variables independientes, mientras que en el procedimiento de eliminación hacia atrás se empieza teniendo todas las variables independientes en el modelo y, de una en una, se eliminan variables. Con los dos procedimientos se puede llegar a la misma ecuación estimada de regresión. Sin embargo, también es posible que se llegue a ecuaciones estimadas de regresión diferentes, como ocurre en el caso de los datos de Cravens. ¿Por cuál de las ecuaciones estimadas de regresión decidirse? Esto es algo que queda a discusión. Al final el analista tiene que aplicar su propio criterio. El procedimiento de los mejores subconjuntos para la construcción de modelos que se estudia a continuación proporciona más información para la construcción de modelos, información que debe ser considerada antes de tomar la decisión final.
Regresión de los mejores subconjuntos La regresión por pasos, la selección hacia adelante y la eliminación hacia atrás son métodos para elegir un modelo de regresión que agrega o elimina, una por una, variables independientes. Ninguno de estos métodos garantiza que dado un determinado número de variables se encuentre el mejor modelo. Por tanto, estos métodos de una por una suelen ser considerados como heurísticos para la selección de un buen modelo de regresión. Algunos paquetes de software usan un procedimiento llamado regresión de los mejores subconjuntos que permite al usuario, hallar el mejor modelo de regresión para un número determinado de variables independientes. Minitab cuenta con este procedimiento. En la figura 16.17 se presenta parte de los resultados obtenidos mediante el procedimiento de los mejores subconjuntos de Minitab aplicado a los datos de Cravens. En estos resultados aparecen las dos mejores ecuaciones de regresión estimada con una sola variable, las dos mejores ecuaciones con dos variables, las dos mejores ecuaciones con tres variables, etc. El criterio que se emplea para determinar cuáles son las mejores ecuaciones estimadas de regresión con un determinado número de predictores es el valor del coeficiente de determinación (R-sq). Por ejemplo, Accounts proporciona la mejor ecuación estimada de regresión con una sola variable independiente, R-sq 56.8%; al usar AdvExp y Accounts se obtiene la mejor ecuación estimada de regresión con dos variables independientes, R-sq 77.5%, y con Poten, AdvExp y Share se obtiene la mejor ecuación estimada de regresión con tres variables independientes, R-sq 84.9%. Para los datos de Cravens, el mayor coeficiente de determinación ajustado (Adj.R-sq 89.4%) es el del modelo con seis variables independientes, Time, Poten, AdvExp, Share, Change y Accounts. Sin embargo, el coeficiente de determinación ajustado del mejor modelo con cuatro variables independientes (Poten, AdvExp, Share y Accounts) es casi igual de alto (88.1%). Por lo general, se prefiere el modelo más sencillo con el menor número de variables.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 724
724
Capítulo 16
Análisis de regresión: construcción de modelos
FIGURA 16.17
PARTE DE LOS RESULTADOS OBTENIDOS CON LA REGRESIÓN DE LOS MEJORES SUBCONJUNTOS DE MINITAB
Vars
R-sq
Adj. R-sq
s
1 1 2 2 3 3 4 4 5 5 6 6 7 7 8
56.8 38.8 77.5 74.6 84.9 82.8 90.0 89.6 91.5 91.2 92.0 91.6 92.2 92.0 92.2
55.0 36.1 75.5 72.3 82.7 80.3 88.1 87.5 89.3 88.9 89.4 88.9 89.0 88.8 88.3
881.09 1049.3 650.39 691.11 545.52 582.64 453.84 463.93 430.21 436.75 427.99 438.20 435.66 440.29 449.02
T i m e
P o t e n
A d v E x p
S h a r e
C h a n g e
A c c o u n t s
W o r K
R a t I n g
X X X
X X X X X X
X X X X X X X X X X X X
X X
X X X X X X X X X X X
X X X X X X X X X X
X X X X X X X X X
X X X X X X X X X X X
Elección final El análisis de los datos de Cravens hecho hasta ahora es una buena preparación para tomar una decisión por un modelo, pero antes habrá que hacer también otros análisis. Como se indicó en los capítulos 14 y 15, es necesario hacer un cuidadoso análisis de los residuales. Se desea que la gráfica de los residuales del modelo elegido parezca una banda horizontal. Suponga que en los residuales no se encuentre ningún problema y que se desee emplear los resultados del procedimiento de los mejores subconjuntos para decidirse por un modelo. El procedimiento de los mejores subconjuntos indica que el mejor modelo con cuatro variables es el que contiene las variables independientes Poten, AdvExp, Share y Accounts. Este modelo resulta ser también el modelo con cuatro variables encontrado mediante el procedimiento de regresión por pasos. La tabla 16.7 ayuda a tomar la decisión final. En esta tabla se muestran varios modelos que contienen algunas, o las cuatro, de estas cuatro variables independientes.
TABLA 16.7
MODELOS SELECCIONADOS CON Accounts, Poten, AdvExp Y Share Modelo
Variables independientes
Adj. R-sq
1 2 3 4 5 6
Accounts AdvExp, Accounts Poten, Share Poten, AdvExp, Accounts Poten, AdvExp, Share Poten, AdvExp, Share, Accounts
55.0 75.5 72.3 80.3 82.7 88.1
16Ander(693-743).qxd 2/29/08 10:28 AM Page 725
16.4
725
Procedimientos de elección de variables
En la tabla 16.7 se ve que el modelo que sólo tiene AdvExp y Accounts es bueno. Su coeficiente de determinación ajustado es 75.5%, y con el modelo con las cuatro variables sólo se logra un aumento de 12.6 puntos porcentuales. El modelo más sencillo que sólo tiene dos variables puede preferirse si, por ejemplo, es difícil medir el potencial de mercado (Poten). Sin embargo, si ya se cuenta con los datos y se requiere gran precisión en la predicción de las ventas, es claro que se preferirá el modelo con las cuatro variables. NOTAS Y COMENTARIOS 1. En el procedimiento por pasos se requiere que Alpha to remove sea mayor o igual que Alpha to enter. Este requerimiento evita que, en un mismo paso, una misma variable sea eliminada y reingresada. 2. Para crear nuevas variables independientes que puedan ser usadas con los procedimientos de esta sección se usan funciones de las variables independientes. Por ejemplo, si se desea tener
en el modelo x1x2 para reflejar la interacción, se usan los datos de x1 y de x2 para crear una variable z x1x2. 3. Ninguno de los procedimientos que agregan o eliminan variables de una en una garantizan que se encuentre el mejor modelo de regresión. Pero estos procedimientos son excelentes para hallar buenos modelos, en especial cuando hay poca multicolinealidad.
Ejercicios
Aplicaciones 16. En un estudio se obtuvieron datos de variables que pueden estar relacionadas con el número de semanas que está desempleado un trabajador de la industria. La variable dependiente de este estudio (semanas) se definió como el número de semanas que un empleado está desempleado debido a despido. En este estudio se usaron las siguientes variables independientes.
archivo CD en Layoffs
Age (edad)
Edad del trabajador
Educ (educación)
Número de años de estudio
Married (casado)
Variable ficticia; 1 si está casado, 0 si no es así
Head (cabeza)
Variable ficticia; 1 si es cabeza de familia, 0 si no es así
Tenure (ocupación)
Número de años en el trabajo anterior
Manager (administrativo) Variable ficticia; 1 si su ocupación es en administración , 0 si no es así Sales (ventas)
Variable ficticia; 1 si su ocupación es en ventas, 0 si no es así
Estos datos se encuentran en el archivo Layoffs del disco compacto que se distribuye con el libro. a. Obtenga la mejor ecuación estimada de regresión que tenga una variable. b. Emplee el procedimiento por pasos para obtener la mejor ecuación estimada de regresión. Use 0.05 como Alpha to enter y Alpha to remove. c. Use el procedimiento de selección hacia adelante para obtener la mejor ecuación estimada de regresión. Use 0.05 como Alpha to enter. d. Use el procedimiento de eliminación hacia atrás para obtener la mejor ecuación estimada de regresión. Use 0.05 como Alpha to remove. e. Use el procedimiento de regresión de los mejores subconjuntos para obtener la mejor ecuación estimada de regresión.
archivo CD en LPGATour2
17. La Ladies Professional Golfers Association (LPGA) lleva estadísticas sobre el desempeño y las ganancias de sus miembros en la LPGA Tour. En el archivo titulado LPGATour 2 del disco compacto se presentan las estadísticas de fin de año sobre el desempeño de las 30 jugadoras que tuvieron las mejores ganancias en la LPGA Tour de 2005 (www.lpga.com, 2006). Earnings (ga-
16Ander(693-743).qxd 2/29/08 10:28 AM Page 726
726
Capítulo 16
Análisis de regresión: construcción de modelos
nancias) (miles) son las ganancias totales en miles de dólares en todos los eventos de la gira; Scoring Avg., es la puntuación promedio de la jugadora en todos los eventos; Drive Average es la distancia media alcanzada en el drive por el jugador en yardas; Greens in Reg., es el porcentaje de veces que una jugadora llega al green en regulación; Putting Avg., es el promedio de putts realizados en el green en regulación, y Sand Saves es el porcentaje de veces que la jugadora logra “subir y bajar” (“up and down”) cuando se encuentra en un búnker de arena al lado del green. Sea Drive Greens una nueva variable independiente que represente la interacción entre la distancia media alcanzada en el drive por el jugador y Greens in Reg. Use los métodos de esta sección para obtener la mejor ecuación estimada de regresión múltiple para estimar Scoring Avg de un jugador. 18. Jeff Sagarin proporciona, desde 1985, evaluaciones deportivas para USA Today. En el béisbol sus pronósticos RPG (runs/game) estadísticos toman en cuenta todas las estadísticas de ofensiva del jugador y, se asegura, que es la mejor medida del verdadero valor de la ofensiva de un jugador. En los datos que se presentan a continuación se da el RPG y varios estadísticos de ofensiva de la temporada de la Liga Mayor de Béisbol correspondientes a 20 miembros de los Yankees de Nueva York (www.usatoday.com, 3 de marzo de 2006). Los rótulos de las columnas se definen como sigue: RPG, estadístico que predice número de carreras por juego; H, batazos buenos; 2B, dobles; 3B, triples; HR, cuadrangulares; RBI, carreras bateadas; BB, bases por bola; SO, ponchadas; SB, bases robadas; CS, atrapado en robo de base; OBP, porcentaje en base; SLG, porcentaje de potencia de bateo; AVG, promedio de bateo.
archivo CD en Yankees
Jugador
RPG
H
D Jeter H Matsui A Rodriguez G Sheffield R Cano B Williams J Posada J Giambi T Womack T Martinez M Bellhorn R Sierra J Flaherty B Crosby M Lawton R Sanchez A Phillips M Cabrera R Johnson F Escalona
6.51 6.32 9.06 6.93 5.01 4.14 5.36 9.11 2.91 5.08 4.07 3.27 1.83 3.48 5.15 3.36 2.13 1.19 3.44 5.31
202 192 194 170 155 121 124 113 82 73 63 39 21 27 6 12 6 4 4 4
2B 3B HR RBI BB SO SB CS OBP
SLG
AVG
25 45 29 27 34 19 23 14 8 9 20 12 5 0 0 1 4 0 2 1
0.45 0.496 0.61 0.512 0.458 0.367 0.43 0.535 0.28 0.439 0.357 0.371 0.252 0.327 0.25 0.302 0.325 0.211 0.333 0.357
0.309 0.305 0.321 0.291 0.297 0.249 0.262 0.271 0.249 0.241 0.21 0.229 0.165 0.276 0.125 0.279 0.15 0.211 0.222 0.286
5 3 1 0 4 1 0 0 1 0 0 0 0 1 0 0 0 0 0 0
19 23 48 34 14 12 19 32 0 17 8 4 2 1 2 0 1 0 0 0
70 77 117 116 63 78 130 91 139 123 78 76 62 16 68 64 53 75 71 66 94 87 108 109 15 12 49 49 38 54 30 52 112 29 9 41 11 6 26 6 4 14 4 7 8 2 2 3 4 1 13 0 0 2 0 1 4 2 1 4
14 2 21 10 1 1 1 0 27 2 3 0 0 4 1 0 0 0 0 0
5 2 6 2 3 2 0 0 5 0 0 0 0 1 0 1 0 0 0 0
0.389 0.367 0.421 0.379 0.32 0.321 0.352 0.44 0.276 0.328 0.324 0.265 0.206 0.304 0.263 0.326 0.171 0.211 0.3 0.375
Considere que la variable dependiente es la estadística RPG. a. Obtenga la mejor ecuación estimada de regresión con una variable. b. Emplee los métodos de esta sección para obtener la mejor ecuación estimada de regresión múltiple que estime el RPG de un jugador.
archivo CD en Stroke
19. Vaya al ejercicio 14. Mediante la edad, la presión sanguínea, si la persona es o no fumadora y cualquier interacción entre estas variables, obtenga una ecuación estimada de regresión que sirva para predecir riesgo. Haga una descripción breve del proceso que utilice para obtener esta ecuación estimada de regresión para estos datos.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 727
16.5
16.5
727
Método de regresión múltiple para el diseño de experimentos
Método de regresión múltiple para el diseño de experimentos En la sección 15.7 se vio el uso de las variables ficticias en el análisis de regresión múltiple. En esta sección se muestra cómo el uso de variables ficticias en una ecuación de regresión múltiple puede proporcionar otro método para resolver problemas de diseño experimental (o diseño de experimentos). El uso de la regresión múltiple en el diseño experimental se demostrará con el ejemplo del diseño completamente aleatorizado presentado en el capítulo 13. Recuerde que Chemitech elaboró un nuevo sistema de filtración para el suministro público de agua. Chemitech compraría los componentes del sistema de filtración a diversos proveedores y los armaría en sus instalaciones en Columbia, Carolina del Sur. Se tenían tres métodos de ensamblados, identificados como método A, B y C. Los gerentes de Chemitech deseaban saber qué método de ensamblado producía mayor número de sistemas de filtración por semana. Se tomó una muestra aleatoria de 15 empleados y cada uno de los tres métodos de ensamblado le fue asignado aleatoriamente a 5 de estos empleados. En la tabla 16.8 se presenta el número de unidades ensambladas por cada empleado. Las medias muestrales del número de unidades producidas con cada uno de los tres métodos son las siguientes:
Número medio producido
Método de ensamblado A B C
62 66 52
Aunque el método B parece ser el que proporciona una tasa de producción más alta, lo que interesa saber es si las tres medias muestrales observadas son suficientemente diferentes como para poder concluir que las medias poblacionales correspondientes a los tres métodos de ensamblado son diferentes. En el método de regresión aplicado a este problema se empieza por definir las variables ficticias que se usarán para indicar cuál de los métodos de ensamblado fue usado. Como en el problema de Chemitech hay tres métodos de ensamblado, o tratamientos, se necesitan dos variables ficticias. En general, si el factor que se va a investigar tiene k niveles, o tratamientos, se necesita definir k 1 variables ficticias. Para el experimento de Chemitech se definen las variables ficticias A y B de la manera que se muestra en la tabla 16.9.
TABLA 16.8
NÚMERO DE UNIDADES PRODUCIDAS POR LOS 15 TRABAJADORES
A
Método B
C
58 64 55 66 67
58 69 71 64 68
48 57 59 47 49
16Ander(693-743).qxd 2/29/08 10:28 AM Page 728
728
Capítulo 16
Análisis de regresión: construcción de modelos
TABLA 16.9
VARIABLES FICTICIAS PARA EL EXPERIMENTO DE CHEMITECH
A
B
1 0 0
0 1 0
Observación relacionada con el método de ensamblado A Observación relacionada con el método de ensamblado B Observación relacionada con el método de ensamblado C
Las variables ficticias se pueden usar para relacionar el número de unidades, y, producidas por semana con el método de ensamblado usado por el empleado. E(y) Valor esperado del número de unidades producidas por semana β0 β1A β2B Por tanto, si interesa el valor esperado del número de unidades ensambladas por semana por un empleado mediante el método C, de acuerdo con el procedimiento para asignar valores numéricos a las variables ficticias se tendrá A B 0. La ecuación de regresión múltiple se reduce entonces a E(y) β0 β1(0) β2(0) β0 La interpretación es que β0 se puede interpretar como el valor esperado de la cantidad de unidades ensambladas por semana por un empleado que use el método C. En otras palabras, β0 es la media de la cantidad de unidades ensambladas por semana mediante el método C. A continuación se considera la forma de la ecuación de regresión múltiple correspondiente a cada uno de los otros métodos. Los valores de las variables ficticias correspondientes al método A son A = 1 y B = 0, y entonces E(y) β0 β1(1) β2(0) β0 β1 Los correspondientes al método B son A 0 y B 1, y entonces E(y) β0 β1(0) β2(1) β0 β2 Como se ve, β0 β1 representa la media del número de unidades ensambladas por semana mediante el método A, y β0 β2 representa la media del número de unidades ensambladas por semana con el método B. Ahora se desea obtener estimaciones para los coeficientes β0, β1 y β2 y, de esta manera, obtener una estimación del número medio de unidades ensambladas por semana con cada uno de los métodos. En la tabla 16.10 se presentan los datos muestrales que consisten en 15 observaciones de A, B y y. En la figura 16.18 se presentan los resultados correspondientes obtenidos usando la regresión múltiple de Minitab. Como se ve, las estimaciones de β0, β1 y β2 son b0 52, b1 10 y b2 14. De esta manera, las mejores estimaciones de las medias del número de unidades ensambladas por semana con cada uno de los métodos de ensamblado son:
Método de ensamblado
A B C
Estimación de E(y)
b0 b1 52 10 62 b0 52 14 66 b0 52
Observe que estas estimaciones, de los números medios de unidades producidas con cada uno de estos tres métodos de ensamblado, obtenidas mediante el análisis de regresión son las mismas que las medias muestrales presentadas previamente.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 729
16.5
729
Método de regresión múltiple para el diseño de experimentos
TABLA 16.10
DATOS PARA EL DISEÑO COMPLETAMENTE ALEATORIZADO DE CHEMITECH A
B
y
1 1 1 1 1 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 1 1 1 1 1 0 0 0 0 0
58 64 55 66 67 58 69 71 64 68 48 57 59 47 49
Ahora se va a ver cómo usar los resultados del análisis de regresión múltiple para realizar la prueba ANOVA de la diferencia entre las medias de estos tres métodos. Primero, se observa que si las medias no difieren E(y) para el método A E(y) para el método C 0 E(y) para el método B E(y) para el método C 0 Como β0 es igual a E(y) al emplear el método C y β0 β1 es igual a E(y) al emplear el método A, la primera diferencia es igual a (β0 β1) β0 β1. Y como β0 β2 es igual a E(y) al emplear el método B, la segunda diferencia es igual a (β0 β2) β0 β2. Se concluye que entre
FIGURA 16.18
RESULTADOS DE LA REGRESIÓN MÚLTIPLE PARA EL DISEÑO COMPLETAMENTE ALEATORIZADO DE CHEMITECH
The regression equation is y = 52.0 + 10.0 A + 14.0 B Predictor Constant A B S = 5.32291
Coef 52.000 10.000 14.000
SE Coef 2.380 3.367 3.367
R-Sq 60.5%
T 21.84 2.97 4.16
P 0.000 0.012 0.001
R-Sq(adj) = 53.9%
Analysis of Variance SOURCE Regression Residual Error Total
DF 2 12 14
SS 520.00 340.00 860.00
MS 260.00 28.33
F 9.18
P 0.004
16Ander(693-743).qxd 2/29/08 10:28 AM Page 730
730
Capítulo 16
Análisis de regresión: construcción de modelos
los tres métodos no hay diferencia si β1 0 y β2 0. Por tanto, la hipótesis nula en una prueba para la diferencia entre las medias se puede expresar como H0 : β1 β2 0 Tome el nivel de significancia α 0.05. Recuerde que para probar este tipo de hipótesis nula acerca de la significancia de la relación de regresión se emplea la prueba F de significancia general. En el resultado de Minitab que se presenta en la figura 16.18 se observa que el valor-p correspondiente a F 9.18 es 0.004. Como valor-p 0.004 α 0.05, H0 : β1 β2 0 se rechaza y se concluye que las medias de los tres métodos de ensamblado no son iguales. Como la prueba F indica que la relación de regresión múltiple es significativa, se puede realizar una prueba t para determinar la significancia de cada uno de los parámetros, β1 y β2. Con α 0.05, los valores-p, 0.012 y 0.001, que aparecen en los resultados de Minitab, indican que las hipótesis nulas H0 : β1 0 y H0 : β2 0, se pueden rechazar. Por tanto, ambos parámetros son estadísticamente significativos. Así, se concluye que las medias de los parámetros A y C son diferentes y que también las medias de los parámetros B y C son diferentes.
Ejercicios
Métodos
Auto examen
20. Considere un diseño completamente aleatorizado en el que haya cuatro tratamientos: A, B, C y D. Escriba la ecuación de regresión múltiple que sirva para analizar estos datos. Defina todas las variables. 21. Dé una ecuación de regresión múltiple que sirva para analizar los datos de un diseño de bloque aleatorizado que tenga tres tratamientos y dos bloques. Defina todas las variables. 22. Dé una ecuación de regresión múltiple que sirva para analizar los datos de un diseño bifactorial que tenga dos niveles para el factor A y tres niveles para el factor B. Defina todas las variables.
Aplicaciones
Auto examen
23. La empresa Jacobs Chemical desea estimar el tiempo promedio (en minutos) necesario para mezclar un lote de un material empleando máquinas provenientes de tres fabricantes diferentes. Para limitar los costos de la prueba se mezclaron cuatro lotes de material en las máquinas producidas por cada uno de los fabricantes. A continuación se presentan los tiempos requeridos.
a. b. c. d.
Fabricante 1
Fabricante 2
Fabricante 3
20 26 24 22
28 26 31 27
20 19 23 22
Dé una ecuación de regresión múltiple que sirva para analizar estos datos. Dé las mejores estimaciones de los coeficientes en su ecuación. En términos de los coeficientes de las ecuaciones de regresión cuáles son las hipótesis a probar para ver si los tiempos son iguales con las máquinas de los tres fabricantes. ¿Cuál es la conclusión que se obtiene con un nivel de significancia 0.05?
24. En la publicidad de cuatro pinturas diferentes se asegura que todas tienen el mismo tiempo de secado. Para comprobar esto se probaron cinco muestras de cada pintura.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 731
16.6
731
Autocorrelación y la prueba de Durbin-Watson
Los tiempos de secado de cada muestra se presentan a continuación
a. b.
Pintura 1
Pintura 2
Pintura 3
Pintura 4
128 137 135 124 141
144 133 142 146 130
133 143 137 136 131
150 142 135 140 153
Use α 0.05 para probar si existe una diferencia significativa entre los tiempos de secado. Dé una estimación del tiempo medio de secado de la pintura 2. ¿Cómo se obtiene de los resultados de un paquete de software?
25. Un comerciante de automóviles realizó una prueba para determinar si el tiempo requerido para ajustar un motor dependía de si se empleaba un analizador computarizado o un analizador electrónico. Como el tiempo que se necesita para ajustar un motor depende de si se trata de un auto pequeño, mediano o grande, se usaron los tres tipos de automóviles como bloques del experimento. Los datos que se obtuvieron (en minutos) son los que se presentan a continuación.
Automóvil
Analizador
Pequeño
Mediano
Grande
Computarizado
50
55
63
Electrónico
42
44
46
Emplee α 0.05 para probar si hay diferencias significativas. 26. Una empresa de ventas por catálogo diseñó un experimento factorial para probar los efectos del tamaño de un anuncio publicitario y su diseño sobre el número (en miles) de catálogos solicitados. Se consideraron tres diseños y dos tamaños diferentes del anuncio publicitario. De éstos se obtuvieron los datos siguientes. Pruebe si hay efectos significativos debido al diseño, al tamaño o a interacciones. Use α 0.05.
Tamaño del anuncio publicitario
Diseño
16.6
Pequeño
Grande
A
8 12
12 8
B
22 14
26 30
C
10 18
18 14
Autocorrelación y la prueba de Durbin-Watson En los negocios y en la economía suele ocurrir que los datos que se usan en estudios de regresión estén correlacionados a lo largo del tiempo. No es raro que el valor de y en el periodo t, que se denota yt esté relacionado con el valor de y en un periodo anterior. En tales casos se dice que existe autocorrelación en los datos (o correlación serial). Si el valor de y en el periodo t está rela-
16Ander(693-743).qxd 2/29/08 10:28 AM Page 732
732
Capítulo 16
FIGURA 16.19
Análisis de regresión: construcción de modelos
DOS CONJUNTOS DE DATOS CON CORRELACIÓN DE SEGUNDO ORDEN
yt – yˆ t
yt – yˆt
0
0
t
t Tiempo
Tiempo Figura A. Autocorrelación positiva
Figura B. Autocorrelación negativa
cionado con su valor en el periodo t 1, existe correlación de primer orden. Si el valor de y en el periodo t está relacionado con su valor en el periodo t 2, existe correlación de segundo orden y así sucesivamente. Cuando hay autocorrelación se viola una de las suposiciones del modelo de regresión: los términos del error no son independientes. En el caso de la autocorrelación de primer orden, el error en el periodo t que se denota t, estará relacionado con el error en el periodo t 1, que se denota t 1. En la figura 16.19 se ilustran dos casos de autocorrelación de primer orden. En la gráfica A se presenta el caso de una autocorrelación positiva; en la gráfica B el de una autocorrelación negativa. En la autocorrelación positiva se espera que el residual positivo de un periodo vaya seguido de un residual positivo en el periodo siguiente, que el residual negativo de un periodo vaya seguido de un residual negativo en el periodo siguiente y así sucesivamente. En la autocorrelación negativa se espera que el residual positivo de un periodo vaya seguido de un residual negativo en el periodo siguiente, después un residual positivo y así sucesivamente. Si existe autocorrelación, se pueden cometer errores serios cuando se realizan pruebas de significancia estadística basadas en el modelo de regresión supuesto. Por tanto, es importante poder detectar la autocorrelación y tomar medidas correctivas. A continuación se mostrará cómo usar el estadístico de Durbin-Watson para detectar autocorrelación de primer orden. Suponga que los valores de no sean independientes sino que estén relacionados de la manera siguiente: t r t 1 z t
(16.16)
donde es un parámetro cuyo valor absoluto es menor que 1 y zi es una variable aleatoria distribuida normal e independientemente, que tienen media cero y varianza σ 2. En la ecuación 16.16 se ve que si 0, los términos del error no están relacionados y cada uno tiene media cero y varianza σ 2. En este caso no hay autocorrelación y se satisfacen las suposiciones de la regresión. Si 0, existe autocorrelación positiva; si 0, existe autocorrelación negativa. En cualquiera de estos casos, se violan las suposiciones de la regresión acerca del término del error. En la prueba de Durbin-Watson para autocorrelación se usan los residuales para determinar si 0. Para simplificar la notación para el estadístico de Durbin-Watson el residual i se denota ei yi ŷi . El estadístico de prueba Durbin-Watson se calcula como sigue.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 733
16.6
733
Autocorrelación y la prueba de Durbin-Watson
ESTADÍSTICO DE PRUEBA DURBIN-WATSON n
兺(e e
2 t 1)
t
d
t 2
(16.17)
n
兺
e 2t
t 1
Si valores sucesivos de los residuales se encuentran cercanos unos de otros (autocorrelación positiva), el valor del estadístico de prueba Durbin-Watson será pequeño. Si valores sucesivos de los residuales se encuentran alejados unos de otros (autocorrelación negativa), el valor del estadístico de prueba Durbin-Watson será grande. El estadístico de prueba Durbin-Watson va de cero a cuatro, si su valor es dos, esto indica que no existe autocorrelación. Durbin y Watson elaboraron tablas para determinar cuándo su estadístico indica la existencia de autocorrelación. En la tabla 16.11 se presentan límites inferiores y superiores (dL y dU) para las pruebas de hipótesis con α 0.05; n denota el número de observaciones. Siempre, la hipótesis nula a probar es que no existe autocorrelación H0: r 0 La hipótesis alternativa que se prueba en la autocorrelación positiva es Ha: r 0 La hipótesis alternativa que se prueba en la autocorrelación negativa es Ha: r
TABLA 16.11
0
VALORES CRÍTICOS PARA LA PRUEBA DE DURBIN-WATSON PARA AUTOCORRELACIÓN
Nota: Los valores que se presentan en la tabla son los valores críticos para la prueba de Durbin-Watson de una cola para autocorrelación. En pruebas de dos colas, se duplica el nivel de significancia.
1 n*
dL
dU
15 20 25 30 40 50 70 100
1.08 1.20 1.29 1.35 1.44 1.50 1.58 1.65
1.36 1.41 1.45 1.49 1.54 1.59 1.64 1.69
Puntos de significancia de dL y dU: α = 0.05 Número de variables independientes 2 3 4 dL dU dL dU dL 0.95 1.10 1.21 1.28 1.39 1.46 1.55 1.63
1.54 1.54 1.55 1.57 1.60 1.63 1.67 1.72
0.82 1.00 1.12 1.21 1.34 1.42 1.52 1.61
* Para valores intermedios de n, interpolar linealmente.
1.75 1.68 1.66 1.65 1.66 1.67 1.70 1.74
0.69 0.90 1.04 1.14 1.29 1.38 1.49 1.59
5 dU
dL
dU
1.97 1.83 1.77 1.74 1.72 1.72 1.74 1.76
0.56 0.79 0.95 1.07 1.23 1.34 1.46 1.57
2.21 1.99 1.89 1.83 1.79 1.77 1.77 1.78
16Ander(693-743).qxd 2/29/08 10:28 AM Page 734
734
Capítulo 16
FIGURA 16.20
Análisis de regresión: construcción de modelos
PRUEBA DE HIPÓTESIS PARA AUTOCORRELACIÓN MEDIANTE LA PRUEBA DE DURBIN-WATSON
Autocorrelación positiva
0
No concluyente dL
No hay evidencia de autocorrelación positiva dU
2
Diagrama A: Prueba para autocorrelación positiva
No hay evidencia de autocorrelación negativa dU
dL
No concluyente 4 dU
2
Autocorrelación negativa
4 dL
4
Diagrama B: Prueba para autocorrelación negativa
Autocorrelación positiva
0
No hay evidencia de autocorrelación
No concluyente dL
4 dU
2
dU
No concluyente
Autocorrelación negativa
4 dL
4
Diagrama C: Prueba para autocorrelación de dos colas
También se puede hacer una prueba de dos colas. En este caso la hipótesis alternativa es Ha: r
0
En la figura 16.20 se muestra el uso de los valores dL y dU de la tabla 16.11 para probar si existe autocorrelación. En el diagrama A se ilustra la prueba para autocorrelación positiva: Si d dL, se concluye que existe correlación positiva. Si dL d dU, se dice que la prueba no es concluyente. Si d dU, se concluye que no hay evidencia de autocorrelación positiva. En el diagrama B se ilustra la prueba para autocorrelación negativa. Si d 4 dL, se concluye que existe autocorrelación negativa. Si 4 dU d 4 dL, se dice que la prueba no es concluyente. Si d 4 dU, se concluye que no existe evidencia de autocorrelación negativa. El diagrama C ilustra la prueba de dos colas. Si d dL o d 4 dL, se rechaza H0 y se concluye que existe correlación. Si dL d dU o si 4 dU d 4 dL, se dice que la prueba no es concluyente. Si dU d 4 dU, se concluye que no hay evidencia de autocorrelación.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 735
16.6
735
Autocorrelación y la prueba de Durbin-Watson
Si se determina que hay una autocorrelación significativa, se debe verificar si se omitieron una o varias variables independientes importantes que tengan un efecto de orden temporal sobre la variable dependiente. Si no se encuentran tales variables, incluir una variable independiente que mida el tiempo en el que se hace la observación (el valor de esta variable, puede ser, por ejemplo, 1 para la primera observación, 2 para la segunda, etc.) algunas veces ayuda para eliminar o reducir la autocorrelación. Cuando no funcionan estos intentos para eliminar o reducir la autocorrelación, hacer transformaciones de las variables independientes resulta útil; un estudio sobre esas transformaciones puede encontrarse en libros más avanzados sobre análisis de regresión. Observe que en las tablas de Durbin-Watson el menor valor para el tamaño de la muestra es 15. La razón es que para muestras menores, la prueba suele ser no concluyente; en realidad, se suele creer que el tamaño de la muestra debe ser de por lo menos 50 para que con la prueba se obtengan resultados que valgan la pena.
Ejercicios
Aplicaciones 27. En los datos siguientes se muestran los precios diarios de cierre (en dólares por acción) de IBM desde el 3 de noviembre de 2005, hasta el 1 de diciembre de 2005 (Compustat, 26 de febrero de 2006).
Fecha Nov. 3 Nov. 4 Nov. 7 Nov. 8 Nov. 9 Nov. 10 Nov. 11 Nov. 14 Nov. 15 Nov. 16 Nov. 17 Nov. 18 Nov. 21 Nov. 22 Nov. 23 Nov. 25 Nov. 28 Nov. 29 Nov. 30 Dic. 1
archivo CD en IBM
a.
b.
Precio ($) 82.87 83.00 83.61 83.15 82.84 83.99 84.55 84.36 85.53 86.54 86.89 87.77 87.29 87.99 88.80 88.80 89.11 89.10 88.90 89.21
Defina la variable independiente Periodo, donde Periodo 1 corresponda al dato del 3 de noviembre, Periodo 2 corresponda al dato del 4 de Noviembre, etc. Obtenga una ecuación estimada de regresión que sirva para predecir el precio del cierre dado el valor del Periodo. Emplee como nivel de significancia 0.05 y pruebe si existe autocorrelación positiva en estos datos.
28. Remítase al conjunto de datos de Craven de la tabla 16.5. En la sección 16.3 se mostró que el coeficiente de determinación ajustado de la ecuación estimada de regresión que contenía Accounts(Cuentas), AdvExp (GastPubl), Poten y Share (Participación) era 88.1%. Use 0.05 como nivel de significancia y aplique la prueba de Durbin-Watson para determinar si existe autocorrelación positiva.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 736
736
Capítulo 16
Análisis de regresión: construcción de modelos
Resumen En este capítulo se analizaron varios de los conceptos que se usan en la construcción de modelos para hallar la ecuación estimada de regresión. Primero se presentó el concepto de modelo lineal general para mostrar cómo pueden extenderse los métodos estudiados en los capítulos 14 y 15 a las relaciones curvilíneas y a los efectos de interacción. Después, se vio cómo emplear transformaciones a la variable dependiente cuando se presentan problemas como el de una varianza no constante en los términos del error. En muchas aplicaciones del análisis de regresión se emplea un gran número de variables independientes. Para agregar o eliminar variables a un modelo de regresión se vio un método general basado en el estadístico F. Después se presentó un problema más grande en el que se tenían 25 observaciones y ocho variables independientes. También se vio que cuando se tienen problemas más grandes, uno de los asuntos a resolver es hallar el mejor subconjunto de variables independientes; para esto existen varios procedimientos de selección de variables: regresión por pasos, selección hacia adelante, eliminación hacia atrás y regresión de los mejores subconjuntos. En la sección 16.5 se amplió el estudio para ver cómo obtener modelos de regresión múltiple que sirven como otro método para la solución de problemas de análisis de varianza y de diseño de experimentos. El capítulo concluyó con una aplicación del análisis de residuales mediante la prueba de Durbin-Watson para autocorrelación.
Glosario Modelo lineal general Modelo de la forma y β0 β1z1 β 2z 2 . . . βp z p , en donde cada una de las variables independientes z j ( j 1, 2, . . . , p) es función de x1, x2, . . . , xk, las variables para las que se han recolectado datos. Interacción Efecto de dos variables independientes cuando actúan juntas. Procedimientos de selección de variables Métodos para la selección de un subconjunto de variables independientes para un modelo de regresión. Autocorrelación Correlación en los errores, que se presenta cuando los términos del error pertenecientes a puntos sucesivos de tiempo están relacionados. Correlación serial Es lo mismo que autocorrelación. Prueba de Durbin-Watson Prueba para determinar si existe autocorrelación de primer orden.
Fórmulas clave Modelo lineal general y β0 β1z1 β2 z 2 . . . βp z p
(16.1)
Estadístico de prueba F para agregar o eliminar p – q variables SCE(x1, x 2, . . . , xq) SCE(x1, x 2, . . . , xq, xq 1, . . . , xp) p q F SCE(x1, x 2, . . . , xq, xq 1, . . . , xp)
(16.13)
n p 1 Autocorrelación de primer orden t r t 1 z t
(16.16)
16Ander(693-743).qxd 2/29/08 10:28 AM Page 737
737
Ejercicios complementarios
Estadístico de prueba de Durbin-Watson n
兺(e e
2 t 1)
t
d
t 2
(16.17)
n
兺
e 2t
t 1
Ejercicios complementarios 29. La disminución en los precios de las impresoras láser a color, hacen de ellas una muy buena alternativa frente a las impresoras de inyección de tinta. PC World examinó y evaluó 10 impresoras a color. En los datos siguientes se presentan el precio, la velocidad de impresión en páginas por minuto (ppm) y la evaluación de PC World de estas impresoras (PC World, diciembre de 2005).
Fabricante y modelo Dell 3000cn Oki Data C5200n Konica Minolta MagiColor 2430DL Brother HL-2700CN Lexmark C522n HP Color LaserJet 3600n Xerox Phaser 6120n Konica Minolta MagiColor 2450 HP Color LaserJet 2600n HP Color LaserJet 2550L
archivo CD en ColorPrinter
Velocidad (ppm)
Evaluación
3.4 5.2 2.7 3.1 3.8 5.6 1.6 1.6 2.6 1.1
83 81 79 78 77 74 73 71 70 61
a.
Elabore un diagrama de dispersión, use como variable independiente la velocidad de impresión. ¿Un modelo de regresión simple parece apropiado? b. Obtenga una ecuación estimada de regresión múltiple en la que las variables independientes sean x velocidad y x2. c. Considere el modelo no lineal indicado por la ecuación (16.7). Use logaritmos para transformar este modelo no lineal en un modelo lineal equivalente y obtenga la ecuación estimada de regresión correspondiente. ¿Esta ecuación estimada de regresión proporciona un mejor ajuste que la ecuación estimada de regresión obtenida en el inciso b? 30. Muchos fondos internacionales ofrecen tasas más razonables que en Estados Unidos. Como los mercados internacionales suelen moverse en direcciones distintas a los mercados de Estados Unidos, las inversiones en mercados extranjeros pueden reducir el riesgo de un inversionista. En la tabla siguiente se presentan 20 fondos internacionales dando tipo de fondo (con comisión o sin comisión), coeficiente de gastos (%), seguridad (0 la más riesgosa, 10 la más segura) y su desempeño en un año al 10 de diciembre de 1999 (Mutual Funds, febrero de 2000).
archivo CD en MutFunds
ABN AMRO Int’l Equity “Com” Accessor Int’l Equity “Adv” Artisan International Columbia Int’l Stock Concert Inv. “A” Int’l Equity Diversified Invstr Int’l Eqty
Coeficiente de Tipo de fondo gastos (%) Sin comisión 1.38 Sin comisión 1.59 Sin comisión 1.45 Sin comisión 1.56 Con comisión 2.16 Sin comisión 1.40
Seguridad 6.9 7.1 6.8 7.1 6.3 7.3
Desempeño (%) 36 42 72 54 116 54 (continúa)
16Ander(693-743).qxd 2/29/08 10:28 AM Page 738
738
Capítulo 16
Análisis de regresión: construcción de modelos
Coeficiente de Tipo de fondo gastos (%) Driehaus Int’l Growth Sin comisión 1.88 Founders Passport Sin comisión 1.52 Guardian Baillie Fifford Int’l “A” Con comisión 1.62 Jamestown Int’l Equity Sin comisión 1.56 Julius Baer Int’l Equity Sin comisión 1.79 Aetna “I” Int’l Sin comisión 1.35 Pilgrim Int’l Value “A” Con comisión 1.80 Fidelity Diversified Int’l Sin comisión 1.48 Putnam “A” Int’l Growth Con comisión 1.59 Sit Int’l Growth Sin comisión 1.50 Touchstone Int’l Equity “A” Con comisión 1.60 United Int’l Growth “A” Con comisión 1.28 Vontobel Int’l Equity Sin comisión 1.50 Waddell & Reed Int’l Growth “B” Con comisión 2.46
a. b. c.
Seguridad 6.5 7.0 7.1 7.1 6.9 7.3 7.1 7.5 6.9 6.9 7.5 7.1 7.0 7.0
Desempeño (%) 92 86 37 35 71 46 42 42 55 49 35 47 43 75
Utilice los métodos de este capítulo para obtener una ecuación estimada de regresión que sirva para estimar el desempeño de un fondo con base en los datos proporcionados. ¿La ecuación estimada de regresión obtenida en el inciso a proporciona un buen ajuste? Explique. Acorn International es un fondo sin comisión cuyo coeficiente de gastos es 1.12% y cuya seguridad es 7.6. Use la ecuación estimada de regresión obtenida en el inciso a para estimar el desempeño en un año de Acorn International.
31. En un estudio se investigó la relación entre el retraso en la auditoría, tiempo transcurrido desde el fin del año fiscal de una empresa hasta la fecha del informe del auditor, y variables que describen al cliente y al auditor. A continuación se presentan algunas de las variables independientes incluidas en este estudio. Industria Pública Calidad
Terminado
Variable ficticia que toma el valor 1 si se trata de una industria y 0 si se trata de un banco, de una institución de ahorro, de préstamo o de seguros. Variable ficticia que toma el valor 1 si la empresa es comercializada en la bolsa o es extra bursátil; 0 si no es así. Medida de la calidad general de los controles internos, a juicio del auditor, con
una escala de cinco puntos que van desde “prácticamente ninguna” (1) hasta “excelente” (5). Una medida que va de 1 a 4, a juicio del auditor, donde 1 indica “todo el trabajo realizado después del fin de año” y 4 indica “la mayor parte del trabajo realizado antes del fin de año”.
En una muestra de 40 empresas se obtuvieron los datos siguientes.
Retraso
archivo CD en Audit
62 45 54 71 91 62 61 69 80 52
Industria
Pública
Calidad
Terminado
0 0 0 0 0 0 0 0 0 0
0 1 0 1 0 0 0 1 0 0
3 3 2 1 1 4 3 5 1 5
1 3 2 2 1 4 2 2 1 3
16Ander(693-743).qxd 2/29/08 10:28 AM Page 739
739
Ejercicios complementarios
Retraso 47 65 60 81 73 89 71 76 68 68 86 76 67 57 55 54 69 82 94 74 75 69 71 79 80 91 92 46 72 85
a. b. c. d.
Industria
Pública
Calidad
Terminado
0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0
3 2 1 1 2 2 5 2 1 5 2 3 2 4 3 5 3 5 1 5 4 2 4 5 1 4 1 4 5 5
2 3 3 2 2 1 4 2 2 2 2 1 3 2 2 2 3 1 1 2 3 2 4 2 4 1 4 3 2 1
Obtenga una ecuación estimada de regresión con todas las variables independientes. ¿La ecuación estimada de regresión obtenida en el inciso a proporciona un buen ajuste? Trace un diagrama de dispersión en el que se presente la variable retraso en función de la variable terminado. Con base en sus observaciones acerca de la relación entre retraso y terminado obtenga otra ecuación estimada de regresión, distinta a la dada en el inciso a, que explique la mayor proporción posible de la variabilidad de retraso.
32. Remítase a los datos del ejercicio 31. Considere un modelo en el que para predecir retraso se use únicamente industria. Emplee como nivel de significancia 0.01 y pruebe si existe alguna autocorrelación en los datos. 33. Remítase a los datos del ejercicio 31. a. Obtenga una ecuación estimada de regresión para predecir retraso empleando industria y calidad. b. Grafique los residuales obtenidos con la ecuación estimada de regresión obtenida en el inciso a en función del orden en que están presentados los datos. ¿Parece existir alguna autocorrelación en los datos? Explique. c. Con un nivel de significancia 0.05, pruebe si existe alguna autocorrelación en los datos. 34. Se realizó un estudio para investigar la actividad de los compradores cuando buscan y miran cosas dentro de una tienda, y de acuerdo con esto se les clasificó como inactivos, poco activos y muy activos. También se midió qué tan cómodo se sentía cada comprador en la tienda; puntuaciones más altas correspondían a mayor comodidad. Los datos siguientes provienen de este estudio. Emplee como nivel de significancia 0.05 y realice una prueba para determinar las diferencias que existen en la comodidad dentro de la tienda entre los tres tipos de compradores.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 740
740
Capítulo 16
Análisis de regresión: construcción de modelos
Inactivos
Poco activos
Muy activos
4 5 6 3 3 4 5 4
5 6 5 4 7 4 6 5
5 7 5 7 4 6 5 7
archivo CD en Browsing
35. La revista Money publicó precios y diversos datos de los 418 vehículos más populares entre los modelos del 2003. Una de estas variables fue el valor de reventa del vehículo, expresado como porcentaje del precio de reventa sugerido por el fabricante. Estos datos se clasificaron de acuerdo con el tamaño y tipo de vehículo. En la tabla siguiente se presentan los valores de reventa de 10 automóviles pequeños elegidos aleatoriamente, de 10 automóviles medianos elegidos aleatoriamente, de 10 automóviles de lujo elegidos aleatoriamente y de 10 automóviles deportivos elegidos aleatoriamente (Money, marzo de 2003).
archivo CD en
Pequeño
Mediano
De lujo
Deportivo
26 31 41 32 27 34 31 38 27 42
26 29 41 27 26 33 27 29 35 39
36 38 38 39 35 26 40 47 41 32
41 39 30 34 40 43 42 39 44 50
Resale
Use α 0.05 para determinar si existe alguna diferencia significativa entre los valores medios
de reventa de los cuatro tipos de automóviles.
Caso problema 1
archivo CD en PGATour
Análisis de las estadísticas de la PGA Tour La Professional Golfers Association (PGA) lleva un registro sobre ganancias y datos de desempeño de sus miembros en la PGA Tour. En el archivo PGA Tour del disco compacto se presentan los datos de fin de año sobre el desempeño de los 125 jugadores que tuvieron los mejores ingresos en los eventos de la PGA Tour de 2005 (www.pgatour.com, 2006). Cada renglón del conjunto de datos corresponde a un jugador de la PGA Tour, y los datos han sido ordenados con base en las ganancias totales. A continuación se presenta la descripción de los datos. Earnings Scoring Avg. Yards/Drive Driving Acc. Greens in Reg.
Ganancias totales en los eventos de la PGA Tour Puntuación promedio de un jugador en todos los eventos Promedio de yardas por salto p. 740 Porcentaje de veces que el jugador llega a la calle con un tee shot Porcentaje de veces que el jugador llega al green en regulación se considera como golpe a un green en regulación, si cualquier parte de la bola está tocando la superficie y la diferencia entre el valor del par para el hoyo y el número de los movimientos para golpear el green es por lo menos 2.
16Ander(693-743).qxd 2/29/08 10:28 AM Page 741
Caso problema 3
Predicción de las tasas de alumnos que llegan a titularse en las universidades
Putting Avg. Save Pct.
Promedio de putts (toques) realizados en el green en regulación Porcentaje de veces que el jugador logra “subir y bajar” (“up and down”) cuando se encuentra en un búnker de arena al lado del green
741
Informe administrativo Suponga que un representante de la PGA Tour lo contrata para analizar los datos para una presentación que se realizará en la reunión anual de la PGA Tour. Este representante le pregunta si es posible usar estos datos para determinar una medida del desempeño que sea el mejor predictor de la puntuación promedio de un jugador. Use los métodos presentados en este capítulo y en los capítulos anteriores para analizar estos datos. Formule un informe para el representante de la PGA Tour en el que resuma su análisis y en el que incluya los resultados estadísticos más importante, sus conclusiones y recomendaciones. En un apéndice presente todo el material técnico que considere adecuado.
Caso problema 2
archivo CD en Cars
Rendimiento de combustible en los automóviles En todos los automóviles nuevos que se venden en Estados Unidos, viene una etiqueta sobre el consumo de combustible indicando el rendimiento en millas por galón que se espera del automóvil tanto en ciudad como en carretera. En la Fuel Economy Guide del Departamento de Energía de Estados Unidos se encuentra esta información para cualquier automóvil o camión. En el archivo Cars del disco compacto que se distribuye con el libro se encuentra parte de estos datos para 230 automóviles (www.fueleconomy.gov, 21 de marzo de 2003). A continuación se presenta una descripción de los datos que vienen en el disco compacto. Class Manufacturer carline name displ cyl trans cty hwy
Tipo de automóvil (compacto, mediano, grande) Empresa fabricante del automóvil Nombre del automóvil Desplazamiento del motor en litros Cilindros que tiene el motor (4, 6, 8) Tipo de transmisión (automática, manual) Consumo de combustible en la ciudad en millas por galón Consumo de combustible en carretera en millas por galón
Informe administrativo Emplee los métodos presentados en este capítulo y en los anteriores y analice este conjunto de datos. El objetivo es obtener una ecuación estimada de regresión que sirva para estimar el consumo de combustible en la ciudad y una ecuación estimada de regresión que sirva para estimar el consumo de combustible en carretera. De su análisis, presente un resumen, en el que incluya los resultados estadísticos más importantes, sus conclusiones y recomendaciones. En un apéndice incluya cualquier material técnico que considere adecuado (resultados de computadora, gráficas de residuales, etc.).
Caso problema 3
Predicción de las tasas de alumnos que llegan a titularse en las universidades Para los administradores universitarios, el porcentaje de alumnos que ingresan a una universidad y que llegan hasta su titulación es un dato estadístico importante. Algunos de los factores que están relacionados con el porcentaje de alumnos que llegan hasta la titulación es el porcentaje de
16Ander(693-743).qxd 2/29/08 10:28 AM Page 742
742
Capítulo 16
Análisis de regresión: construcción de modelos
clases en las que hay menos de 20 alumnos, el porcentaje de clases en las que hay más de 50 estudiantes, la proporción de estudiantes por facultad, el porcentaje de estudiantes que solicitan ingresar a la universidad y que son admitidos, el porcentaje de estudiantes de primer ingreso que estuvieron en el 10% más alto de sus clases de bachillerato y la reputación académica de la universidad. Para estudiar el efecto de estos factores sobre el porcentaje de alumnos que llegan a la titulación, se recolectaron datos de 48 universidades de Estados Unidos (America’s Best Colleges, Edición del año 2000). Estos datos se encuentran en el archivo GradeRate del disco compacto. A continuación se presenta una descripción de los datos que aparecen en el disco.
archivo CD en GradRate
Region Graduation Rate % of classes under 20 % of classes of 50 or more Student-Faculty Ratio Acceptance rate 1st-Year students in top 10% of HS class Academic Reputation Score
Región del país en donde se encuentra la universidad Porcentaje de estudiantes que entran a la universidad y que se titulan Porcentaje de las clases en las que hay menos de 20 alumnos Porcentaje de las clases en las que hay más de 50 alumnos Cociente del número de estudiantes inscritos dividido entre el número de profesores Porcentaje de estudiantes que solicitan inscripción a la universidad y que son aceptados De los estudiantes admitidos a la universidad, porcentaje que estuvo en el 10% más alto de sus clases de bachillerato Una medida de la reputación de la universidad determinada mediante una revisión a los administradores en otras universidades: medida en una escala del 1 (marginal) al 5 (distinguida)
Informe administrativo Use los métodos presentados en este capítulo y en los capítulos anteriores para analizar este conjunto de datos. Presente un resumen de su análisis en el que dé los principales resultados estadísticos, sus conclusiones y recomendaciones, en un informe administrativo. En un apéndice presente cualquier material técnico (resultados de computadora, gráficas de residuales, etc.) que considere adecuados.
Apéndice 16.1
Procedimientos de selección de variables con Minitab En la sección 16.4 se vio el uso de los procedimientos de selección de variables para la solución de problemas de regresión múltiple. En la figura 16.16 se mostraron los resultados que da la regresión por pasos de Minitab aplicada a los datos de Cravens y en la figura 16.17 los resultados que da el procedimiento de los mejores subconjuntos de Minitab. En este apéndice se describen los pasos necesarios para obtener los resultados que se muestran en esas dos figuras, así como los pasos que se requieren en los procedimientos de selección hacia adelante y eliminación hacia atrás. Primero, en una hoja de cálculo de Minitab se ingresan los datos de la tabla 16.5. Los valores de Sales, Time, Poten, AdvExp, Share, Change, Accounts y Rating se ingresan en las columnas C1-C9 de la hoja de cálculo de Minitab.
Uso del procedimiento por pasos de Minitab Mediante los pasos siguientes se obtienen los resultados de la regresión por pasos de Minitab para los datos de Cravens. Paso 1. Seleccionar el menú Stat Paso 2. Seleccionar el menú Regression Paso 3. Elegir Stepwise
16Ander(693-743).qxd 2/29/08 10:28 AM Page 743
Apéndice 16.1
Procedimientos de selección de variables con Minitab
743
Paso 4. Cuando aparezca el cuadro de diálogo Stepwise Regression: Ingresar Sales en el cuadro de diálogo Response Ingresar Time, Poten, AdvExp, Share, Change, Accounts y Rating en el cuadro Predictors Seleccionar el botón Methods Paso 5. Cuando aparezca el cuadro de diálogo Stepwise Method: Seleccionar Stepwise (forward and backward) Ingresar 0.05 en el cuadro Alpha to enter Ingresar 0.05 en el cuadro Alpha to remove Clic en OK Paso 6. Cuando aparezca el cuadro de diálogo Stepwise Regression: Clic en OK
Uso del procedimiento de selección hacia adelante de Minitab Para usar el procedimiento de selección hacia adelante de Minitab, sólo hay que modificar el paso 5 del procedimiento de regresión por pasos, como se indica a continuación: Paso 5. Cuando aparezca el cuadro de diálogo Stepwise-Methods: Seleccionar Forward Selection Ingresar 0.05 en el cuadro de diálogo Alpha to enter Clic en OK
Uso del procedimiento de eliminación hacia atrás de Minitab Para usar el procedimiento de eliminación hacia atrás de Minitab, sólo hay que modificar el paso 5 del procedimiento de regresión por pasos, como se indica a continuación: Paso 5. Cuando aparezca el cuadro de diálogo Stepwise-Methods: Seleccionar Backward elimination Ingresar 0.05 en el cuadro de diálogo Alpha to remove Clic en OK
Uso del procedimiento de los mejores subconjuntos de Minitab Mediante los pasos siguientes se obtienen los resultados para los datos de Cravens que da la regresión de los mejores subconjuntos de Minitab. Paso 1. Paso 2. Paso 3. Paso 4.
Seleccionar el menú Stat Seleccionar el menú Regression Elegir Best Subsets Cuando aparezca el cuadro de diálogo Best Subsets Regression Ingresar Sales en el cuadro Response Ingresar Time, Poten, AdvExp, Share, Change, Accounts y Rating en el cuadro Predictors Clic en OK
17Ander(744-764).qxd 2/29/08 11:44 AM Page 744
CAPÍTULO
17
Números índice CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: DEPARTAMENTO DEL TRABAJO DE ESTADOS UNIDOS, DEPARTAMENTO DE ESTADÍSTICA LABORAL 17.1 PRECIOS RELATIVOS 17.2 ÍNDICES DE PRECIOS AGREGADOS 17.3 CÁLCULO DE UN ÍNDICE DE PRECIOS AGREGADOS A PARTIR DE PRECIOS RELATIVOS 17.4 ALGUNOS ÍNDICES DE PRECIOS IMPORTANTES Índice de precios al consumidor
Índice de precios al productor Promedios Dow Jones 17.5 DEFLACTAR UNA SERIE MEDIANTE ÍNDICES DE PRECIOS 17.6 ÍNDICES DE PRECIOS: OTRAS CONSIDERACIONES Selección de los artículos Selección de un periodo base Variaciones en la calidad 17.7 ÍNDICES DE CANTIDAD
17Ander(744-764).qxd 2/29/08 11:44 AM Page 745
745
La estadística en la práctica
LA ESTADÍSTICA
en LA PRÁCTICA
DEPARTAMENTO DEL TRABAJO DE ESTADOS UNIDOS, DEPARTAMENTO DE ESTADÍSTICA LABORAL WASHINGTON, D.C.
El Departamento del Trabajo de Estados Unidos, a través de su Departamento de Estadística Laboral, recopila y hace circular índices que sirven como indicadores de la actividad comercial y económica de Estados Unidos. Por ejemplo, este departamento recopila y publica el índice de precios al consumidor, el índice de precios al productor, y otras estadísticas sobre horas y ganancias promedio de varios tipos de trabajadores. Quizás el índice más citado de los elaborados por el Departamento de Estadística Laboral es el índice de precios al consumidor. Este índice suele emplearse como una medida de la inflación. En febrero de 2006, el Departamento de Estadística Laboral informó que el índice de precios al consumidor (IPC) había tenido un aumento de 0.2% desde enero. Este incremento se presentaba después de un incremento de 0.7% en enero y parecía indicar una desaceleración de la tasa de inflación. El Departamento de Estadística Laboral también informó que la “tasa central” de la inflación había sido de sólo 0.1% en febrero. En la “tasa central” se excluyen del IPC los componentes volátiles que son alimentos y combustibles (energía), y se le suele considerar como un mejor indicador de las presiones inflacionarias. El costo de los combustibles (energía) aumentó 5% en enero y fue la principal razón de que el IPC tuviera un incremento de 0.7% en ese mes. El Departamento de Estadística Laboral informó que el índice de precios al productor (IPP) había disminuido
El precio de la gasolina es un componente del índice del precio del consumidor. © AP Photo/Jeff Chiu.
1.4% en febrero de 2006. El IPP mide la variación de los precios en los mercados mayoristas y suele considerarse como el principal indicador de las variaciones en el índice de precios al consumidor. Gran parte de esa disminución se debió a la disminución de los precios de los bienes de energía. Al eliminar alimentos y combustibles (energía), el IPP en realidad aumentó en el mes de febrero. En este capítulo se verá cómo se calculan diversos índices, como los índices de precios al consumidor y al productor y cómo deben interpretarse.
Todos los meses, el gobierno de Estados Unidos publica diversos índices con objeto de ayudar a las personas a entender las condiciones económicas y comerciales vigentes. El más conocido y citado de estos índices es, probablemente, el índice de precios al consumidor (IPC). Como su nombre lo indica, el IPC es un indicador de lo que ocurre con los precios que pagan los consumidores por los artículos que compran. En concreto, el IPC mide las variaciones en los precios a lo largo de un lapso. Al partir de un punto determinado o periodo base y de su índice correspondiente, que es 100, el IPC sirve para comparar los precios al consumidor del periodo actual con los del periodo base. Por ejemplo, si el IPC es 125, esto significa que los precios, como un todo, al consumidor son aproximadamente 25% más altos que los precios de los mismos artículos en el periodo base. Aun cuando relativamente pocas personas saben exactamente lo que significan estos números, acerca del IPC todo mundo sabe lo suficiente para entender que su aumento significa precios más altos. A pesar de que el IPC es tal vez el índice más conocido, hay muchos otros índices gubernamentales y del sector privado que ayudan a medir y a entender las condiciones económicas de un periodo, en comparación con las de otro periodo. El objetivo de este capítulo es describir los tipos de índices más comunes. Para empezar se construirán algunos números índice sencillos para poder entender mejor cómo se calculan.
17Ander(744-764).qxd 2/29/08 11:44 AM Page 746
746
Capítulo 17
17.1 TABLA 17.1 COSTO DE LA GASOLINA NORMAL
Año
Precio por galón ($)
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
1.30 1.10 1.09 1.07 1.08 1.11 1.22 1.20 1.03 1.14 1.48 1.42 1.34 1.56 1.85 2.27
Fuente: U.S. Energy Information Administration.
17.2
TABLA 17.2
PRECIOS RELATIVOS DE UN GALÓN DE GASOLINA NORMAL Año
Precio relativo (Base 1990)
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
(1.30/1.30)100 100.0 (1.10/1.30)100 84.6 (1.09/1.30)100 83.8 (1.07/1.30)100 82.3 (1.08/1.30)100 83.1 (1.11/1.30)100 85.4 (1.22/1.30)100 93.8 (1.20/1.30)100 92.3 (1.03/1.30)100 79.2 (1.14/1.30)100 87.7 (1.48/1.30)100 113.8 (1.42/1.30)100 109.2 (1.34/1.30)100 103.1 (1.56/1.30)100 120.0 (1.85/1.30)100 142.3 (2.27/1.30)100 174.6
Números índice
Precios relativos La forma más sencilla de un índice de precios permite hacer una comparación entre el precio actual por unidad de un artículo y el precio por unidad del mismo artículo en el periodo base. Por ejemplo, en la tabla 17.1 se presentan los precios de un galón de gasolina desde 1990 hasta 2005. Para facilitar la comparación con otros años, se convierte el precio actual por galón a un precio relativo que expresa el precio unitario en cada periodo como un porcentaje del precio unitario en el periodo base. Precio relativo en el periodo t
Precio en el periodo t (100) Precio en el periodo base
(17.1)
Con 1990 como año base para los precios de la gasolina de la tabla 17.1, se pueden calcular los precios relativos de un galón de gasolina normal desde 1990 hasta 2005. En la tabla 17.2 se presentan estos precios relativos. Note lo fácil que es: el precio de cualquier año se compara con el precio del año base y el resultado es el precio relativo. Por ejemplo, el precio relativo de 1995 es 85.4, lo que indica que en 1995 la gasolina costaba 14.6% menos que en el año base 1990. De manera similar, en el año 2002 el precio relativo fue 103.1, lo que indica que en el 2002 hubo un incremento de 3.1% en el costo de la gasolina en comparación con el año base 1990. Los precios relativos, como los de la gasolina normal, son muy útiles para entender e interpretar cambios en las condiciones comerciales y económicas a través del tiempo.
Índices de precios agregados Aunque los precios relativos sirven para identificar las variaciones a lo largo del tiempo en los precios de artículos individuales, suele tenerse más interés en las variaciones en el precio de un conjunto de artículos considerados como un todo. Por ejemplo, si se desea tener un índice que mida la variación del costo general de la vida a lo largo del tiempo, el índice deberá basarse en la variación de los precios de diversos artículos como alimentos, vivienda, vestido, transporte, asistencia médica, etc. Un índice de precios agregados tiene como propósito medir la variación combinada de un grupo de artículos. Considere, por ejemplo, un índice de precios agregados de un grupo de artículos catalogados como gastos por el uso de un automóvil. Para ejemplificar, los artículos comprendidos en este grupo se limitarán a gasolina, aceite, neumáticos y gastos de seguro. En la tabla 17.3 se presentan los datos, para este índice de gastos, correspondientes a los años 1990 y 2005. Con 1990 como periodo base, un índice de precios agregados para estos cuatro componentes proporcionará una medida de la variación en el periodo de 1990 a 2005 en los gastos por el uso de un automóvil. Un índice agregado no ponderado se obtiene al sumar los precios unitarios en el año de interés (en este caso, 2005) y dividir esta suma entre la suma de los precios unitarios en el año base (1990). Sean Pit precio unitario del artículo i en el periodo t Pi0 precio unitario del artículo i en el periodo base Un índice agregado no ponderado del periodo t, que se denota It, está dado por It
兺Pit (100) 兺Pi0
donde las sumas son de todos los artículos del grupo.
(17.2)
17Ander(744-764).qxd 2/29/08 11:44 AM Page 747
17.2
747
Índices de precios agregados
TABLA 17.3
DATOS PARA EL ÍNDICE DE GASTOS POR EL USO DE UN AUTOMÓVIL
Artículo
Precio unitario ($) 1990 2005
Galón de gasolina Cuarto de galón de aceite Neumáticos Seguro
1.30 2.10 130.00 820.00
2.27 3.50 170.00 939.00
Un índice agregado no ponderado de los gastos por el uso de un automóvil en 2005 (t = 2005) está dado por 2.27 3.50 170.00 939.00 (100) 1.30 2.10 130.00 820.00 1114.77 (100) 117 953.4
I2005
Si la cantidad usada de cada uno de los artículos es la misma, con un índice no ponderado se obtienen los mismos resultados que con un índice ponderado. Sin embargo, en la práctica, las cantidades usadas rara vez son iguales.
TABLA 17.4
INFORMACIÓN SOBRE USO ANUAL PARA EL ÍNDICE DE USO DE UN AUTOMÓVIL Artículo
Ponderador de la cantidad*
Galones de gasolina Cuartos de galón de aceite Neumáticos Seguro
1000 15 2 1
* Con base en 15 000 millas por año. La vida de uso de los neumáticos es de 30 000 millas.
De acuerdo con este índice de precios agregados no ponderados, se concluye que, en el periodo de 1990 a 2005, el precio de los gastos por el uso de un automóvil ha aumentado 17%. Pero hay que notar que en este índice de precios no ponderados por los gastos del uso de un automóvil influyen más los artículos cuyo precio unitario es elevado. Por tanto, artículos que tienen precios unitarios bajos, como gasolina y aceite, están dominados por los artículos de precio unitario alto, como neumáticos y seguro. La influencia que tienen los precios de los neumáticos y del seguro sobre el índice agregado no ponderado de los gastos por el uso de un automóvil es muy grande. Debido a la sensibilidad que muestran los índices no ponderados de uno o varios artículos de precio más elevado, este tipo de índice agregado no es muy usado. Cuando las cantidades usadas son diferentes, con un índice de precios agregados ponderados se obtiene una mejor comparación. La filosofía que hay detrás del índice de los precios agregados ponderados es que cada artículo del grupo debe ser ponderado de acuerdo con su importancia. Por tanto, se necesita una medida de la cantidad de uso de cada artículo del grupo. En la tabla 17.4 se presenta la información del uso anual de cada artículo que se debe tener en cuenta en el uso de un automóvil, con base en el uso estándar de un automóvil mediano que recorre alrededor de 15 000 millas anuales. Los ponderadores de las cantidades mostrados indican el uso anual esperado en estas condiciones. Sea Qi = cantidad usada del artículo i. El índice de precio agregado ponderado del periodo t está dado por It
兺Pit Qi (100) 兺Pi0 Qi
(17.3)
donde las sumas son de todos los artículos del grupo. Aplicado a los gastos por el uso de un automóvil, el índice de precios agregados ponderados se obtiene al dividir los costos del uso del automóvil en 2005 entre los costos de uso del automóvil en 1990. Si t = 2005, con los ponderadores de la tabla 17.4 se obtiene el siguiente índice de precios agregados ponderados para los gastos por el uso de un automóvil en 2005. 2.27(1000) 3.50(15) 170.00(2) 939.00(1) (100) 1.30(1000) 2.10(15) 130.00(2) 820.00(1) 3601.5 (100) 149 2411.5
I 2005
De acuerdo con este índice de precios agregados ponderados, se puede concluir que durante el periodo 1990 a 2005, el precio de los gastos por el uso de un automóvil ha aumentado 49%.
17Ander(744-764).qxd 2/29/08 11:44 AM Page 748
748
Capítulo 17
Números índice
Es claro que en comparación con el índice agregado no ponderado, el índice ponderado da una indicación más precisa de la variación que ha habido de 1990 a 2005, en el precio de los gastos por el uso de un automóvil. Al tomar en cuenta la cantidad usada de gasolina, se contrarresta el pequeño aumento porcentual de los costos del seguro. Con el índice ponderado se obtiene un aumento mayor, en los gastos por el uso de un automóvil, que con el índice no ponderado. En general, para establecer un índice de precios para un grupo de artículos se prefieren los índices agregados ponderados con las cantidades de uso como cargas. Observe que en la fórmula (17.3) para el índice de precios agregados ponderados, el término correspondiente a la cantidad Qi no tiene un segundo subíndice que indique el tiempo. La razón es que las cantidades Qi son fijas, no varían con el tiempo como lo hacen los precios. Estos ponderados fijos o cantidades los especifica la persona que diseña el índice al emplear las cantidades que considere representativas del uso estándar. Una vez establecidas estas cantidades se mantienen constantes o fijas para todos los periodos que se use el índice. Para obtener índices de otros años que no sean el 2005, es necesario recolectar nuevos datos Pit, pero las cantidades ponderadoras Qi permanecen constantes. En un caso especial del índice agregado de ponderadores fijos, las cantidades se determinan de acuerdo con el uso en el año base. En este caso se escribe Qi = Qi0, donde el cero que se emplea como subíndice indica el ponderador de la cantidad del año base; la fórmula (17.3) se convierte en 兺Pit Qi0 (100) (17.4) 兺Pi0 Qi0 Cuando los ponderadores fijos de las cantidades se determinan a partir de los usos en el año base, al índice agregado ponderado se le conoce como índice de Laspeyres. Otra posibilidad para determinar los ponderadores de las cantidades es ir modificando estas cantidades en cada periodo. En este caso, cada año para el que se calcula el índice se determina Qit. El índice agregado ponderado del periodo t con estos ponderadores de las cantidades está dado por 兺Pit Qit It (100) (17.5) 兺Pi0 Qit Observe que tanto en el periodo base (periodo 0) como en el periodo t se usan los mismos ponderadores de las cantidades. Pero las ponderaciones están basadas en el uso en el periodo t, no en el periodo base. A este índice agregado ponderado se le conoce como índice de Paasche. Este índice tiene la ventaja de estar basado en los estándares de uso actuales. Sin embargo, este método de cálculo de un índice agregado ponderado tiene dos desventajas: las cantidades del uso Qit tienen que ser determinadas cada año, sumando al tiempo y al costo de la recolección de datos, y cada año hay que volver a calcular los números índice de los años anteriores para que pueda verse el efecto de los nuevos pesos. Debido a esta desventaja, el índice más usado es el índice de Laspeyres. El índice de los gastos por el uso de un automóvil se calculó con las cantidades del periodo base; por tanto, es un índice de Laspeyres. Si se hubieran usado las cifras correspondientes al 2005, hubiera sido un índice de Paasche. En realidad, debido a que los automóviles han ido teniendo un consumo de gasolina más eficiente, el uso de gasolina ha disminuido y con el índice de Paasche se obtiene una cifra distinta que con el índice de Laspeyres. It
Ejercicios
Métodos
Auto examen
1. En la tabla siguiente se presentan precios y cantidades usadas de dos productos correspondientes a 2004 y a 2006. Cantidad
Precio unitario ($)
Artículo
2004
2006
2004
2006
A B
1500 2
1800 1
7.50 630.00
7.75 1500.00
17Ander(744-764).qxd 2/29/08 11:44 AM Page 749
17.2
749
Índices de precios agregados
a. b. c. d.
Calcule los precios relativos de cada artículo en el 2006 con 2004 como periodo base. Calcule un índice de precios agregados no ponderados de estos dos artículos en 2006, use 2004 como periodo base. Calcule un índice de precios agregados ponderados de estos dos artículos con el método de Laspeyres. Calcule un índice de precios agregados ponderados de estos dos artículos con el método de Paasche.
2. En 2006 un artículo cuyo precio relativo es 132 cuesta $10.75. Su año base es 1992. a. ¿En qué porcentaje aumentó o disminuyó el costo de este artículo en este lapso de 14 años? b. ¿Cuánto costaba este artículo en 1992?
Aplicaciones
Auto examen
3. Un fabricante tiene tres proveedores de un determinado componente; los tres proveedores difieren en calidad y cantidad que suministran. En la tabla siguiente se presentan los datos correspondientes a los años 2004 y 2006
Proveedor A B C
a. b. c.
Cantidad (2004) 150 200 120
Precio unitario ($) 2004 2006 5.45 6.00 5.60 5.95 5.50 6.20
Calcule, por separado, los precios relativos de cada proveedor. Compare el incremento de precios de los proveedores en este lapso de dos años. Calcule un índice de precios agregados no ponderados de los componentes en el 2006. Calcule un índice de precios agregados ponderados de los componentes en el 2006. ¿Qué significado tiene este índice para el fabricante?
4. La empresa R&B Beverages, Inc., tiene toda una línea de cervezas, vinos y refrescos que distribuye a través de minoristas en Iowa central. En la tabla siguiente se presentan precios unitarios en 2003 y en 2006 y cantidades vendidas (cajas) en 2003.
Artículo Cerveza Vino Refresco
Cantidades 2003 (cajas) 35 000 5 000 60 000
Precio unitario ($) 2003 2006 16.25 17.50 64.00 100.00 7.00 8.00
Calcule el índice agregado ponderado de las ventas de R&B en 2006, emplee 2003 como periodo base. 5. En el método LIFO de evaluación de inventario se debe establecer un índice de precios del inventario para fines de impuestos. Los pesos se basan en los niveles de inventario de fin de año. Use el precio unitario de principio de año como precio del periodo base y obtenga un índice agregado ponderado del valor total de inventario a fin de año. ¿Qué tipo de índice de precios agregados ponderados debe emplearse para la evaluación LIFO de inventario?
Producto A B C D
Inventario final 500 50 100 40
Precio unitario ($) Principio Fin 0.15 0.19 1.60 1.80 4.50 4.20 12.00 13.20
17Ander(744-764).qxd 2/29/08 11:44 AM Page 750
750
Capítulo 17
17.3
Hay que comprobar que los precios y las cantidades se den en las mismas unidades. Por ejemplo, si los precios son precios por caja, las cantidades deben darse en cantidad de cajas y no, por ejemplo, en cantidad de las unidades que vienen en las cajas.
Números índice
Cálculo de un índice de precios agregados a partir de precios relativos En la sección 17.1 se definió el concepto de precio relativo y se mostró cómo calcular un precio relativo a partir del precio unitario en el periodo actual y del precio unitario en el periodo base. Ahora se quiere mostrar cómo calcular directamente, a partir de la información sobre el precio relativo de cada artículo, índices de precios relativos como los obtenidos en la sección 17.2. Debido al uso limitado de los índices no ponderados, se restringirá la atención a los índices de precios agregados ponderados. Se vuelve a los índices de los gastos por el uso de un automóvil de la sección anterior. La información necesaria acerca de los cuatro artículos se encuentra en la tabla 17.5. Sea wi la ponderación correspondiente al precio relativo del artículo i. La expresión general para obtener un promedio ponderado de precios relativos es la dada por Pit
兺P
It
(100)wi
i0
(17.6)
兺wi
Elegir de manera adecuada las ponderaciones de la ecuación (17.6) permitirá calcular un índice de precios agregados ponderados a partir de los precios relativos. Las ponderaciones adecuadas son las que se obtienen al multiplicar el precio del periodo base por la cantidad usada (la cantidad de uso). wi Pi 0 Qi
(17.7)
Sustituyendo wi = Pi0Qi en la ecuación (17.6) se obtiene la ecuación siguiente que da un índice de precios relativos ponderados. Pit
It
兺P
(100)(Pi0 Qi)
i0
(17.8)
兺Pi0 Qi
Como en el numerador se cancelan los términos Pi0, se obtiene la siguiente expresión equivalente para el índice de precios relativos ponderados It
兺Pit Qi (100) 兺Pi0 Qi
Como se ve, el índice de precios relativos ponderados en el que wi = PioQi proporciona un índice idéntico al índice agregado ponderado al que se obtiene con la ecuación (17.3) de la sección TABLA 17.5
PRECIOS RELATIVOS PARA EL ÍNDICE DE GASTOS POR EL USO DE UN AUTOMÓVIL
Artículo
Precio unitario ($) 1990 2005 (P0 ) (Pt )
Galón de gasolina Cuarto de galón de aceite Neumáticos Seguro
1.30 2.10 130.00 820.00
2.27 3.50 170.00 939.00
Precio relativo (Pt /P0 )100
Uso anual
174.6 166.7 130.8 114.5
1000 15 2 1
17Ander(744-764).qxd 2/29/08 11:44 AM Page 751
17.3
751
Cálculo de un índice de precios agregados a partir de precios relativos
TABLA 17.6
ÍNDICE DE GASTOS POR EL USO DE UN AUTOMÓVIL (1990-2005) CON BASE EN LOS PRECIOS RELATIVOS PONDERADOS
Artículo
Precios relativos (Pit /Pi0 )(100)
Precio base ($) Pi0
Cantidad Qi
174.6 166.7 130.8 114.5
1.30 2.10 130.00 820.00
1000 15 2 1
Gasolina Aceite Neumáticos Seguro
Precios Carga relativos ponderados wi ⴝ Pi0Qi (Pit /Pi0 )(100)wi
Totales I2005
1300.00 31.50 260.00 820.00
226 980.00 5 251.05 34 008.00 93 890.00
2411.50
360 129.05
360,129.05 149 2411.50
17.2. Al usar en la ecuación (17.7) las cantidades del periodo base (es decir, Qi = Qi0) se obtiene el índice de Laspeyres. En la ecuación (17.7) si usan las cantidades del periodo actual (es decir, Qi = Qit) se obtiene el índice de Paasche. Para los datos de los gastos por el uso de un automóvil, si usa los precios relativos de la tabla 17.5 y la ecuación (17.6) calcula el promedio ponderado de los precios relativos. En la tabla 17.6 se dan los resultados que se obtienen al usar las ponderaciones especificadas por la ecuación (17.7). El número índice, 149, indica que ha habido un aumento de 49% en los gastos por el uso de un automóvil, que es el mismo aumento que se encontró con el índice agregado ponderado de la sección 17.2.
Ejercicios
Métodos
Auto examen
6. En la tabla siguiente se dan los precios relativos de tres artículos, así como sus precios y uso en el periodo base. Calcule un índice de precios agregados ponderados para el periodo actual.
Periodo base Artículo
Precio relativo
Precio
Uso
A B C
150 90 120
22.00 5.00 14.00
20 50 40
Aplicaciones
Auto examen
7. La empresa Mitchell Chemical fabrica un producto químico para la industria que es una mezcla de tres ingredientes químicos. A continuación se presentan los costos al comienzo del año, los costos al final del año y la proporción de cada ingrediente en la mezcla. Costo por libra ($) Ingrediente
Comienzo
Final
Cantidad (libras) por cada 100 libras del producto
A B C
2.50 8.75 .99
3.95 9.90 .95
25 15 60
17Ander(744-764).qxd 2/29/08 11:44 AM Page 752
752
Capítulo 17
a. b.
Números índice
Calcule los precios relativos de cada uno de estos tres ingredientes. Calcule el promedio ponderado de los precios relativos para obtener el índice de costo anual de las materias primas usadas en este producto. ¿Qué interpretación da al valor de este índice?
8. Un portafolio de inversiones consta de cuatro acciones. En la tabla siguiente se da el precio de compra, el precio actual y la cantidad de cada una de las acciones.
Acción Holiday Trans NY Electric KY Gas PQ Soaps
Precio de compra/ acción ($)
Precio actual/acción ($)
Cantidad de acciones
15.50 18.50 26.75 42.25
17.00 20.25 26.00 45.50
500 200 500 300
Obtenga un promedio ponderado de los precios relativos como índice del desempeño del portafolio hasta la fecha. Interprete este índice de precios. 9. Calcule los precios relativos de los productos de R&B del ejercicio 4. Utilice un promedio ponderado de los precios relativos para demostrar que con este método se obtiene el mismo índice que con el método agregado ponderado.
17.4
Algunos índices de precios importantes Se han descrito los procedimientos que se usan para calcular índices de precios de artículos o de grupos de artículos. Ahora se verán algunos índices de precios que son indicadores importantes de la situación comercial y económica. Se considerarán el índice de precios al consumidor, el índice de precios al productor y los promedios Dow Jones.
Índice de precios al consumidor El IPC incluye gastos en servicios (por ejemplo, gastos en médicos y dentistas) y todos los impuestos debidos a la compra y el uso de un artículo.
El índice de precios al consumidor (IPC), que es publicado mensualmente por el Departamento de Estadística Laboral de Estados Unidos, es la medida principal del costo de la vida en Estados Unidos. El conjunto de artículos que se usa para elaborar este índice consta de una canasta de mercado de 400 artículos que comprende alimentos, vivienda, vestido, transporte y medicamentos. El IPC es un índice de precios agregados ponderados que tiene pesos fijos.* Las ponderaciones que se aplican a cada artículo en la canasta de mercado se obtienen mediante un estudio de uso entre todas las familias de Estados Unidos. En febrero de 2006, el IPC, calculado con el índice base de 100 de 1982-1984, fue 198.7. Esta cifra indica que el costo de la canasta de mercado de bienes y servicios ha aumentado 98.7% desde el periodo base 1982-1984. En la figura 17.1 se muestra una serie de IPC de 50 años, desde 1950 hasta 2000. Observe cómo el IPC refleja la conducta inflacionaria de la economía a fines de los años setenta y comienzo de los ochenta.
Índice de precios al productor El IPP tiene por objeto medir la variación en los precios de los bienes internos; no incluye las importaciones.
El Índice de precios al productor (IPP), que también es publicado mensualmente por el Departamento de Estadística Laboral de Estados Unidos, mide las variaciones mensuales de los precios en los mercados primarios de Estados Unidos. El IPP está basado en los precios de la primera operación en cada producto de los mercados no minoristas. Todos los artículos que se * En realidad, el Departamento de Estadística Laboral publica dos índices de precio al consumidor: uno para los consumidores urbanos (IPC-U) y otro índice de precios al consumidor ajustado para los trabajadores asalariados y de oficina (IPC-W). El IPC-U es uno de los índices más citados y se publica de manera regular en The Wall Street Journal.
17Ander(744-764).qxd 2/29/08 11:44 AM Page 753
17.4
753
Algunos índices de precios importantes
FIGURA 17.1
ÍNDICE DE PRECIOS AL CONSUMIDOR, 1950-2000 (BASE 1982-1984 = 100)
200
Índice de precios al consumidor
175 150 125 100 75 50 25 0
1950
1960
1970
1980
1990
2000
Año
venden en operaciones comerciales de estos mercados están representados. Abarca materia prima, productos manufacturados y productos procesados en cualquiera de los niveles de procesamiento de los productos de las industrias clasificadas como manufacturera, agrícola, forestal, de pesca, minería, gas y electricidad y servicios públicos. Este índice sirve, entre otras cosas, como el principal indicador de la tendencia futura en los precios al consumidor y en el costo de la vida. El aumento del IPP refleja que ha habido un aumento en los precios al productor, lo que al final repercutirá en precios más elevados para el consumidor. Los pesos para los diversos artículos en el IPP están basados en el valor de los pedidos de mercancías. El promedio ponderado de los precios relativos se calcula usando el método de Laspeyres. En febrero de 2006 el IPP fue 157.8 con 100 para el año 1982.
Promedios Dow Jones
Charles Henry Dow publicó su primer índice accionario el 3 de julio de 1884, en el Customer’s Afternoon Letter. Este primer índice comprendía 11 acciones, nueve de las cuales eran ferroviarias. Un promedio comparable con el DJIA fue publicado por primera vez el 1 de octubre de 1928.
Los promedios Dow Jones son índices que sirven como indicadores de las tendencias de los precios y de los movimientos de acciones ordinarias. El más conocido de los índices Dow Jones es el índice industrial Dow Jones (DJIA, por sus siglas en inglés), el cual está basado en los precios de las acciones ordinarias de 30 empresas grandes; es la suma de los precios de estas acciones ordinarias dividida entre un número, que se corrige de tiempo en tiempo para ajustarlo a las escisiones de las acciones o fusiones de las empresas que participan en el índice. A diferencia de los demás índices de precios estudiados, este índice no se expresa como un porcentaje de los precios del año base. En la tabla 17.7 se enumeran las empresas usadas en febrero de 2006 para calcular el DJIA. Otros promedios Dow Jones se calculan con 20 acciones del transporte o con 15 acciones de empresas de servicio público Los promedios Dow Jones se calculan y se publican diariamente en The Wall Street Journal y en otras publicaciones financieras.
17Ander(744-764).qxd 2/29/08 11:44 AM Page 754
754
Capítulo 17
TABLA 17.7
Números índice
LAS 30 EMPRESAS USADAS EN EL ÍNDICE INDUSTRIAL DOW JONES (MARZO 2006)
Alcoa Altria Group AIG American Express AT&T Boeing Caterpillar Citigroup Coca-Cola Disney
DuPont Exxon Mobil General Electric General Motors Hewlett-Packard Home Depot Honeywell Int’l IBM Intel Johnson & Johnson
J. P. Morgan Chase McDonald’s Merck Microsoft Minnesota Mining Pfizer Procter & Gamble United Technologies Verizon Wal-Mart Stores
Fuente: Barron’s, 20 de marzo 2006.
17.5 Las series se deflactan para eliminar el efecto de la inflación.
Deflactar una serie mediante índices de precios Muchas series comerciales y económicas medidas a lo largo del tiempo, como ventas de empresas, ventas industriales e inventarios, miden su monto en dólares. Estas series suelen mostrar a lo largo del tiempo un patrón de aumento de crecimiento, lo que se considera como una indicación del aumento en el volumen físico relacionado con estas actividades. Por ejemplo, un aumento de 10% en el monto en dólares de un inventario puede ser interpretado como que el inventario físico es 10% mayor. Tales interpretaciones pueden ser erróneas cuando una serie de tiempo se mide en dólares y el monto total en dólares, es combinación tanto de cambios en los precios como en las cantidades. Por tanto, en aquellos periodos en que las variaciones en los precios son significativas, las variaciones en el monto en dólares pueden no corresponder a variaciones en la cantidad, a menos que la serie de tiempo pueda ser ajustada para eliminar los efectos de las variaciones en los precios. Por ejemplo, desde 1976 hasta 1980, la cantidad total de gastos en la industria de la construcción aumentó aproximadamente 75%. Esta cifra sugiere un excelente crecimiento en la actividad de la construcción. Pero, los precios en la construcción aumentaban en ese momento tan rápido —o algunas veces aún más— como esta tasa de 75%. En efecto, aunque los gastos totales en la construcción aumentaban, la actividad en la construcción permanecía relativamente constante o, en casos como la construcción de casas nuevas, incluso disminuía. Para interpretar correctamente la actividad en la construcción durante este periodo 1976-1980, es necesario ajustar la serie de los gastos totales mediante un índice de precios para eliminar el efecto del aumento de precios. Siempre que se elimina el efecto del aumento de precios de una serie de tiempo, se dice que se está deflactando la serie. En relación con el ingreso de las personas y con los salarios se suele oír discusiones acerca de “salarios reales” o “poder adquisitivo” del salario. Estos conceptos están relacionados con la noción de deflactar un índice de salario por hora. Por ejemplo, en la figura 17.2 se muestra el patrón seguido por los salarios por hora de los trabajadores de la industria en el periodo 1998-2002. Se observa una tendencia de aumento en los salarios, de $12.78 por hora a $14.77 por hora. ¿Los trabajadores de la industria estarán contentos con este aumento de los salarios por hora? La respuesta depende de lo que ocurra con el poder adquisitivo de sus salarios. Si se puede comparar el poder adquisitivo del salario de $12.78 por hora de 1998 con el poder adquisitivo del salario de $14.77 de 2002, se estará en mejores condiciones para juzgar la mejora relativa del salario. En la tabla 17.8 se presentan tanto salarios por hora como el IPC desde 1998 hasta 2002.Con estos datos se mostrará cómo usar el IPC para deflactar el índice de los salarios por hora. La serie deflactada se obtiene al dividir el salario por hora de cada año entre el valor correspondiente
17Ander(744-764).qxd 2/29/08 11:44 AM Page 755
17.5
755
Deflactar una serie mediante índices de precios
FIGURA 17.2
SALARIOS POR HORA DE LOS TRABAJADORES DEL SECTOR PRODUCCIÓN
14.8 14.6 14.4
Salario por hora
14.2 14.0 13.8 13.6 13.4 13.2 13.0 12.8 12.6 1998
Los salarios reales son una mejor medida del poder de compra que los salarios nominales. Muchos contratos sindicales piden que los salarios se ajusten de acuerdo con los cambios en el costo de la vida.
1999
2000 Año
2001
2002
del IPC y multiplicarlo por 100. En la tabla 17.9 se da el índice deflactado de los salarios por hora de los trabajadores de la industria; en la figura 17.3 se presenta una gráfica que muestra el salario deflactado o real. ¿Qué indica la serie deflactada de salarios acerca de los salarios reales o poder adquisitivo de los trabajadores durante el periodo 1998-2002? En términos de dólares, en el periodo base (1982-1984 = 100), el salario por hora no aumentó mucho. Una vez eliminado el efecto inflacionario, se ve que el poder adquisitivo de los trabajadores no aumentó mucho. Este efecto se ve en la figura 17.3. Por tanto, la ventaja de usar índices de precios para deflactar una serie es que se obtiene una imagen más clara de los cambios reales, en dólares, ocurridos. Este proceso de deflactar una serie a lo largo del tiempo tiene una aplicación importante en el cálculo del producto interno bruto (PIB). El PIB es el valor total de todos los bienes y servi-
TABLA 17.8
SALARIOS POR HORA PARA LOS TRABAJADORES DE LA INDUSTRIA E ÍNDICES DE PRECIOS AL CONSUMIDOR, 1998-2002 Año
Salario por hora ($)
IPC(base: 1982-1984)
1998 1999 2000 2001 2002
12.78 13.24 13.76 14.31 14.77
163.0 166.6 172.2 177.1 179.9
Fuente: Departamento de Estadística Laboral.
17Ander(744-764).qxd 2/29/08 11:44 AM Page 756
756
Capítulo 17
TABLA 17.9
Números índice
SERIE DEFLACTADA DE LOS SALARIOS POR HORA PARA LOS TRABAJADORES DE LA INDUSTRIA, 1998-2002
FIGURA 17.3
Año
Salario por hora deflactado
1998 1999 2000 2001 2002
($12.78/163.0)(100) $7.84 ($13.24/166.6)(100) $7.95 ($13.76/172.2)(100) $7.99 ($14.31/177.1)(100) $8.08 ($14.77/179.9)(100) $8.21
SALARIOS REALES POR HORA PARA LOS TRABAJADORES DE LA INDUSTRIA, 1998-2002
Salario real por hora
8.5
8.25
8.0
7.75 1998
1999
2000 Año
2001
2002
cios producidos en un país. Es claro que si el PIB no se deflacta mediante un índice de precios, con el tiempo mostrará aumentos debidos en parte al aumento de los precios. Por tanto, para ajustar el valor total de los bienes y servicios de manera que reflejen los verdaderos cambios en el volumen de bienes y servicios producidos y vendidos, el PIB debe ser calculado con un índice de precios como deflactor. El proceso es similar al visto para calcular los salarios reales.
Ejercicios
Aplicaciones
Auto examen
10. En febrero de 1996, el salario promedio por hora para los trabajadores de la industria era de $11.86; en febrero de 2006 era $16.47. El IPC en febrero de 1996 era 154.9; en 2006 era 198.7. a. Deflacte los salarios por hora de 1996 y de 2006 para hallar los salarios reales. b. ¿Cuál es el cambio porcentual en los salarios nominales por hora de 1996 a 2006? c. ¿Cuál es el cambio porcentual en los salarios reales por hora de 1996 a 2006?
17Ander(744-764).qxd 2/29/08 11:44 AM Page 757
17.5
757
Deflactar una serie mediante índices de precios
11. Los salarios promedio por hora de los trabajadores de la industria de servicios en los cuatro años desde 2002 hasta 2005 se presentan a continuación. Use los índices de precios al consumidor para deflactar la serie de salarios. Calcule el aumento o la disminución porcentual de los salarios reales y de los salarios nominales, desde 2003 hasta 2005.
Año
Salarios por hora
IPC (base: 1982-1984)
2002 2003 2004 2005
18.52 18.95 19.23 19.46
179.9 184.0 188.9 195.3
Fuente: Departamento de Estadística Laboral.
12. La Oficina de Censos de Estados Unidos publica las siguientes cantidades de pedidos de la industria desde 1999 hasta 2001.
a.
b.
c.
Año
Pedidos de la industria ($ miles de millones)
1999 2000 2001
4032 4218 3971
Los índices de precios al consumidor desde 1998 hasta 2002 se presentan en la tabla 17.8. Use esta información para deflactar la serie de pedidos de la industria y dé un comentario respecto al patrón que siguen los pedidos de la industria en términos de dólar constante. Los siguientes índices de precios al consumidor (bienes de consumo terminados) corresponden a los años 1999 a 2001, tome como año base 1982. Use el IPP para deflactar la serie.
Año
IPP (1982 ⴝ 100)
1999 2000 2001
133.0 138.0 140.7
¿Qué índice piensa que sea más adecuado como deflactor de los pedidos de la industria, el IPC o el IPP?
13. En la tabla siguiente se presentan volúmenes totales de ventas al menudeo de los Dooley Retail Outlets’, para algunos de los años de 1982 a 2002. También se presentan los IPC con base 19821984. Deflacte las cifras de los volúmenes de venta con base en el dólar constante de 1982-1984, y haga un comentario sobre el volumen de venta de esta empresa en términos de dólares deflactados.
Año
Ventas al menudeo ($)
IPC (base: 1982-1984)
1982 1987 1992 1997 2002
380 000 520 000 700 000 870 000 940 000
96.5 113.6 140.3 160.5 179.9
17Ander(744-764).qxd 2/29/08 11:44 AM Page 758
758
Capítulo 17
17.6
Números índice
Índices de precios: otras consideraciones En las secciones anteriores se describieron varios métodos para calcular índices de precios, se vio el uso de algunos de los índices más importantes y se presentó un procedimiento para usar los índices de precios en la deflacción de series de tiempo. Para comprender mejor cómo se construyen y se usan los índices de precios, es necesario considerar también otras cuestiones, algunas de las cuales se verán en esta sección.
Selección de los artículos El propósito principal de un índice de precios es medir la variación, en el transcurso del tiempo, del precio de un determinado conjunto de artículos, productos, etc. Si este conjunto es muy grande, el índice no se puede basar en todos los artículos de tal conjunto; es necesario usar una muestra representativa de estos artículos. Mediante los precios y cantidades de los artículos en la muestra, se espera poder tener una buena idea del comportamiento de los precios de todos los artículos que representa el índice. Por ejemplo, para el índice de precios al consumidor, la cantidad de artículos a considerar, como población de artículos que compra normalmente un consumidor, es de 2000 o más. Pero este índice se basa sólo en las características de precio y cantidad de 400 artículos. La selección de los artículos para calcular este índice no es una tarea trivial. Se requiere estudiar los patrones de compra de los consumidores, así como tener un buen criterio; para seleccionar los 400 artículos no se emplea una muestra aleatoria simple. Una vez realizada la selección inicial, el grupo de artículos que se usa para calcular el índice se revisa y se modifica periódicamente siempre que haya modificaciones en los patrones de compra. De manera que la decisión de cuáles son los artículos a incluir en un índice es un problema que debe ser resuelto para elaborar el índice y para modificarlo.
Selección de un periodo base La mayor parte de los índices que se establecen dan el valor 100 al periodo base. Todos los valores futuros del índice son valores en relación con el valor del periodo base. Cuál es el periodo base apropiado para un índice, no es una pregunta que sea fácil de responder. Debe estar basada en el criterio de la persona que elabora el índice. Muchos de los índices establecidos por el gobierno de Estados Unidos hasta el 2006 utilizan 1982 como periodo base. Como lineamiento general, el periodo base no debe ser un periodo muy alejado del actual. Por ejemplo, un índice de precios al consumidor que tenga como periodo base 1945 sería un índice difícil de entender para la mayoría de los individuos, debido a que la mayoría no está familiarizada con las condiciones de 1945. Así, el periodo base de la mayor parte de los índices se cambia periódicamente por un periodo más reciente. El periodo base para el IPC se cambió en 1988, de 1967 al promedio de 1982-1984. El IPP emplea 1982 como periodo base (es decir, 1982 = 100).
Variaciones en la calidad El propósito de un índice es medir las variaciones de los precios a lo largo del tiempo. Lo ideal es obtener los datos, en diferentes tiempos, de los precios de los artículos de un mismo conjunto y después calcular el índice. Una suposición básica es que en cada periodo se identifiquen los precios de los mismos artículos. Un problema se presenta cuando la calidad de los productos cambia de un periodo al siguiente. Por ejemplo, un fabricante puede modificar la calidad de un producto de un año a otro, ya sea con materiales menos costosos, al modificar las características del artículo, etc. El precio puede aumentar en los años siguientes, pero es un precio por un producto de menor calidad. En consecuencia, en realidad, el precio puede aumentar más de lo que indica la lista de precios. Es difícil, si no es que imposible, ajustar un índice a la disminución de la calidad de un artículo.
17Ander(744-764).qxd 2/29/08 11:44 AM Page 759
17.7
759
Índices de cantidad
Una mejora importante en la calidad ocasiona un aumento en el precio de un producto. La parte del precio que está relacionada con la mejora de la calidad debe excluirse del cálculo del índice. Sin embargo, ajustar un índice a un aumento de precio que está relacionado con una mejor calidad de un artículo es extremadamente difícil, si no es que imposible. Al elaborar un índice de precios se acostumbra ignorar cambios pequeños en la calidad de un artículo, los cambios importantes sí deben tomarse en cuenta debido a que éstos pueden modificar, de un periodo a otro, la descripción de un producto. Si la descripción de un producto cambia, el índice debe modificarse para reflejar este cambio; en algunos casos ese producto se elimina del índice. Sin embargo, en otros casos, una mejora importante de la calidad va acompañada por una disminución del precio. Esta situación, menos común, es lo que ocurrió con las computadoras personales durante los años noventa y los primeros años del siglo XXI.
17.7
Índices de cantidad Además de los índices de precios descritos en las secciones anteriores, hay otros tipos de índices también útiles. En particular, otra aplicación de los números índice es medir cambios de cantidad a lo largo del tiempo. A este tipo de índices se les conoce como índices de cantidad. Recuerde que en la sección 17.2, al obtener el índice de precios agregados ponderados, para calcular el número índice del periodo t se necesitaron los precios unitarios del periodo base (P0 ) y del periodo t (Pt). Mediante la ecuación (17.3) se obtuvo el índice de precios agregados ponderados de la manera siguiente It
兺Pit Qi (100) 兺Pi0 Qi
El numerador, 兺Pit Qi, representa el valor total de cantidades fijas de los artículos del índice en el periodo t. El denominador, 兺Pi0 Qi, representa el valor total de las mismas cantidades fijas de los artículos del índice en el periodo 0. El cálculo de un índice de cantidades agregadas ponderadas es similar al del índice de precios agregados ponderados. Las cantidades de cada artículo se miden en el periodo base y en el periodo t; Qi0 y Qit representan, respectivamente, estas cantidades del artículo i. Después, estas cantidades se ponderan mediante un precio fijo, el valor agregado o algún otro factor. El “valor agregado” de un producto es el valor de venta menos el costo de las inversiones. La fórmula para calcular el índice de cantidad agregada ponderada para el periodo t es It
兺Qitwi (100) 兺Qi0wi
(17.9)
En algunos índices de cantidad, el peso que se usa para el artículo i es el precio en el periodo base (Pi0), en cuyo caso, el índice de cantidades agregadas ponderadas es It
兺Qit Pi0 (100) 兺Qi0 Pi0
(17.10)
Los índices de cantidad también pueden calcularse con base en cantidades relativas ponderadas. A continuación se presenta una fórmula para esta versión de índices de cantidad Qit
It
兺Q
(Qi0 Pi)
i0
兺Qi0 Pi
(100)
(17.11)
17Ander(744-764).qxd 2/29/08 11:44 AM Page 760
760
Capítulo 17
Números índice
Esta fórmula es la versión para cantidades de la fórmula para precios relativos ponderados de la ecuación (17.8), sección 17.3. El índice de cantidad más conocido es probablemente el índice de la producción industrial, elaborado por el consejo de la Reserva Federal de Estados Unidos. Este índice se publica cada mes y el periodo base es al año 2002. Este índice tiene por objeto medir variaciones en el volumen de producción de diversos productos manufacturados, además de productos de minería y de empresas de servicio público. En febrero de 2006 el índice fue 110.9.
Ejercicios
Métodos
Auto examen
14. En la siguiente tabla se presentan datos de las cantidades vendidas de tres artículos en 1995 y en 2006, se dan también los precios de venta de estos artículos en 1995. Calcule el índice de cantidades agregadas ponderadas para 2006.
Cantidad vendida Artículo
1995
2006
Precio unitario 1995 ($)
A B C
350 220 730
300 400 850
18.00 4.90 15.00
Aplicaciones
Auto examen
15. Una empresa de transporte de mercancías traslada tres productos de un determinado distribuidor. En la tabla siguiente se presentan los envios de estos tres productos en 1994 y en 2006, así como los precios de 1994.
Materia prima Producto
1994
2006
Precio/envío 1994
A B C D
120 86 35 60
95 75 50 70
$1200 $1800 $2000 $1500
Obtenga un índice de cantidades agregadas ponderadas con 1994 como base. Presente un comentario sobre el aumento o la disminución de estas cantidades en el periodo 1994-2006. 16. Un comerciante de automóviles presenta en la siguiente tabla sus ventas de tres modelos en 1992 y en 2006. Calcule las cantidades relativas y úselas para obtener un índice de cantidades agregadas ponderadas para al año 2006, emplee los datos de los dos años.
Ventas Modelo
1992
2006
Precio medio por venta (1992)
Sedan Sport Wagon
200 100 75
170 80 60
$15 200 $17 000 $16 800
17Ander(744-764).qxd 2/29/08 11:44 AM Page 761
761
Fórmulas clave
Resumen Los índices de precio y la cantidad son medidas importantes de las variaciones de precio y cantidad en la economía y el comercio. Los precios relativos son simplemente el cociente del precio unitario actual de un artículo entre el precio unitario del periodo base, multiplicado por 100; si el valor del precio relativo de un artículo es 100, esto indica que no hay diferencia entre el precio actual y el del periodo base. Los índices de precios agregados son una medida compuesta de la variación general en los precios de un determinado grupo de artículos o productos. Los artículos de un índice de precios agregados suelen ponderarse mediante su cantidad de uso. Un índice de precios agregados ponderados también se calcula al ponderar los precios relativos mediante las cantidades de uso en los artículos del índice. El índice de precios al consumidor y el índice de precios al productor son dos índices muy citados y sus años base son, respectivamente, 1982-1984 y 1982. El promedio industrial Dow Jones es otro índice de precios muy citado. Este índice es una suma ponderada de los precios de 30 acciones ordinarias de empresas grandes. A diferencia de muchos otros índices, este índice no se da como porcentaje del valor de algún año base. Con frecuencia los índices de precios se usan para deflactar algunas otras series económicas que se miden a lo largo del tiempo. Se vio el uso del IPC para deflactar los salarios por hora y obtener un índice de salarios reales. Consideraciones importantes para obtener un número índice son la selección de los artículos a incluir en el índice, la selección del periodo base para el índice y el ajuste a las variaciones en la cantidad. También se revisaron brevemente los índices de cantidad y se mencionó el índice de la producción industrial como un importante índice de cantidad.
Glosario Precio relativo Índice de precio para un determinado artículo que se calcula al dividir un precio unitario actual entre un precio unitario del periodo base y multiplicar el resultado por 100. Índice de precios agregados Índice de precio compuesto que se basa en los precios de un grupo de artículos. Índice de precios agregados ponderados Índice en el cual los precios de los artículos que lo componen son ponderados mediante su importancia relativa. Índice de Laspeyres Índice de precios agregados ponderados en el que el peso de cada artículo es su cantidad en el periodo base. Índice de Paasche Índice de precios agregados ponderados en el que el peso de cada artículo es su cantidad en el periodo actual. Índice de precios al consumidor (IPC) Índice de precios mensual que usa las variaciones de precio en la canasta de mercado de los bienes y servicios de consumo para medir las variaciones en los precios al consumidor a lo largo del tiempo. Índice de precios al productor (IPP) Índice de precios mensual diseñado para medir variaciones en los precios de bienes vendidos en mercados primarios (esto es, la primera compra de una materia prima en un mercado no minorista). Promedios Dow Jones Índice de precios agregados diseñado para mostrar tendencias de precios y movimientos en la Bolsa de Cambio de Nueva York. Índice de cantidad Índice que tiene por objeto medir cambios de cantidades a lo largo del tiempo. Índice de la producción industrial Un índice de cantidad diseñado para medir variaciones, a lo largo del tiempo, en el volumen físico o en los niveles de producción de los bienes industriales.
Fórmulas clave Precio relativo del periodo t Precio del periodo t (100) Precio del periodo base
(17.1)
17Ander(744-764).qxd 2/29/08 11:44 AM Page 762
762
Capítulo 17
Números índice
Índice de precios agregados no ponderados del periodo t It
兺Pit (100) 兺Pi0
(17.2)
Índice de precios agregados ponderados del periodo t It
兺Pit Qi (100) 兺Pi0 Qi
(17.3)
Promedio ponderado de precios relativos Pit
兺P
It
(100)wi
i0
(17.6)
兺wi
Factor de ponderación en la ecuación (17.6) wi Pi0 Qi
(17.7)
Índice de cantidades agregadas ponderadas It
兺Qitwi (100) 兺Qi0wi
(17.9)
Ejercicios complementarios 17. Los precios medianos de casas habitación nuevas de 1998 al 2001 son los siguientes (Statistical Abstract of the United States, 2002).
a. b.
Año
Precio ($ miles)
1998 1999 2000 2001
152.5 161.0 169.0 175.2
Con 1998 como año base, obtenga un índice de precios, correspondiente a estos años, para casas habitación nuevas. Con 1999 como año base, obtenga un índice precios de casas habitación nuevas para estos años.
18. Los siguientes son datos de la empresa Nickerson Manufacturing sobre las cantidades de sus pedidos y el costo unitario de cada uno de sus productos:
Productos
Cantidades en el periodo base (2003)
A B C D
2000 5000 6500 2500
Costo unitario medio del pedido ($) 2003
2006
10.50 16.25 12.20 20.00
15.90 32.00 17.40 35.50
17Ander(744-764).qxd 2/29/08 11:44 AM Page 763
763
Ejercicios complementarios
a. b.
Calcule el precio relativo de cada producto. Calcule un índice de precios agregados ponderados que refleje la variación del costo de los pedidos en estos cuatro años.
19. Utilice los datos del ejercicio 18 para calcular el índice Paasche de los costos de los pedidos si en el 2006 las cantidades en los pedidos son 4000, 3000, 7500 y 3000 para cada uno de los productos. 20. Boran Stockbrokers, Inc., selecciona cuatro acciones con el propósito de obtener su propio índice para el comportamiento del mercado de acciones. A continuación se dan los precios por acción en el 2004, que es el periodo base, en enero de 2006 y en marzo de 2006. Las cantidades del año base se fijan de acuerdo con los volúmenes históricos de las cuatro acciones.
Precio por acción ($) Acción A B C D
Cantidad en 2004
Industria
Petrolera De la computación Del acero Inmobiliaria
100 150 75 50
Base: 2004
Enero 2006
Marzo 2006
31.50 65.00 40.00 18.00
22.75 49.00 32.00 6.50
22.50 47.50 29.50 3.75
Use el periodo base, 2004, para calcular el índice Boran correspondiente a enero de 2006 y a marzo de 2006. Haga un comentario sobre lo que dice este índice acerca de lo que ocurre en el mercado de acciones. 21. Calcule los precios relativos de las cuatro acciones que en el ejercicio 20 se emplean para el índice Boran. Use los agregados ponderados de los precios relativos para calcular los índices Boran correspondientes a enero de 2006 y a marzo de 2006. 22. Considere la información siguiente sobre precios relativos y cantidades referentes a la producción de grano en Iowa (Statistical Abstract of the United States, 2002).
Producto Maíz Frijol de soya
Cantidades en 1991 (millones de bushels)
Precio base por bushel ($)
Precios relativos 1991-2001
1427 350
2.30 5.51
91 78
¿Cuál es el índice de precios agregados ponderados del 2001 para los granos de Iowa? 23. A continuación se presentan datos sobre el consumo de las frutas y los precios en 1988 y en 2001.
Fruta Plátanos Manzanas Naranjas Peras
a. b.
Consumo per cápita, 1998 (libras)
Precio 1988 ($/libras)
Precio 2001 ($/libras)
24.3 19.9 13.9 3.2
0.41 0.71 0.56 0.64
0.51 0.87 0.71 0.98
Calcule el precio relativo de cada producto. Calcule el índice de precios agregados ponderados de estos productos. Haga un comentario sobre la variación de los precios de las frutas en este lapso de 13 años.
17Ander(744-764).qxd 2/29/08 11:44 AM Page 764
764
Capítulo 17
Números índice
24. A continuación se presentan los salarios iniciales de los asistentes de profesor de administración en una universidad. Use los IPC para deflactar los salarios a dólar constante. Haga un comentario sobre la tendencia de los salarios en la educación de acuerdo con lo que indican estos datos.
Año
Salario inicial ($)
IPC (base: 1982-1984 )
1970 1975 1980 1985 1990 1995 2000 2005
14 000 17 500 23 000 37 000 53 000 65 000 80 000 110 000
38.8 53.8 82.4 107.6 130.7 152.4 172.2 195.3
25. Para una determinada acción se dan a continuación los precios por acción en cinco años consecutivos, así como los IPC que tienen como periodo base 1982-1984.
Año
Precio por acción ($)
IPC (base: 1982-1984)
2001 2002 2003 2004 2005
51.00 54.00 58.00 59.50 59.00
177.1 179.9 184.0 188.9 195.3
Deflacte la serie de precios de estas acciones y haga un comentario sobre la inversión en estas acciones. 26. En la tabla siguiente se presentan cantidad y valor de los productos de una empresa fabricante en los años 2002 y 2006. Con estos datos calcule un índice de cantidades agregadas ponderadas. Dé un comentario sobre el significado de este índice de cantidad.
Cantidad Producto
2002
2006
Valores ($)
A B C
800 600 200
1200 500 500
30.00 20.00 25.00
18Ander(765-811).qxd 2/29/08 11:46 AM Page 765
CAPÍTULO
18
Pronóstico CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: OCCUPATIONAL HEALTH CLINIC DE NEVADA 18.1 COMPONENTES DE UNA SERIE DE TIEMPO Componente de tendencia Componente cíclico Componente estacional Componente irregular 18.2 MÉTODOS DE SUAVIZAMIENTO Promedios móviles Promedios móviles ponderados Suavizamiento exponencial 18.3 PROYECCIÓN DE TENDENCIA 18.4 COMPONENTES DE TENDENCIA Y ESTACIONALES Modelo multiplicativo
Cálculo de los índices estacionales Desestacionalización de una serie de tiempo Uso de una serie de tiempo desestacionalizada para la identificación de tendencias Ajustes estacionales Modelos basados en datos mensuales Componente cíclico 18.5 ANÁLISIS DE REGRESIÓN 18.6 MÉTODOS CUALITATIVOS Método de Delphi Opinión de un experto Escenarios futuros Métodos intuitivos
18Ander(765-811).qxd 2/29/08 11:46 AM Page 766
766
LA ESTADÍSTICA
Capítulo 18
Pronóstico
en LA PRÁCTICA
OCCUPATIONAL HEALTH CLINIC DE NEVADA* SPARKS, NEVADA
La Occupational Health Clinic de Nevada es una clínica privada que se encuentra en Sparks, Nevada. La clínica se ha especializado en medicina industrial y opera en el mismo sitio desde hace más de 20 años. La clínica había tenido una etapa de crecimiento rápido en la que su facturación mensual creció de $57 000 a más de $300 000, durante 26 meses, cuando un incendio consumió el edificio principal de la clínica. La póliza de seguro de la clínica cubría los daños materiales y al equipo, así como los ingresos durante la interrupción de su funcionamiento normal. Establecer la declaración de daños materiales fue relativamente sencillo, ya que consistió en determinar el valor de los mismos y de la pérdida de equipo a causa del fuego. Sin embargo, determinar el valor del ingreso durante los siete meses que se necesitaron para reconstruir la clínica fue un asunto complicado que requirió de negociaciones entre los dueños de la clínica y la empresa aseguradora. No había reglas preestablecidas para calcular “qué hubiera pasado” con la facturación de la clínica de no haber ocurrido el incendio. Para estimar los ingresos perdidos, la clínica empleó un método de pronóstico para proyectar el crecimiento que *Los autores agradecen a Bard Betz, director de operaciones y a Curtis Brauer, asistente ejecutivo de la Occupational Health Clinic de Nevada por proporcionar este artículo para La estadística en la práctica.
La mayor parte de las empresas pueden pronosticar la demanda total de sus productos con un error menor a 5%. Sin embargo, al pronosticar la demanda de uno solo de los productos es posible tener errores significativamente mayores. Un pronóstico es simplemente un pronóstico de lo que ocurrirá en el futuro. Los administradores deben aceptar que, sea cual sea la técnica que usen, no podrán obtener pronósticos perfectos.
Un incendio hizo que la Occupational Health Clinic de Nevada se cerrara durante siete meses. © PhotoDisc/Getty Images. hubieran tenido los ingresos durante los siete meses que la clínica permaneció cerrada. La historia de la facturación antes del incendio suministró la base para obtener un modelo de pronóstico de tendencia lineal y componentes estacionales como los que se discuten en este capítulo. El modelo de pronóstico permitió a la clínica establecer una estimación exacta de la pérdida, la cual fue finalmente aceptada por la empresa de seguros.
Un aspecto esencial en la administración de cualquier organización es la planeación para el futuro. En efecto, el éxito a largo plazo de una organización está estrechamente relacionado con la capacidad que tenga la administración de anticipar el futuro y elaborar estrategias adecuadas. Criterio, intuición y atención al entorno económico permiten que un administrador tenga una idea aproximada de lo que puede ocurrir en el futuro. Sin embargo, no resulta fácil convertir una idea aproximada en un número que pueda representar el volumen de ventas del trimestre próximo o el costo de la materia prima en el año siguiente. El objetivo de este capítulo es presentar varios métodos para obtener pronósticos. Suponga que se le pide dar un pronóstico trimestral del volumen de ventas durante el año próximo de un determinado producto. El pronóstico trimestral que dé afectará el programa de producción, la compra de materias primas, las políticas de inventario y el monto de las ventas. En consecuencia, un mal pronóstico puede llevar a una mala planeación, lo cual incrementará los costos de la empresa. ¿Cómo proceder para dar un pronóstico trimestral del volumen de ventas? Seguramente habrá que revisar los datos de las ventas del producto en los periodos pasados. Utilizar estos datos históricos permite identificar el volumen general de ventas y si, con el tiempo, existe alguna tendencia de aumento o disminución en el volumen de ventas. Mediante una revisión más cuidadosa de los datos podría determinarse, por ejemplo, si las ventas siguen un patrón estacional que se manifieste en un aumento de las ventas en el tercer trimestre de cada año y volúmenes de ventas que tocan fondo en el primer trimestre. Revisar los datos históricos facilita entender mejor el patrón de las ventas en el pasado, lo que lleva a mejores pronósticos de las ventas futuras del producto.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 767
18.1
Componentes de una serie de tiempo
767
Los datos históricos forman una serie de tiempo. Una serie de tiempo es un conjunto de observaciones de una variable medida en puntos sucesivos en el tiempo o en periodos de tiempo sucesivos. En este capítulo se presentan varios métodos para el análisis de series de tiempo. El objetivo de tal análisis es obtener un buen pronóstico o predicción de los valores futuros de una serie de tiempo. Los métodos de pronóstico se clasifican como cualitativos y cuantitativos. Los métodos cuantitativos de pronóstico se suelen usar cuando 1) se cuenta con información del pasado acerca de la variable que se desea pronosticar, 2) esa información se puede cuantificar y 3) es razonable pensar que el patrón seguido en el pasado continuará en el futuro. En tales casos es posible obtener un buen pronóstico mediante un método de series de tiempo o un método causal. Si los datos históricos están restringidos a valores pasados de la variable, al método de pronóstico se le conoce como un método de series de tiempo. El objetivo de un método de series de tiempo es descubrir en los datos históricos un patrón para después extrapolar ese patrón al futuro; el pronóstico se basa únicamente en los valores de la variable en el pasado o en errores de pronóstico en el pasado. En este capítulo se estudian tres métodos de series de tiempo: suavizamiento (promedios móviles, promedios movibles ponderados y suavizamiento exponencial), proyección de tendencia y proyección de tendencia ajustada a la influencia estacional. Los métodos de pronóstico causal están sustentados en la suposición de que la variable a pronosticar tiene una relación de causa y efecto con otra u otras variables. En este capítulo se verá el uso del análisis de regresión como método de pronóstico causal. Por ejemplo, los gastos en publicidad suelen influir en los volúmenes de ventas de muchos artículos, de manera que se puede emplear el análisis de regresión para obtener una ecuación que muestre cómo es la relación entre estas dos variables. Así, una vez que se establezca la cantidad presupuestada para la publicidad del periodo siguiente, se podrá sustituir este valor en la ecuación y obtener una predicción o pronóstico para el volumen de ventas de ese periodo. Observe que si se utiliza un método de series de tiempo para obtener un pronóstico, los gastos en publicidad no son tomados en consideración; es decir, cuando se emplea un método de series de tiempo el pronóstico se sustenta únicamente en las ventas del pasado. En los métodos cualitativos, para obtener un pronóstico, suele necesitarse el criterio de un experto. Por ejemplo, un panel de expertos puede elaborar un pronóstico consensual para el tipo de interés preferencial que estará vigente durante un año a partir de ahora. Los métodos cualitativos presentan ventajas cuando la información acerca de la variable que se pronostica no puede cuantificarse y cuando no se cuenta con datos históricos o cuando los datos históricos con los que se cuenta no son aplicables. En la figura 18.1 se presenta una visión general de los métodos de pronóstico.
18.1
Componentes de una serie de tiempo El patrón o el comportamiento que siguen los datos de una serie de tiempo se debe a diversos componentes. Por lo general se supone que son cuatro los componentes que se combinan para dar los valores de una serie de tiempo: de tendencia, cíclico, estacional e irregular. A continuación se verá cada uno de estos cuatro componentes.
Componente de tendencia En el análisis de las series de tiempo, las mediciones pueden hacerse cada hora, diario, a la semana, cada mes, anualmente o en cualquier otro intervalo regular de tiempo.* Aunque los datos de las series de tiempo suelen mostrar fluctuaciones aleatorias, las series de tiempo también muestran un desplazamiento o movimiento gradual hacia valores relativamente altos o bajos a través de un lapso largo. A este desplazamiento gradual de la serie de tiempo se le conoce como la tendencia de la serie de tiempo; este desplazamiento o tendencia suele deberse a factores de largo plazo como variaciones en las características demográficas de la población, en la tecnología o en las preferencias del público. Por ejemplo, un fabricante de cámaras fotográficas encuentra que cada mes existe una variación sustancial en la cantidad de cámaras que vende. Sin embargo, al observar las ventas de los *Aquí el estudio se limitará a las series de tiempo con valores tomados a intervalos regulares. Los casos en que las observaciones no se hacen a intervalos regulares quedan fuera del alcance de este libro.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 768
Capítulo 18
FIGURA 18.1
Pronóstico
VISIÓN GENERAL DE LOS MÉTODOS DE PRONÓSTICO
Métodos de pronóstico
Cualitativos (sección 18.6)
Cuantitativos
Causal (sección 18.5)
Series de tiempo
Suavizamiento (sección 18.2)
Proyección de tendencia (sección 18.3)
Proyección de tendencia ajustada a la influencia estacional (sección 18.4)
últimos 10 a 15 años, este fabricante se percata de que ha habido un aumento gradual del volumen de ventas. Suponga que en 1996 el volumen de ventas fue aproximadamente de 17 000 cámaras; en 2001, 23 000 cámaras y en el 2006, 25 000 cámaras. Este crecimiento gradual de las ventas a lo largo del tiempo representa una tendencia ascendente de esta serie de tiempo. En la figura 18.2 se muestra una línea recta que puede ser una buena aproximación a la tendencia observada en las ventas de las cámaras fotográficas. Aunque la tendencia en las ventas de las cámaras parece ser lineal y creciente, en una serie de tiempo pueden presentarse tendencias que se describen mejor mediante algún otro patrón. FIGURA 18.2
Ventas anuales (unidades)
768
TENDENCIA LINEAL EN LAS VENTAS DE CÁMARAS FOTOGRÁFICAS
26 000
22 000
18 000
1996
2001 Año
2006
18Ander(765-811).qxd 2/29/08 11:46 AM Page 769
769
Componentes de una serie de tiempo
Volumen
EJEMPLOS DE ALGUNOS PATRONES POSIBLES EN UNA SERIE DE TIEMPO
Volumen
FIGURA 18.3
Tiempo A. No lineal
Volumen
18.1
Tiempo B. Tendencia lineal decreciente
Tiempo C. Sin tendencia
En la figura 18.3 se muestran otros patrones que puede seguir la tendencia de una serie de tiempo. En la gráfica A se muestra una tendencia no lineal; en este caso, al inicio se observa poco crecimiento en la serie de tiempo y al final una estabilización. Esta tendencia puede ser una buena aproximación a las ventas de un producto desde su introducción, seguida por una etapa de crecimiento y llegando al final a un periodo de saturación del mercado. La tendencia de disminución lineal que se observa en la gráfica B se encuentra en series de tiempo que observan una disminución creciente a lo largo del tiempo. La línea horizontal que se observa en la gráfica C representa una serie de tiempo en la que no hay un aumento ni una disminución consistentes a lo largo del tiempo y, por tanto, en la que no hay tendencia alguna.
Componente cíclico Aunque una serie de tiempo puede tener una tendencia a través de lapsos largos, no todos los valores futuros de la serie de tiempo caerán exactamente sobre la línea de tendencia. Las series de tiempo suelen mostrar secuencias de puntos que caen de manera alternante arriba y abajo de la línea de tendencia. Toda sucesión recurrente de puntos que caiga abajo y arriba de la línea de tendencia y que dure más de un año puede atribuirse al componente cíclico de la serie de tiempo. En la figura 18.4 se muestra la gráfica de una serie de tiempo con un componente cíclico obvio. Estas observaciones fueron tomadas en intervalos de un año. Muchas series de tiempo muestran un comportamiento cíclico, con observaciones que caen de manera regular abajo y arriba de la línea de tendencia. Por lo general, este componente de las series de tiempo es debido a movimientos cíclicos multianuales de la economía. Por ejemplo, periodos de inflación moderada seguidos de periodos de inflación rápida pueden hacer que la serie FIGURA 18.4
COMPONENTES DE TENDENCIA Y CÍCLICOS DE UNA SERIE DE TIEMPO. LOS PUNTOS CORRESPONDEN A DATOS TOMADOS A INTERVALOS DE UN AÑO
Volumen
Los ciclos se manifiestan por las corridas de observaciones sobre y debajo de la línea de tendencia.
Línea de tendencia Tiempo
18Ander(765-811).qxd 2/29/08 11:46 AM Page 770
770
Capítulo 18
Pronóstico
de tiempo alterne hacia arriba y hacia abajo de la línea general de tendencia creciente (por ejemplo, una serie de tiempo sobre el costo de la vivienda).
Componente estacional Mientras los componentes cíclico y de tendencia de las series de tiempo se identifican tras el análisis de las variaciones multianuales en los datos históricos, en muchas series de tiempo se observa un patrón permanente en lapsos de un año. Por ejemplo, un fabricante de albercas espera tener pocas ventas durante los meses de otoño e invierno y sus mayores ventas en los meses de primavera y verano. Los fabricantes de equipo para remover la nieve y los fabricantes de ropa de invierno esperan exactamente lo contrario. Por tanto, es natural que al componente de las series de tiempo que representan la variabilidad en los datos debida a la influencia estacional se le conozca como componente estacional. Aunque por lo general se considera que las variaciones estacionales son variaciones que se presentan durante el lapso de un año, el componente estacional también se usa para representar cualquier variación que se presente con regularidad en un lapso menor que un año. Por ejemplo, en el volumen de tráfico diario, en el lapso de un día, se observa una conducta “estacional”, en donde los valores máximos se presentan en las horas pico, y durante el resto del día y al comienzo de la noche un flujo moderado, y un flujo ligero desde la media noche hasta las primeras horas de la mañana.
Componente irregular El componente irregular de una serie de tiempo es el factor residual o el factor que da cuenta de las desviaciones de los valores reales de la serie de tiempo de los valores que se esperan al considerar los efectos de los componentes de tendencia, cíclicos y estacionales. Este componente irregular es ocasionado por factores a corto plazo, imprevistos y no recurrentes que afectan a la serie de tiempo. Dado que este componente da cuenta de la variabilidad aleatoria en una serie de tiempo, es un componente impredecible. No es posible predecir su efecto sobre la serie de tiempo.
18.2 En el ambiente de la manufactura suelen requerirse pronósticos mensuales o semanales para miles de artículos. Por tanto, al elegir una técnica de suavizamiento se requiere sencillez y facilidad de uso. Para las técnicas que se presentan en esta sección los requerimientos de datos son mínimos y las técnicas son fáciles de usar y de entender.
Métodos de suavizamiento En esta sección se estudian tres métodos de pronóstico: promedios móviles, promedios móviles ponderados y suavizamiento exponencial. Estos métodos tienen por objeto suavizar las fluctuaciones aleatorias ocasionadas por el componente irregular de la serie de tiempo, razón por la que se les conoce como métodos de suavizamiento. Los métodos de suavizamiento son adecuados para series de tiempo estables; es decir, para aquellas series que no muestran efectos importantes de tendencia, cíclicos o estacionales porque se adaptan muy bien a los cambios en el nivel de la serie de tiempo. Sin embargo, sin alguna modificación, no funcionan muy bien cuando hay variaciones importantes de tendencia, cíclicas o estacionales. Los métodos de suavizamiento son fáciles de utilizar y, por lo general, se obtiene una buena exactitud en pronósticos a corto plazo, como, por ejemplo, pronósticos para el periodo siguiente. Uno de estos métodos, el suavizamiento exponencial, tiene requerimientos mínimos de datos por lo que es un método adecuado cuando se requiere de pronósticos para una gran número de artículos.
Promedios móviles En el método de los promedios móviles, para pronosticar el periodo siguiente, se emplea el promedio de los valores de los n datos más recientes de la serie de tiempo. El cálculo de un promedio móvil se hace como sigue.
PROMEDIO MÓVIL
Promedio móvil
兺(de los n datos más recientes) n
(18.1)
18Ander(765-811).qxd 2/29/08 11:46 AM Page 771
18.2
771
Métodos de suavizamiento
El término móvil se usa porque cada vez que en la serie de tiempo hay una nueva observación, ésta sustituye a la observación más antigua que se emplee en la ecuación (18.1) y se calcula un SERIE DE TIEMPO nuevo promedio. De esta manera, el promedio se modifica, o se mueve, cada vez que se tiene una DE LAS VENTAS nueva observación. DE GASOLINA Para ilustrar el método de los promedios móviles, considere los datos de 12 semanas que se preVentas (miles sentan en la tabla 18.1 y en la figura 18.5. En esa tabla se presenta el número de galones de gasoSemana de galones) lina vendidos en las últimas 12 semanas en una gasolinera de Bennington, Vermont. En la figura 1 17 2 21 18.5 se observa que aunque existe una variabilidad aleatoria, la serie de tiempo parece ser estable 3 19 a lo largo del tiempo; por lo que se pueden emplear los métodos de suavizamiento de esta sección. 4 23 Para emplear este método en el pronóstico de las ventas de gasolina, primero hay que decidir 5 18 6 16 cuántos valores se usarán para calcular los promedios móviles. Aquí, por ejemplo, se calcularán 7 20 promedios móviles de tres semanas. El promedio móvil de las ventas de gasolina correspondien8 18 te a las tres primeras semanas es 9 22 TABLA 18.1
20 15 22
archivo CD en Gasoline
Promedio móvil (semanas 1-3)
17 21 19 19 3
Este promedio móvil se usa como pronóstico para la semana 4. Como el verdadero valor observado en la semana 4 es 23, el error de pronostico es 23 19 4. En un pronóstico el error es la diferencia entre el valor observado en la serie de tiempo y el valor obtenido como pronóstico. El siguiente promedio móvil de tres semanas es Promedio móvil (semanas 2-4)
FIGURA 18.5
21 19 23 21 3
SERIE DE TIEMPO DE LAS VENTAS DE GASOLINA
25
20 Ventas (miles de galones)
10 11 12
15
10
5
0
1
2
3
4
5
6
7
Semana
8
9
10
11
12
18Ander(765-811).qxd 2/29/08 11:46 AM Page 772
772
Capítulo 18
TABLA 18.2
Semana 1 2 3 4 5 6 7 8 9 10 11 12
Pronóstico
RESUMEN DE LOS CÁLCULOS DE LOS PROMEDIOS MÓVILES DE TRES SEMANAS Valores de la serie de tiempo
Pronóstico con el promedio móvil
Error de pronóstico
Error de pronóstico al cuadrado
17 21 19 23 18 16 20 18 22 20 15 22
19 21 20 19 18 18 20 20 19
4 3 4 1 0 4 0 5 3
16 9 16 1 0 16 0 25 9
0
92
Totales
Por tanto, el pronóstico para la semana 5 es 21. El error correspondiente a este pronóstico es 18 21 3. El error de pronóstico puede ser positivo o negativo según si el pronóstico es muy bajo o muy alto. En la tabla 18.2 y en la figura 18.6 se presenta un resumen de los promedios móviles con tres semanas para la serie de tiempo de las ventas de gasolina. La exactitud del pronóstico no es la única consideración importante. Algunas veces, en métodos más exactos, se requieren datos sobre series de tiempo relacionadas, datos que son costosos o difíciles de obtener. Por lo general, en un pronóstico se tiene que sacrificar costo o exactitud.
Al final de esta sección, en el ejercicio 2, se pide calcular promedios móviles de cuatro y cinco semanas para las ventas de gasolina.
Exactitud del pronóstico Al elegir el método de pronóstico es importante considerar la exactitud del método. Es claro que se desea que el error de pronóstico sea pequeño. En las dos últimas columnas de la tabla 18.2 se encuentran los errores de pronóstico y los cuadrados de los errores de pronóstico, los cuales sirven para obtener una medida de la exactitud del pronóstico. Respecto de la serie de tiempo de las ventas de gasolina, se usa la última columna de la tabla 18.2 para calcular el promedio de la suma de los cuadrados de los errores. Así se obtiene
Promedio de la suma de los errores al cuadrado
92 10.22 9
Al promedio de la suma de los errores al cuadrado se le conoce como cuadrado medio debido al error (CME). Este CME suele usarse como medida de la exactitud del método de pronóstico y es la medida que se usará en este capítulo. Como ya se dijo, para usar el método de los promedios móviles, hay que decidir, primero, cuántos datos se emplearán para calcular los promedios móviles. Es claro que para una determinada serie de tiempo, con promedios móviles de longitudes diferentes se obtendrán diferentes exactitudes en el pronóstico de la serie de tiempo. Una manera de decidir cuántos datos emplear en el cálculo de los promedios móviles es determinar, mediante el método de prueba y error, la longitud con la que se minimiza el CME. Si se está dispuesto a asumir que la longitud que es la mejor para el pasado será también la mejor para el futuro, el siguiente valor de la serie de tiempo se pronosticará mediante la cantidad de datos que minimicen el CME en los datos históricos.
Promedios móviles ponderados En el método de los promedios móviles, a todos los datos que se emplean en el cálculo se les da el mismo peso. En una variación conocida como promedios móviles ponderados, a cada uno de los valores de los datos se le da un peso diferente y, después, se calcula el promedio ponderado
18Ander(765-811).qxd 2/29/08 11:46 AM Page 773
18.2
773
Métodos de suavizamiento
FIGURA 18.6
SERIE DE TIEMPO DE LAS VENTAS DE GASOLINA Y PRONÓSTICOS CON PROMEDIOS MÓVILES DE TRES SEMANAS
Pronósticos con promedios móviles de tres semanas
25
Ventas (miles de galones)
20
15
10
5
0
1
2
3
4
5
6
7
8
9
10
11
12
Semana
de los valores de los n datos más recientes para obtener el pronóstico. En la mayoría de las veces, a la observación más reciente se le da el mayor peso y los pesos disminuyen conforme los datos son más antiguos. Por ejemplo, con los datos de las ventas de gasolina se calcula un promedio móvil ponderado de tres semanas: a la observación más reciente se le da un peso que sea el triple del que se le dé a la observación más antigua y a la observación intermedia un peso que sea el doble del de la observación más antigua. Como promedio de la semana 4 se tiene: Pronóstico para la semana 4 ¹ ₆ (17) ² ₆ (21) ³ ₆ (19) 19.33 Observe que en un promedio móvil ponderado, la suma de los pesos es igual a 1. En realidad, la suma de los pesos en el promedio móvil simple también fue igual a 1: cada peso fue de 1/3. Sin embargo, recuerde que con el promedio móvil simple o no ponderado el pronóstico fue 19. Exactitud del pronóstico Para usar el método de promedios móviles ponderados primero se debe establecer el número de datos a usar para calcular los promedios móviles ponderados y después elegir los pesos para cada uno de los datos. En general, si se cree que el pasado reciente sea un mejor predictor del futuro que el pasado distante, habrá que dar pesos mayores a las observaciones más recientes. Sin embargo, si la serie de tiempo es muy variable, puede ser mejor elegir pesos aproximadamente iguales para todos los datos. Note que el único requerimiento es que la suma de los pesos sea igual a 1. Para estimar si con una determinada combinación de número de datos y pesos, se obtiene un pronóstico más exacto que con otra combinación, se seguirá usando el criterio de CME como medida de la exactitud del pronóstico. Es decir, si se supone que la combinación que es mejor para el pasado también será la mejor para el futuro, para pronosticar el valor siguiente de la serie de tiempo se empleará la combinación de número de datos y pesos, que minimice el CME de la serie de tiempo histórica.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 774
774
Capítulo 18
Pronóstico
Suavizamiento exponencial El suavizamiento exponencial es sencillo y tiene pocos requerimientos de datos, por lo que es un método no costoso para las empresas que, en cada periodo, tienen que hacer una gran cantidad de predicciones.
En el suavizamiento exponencial se usa un promedio ponderado de los valores pasados de la serie de tiempo; es un caso especial del método de promedios ponderados móviles; en este caso sólo hay que elegir un peso, el peso para la observación más reciente. Los pesos para los demás datos se calculan automáticamente y son más pequeños a medida que los datos son más antiguos. A continuación se presenta el modelo de suavizamiento exponencial básico. MODELO DE SUAVIZAMIENTO EXPONENCIAL
Ft 1 αYt (1 α)Ft
(18.2)
donde Ft 1 Yt Ft α
pronóstico para el periodo t 1 de la serie de tiempo valor real en el periodo t de la serie de tiempo pronóstico para el periodo t de la serie de tiempo constante de suavizamiento (0 α 1)
La ecuación (18.2) muestra que el pronóstico para el periodo t 1 es un promedio ponderado del valor real en el periodo t y del valor pronosticado para el periodo t; observe, en particular, que el peso dado al valor real del periodo t es α y el peso dado al valor pronosticado para el periodo t es 1 α. En una serie de tiempo, como ejemplo, de tres datos: Y1, Y2 y Y3 se demostrará que el pronóstico obtenido mediante suavizamiento exponencial para cualquier periodo es un promedio ponderado de todos los valores reales anteriores de la serie de tiempo. Para empezar, sea F1 igual al valor real de la serie de tiempo en el periodo 1; es decir F1 = Y1. Por tanto, el pronóstico para el periodo 2 es F2 αY1 (1 α)F1 αY1 (1 α)Y1 Y1 De tal manera que el pronóstico obtenido mediante suavizamiento exponencial para el periodo 2 es igual al valor real de la serie de tiempo para el periodo 1. El pronóstico para el periodo 3 es F3 αY2 (1 α)F2 αY2 (1 α)Y1 En último lugar, al sustituir la expresión para F3 en la expresión para F4 se obtiene F4 αY3 (1 α)F3 αY3 (1 α)[αY2 (1 α)Y1] αY3 α(1 α)Y2 (1 α)2Y1 El término suavizamiento exponencial se debe al carácter exponencial de los pesos que se emplean para los datos históricos.
Por tanto, F4 es un promedio ponderado de los tres primeros valores de la serie de tiempo. La suma de los coeficientes o pesos de Y1, Y2 y Y3 es igual a uno. Mediante un argumento similar se puede demostrar que, en general, cualquier pronóstico Ft 1 es un promedio ponderado de los valores previos de la serie de tiempo. A pesar de que con el suavizamiento exponencial se obtiene un pronóstico que es el promedio ponderado de todas las observaciones pasadas, no es necesario conservar todos los datos pasados para calcular el pronóstico para el periodo siguiente. En efecto, una vez elegida la constante de suavizamiento α, sólo se necesitan dos informaciones para calcular el pronóstico. En la ecuación (18.2) se observa que dada una α, para calcular el pronóstico en el periodo t 1 sólo se necesita conocer el valor real y el valor pronosticado de la serie de tiempo para el periodo t, es decir, Yt y Ft.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 775
18.2
775
Métodos de suavizamiento
Para ilustrar el uso del método de suavizamiento exponencial para obtener pronósticos, considere la serie de tiempo de los precios de la gasolina presentada en la tabla 18.1 y en la figura 18.5. Como ya se mostró, el pronóstico obtenido mediante suavizamiento exponencial para el periodo 2 es igual al valor real en la serie de tiempo para el periodo 1. Por tanto, como Y1 17, para empezar con los cálculos del suavizamiento exponencial se hace F2 17. De regreso con los datos de la serie de tiempo, presentados en la tabla 18.1, se encuentra que el valor real para el periodo 2 es Y2 21. El error de pronóstico del periodo 2 es 21 17 4. Al continuar con los cálculos del suavizamiento exponencial, con α 0.2 como constante de suavizamiento, se obtiene el pronóstico siguiente para el periodo 3. F3 0.2Y2 0.8F2 0.2(21) + 0.8(17) 17.8 Una vez conocido el valor real para el periodo 3 de la serie de tiempo, Y3 19, se puede generar el pronóstico para el periodo 4 F4 0.2Y3 0.8F3 0.2(19) + 0.8(17.8) 18.04 Si continúa de esta manera con los cálculos para el suavizamiento exponencial se determinan los pronósticos semanales y los errores semanales de pronóstico como se muestra en la tabla 18.3. Observe que para el periodo 1 no se da ningún pronóstico obtenido mediante suavizamiento exponencial ni tampoco ningún error de pronóstico, ya que no se obtuvo ningún pronóstico. Para la semana 12 se tiene Y12 22 y F12 18.48. ¿Se puede emplear esta información para generar un pronóstico para la semana 13 antes de que se conozca el valor real de la semana 13? Con el modelo de suavizamiento exponencial, se tiene F13 0.2Y12 0.8F12 0.2(22) + 0.8(18.48) 19.18 Por tanto, el pronóstico obtenido mediante suavizamiento exponencial para la semana 13 es 19.18 o 19,180 galones de gasolina. Este pronóstico le será útil a la empresa para la planeación y para la toma de decisiones. La exactitud de este pronóstico no se conocerá sino hasta el final de la semana 13. En la figura 18.7 se muestra una gráfica con los valores reales y pronosticados de la serie de tiempo. Observe, en especial, cómo los pronósticos suavizan la irregularidad de las fluctuaciones de la serie de tiempos. Exactitud del pronóstico En los cálculos anteriores para el suavizamiento exponencial, se empleó como constante de suavizamiento α 0.2. Aunque para α se puede usar cualquier valor enTABLA 18.3
Semana (t) 1 2 3 4 5 6 7 8 9 10 11 12
RESUMEN DE LOS PRONÓSTICOS OBTENIDOS POR SUAVIZAMIENTO EXPONENCIAL Y DE LOS ERRORES DE PRONÓSTICO PARA LAS VENTAS DE GASOLINA, CON α 0.2 COMO CONSTANTE DE SUAVIZAMIENTO Valores en la serie de tiempo (Yt )
Pronóstico con suavizamiento exponencial (Ft )
Error de pronóstico (Yt ⴚ Ft )
17 21 19 23 18 16 20 18 22 20 15 22
17.00 17.80 18.04 19.03 18.83 18.26 18.61 18.49 19.19 19.35 18.48
4.00 1.20 4.96 1.03 2.83 1.74 0.61 3.51 0.81 4.35 3.52
18Ander(765-811).qxd 2/29/08 11:46 AM Page 776
Capítulo 18
FIGURA 18.7
Pronóstico
SERIES DE TIEMPO, REAL Y PRONOSTICADA, DE LAS VENTAS DE GASOLINA, CON α 0.2 COMO CONSTANTE DE SUAVIZAMIENTO
25
Serie de tiempo real
20 Ventas (miles de galones)
776
15 Serie de tiempo pronosticada con α = 0.2 10
5
0
1
2
3
4
5
6
7
8
9
10
11
12
Semana
tre 0 y 1, con algunos valores se obtendrá un mejor pronóstico que otros. Una idea de cómo elegir el mejor valor para α se obtiene al revisar el modelo básico de suavizamiento exponencial. Ft 1 αYt (1 α)Ft Ft 1 αYt Ft αFt Ft 1 Ft α(Yt Ft)
Pronóstico para el periodo t
(18.3)
Error de pronóstico en el periodo t
De manera que el nuevo pronóstico Ft 1 es igual al pronóstico anterior Ft más un ajuste, el cual es igual a α multiplicado por el error de pronóstico más reciente, Yt Ft. Es decir, el pronóstico para el periodo t 1 se obtiene al ajustar el pronóstico para el periodo t mediante una fracción del error de pronóstico. Si en la serie de tiempo existe una gran variabilidad aleatoria, se prefiere un valor pequeño para la constante de suavizamiento. La razón es que como gran parte del error de pronóstico se debe a la variabilidad aleatoria, no se quiere reaccionar de manera exagerada y ajustar el pronóstico muy rápidamente. En una serie de tiempo con variabilidad aleatoria relativamente pequeña, valores mayores para la constante de suavizamiento permiten ajustar rápidamente los pronósticos cuando ocurren errores de pronóstico, esto permite adaptar los pronósticos, en forma rápida, a las condiciones cambiantes. El criterio que se usará para determinar el valor adecuado para la constante de suavizamiento α es el mismo que el propuesto para determinar el número de periodos a incluir en el cálculo de los promedios móviles. Es decir, se elige el valor α que minimice el cuadrado medio debido al error (CME). En la tabla 18.4 se presenta, para las ventas de gasolina, un resumen de los cálcu-
18Ander(765-811).qxd 2/29/08 11:46 AM Page 777
18.2
777
Métodos de suavizamiento
TABLA 18.4
CÁLCULO DEL CME DE LOS PRONÓSTICOS PARA LAS VENTAS DE GASOLINA CON α 0.2
Semana Valores de la serie (t) de tiempos (Yt ) 1 2 3 4 5 6 7 8 9 10 11 12
17 21 19 23 18 16 20 18 22 20 15 22
Pronóstico Error de (Ft ) pronóstico (Yt ⴚ Ft ) 17.00 17.80 18.04 19.03 18.83 18.26 18.61 18.49 19.19 19.35 18.48
4.00 1.20 4.96 1.03 2.83 1.74 0.61 3.51 0.81 4.35 3.52
Cuadrado del error de pronóstico (Yt ⴚ Ft )2 16.00 1.44 24.60 1.06 8.01 3.03 0.37 12.32 0.66 18.92 12.39 Total 98.80
CME
98.80 8.98 11
los del CME en los pronósticos obtenidos mediante suavizamiento exponencial con α = 0.2. Observe que hay un cuadrado del error menos que el número de periodos de tiempo, esto se debe a que no se cuenta con un valor anterior para obtener un pronóstico para el periodo 1. ¿Habrá un valor de α que dé mejores resultados en términos de un valor menor para CME? La manera más sencilla de responder esta pregunta es probar otros valores para α, y después comparar los cuadrados medios de los errores con el valor 8.98 obtenido para el CME con α 0.2. En la tabla 18.5 se muestran los resultados del suavizamiento exponencial con α 0.3. Como el CME = 9.35, en este conjunto de datos, al emplear como constante de suavizamiento α 0.3 se TABLA 18.5
Semana (t) 1 2 3 4 5 6 7 8 9 10 11 12
CÁLCULO DEL CME PARA LOS PRONÓSTICOS DE LAS VENTAS DE GASOLINA CON α 0.3 Valores de la serie de tiempo (Yt ) 17 21 19 23 18 16 20 18 22 20 15 22
Pronóstico Error de (Ft ) pronóstico (Yt ⴚ Ft ) 17.00 18.20 18.44 19.81 19.27 18.29 18.80 18.56 19.59 19.71 18.30
4.00 0.80 4.56 1.81 3.27 1.71 0.80 3.44 0.41 4.71 3.70
Cuadrado del error de pronóstico (Yt ⴚ Ft )2 16.00 0.64 20.79 3.28 10.69 2.92 0.64 11.83 0.17 22.18 13.69 Total 102.83
CME
102.83 9.35 11
18Ander(765-811).qxd 2/29/08 11:46 AM Page 778
778
Capítulo 18
Pronóstico
obtiene menos exactitud en los pronósticos que si se empleara la constante de suavizamiento α 0.2. Por tanto, se preferirá la constante de suavizamiento original, α 0.2. Al probar con otros valores de α se puede hallar un “buen” valor para la constante de suavizamiento. Este valor puede emplearse en el modelo de suavizamiento exponencial para obtener pronósticos para el futuro. En un momento posterior, después de haber obtenido nuevas observaciones para la serie de tiempo, se vuelven a analizar los datos recolectados de la serie de tiempo y se determina si es necesario modificar la constante de suavizamiento para obtener mejores pronósticos. NOTAS Y COMENTARIOS 1. Otra medida de la exactitud de los pronósticos es la desviación absoluta de la media (DAM). Esta medida es simplemente el promedio de los valores absolutos de todos los errores de pronóstico. Con los errores que se presentan en la tabla 18.2 se obtiene DAM
del pronóstico no es un asunto sencillo. Hasta los expertos en la materia suelen no ponerse de acuerdo respecto a qué medida deba usarse. En este capítulo se usará el CME. 2. Los paquetes de hojas de cálculo son una
buena ayuda en la elección de un valor adecuado para α en el suavizamiento exponencial así como en la elección de los pesos en el método de los pesos móviles ponderados. Al tener en la hoja de cálculo los datos de la serie de tiempo y las fórmulas de pronóstico, se pueden probar distintos valores de α (o pesos para el promedio móvil) y elegir el valor o los valores con que se obtenga el menor CME o DAM.
4 3 4 1 0 4 0 5 3 2.67 9
Una de las principales diferencias entre CME y DAM es que al CME lo influyen mucho más los errores de pronóstico grandes que los errores de pronóstico pequeños (debido a que para el CME los errores se elevan al cuadrado). La elección de la mejor medida para la precisión
Ejercicios
Métodos 1. Considere la serie de tiempo siguiente.
Auto examen a. b. c. d.
e.
archivo CD en Gasoline
archivo CD en Gasoline
Semana
1
2
3
4
5
6
Valor
8
13
15
17
16
9
Obtenga un promedio móvil de tres semanas para esta serie de tiempo. ¿Cuál es el pronóstico para la semana 7? Calcule el CME de este promedio móvil de tres semanas. Use α 0.2 para calcular los valores de suavizamiento exponencial de esta serie de tiempo. ¿Cuál es el pronóstico para la semana 7? Compare el pronóstico obtenido con el promedio móvil de tres semanas, con el pronóstico obtenido con el suavizamiento exponencial usando α 0.2. ¿Con cuál se obtiene un mejor pronóstico? Use 0.4 como constante de suavizamiento, calcule los valores que se obtienen mediante suavizamiento exponencial.
2. Vaya a la serie de tiempo de las ventas de gasolina, presentada en la tabla 18.1. a. Para esa serie de tiempo calcule los promedios móviles de cuatro y de cinco semanas. b. Calcule el CME de los pronósticos obtenidos con los promedios móviles de cuatro semanas y con los promedios móviles de cinco semanas. c. ¿Cuántas semanas es mejor usar para calcular el promedio móvil? Recuerde que el CME del promedio móvil de tres semanas es 10.22. 3. Vaya a la serie de tiempo de las ventas de gasolina, presentada en la tabla 18.1. a. Para esa serie de tiempo calcule un promedio móvil ponderado de tres semanas, emplee 1/2 como peso para la observación más reciente, 1/3 para la siguiente observación y 1/6 para la observación más antigua.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 779
18.2
b.
c.
archivo CD en Gasoline
779
Métodos de suavizamiento
Para el promedio móvil ponderado del ejercicio a calcule el CME. ¿Prefiere este promedio móvil ponderado, o el promedio móvil no ponderado? Recuerde que el CME del promedio móvil no ponderado es 10.22. Suponga que se permite elegir los pesos, con la única condición de que su suma sea uno. ¿Siempre será posible elegir un conjunto de pesos que hagan que el CME sea menor para un promedio móvil ponderado que para el promedio móvil no ponderado?
4. Para la serie de tiempo de las ventas de gasolina, presentada en la tabla 18.1, dé los pronósticos, emplee α 0.1. Si aplica el criterio del CME, ¿qué constante de suavizamiento será preferible emplear, 0.1 o 0.2? 5. Emplee como constante de suavizamiento α 0.2, la ecuación (18.2) indica que el pronóstico para la semana 13 de las ventas de gasolina, que se presentan en la tabla 18.1, está dado por F13 0.2Y12 0.8F12, pero como el pronóstico para la semana 12 está dado por F12 0.2Y11 0.8F11, al combinar estas dos ecuaciones, el pronóstico para la semana 12 se puede escribir como
F13 0.2Y12 0.8(0.2Y11 0.8F11) 0.2Y12 0.16Y11 0.64F11 a.
b.
Haga uso de F11 0.2Y10 + 0.8F10 (y de manera similar F10 y F9), continúe expandiendo la expresión para F13 hasta que quede en función de los valores pasados Y12, Y11, Y10, Y9, Y8 y del pronóstico para el periodo 8. Observe los coeficientes o pesos de los valores del pasado Y12, Y11, Y10, Y9, Y8; ¿qué puede decir acerca de los pesos del suavizamiento exponencial de los valores pasados al tener un nuevo pronóstico? Compare estos pesos con los pesos en el método del promedio móvil.
Aplicaciones 6. En la empresa Hawkins, los porcentajes de pedidos recibidos a tiempo en los últimos 12 meses son 80, 82, 84, 83, 83, 84, 85, 84, 82, 83, 84 y 83. a. Compare un pronóstico obtenido con el método de promedios móviles, use promedios de tres meses, con el pronóstico obtenido con el método de suavizamiento exponencial, emplee α 0.2. ¿Con qué método se obtiene un mejor pronóstico? b. ¿Cuál es el pronóstico para el mes próximo? 7. A continuación se dan las tasas de interés de bonos corporativos triple A en 12 meses consecutivos. 9.5 a. b.
Auto examen
9.3
9.4
9.6
9.8
9.7
9.8
10.5
9.9
9.7
9.6
9.6
Desarrolle promedios móviles de tres y cuatro meses para esta serie de tiempo. ¿Cuál de los dos promedios proporciona el mejor pronóstico? Explique. ¿Cuál es el pronóstico del promedio móvil para el mes próximo?
8. A continuación se presentan los valores (en millones de dólares) de los contratos de construcción en Alabama correspondientes a un periodo de 12 meses. 240 a.
b.
350
230
260
280
320
220
310
240
310
240
230
Compare el pronóstico obtenido con promedios móviles de tres meses con el pronóstico obtenido mediante suavizamiento exponencial con α 0.2. ¿Con cuál de los métodos se obtiene un mejor pronóstico? ¿Cuál es el pronóstico para el mes próximo?
9. En la serie de tiempo siguiente se dan las ventas de un determinado producto en los últimos 12 meses.
Mes
Ventas
Mes
Ventas
1 2 3 4 5 6
105 135 120 105 90 120
7 8 9 10 11 12
145 140 100 80 100 110
18Ander(765-811).qxd 2/29/08 11:46 AM Page 780
780
Capítulo 18
a. b.
Pronóstico
Emplee α 0.3 y calcule los valores que se obtienen para esta serie de tiempo con el método de suavizamiento exponencial. Use la constante de suavizamiento α 0.5 para calcular los valores de suavizamiento exponencial. ¿Con cuál valor, 0.3 o 0.5, de la constante α se obtiene un mejor pronóstico?
10. Los datos siguientes son los valores del índice Commodity Futures Index en 10 semanas: 7.35, 7.40, 7.55, 7.56, 7.60, 7.52, 7.52, 7.70, 7.62 y 7.55. a. Dé los valores que se obtienen con el método de suavizamiento exponencial con α 0.2. b. Proporcione los valores que se obtienen con el método de suavizamiento exponencial con α 0.3. c. ¿Cuál de los dos modelos anteriores proporciona mejores pronósticos? Dé el pronóstico para la semana 11. 11. Los datos siguientes corresponden a la utilización de la capacidad de producción (en porcentajes) en los últimos 15 trimestres.
Trimestre/año
Utilización (%)
Trimestre/año
Utilización (%)
1/2003 2/2003 3/2003 4/2003 1/2004 2/2004 3/2004 4/2004
82.5 81.3 81.3 79.0 76.6 78.0 78.4 78.0
1/2005 2/2005 3/2005 4/2005 1/2006 2/2006 3/2006
78.8 78.7 78.4 80.0 80.7 80.7 80.8
archivo CD en MfgCap
a.
b. c.
18.3
TABLA 18.6
SERIE DE TIEMPO DE LA VENTA DE BICICLETAS Año (t)
Ventas (en miles) (Yt )
1 2 3 4 5 6 7 8 9 10
21.6 22.9 25.5 21.9 23.9 27.5 31.5 29.7 28.6 31.4
Para esta serie de tiempo calcule promedios móviles de tres semanas y promedios móviles de cuatro semanas. ¿Con cuál de estos promedios móviles se obtiene un mejor pronóstico para el cuarto trimestre de 2006? Obtenga pronósticos para el cuarto trimestre de 2006, use α 0.4 y α 0.5. ¿Con qué constantes de suavizamiento se obtiene un mejor pronóstico? De acuerdo con los resultados de los incisos a y b, ¿con qué método —promedios móviles o suavizamiento exponencial— se obtiene un mejor pronóstico? Explique.
Proyección de tendencia En esta sección se muestra cómo hacer pronósticos para una serie de tiempo que a largo plazo tenga una tendencia lineal. El tipo de series de tiempo al que se aplica el método de la proyección de tendencia son las series de tiempo que muestran un aumento o disminución consistente a lo largo del tiempo; como estas series de tiempo no son estables, no se pueden utilizar los métodos de suavizamiento descritos en la sección anterior. Considere la serie de tiempo formada por las ventas de bicicletas de un determinado fabricante en los últimos 10 años, la cual se muestra en la tabla 18.6 y en la figura 18.8. Observe que en el año 1 se vendieron 21 600 bicicletas, en el año 122 900 en el año 2, etc. En el año 10, el año más reciente, se vendieron 31 400 bicicletas. Aunque en la figura 18.8 se observa que en los últimos 10 años ha habido algunos ascensos y algunos descensos, esta serie de tiempo parece mostrar una tendencia general de aumento o creciente. No puede esperar que el componente de tendencia de una serie de tiempo siga todos y cada uno de los movimientos de ascenso y descenso. Lo que se espera es que el componente de tendencia se refleje en el desplazamiento gradual —en este caso, un crecimiento— de los valores de la serie de tiempo. Después de observar los datos de la serie de tiempo que se presentan en la tabla 18.6 y su gráfica que aparece en la figura 18.8, se puede estar de acuerdo en que una descripción razonable de los movimientos a largo plazo de esta serie es una tendencia lineal como la que se muestra en la figura 18.9.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 781
18.3
781
Proyección de tendencia
Ventas (en miles)
FIGURA 18.8
SERIE DE TIEMPO DE LAS VENTAS DE BICICLETAS 32 31 30 29 28 27 26 25 24 23 22 21 20
0
1
2
3
4
5
6
7
8
9
10
Año
Ventas (en miles)
FIGURA 18.9
TENDENCIA REPRESENTADA POR UNA FUNCIÓN LINEAL PARA EL CASO DE LAS VENTAS DE BICICLETAS 32 31 30 29 28 27 26 25 24 23 22 21 20
0
1
2
3
4
5
6
7
8
9
10
Año
archivo CD en Bicycle
Para ilustrar los cálculos a realizar al emplear el análisis de regresión para identificar una tendencia lineal, se aprovecharán los datos de las ventas de bicicletas. Recuerde que en el capítulo 14, cuando se estudió la regresión lineal simple, se vio cómo usar el método de mínimos cuadrados para hallar la mejor relación lineal entre dos variables. Para obtener la línea de tendencia para la serie de tiempo de las ventas de bicicletas se empleará esa misma metodología. Es decir, se usará el análisis de regresión para estimar la relación entre tiempo y volumen de ventas.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 782
782
Capítulo 18
Pronóstico
En el capítulo 14 la ecuación de regresión estimada que describía una relación lineal entre una variable independiente x y una variable dependiente y se expresó como ŷ b0 b1x
(18.4)
Para hacer énfasis en el hecho de que al hacer un pronóstico la variable independiente es el tiempo, en la ecuación (18.4) se usará t en lugar de x; además, en lugar de ŷ se usará Tt. Por tanto, en el caso de una tendencia lineal, el volumen de ventas estimado que se expresa en función del tiempo se escribe
ECUACIÓN DE TENDENCIA LINEAL
Tt b0 b1t
(18.5)
donde Tt b0 b1 t
valor de tendencia de la serie de tiempo en el periodo t intersección de la línea de tendencia pendiente de la línea de tendencia tiempo
En la ecuación (18.5), se hará t 1 para el tiempo de la primera observación de la serie de tiempo, t 2 para el tiempo de la segunda observación y así sucesivamente. Observe que en la serie de tiempo de las ventas de bicicletas, t 1 corresponde al valor más antiguo de la serie, y t 10 corresponde al dato del año más reciente. A continuación se presentan las fórmulas para calcular los coeficientes de regresión estimados (b1 y b0) de la ecuación (18.5).
CÁLCULO DE LA PENDIENTE (b1) Y DE LA INTERSECCIÓN (b0)
兺tYt (兺t 兺Yt)兾n 兺t 2 (兺t)2兾n b0 Ȳ b1t̄
b1
(18.6) (18.7)
donde Yt valor en la serie de tiempo en el periodo t n número de periodos Ȳ valor promedio de la serie de tiempo; es decir, Ȳ 兺Yt 兾n t̄ valor promedio de t, es decir, t̄ 兺t兾n Al emplear las ecuaciones (18.6) y (18.7) y los datos de las ventas de bicicletas presentados en la tabla 18.6, b0 y b1 se calculan como sigue.
t
Yt
tYt
t2
1 2 3 4 5 6
21.6 22.9 25.5 21.9 23.9 27.5
21.6 45.8 76.5 87.6 119.5 165.0
1 4 9 16 25 36
18Ander(765-811).qxd 2/29/08 11:46 AM Page 783
18.3
783
Proyección de tendencia
Totales
t
Yt
tYt
t2
7 8 9 10
31.5 29.7 28.6 31.4
220.5 237.6 257.4 314.0
49 64 81 100
55
264.5
1545.5
385
55 5.5 10 264.5 Ȳ 26.45 10 1545.5 (55)(264.5)兾10 b1 1.10 385 (55)2兾10 b0 26.45 1.10(5.5) 20.4 t̄
Por tanto, Tt 20.4 1.1t Antes de usar la ecuación de tendencia para obtener un pronóstico, debe realizar una prueba de significancia estadística (ver capítulo 14). En la práctica, esta prueba debe ser parte rutinaria del ajuste de la línea de tendencia.
(18.8)
es la expresión del componente de tendencia lineal en la serie de tiempo de las ventas de bicicletas. Como la pendiente es 1.1, esto indica que en los pasados 10 años la empresa tuvo un crecimiento promedio en ventas de 1 100 unidades por año. Si se supone que la tendencia en ventas de los últimos 10 años es un buen indicador del futuro, entonces se emplea la ecuación 18.8 para proyectar el componente de tendencia de la serie de tiempo. Por ejemplo, al sustituir en la ecuación (18.8) t 11, se obtiene la proyección de tendencia para el año próximo, T11. T11 20.4 1.1(11) 32.5 Por tanto, si emplea únicamente el componente de tendencia se pronostica que, el año próximo, las ventas serán de 32 500 bicicletas. Para modelar una tendencia suele usarse el modelo de función lineal, sin embargo, como ya se vio, algunas veces las series de tiempo tienen tendencias curvilíneas, o no lineales, similares a las que se muestran en la figura 18.10. En el capítulo 16 se vio cómo usar el análisis de regresión para modelar relaciones curvilíneas como la presentada en la gráfica A de la figura 18.10. En libros más avanzados se ve detalladamente cómo obtener modelos de regresión como el mostrado en la gráfica B de la figura 18.10. FIGURA 18.10
FORMAS POSIBLES PARA UN PATRÓN DE TENDENCIA NO LINEAL Yt
Yt
Tiempo
t
Gráfica A. Tendencia exponencial
Tiempo
t
Gráfica B. Curva de crecimiento de Gompertz
18Ander(765-811).qxd 2/29/08 11:46 AM Page 784
784
Capítulo 18
Pronóstico
Ejercicios
Métodos 12. Considere la serie de tiempo siguiente.
Auto examen
t
1
2
3
4
5
Yt
6
11
9
14
15
Obtenga una ecuación para el componente de tendencia lineal de esta serie. Dé el pronóstico para t 6. 13. Considere la serie de tiempo siguiente. t
1
2
3
4
5
6
Yt
205
202
195
190
191
188
Obtenga una ecuación para el componente de tendencia lineal de esta serie. Dé el pronóstico para t 7.
Aplicaciones 14. Se presentan los datos de matrícula (en miles) en una universidad en los últimos seis años.
Auto examen
Año Matrícula
1
2
3
4
5
6
20.5
20.2
19.5
19.0
19.1
18.8
Obtenga la ecuación para el componente de tendencia lineal de esta serie. Haga un comentario sobre lo que pasa con la matrícula en esta institución. 15. En la tabla siguiente se dan las cifras correspondientes a los últimos siete años, de asistencia promedio a los juegos de futbol, en casa, de una universidad. Obtenga la ecuación para el compo-
nente de tendencia lineal de esta serie de tiempo.
Año
Asistencia
1 2 3 4 5 6 7
28 000 30 000 31 500 30 400 30 500 32 200 30 800
16. De las ventas de automóviles en los últimos 10 años en B.J. Scott Motors, Inc., se obtuvo la serie de tiempo siguiente.
Año
Ventas
Año
Ventas
1 2 3 4 5
400 390 320 340 270
6 7 8 9 10
260 300 320 340 370
Grafique esta serie de tiempo y haga un comentario sobre si es adecuado suponer una tendencia lineal. ¿Qué tipo de forma funcional considera más adecuada para el patrón de tendencia de esta serie?
18Ander(765-811).qxd 2/29/08 11:46 AM Page 785
18.3
785
Proyección de tendencia
17. Al presidente de una pequeña fábrica le preocupa el aumento continuo que ha habido en los costos de fabricación en los últimos años. Las cifras siguientes constituyen una serie de tiempo del costo por unidad de los principales productos de esta empresa en los últimos ocho años.
a. b.
Año
Costo/unidad ($)
Año
Costo/unidad ($)
1 2 3 4
20.00 24.50 28.20 27.50
5 6 7 8
26.60 30.00 31.00 36.00
Presente una gráfica de esta serie de tiempo. ¿Parece existir una tendencia lineal? Obtenga la ecuación del componente de tendencia lineal de esta serie de tiempo. ¿Cuál es el incremento anual promedio en el costo que ha habido en la empresa?
18. Los datos siguientes presentan el porcentaje de estadounidenses rurales, urbanos y suburbanos que tienen en casa una conexión de alta velocidad (Pew Internet Rural Broadband Internet Use Memo, febrero de 2006).
archivo CD en Broadband
a. b. c.
Año
Rural
Urbano
Suburbano
2001 2002 2003 2004 2005
3 6 9 16 24
9 18 21 29 38
9 17 23 29 40
Para cada grupo, obtenga una ecuación de tendencia lineal. Utilice la ecuación de tendencia obtenida en el inciso a para comparar las tasas de crecimiento de los tres grupos. Use la ecuación de tendencia de cada grupo para obtener un pronóstico para el año 2006.
19. En los datos siguientes se observan los promedios en las cuentas por teléfonos celulares (The New York Times Almanac, 2006)
a. b. c.
Año
Cantidad ($)
1998 1999 2000 2001 2002 2003
39.43 41.24 45.27 47.37 48.40 49.91
Grafique esta serie de tiempo. ¿Observa alguna tendencia? Para esta serie de tiempo obtenga una ecuación de tendencia lineal. Use la ecuación de tendencia para estimar la cuenta promedio mensual en 2004.
20. A continuación se presentan los datos del ingreso bruto (en millones de dólares) de las aerolíneas regionales en un periodo de 10 años. Año
Ingreso
Año
Ingreso
1 2 3 4 5
2428 2951 3533 3618 3616
6 7 8 9 10
4264 4738 4460 5318 6915
18Ander(765-811).qxd 2/29/08 11:46 AM Page 786
786
Capítulo 18
a. b.
Pronóstico
Para esta serie de tiempo, obtenga una ecuación de tendencia lineal. Haga un comentario sobre lo que revela esta ecuación acerca del ingreso bruto de las aerolíneas en los últimos 10 años. Pronostique los ingresos brutos en los años 11 y 12.
21. FRED® (Federal Reserve Economic Data), una base de datos que con más de 3 000 series de tiempo económicas contiene datos históricos sobre los tipos de cambio. Los datos siguientes corresponden al tipo de cambio entre Estados Unidos y Canadá (http://research.stlouisfed.org/fred2/). Las unidades en esta tasa de cambio son cantidad de dólares canadienses por un dólar estadounidense. Fecha Abril 2005 Mayo 2005 Junio 2005 Julio 2005 Agosto 2005 Septiembre 2005 Octubre 2005 Noviembre 2005 Diciembre 2005 Enero 2006
a. b. c. d.
18.4
Cambio 1.2359 1.2555 1.2402 1.2229 1.2043 1.1777 1.1774 1.1815 1.1615 1.1572
Grafique esta serie de tiempo. ¿Está presente una tendencia lineal? Obtenga la ecuación para el componente de tendencia lineal de esta serie de tiempo. Use la ecuación de tendencia para pronosticar el tipo de cambio en febrero 2006. ¿Usaría con confianza esta ecuación para pronosticar el tipo de cambio en julio de 2006?
Componentes de tendencia y estacionales Ya se mostró cómo hacer pronósticos para una serie de tiempo que tiene un componente de tendencia. En esta sección se amplía este estudio y se muestra cómo hacer pronósticos para una serie de tiempo que tiene tanto un componente de tendencia como un componente estacional. En muchas situaciones relacionadas con las actividades comerciales o económicas es necesario hacer comparaciones entre los periodos. Informaciones en el sentido de que ha habido un aumento de 2% en el desempleo, en comparación con el último mes; o un crecimiento de 5% en la producción de acero, en comparación con el mes anterior, o una disminución de 3% en el consumo en la energía eléctrica, en comparación con el mes anterior, suelen ser de interés. Sin embargo, hay que tener cuidado con este tipo de información, ya que si existe una influencia estacional, esta información puede entenderse de manera equivocada. Por ejemplo, el hecho de que el consumo de energía haya disminuido 3% de agosto a septiembre puede deberse únicamente al efecto estacional, al menor uso que se hace del aire acondicionado, y no a una disminución a largo plazo en el consumo de energía eléctrica. En realidad, una vez hecho el ajuste estacional, es posible que incluso se encuentre que el consumo de energía eléctrica haya aumentado. A la eliminación del efecto estacional de una serie de tiempo se le conoce como desestacionalización de la serie de tiempo. La desestacionalización permite que las comparaciones de un periodo con otro sean útiles y ayuda a identificar la existencia de tendencias. El método que se expondrá aquí es adecuado cuando existen únicamente efectos estacionales o cuando existen tanto efectos estacionales como de tendencia. El primer paso es calcular los índices estacionales y usarlos para desestacionalizar los datos. Después, si en los datos desestacionalizados se observa alguna tendencia, se estima el componente de tendencia aplicando el análisis de regresión a la serie desestacionalizada.
Modelo multiplicativo Se supone que en la serie de tiempo además del componente de tendencia (T) y del componente estacional (S) existe un componente irregular (I). El componente irregular corresponde a todos los efectos aleatorios que puede haber sobre la serie de tiempo, es decir, los efectos que no pueden ser
18Ander(765-811).qxd 2/29/08 11:46 AM Page 787
18.4
787
Componentes de tendencia y estacionales
explicados por los componentes de tendencia y estacional. Para identificar los componentes de tendencia, estacional e irregular correspondientes a un tiempo t se usarán Tt¸ St e It, respectivamente, y se supondrá que el valor correspondiente de la serie de tiempo, que se denotará Yt, se puede determinar mediante el siguiente modelo multiplicativo para una serie de tiempo. Yt Tt St It
(18.9)
TABLA 18.7
En este modelo, Tt es la tendencia, y se mide en las unidades del artículo que se pronostica. En camDATOS TRIMESTRA- bio, los componentes St e It se miden en términos relativos, donde valores mayores a 1.00 indican efectos superiores a la tendencia y valores menores a 1.00 indican valores inferiores a la tendencia. LES DE LA VENTA Para ilustrar el uso del modelo multiplicativo que comprende los componentes de tendenDE TELEVISORES cia, estacional e irregular se emplearán los datos trimestrales que se muestran en la tabla 18.7 y TriVentas Año mestre (en miles) en la figura 18.11. Estos son los datos que corresponden a las ventas de unidades de televisores (en miles) que ha vendido un determinado fabricante en los últimos cuatro años. Primero se mos1 1 4.8 2 4.1 trará cómo identificar el componente estacional en la serie de tiempo.
3
4
6.0 6.5 5.8 5.2 6.8 7.4 6.0 5.6 7.5 7.8 6.3 5.9 8.0 8.4
archivo CD en TVSales
Cálculo de los índices estacionales En la figura 18.11 se observa que cada año las ventas disminuyen en el segundo trimestre, y aumentan en el tercero y cuarto trimestres. Por tanto, se concluye que en la venta de estos televisores hay un comportamiento estacional. Para identificar el componente estacional de cada trimestre, se empieza por calcular un promedio móvil para separar los componentes estacional e irregular, St e It, del componente de tendencia Tt. Para calcular cada promedio se usan datos de todo un año. Como se trabaja con una serie trimestral, para calcular cada promedio móvil se usan cuatro datos. El cálculo del promedio móvil de los cuatro primeros trimestres de ventas de televisores es Primer promedio móvil
4.8 4.1 6.0 6.5 21.4 5.35 4 4
Observe que el promedio móvil de los primeros cuatro trimestres da el promedio trimestral de las ventas en el año 1 de la serie de tiempo. Para continuar con el cálculo de los promedios móFIGURA 18.11
Ventas trimestrales de televisores (en miles)
2
3 4 1 2 3 4 1 2 3 4 1 2 3 4
SERIE DE TIEMPO DE LAS VENTAS TRIMESTRALES DE TELEVISORES
8.0
7.0
6.0
5.0
4.0
1
2
3
Año 1
4
1
2
3
Año 2
4
1
2
3
Año 3
Año/trimestre
4
1
2
3
Año 4
4
18Ander(765-811).qxd 2/29/08 11:46 AM Page 788
788
Capítulo 18
Pronóstico
viles, se agrega el valor 5.8 correspondiente al primer trimestre del año 2 y se elimina el 4.8 correspondiente al primer trimestre del año 1. De esta manera el segundo promedio móvil es Segundo promedio móvil
4.1 6.0 6.5 5.8 22.4 5.60 4 4
De manera similar, el tercer promedio móvil es (6.0 6.5 5.8 5.2)/4 5.875. Antes de continuar el cálculo de los promedios móviles de toda la serie, regrese al primer promedio móvil, que es 5.35. El valor 5.35 representa un promedio trimestral del volumen de ventas (a lo largo de todas las estaciones) en el año 1. Parece razonable asociar el valor 5.35 con el trimestre “central” de los promedios empleados en el cálculo del promedio móvil. Sin embargo, como en cada promedio móvil intervienen cuatro trimestres, no hay un trimestre central. El 5.35 corresponderá a la segunda mitad del segundo trimestre y a la primera mitad del tercer trimestre. De manera similar, al pasar al valor del siguiente promedio móvil, que es 5.60, el trimestre central corresponderá a la segunda mitad del tercer trimestre y a la primera mitad del cuarto trimestre. Recuerde que la razón por la que se calculan los promedios móviles es para aislar los componentes combinados estacional e irregular. Sin embargo, los valores de los promedios móviles no corresponden precisamente a los trimestres originales de la serie de tiempo. Esta dificultad se puede resolver con el uso de los puntos medios entre los valores sucesivos de los promedios móviles. Por ejemplo, si 5.35 corresponde a la primera mitas del tercer trimestre y 5.60 corresponde a la última mitad del tercer trimestre, se puede usar (5.35 5.60)/2 5.475 como valor correspondiente al promedio móvil del tercer trimestre. De manera similar, se asocia el valor del promedio móvil (5.60 5.875)/2 5.738 con el cuarto trimestre. Lo que se obtiene es un promedio móvil centrado. En la tabla 18.8 se muestra el resumen completo de los promedios móviles para los datos de las ventas de televisores. Si en un promedio móvil el número de datos es non, el punto medio corresponderá a uno de los periodos de la serie de tiempo. En tales casos, no es necesario centrar los promedios móviles para hacerlos corresponder a un determinado periodo como se hizo con los datos de la tabla 18.8. ¿Qué información se obtiene, de los promedios móviles centrados de la tabla 18.8, acerca de esta serie de tiempo? En la figura 18.12 se grafican los valores reales de la serie de tiempo y los valores de los promedios móviles centrados. Observe, en particular, cómo los promedios móviles centrados tienden a “suavizar” tanto las fluctuaciones estacionales como las fluctuaciones irregulares de la serie de tiempo. En los promedios móviles calculados con cuatro trimestres no aparecen las fluctuaciones debidas a la influencia estacional ya que este efecto es eliminado con los promedios. Cada promedio móvil centrado representa el valor de la serie de tiempo si no existieran las influencias estacional irregular. Al dividir cada observación de la serie de tiempo entre su correspondiente promedio móvil centrado se identifica el efecto estacional irregular sobre la serie de tiempo. Por ejemplo, para el tercer trimestre del año 1, 6.0/5.475 1.096 es el valor combinado estacional irregular. En la tabla 18.9 se dan los valores estacionales irregulares de toda la serie de tiempo. Respecto del tercer trimestre se observa que los valores de éste en los años 1, 2, y 3 son 1.096, 1.075 y 1.109, respectivamente. De manera que en todos los casos, el valor estacional irregular parece tener una influencia superior a la promedio sobre el tercer trimestre. Dado que las fluctuaciones que se observan año con año en el valor estacional irregular son atribuibles principalmente al componente irregular, pueden promediarse esos valores para eliminar la influencia irregular y obtener una estimación de la influencia estacional del tercer trimestre. Efecto estacional del tercer trimestre
1.096 1.075 1.109 1.09 3
Al número 1.09 se le conoce como índice estacional del tercer trimestre. En la tabla 18.10 se resumen los cálculos para obtener los índices estacionales de la serie de tiempo de las ventas de te-
18Ander(765-811).qxd 2/29/08 11:46 AM Page 789
18.4
TABLA 18.8
789
Componentes de tendencia y estacionales
PROMEDIOS MÓVILES CENTRADOS DE LA SERIE DE TIEMPO DE LAS VENTAS DE TELEVISORES
Año
Trimestre
Ventas (en miles)
1
1
4.8
2
4.1
3
6.0
Promedio móvil de cuatro trimestres
Promedios móviles centrados
5.350 5.475 5.600 4
6.5
5.738 5.875
2
1
5.8
5.975 6.075
2
5.2
6.188 6.300
3
6.8
6.325 6.350
4
7.4
6.400 6.450
3
1
6.0
6.538 6.625
2
5.6
6.675 6.725
3
7.5
6.763 6.800
4
7.8
6.838 6.875
4
1
6.3
6.938 7.000
2
5.9
7.075 7.150
3
8.0
4
8.4
levisores. Por tanto, los índices estacionales de los cuatro trimestres son: primer trimestre, 0.93; segundo trimestre, 0.84; tercer trimestre, 1.09, y cuarto trimestre 1.14. Si observa los valores de la tabla 18.10 obtiene una interpretación del componente estacional en las ventas de televisores. En el cuarto trimestre es cuando se tienen las mejores ventas, que son 14% superiores al promedio de las ventas trimestrales. El peor trimestre de ventas es el segundo trimestre; su índice estacional es 0.84, lo que indica que en este trimestre las ventas son 16% inferiores a las ventas promedio de los cuatro trimestres. El componente estacional corresponde con claridad a lo que la intuición prevé: en el cuarto trimestre, debido a la llegada del invierno y a la disminución de las actividades al aire libre (en Estados Unidos) aumenta el interés por ver televisión y con ello las compras de televisores. Las bajas ventas en el segundo trimestre reflejan la disminución del interés por ver televisión debido a la primavera y a las actividades de preparación para el verano, de los compradores potenciales. Para obtener el índice estacional suele ser necesario un último ajuste. En el modelo multiplicativo se requiere que el índice estacional promedio sea igual a 1.00, de manera que la suma de los cuatro índices estacionales, que se presentan en la figura 18.10, debe ser igual a 4.00. En otras palabras, el efecto estacional debe compensarse a lo largo del año. En el ejemplo visto aquí, el
18Ander(765-811).qxd 2/29/08 11:46 AM Page 790
Capítulo 18
Pronóstico
FIGURA 18.12
Ventas trimestrales de televisores (miles)
790
SERIE DE TIEMPO DE LAS VENTAS TRIMESTRALES DE TELEVISORES Y PROMEDIOS MÓVILES CENTRADOS
8.0 7.0 6.0 5.0
Serie de tiempo de los promedios móviles centrados
4.0
1
2 3 Año 1
4
1
2 3 Año 2
4
1
2 3 4 Año 3
1
2 3 4 Año 4
Año/trimestre
TABLA 18.9
VALORES ESTACIONALES IRREGULARES DE LA SERIE DE TIEMPO DE LAS VENTAS DE TELEVISORES
Año
Trimestre
Ventas (en miles)
Promedio móvil centrada
Valor estacional irregular
1
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
4.8 4.1 6.0 6.5 5.8 5.2 6.8 7.4 6.0 5.6 7.5 7.8 6.3 5.9 8.0 8.4
5.475 5.738 5.975 6.188 6.325 6.400 6.538 6.675 6.763 6.838 6.938 7.075
1.096 1.133 0.971 0.840 1.075 1.156 0.918 0.839 1.109 1.141 0.908 0.834
2
3
4
18Ander(765-811).qxd 2/29/08 11:46 AM Page 791
18.4
791
Componentes de tendencia y estacionales
TABLA 18.10
CÁLCULO DE LOS ÍNDICES ESTACIONALES DE LA SERIE DE TIEMPO DE LAS VENTAS DE TELEVISORES
Trimestre 1 2 3 4
Valor del componente estacional irregular (St It )
Índice estacional (St )
0.971, 0.918, 0.908 0.840, 0.839, 0.834 1.096, 1.075, 1.109 1.133, 1.156, 1.141
0.93 0.84 1.09 1.14
promedio de los índices estacionales es igual a 1.00 y por tanto, no es necesario hacer ningún ajuste. En otros casos puede ser necesario hacer un ligero ajuste. Este ajuste se hace al multiplicar cada índice estacional por el número de estaciones dividido entre la suma de los índices estacionales no ajustados. Por ejemplo, cuando se tienen datos trimestrales se multiplica cada índice estacional por 4/(suma de los índices estacionales no ajustados). En algunos de los ejercicios se necesitará hacer este ajuste para obtener el índice estacional adecuado.
Desestacionalización de una serie de tiempo Cuando se tienen datos desestacionalizados, tiene sentido comparar las ventas de periodos consecutivos. Si se tienen datos que no han sido desestacionalizados, comparaciones útiles pueden obtenerse al contrastar las ventas del periodo presente con las ventas del mismo periodo en el año anterior.
El objeto de hallar los índices estacionales es eliminar de la serie de tiempo los efectos estacionales. A este proceso se le conoce como desestacionalización de la serie de tiempo. En publicaciones como Survey of Current Business, The Wall Street Journal y BusinessWeek suelen publicarse series de tiempo económicas ajustadas a las variaciones estacionales (series de tiempo desestacionalizadas). Si emplea la noción de modelo multiplicativo, tiene Yt Tt St It Para eliminar de una serie de tiempo el efecto estacional, se divide cada observación de la serie de tiempo entre su índice estacional correspondiente. En la tabla 18.11 se presenta la serie de tiempo desestacionalizada de las ventas de televisores. En la figura 18.13 se presenta una gráfica de la serie de tiempo desestacionalizada de las ventas de televisores.
Uso de una serie de tiempo desestacionalizada para la identificación de tendencias A pesar de que en la figura 18.13 se observan algunos movimientos aleatorios, hacia arriba o hacia abajo, a lo largo de los últimos 16 trimestres, la serie de tiempo parece tener una tendencia lineal ascendente. Para identificar esta tendencia, se usa el mismo procedimiento que en la sección anterior; en este caso los datos son ventas trimestrales desestacionalizadas. Por tanto, en una tendencia lineal, el volumen estimado de las ventas, expresado en función del tiempo es Tt b0 b1t donde Tt valor de la tendencia en la venta de televisores en el periodo t b0 intersección de la línea de tendencia con el eje y b1 pendiente de la línea de tendencia Como antes, t 1 corresponde al tiempo de la primera observación en la serie de tiempo, t 2 corresponde al tiempo de la segunda observación y así sucesivamente. Así, en la serie de tiempo
18Ander(765-811).qxd 2/29/08 11:46 AM Page 792
792
Capítulo 18
TABLA 18.11
Pronóstico
VALORES DESESTACIONALIZADOS DE LA SERIE DE TIEMPO DE LAS VENTAS DE TELEVISORES
Año
Trimestre
Ventas (en miles) (Yt )
Índice estacional (St )
Ventas desestacionalizadas (Yt /St ⴝ Tt It )
1
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
4.8 4.1 6.0 6.5 5.8 5.2 6.8 7.4 6.0 5.6 7.5 7.8 6.3 5.9 8.0 8.4
.93 .84 1.09 1.14 .93 .84 1.09 1.14 .93 .84 1.09 1.14 .93 .84 1.09 1.14
5.16 4.88 5.50 5.70 6.24 6.19 6.24 6.49 6.45 6.67 6.88 6.84 6.77 7.02 7.34 7.37
2
3
4
de las ventas de televisores, t 1 corresponde al valor de las ventas desestacionalizadas del primer trimestre y t 16 corresponde al valor de las ventas desestacionalizadas del semestre más reciente. A continuación se presentan las fórmulas para calcular los valores de b0 y b1. 兺tYt (兺t 兺Yt)兾n 兺t 2 (兺t)2兾n b0 Ȳ b1t̄
b1
Ventas desestacionalizadas (en miles)
FIGURA 18.13
SERIE DE TIEMPO DESESTACIONALIZADA DE LAS VENTAS DE TELEVISORES
8.0
7.0
6.0
5.0
4.0
1
2
3
Año 1
4
1
2
3
Año 2
4
1
2
3
Año 3
4
1
2
3
Año 4
4
18Ander(765-811).qxd 2/29/08 11:46 AM Page 793
18.4
793
Componentes de tendencia y estacionales
Sin embargo, observe, que ahora Yt se refiere al valor de la serie de tiempo desestacionalizada en el tiempo t y no al valor de la serie de tiempo original. Al usar las ecuaciones para obtener b0 y b1 y los datos de las ventas desestacionalizadas presentados en la tabla 18.11, se tienen los cálculos siguientes.
t
Totales
Yt (desestacionalizada)
tYt
t2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
5.16 4.88 5.50 5.70 6.24 6.19 6.24 6.49 6.45 6.67 6.88 6.84 6.77 7.02 7.34 7.37
5.16 9.76 16.50 22.80 31.20 37.14 43.68 51.92 58.05 66.70 75.68 82.08 88.01 98.28 110.10 117.92
1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256
136
101.74
914.98
1496
donde 136 8.5 16 101.74 Ȳ 6.359 16 914.98 (136)(101.74)兾16 b1 0.148 1496 (136)2兾16 b0 6.359 0.148(8.5) 5.101 t̄
Por tanto, Tt 5.101 0.148t es la expresión para el componente de tendencia lineal de la serie de tiempo desestacionalizada. La pendiente, 0.148, indica que en los 16 trimestres pasados, el crecimiento promedio de las ventas desestacionalizadas de la empresa fue de 148 televisores por trimestre. Si se supone que la tendencia en los datos de ventas de los últimos 16 trimestres es un indicador razonablemente bueno del futuro, esta ecuación puede usarse para proyectar el componente de tendencia de la serie de tiempo desestacionalizada a los trimestres futuros. Por ejemplo, si sustituye en esta ecuación t 17, se obtiene la proyección de la tendencia desestacionalizada para el trimestre siguiente, T17. T17 5.101 0.148(17) 7.617
18Ander(765-811).qxd 2/29/08 11:46 AM Page 794
794
Capítulo 18
TABLA 18.12
Pronóstico
PRONÓSTICOS TRIMESTRALES PARA LA SERIE DE TIEMPO DE LAS VENTAS DE TELEVISORES
Año
Trimestre
Pronóstico para la tendencia desestacionalizada
5
1 2 3 4
7617 7765 7913 8061
Índice estacional (ver tabla 18.11) 0.93 0.84 1.09 1.14
Pronóstico trimestral (7617)(0.93) (7765)(0.84) (7913)(1.09) (8061)(1.14)
7084 6523 8625 9190
Por tanto, el componente de tendencia da un pronóstico de ventas desestacionalizadas de 7 617 televisores para el siguiente trimestre. De manera similar, el componente de tendencia produce pronósticos de ventas desestacionalizadas de 7 765, 7 913 y 8 061 televisores para los trimestres 18, 19 y 20, respectivamente.
Ajustes estacionales El último paso para obtener un pronóstico cuando existen tanto un componente estacional como un componente de tendencia, es usar el índice estacional para ajustar la proyección de tendencia desestacionalizada. De regreso con el ejemplo de las ventas de televisores, ya se tienen proyecciones desestacionalizadas para los cuatro trimestres siguientes. Ahora es necesario ajustar las proyecciones de acuerdo al efecto estacional. El índice estacional para el primer trimestre del año 5 (t 17) es 0.93, de manera que el pronóstico para ese trimestre se obtiene al multiplicar el pronóstico desestacionalizado basado en la tendencia (T17 7 617) por el índice estacional (0.93). Por tanto, el pronóstico para el trimestre siguiente es 7 617(0.93) 7 084. En la tabla 18.12 se presentan los pronósticos trimestrales para los trimestres 17 a 20. El cuarto trimestre de alto volumen de ventas tiene un pronóstico de 9 190 unidades, y el segundo trimestre de volumen bajo de ventas tiene 6 523 unidades como pronóstico.
Modelos basados en datos mensuales En el ejemplo de las ventas de televisores se emplearon datos trimestrales para ilustrar el cálculo de los índices estacionales. Sin embargo, en muchas ocasiones suelen usarse pronósticos mensuales en lugar de pronósticos trimestrales. En tales casos el procedimiento presentado en esta sección puede emplearse con ligeros cambios. Primero, en lugar de un promedio móvil de cuatro trimestres se usa un promedio móvil de 12 meses; segundo, se calculan índices estacionales de 12 meses en lugar de índices estacionales de cuatro trimestres. Fuera de estos cambios, los cálculos y los pronósticos son idénticos.
Componente cíclico En términos matemáticos es posible ampliar el modelo multiplicativo de la ecuación (18.9) para incluir el componente cíclico. Yt Tt Ct St It
(18.10)
El componente cíclico, como ocurre con el componente estacional, se expresa como porcentaje de la tendencia. Como se dijo en la sección 18.1, este componente se atribuye a ciclos multianuales en la serie de tiempo. Es semejante al componente estacional, sólo que se presenta a lo largo de periodos más prolongados. Sin embargo, debido a la duración del componente cíclico, suele ser difícil obtener suficientes datos relevantes para estimarlo. Otra dificultad es que estos ciclos suelen tener longitudes variables. Un estudio más detallado del componente cíclico se deja para libros sobre métodos de pronóstico.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 795
18.4
795
Componentes de tendencia y estacionales
Ejercicios
Métodos
Auto examen
22. Considere los datos de la siguiente serie de tiempo.
Trimestre 1 2 3 4
a. b.
Año 1
Año 2
Año 3
4 2 3 5
6 3 5 7
7 6 6 8
Dé los valores de los promedios móviles de cuatro trimestres y de los promedios móviles centrados. Calcule los índices estacionales de los cuatro trimestres.
Aplicaciones 23. A continuación se presentan los datos, correspondientes a los últimos tres años de ventas trimestrales (número de ejemplares vendidos) de un libro de texto universitario.
a. b. c.
Trimestre
Año 1
Año 2
Año 3
1 2 3 4
1690 940 2625 2500
1800 900 2900 2360
1850 1100 2930 2615
Para esta serie de tiempo dé los promedios móviles de cuatro trimestres y los promedios móviles centrados. Calcule los índices estacionales de los cuatro trimestres. ¿Cuándo obtiene la editorial el mayor índice estacional? ¿Parece ser razonable este resultado? Explique.
24. A continuación se presentan los gastos mensuales, a lo largo de tres años, en un edificio de seis departamentos en el sur de Florida. Determine los índices estacionales mensuales. Use 12 meses como promedio móvil. Gastos
archivo CD en AptExp
Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
Año 1
Año 2
Año 3
170 180 205 230 240 315 360 290 240 240 230 195
180 205 215 245 265 330 400 335 260 270 255 220
195 210 230 280 290 390 420 330 290 295 280 250
18Ander(765-811).qxd 2/29/08 11:46 AM Page 796
796
Capítulo 18
Pronóstico
25. En el sur de California, los especialistas en el control de la contaminación atmosférica cada hora monitorean las cantidades de ozono, dióxido de carbono y dióxido de nitrógeno en el aire. En los datos de esta serie de tiempo horaria se observa estacionalidad, los niveles de contaminación muestran ciertos patrones según la hora del día. Los niveles de dióxido de nitrógeno en el centro, para las 12 horas, de las 6:00 de la mañana a las 6:00 de la tarde, los días 15, 16 y 17 de julio fueron los siguientes. 15 de julio: 16 de julio: 17 de julio:
archivo CD en Pollution
a. b.
c.
25 28 35
28 30 42
35 35 45
50 48 70
60 60 72
60 65 75
40 50 60
35 40 45
30 35 40
25 25 25
25 20 25
20 20 25
Determine los índices estacionales por hora de las 12 lecturas de cada día. Mediante los índices estacionales del inciso a, se desestacionalizaron los datos; la ecuación de tendencia obtenida para los datos desestacionalizados es Tt 32.983 0.3922t. Emplee únicamente el componente de tendencia y obtenga los pronósticos para las 12 horas del 18 de julio. Use los índices de tendencia del inciso a para ajustar los pronósticos de tendencia obtenidos en el inciso b.
26. El consumo de energía eléctrica se mide en kilowatts-hora (kWh). La empresa pública local que proporciona el servicio de energía eléctrica ofrece un programa de ahorro en el que los clientes comerciales participantes pagan tarifas especialmente favorables a condición de que reduzcan su consumo de energía eléctrica cuando la empresa pública se los solicite. La empresa Timko Products redujo su consumo de energía eléctrica a partir del mediodía del jueves. Para evaluar el ahorro de energía, la empresa pública tiene que estimar el consumo normal de energía de Timko. El periodo de reducción de consumo de energía fue desde el medio día hasta las 8:00 de la noche. Los datos sobre el consumo de energía de esta empresa en las 72 horas anteriores son los siguientes. Lapso
archivo CD en Power
0:00-4:00 4:00-8:00 8:00-12:00 0:00-24:00 4:00-8:00 8:00-24:00
a. b.
18.5
Lunes
Martes
Miércoles
Jueves
— — — 124 299 113 545 41 300
19 281 33 195 99 516 123 666 111 717 48 112
31 209 37 014 119 968 156 033 128 889 73 923
27 330 32 715 152 465
¿Se observa algún efecto estacional en este periodo de 24 horas? Calcule los índices estacionales de estos seis lapsos de 4 horas. Emplee el ajuste de tendencia para estimar los índices estacionales del consumo normal de Timko en el periodo que realizó el ahorro.
Análisis de regresión Cuando se estudió el análisis de regresión en los capítulos 14, 15 y 16, se mostró cómo usar una o varias variables independientes para predecir el valor de una variable dependiente. Si considera el análisis de regresión como una herramienta para pronóstico, el valor de la serie de tiempo que se desea pronosticar puede verse como la variable dependiente. Por tanto, si se logra determinar un buen conjunto de variables independientes, o predictoras, se podrá obtener una ecuación de regresión estimada para predecir o pronosticar la serie de tiempo. El método empleado en la sección 18.3 para ajustar una línea de tendencia lineal a la serie de tiempo de las ventas de bicicletas es un caso especial del análisis de regresión. En ese ejemplo se mostró que las dos variables, ventas de bicicletas y tiempo, estaban relacionadas linealmente.* Debido a la inherente complejidad de la mayoría de los problemas reales, para predecir *En un sentido estrictamente técnico, no se considera que el número de bicicletas vendidas esté relacionado con el tiempo, sino que el tiempo se usa como sustituto de variables con las que está relacionada el número de bicicletas vendidas, pero tales variables no se conocen o son difíciles de medir.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 797
18.5
797
Análisis de regresión
la variable de interés es necesario considerar más de una variable. En tales situaciones se usa la técnica estadística conocida como análisis de regresión múltiple. Recuerde que para obtener una ecuación estimada de regresión múltiple se necesita una muestra de observaciones de la variable dependiente y de todas las variables independientes. En el análisis de las series de tiempo, los datos de n periodos de la serie de tiempo representan una muestra de n observaciones de cada una de las variables que pueden usarse en el análisis. La notación que se usa para una función con k variables independientes es la siguiente. Yt valor de la serie de tiempo en el periodo t x1t valor de la variable independiente 1 en el periodo t x 2t valor de la variable independiente 2 en el periodo t . . . xkt valor de la variable independiente k en el periodo t Los n periodos de datos que se necesitan para obtener la ecuación estimada de regresión se verán como se muestra en la tabla siguiente.
Periodo
Serie de tiempo (Yt )
x1t
1 2 . . . n
Y1 Y2 . . . Yn
x11 x12 . . . x1n
Valor de las variables independientes x2t x3t . . . x21 x22 . . . x2n
x31 x32 . . . x3n
. . . . . .
. . . . . .
. . . . . .
xkt xk1 xk2 . . . xkn
Como puede uno suponer, existen diversas posibilidades para elegir las variables independientes para el modelo de pronóstico. Una posible variable independiente es simplemente el tiempo. Ésta fue la variable que se eligió en la sección 18.3 cuando se estimó la tendencia de la serie de tiempo mediante una función lineal de la variable independiente tiempo. Si x1t = t, se obtiene una ecuación de regresión estimada de la forma Ŷt b0 b1t
donde Ŷt es una estimación del valor Yt de la serie de tiempo y donde b0 y b1 son estimaciones de los coeficientes de regresión. En modelos más complejos, pueden tenerse más términos que corresponden al tiempo elevado a otras potencias. Por ejemplo, si x 2t t 2 y x3t t3, la ecuación estimada de regresión tomará la forma Ŷt b0 b1x1t b2 x 2t b3 x3t b0 b1t b2t 2 b3t 3 Observe que con este modelo se obtiene un pronóstico para una serie de tiempo que tiene características curvilíneas a lo largo del tiempo. En otros modelos de pronóstico basados en la regresión se emplea una mezcla de variables independientes económicas y demográficas. Por ejemplo, para pronosticar las ventas de refrigeradores, pueden emplearse las siguientes variables independientes.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 798
798
Capítulo 18
Pronóstico
x1t = precio en el periodo t x2t = ventas totales de la industria en el periodo t – 1 x3t = número de permisos de construcción para casas en el periodo t – 1 x4t = pronóstico poblacional para el periodo t x5t = presupuesto para publicidad en el periodo t
Spyros Makridakis, un destacado experto en pronósticos, mostró que las técnicas más sencillas son mejores que los procedimientos más complicados para pronósticos a corto plazo. El uso de procedimientos más caros y sofisticados no garantiza la obtención de un mejor pronóstico.
De acuerdo con el procedimiento usual de regresión múltiple, para obtener el pronóstico habrá que usar una ecuación estimada de regresión con cinco variables independientes. La obtención de un buen pronóstico mediante un método de regresión depende en gran parte de la capacidad para identificar y obtener los datos de variables independientes que estén estrechamente relacionadas con la serie de tiempo. Por lo general, al tratar de obtener una ecuación estimada de regresión se ponen a consideración diversos conjuntos de variables independientes. Por tanto, una parte del proceso del análisis de regresión debe ser la elección del conjunto de variables independientes con las que se obtenga el mejor modelo de pronóstico. En la introducción de este capítulo se dijo que en los modelos causales de pronóstico se usan series de tiempo relacionadas con la serie que se quiere pronosticar para tratar de explicar la causa del comportamiento de dicha serie. La herramienta más usada para obtener modelos causales es el análisis de regresión. La serie de tiempo relacionada es la variable independiente y la serie de tiempo que se quiere pronosticar es la variable dependiente. En otro tipo de modelo de pronóstico basado en la regresión, las variables independientes son todos los valores anteriores de la misma serie de tiempo. Por ejemplo, si los valores de la serie de tiempo se denotan Y1, Y2, ..., Yn, y la variable independiente es Yt, se trata de hallar una ecuación de regresión estimada que relacione Yt con los valores más recientes de la serie de tiempo Yt 1, Yt 2, etc. Si se emplean como variables independientes los tres periodos más recientes, la ecuación estimada de regresión será Ŷt b0 b1Yt 1 b2Yt 2 b3Yt 3 A los modelos de regresión que tienen variables independientes con los valores anteriores de la serie de tiempo se les conoce como modelos autorregresivos. Por último, en otro método de pronóstico basado en regresión se incorpora una mezcla de las variables independientes ya estudiadas. Por ejemplo, se puede usar una combinación de variables de tiempo, algunas variables económico-demográficas y algunos de los valores previos de las mismas series de tiempo.
18.6 Si no se cuenta con datos históricos, es necesario emplear técnicas cualitativas para obtener pronósticos. Pero el costo de emplear las técnicas cualitativas puede ser elevado por la cantidad de tiempo que se requiere invertir.
Métodos cualitativos En las secciones anteriores se vieron varios métodos cuantitativos para hacer pronósticos. En la mayor parte de estas técnicas se necesitan datos históricos sobre la variable de interés, de manera que estas técnicas no se pueden emplear cuando no se cuenta con datos históricos. Además de esto, aun cuando se cuente con datos históricos, un cambio significativo que afecte a la serie de tiempo puede hacer cuestionable el uso de datos del pasado para predecir valores futuros de la serie de tiempo. Por ejemplo, un programa de racionalización de la gasolina, impuesto por el gobierno, hará dudar de la validez de un pronóstico sobre las ventas de gasolina que se base en datos históricos. Las técnicas cualitativas de pronóstico ofrecen una alternativa en éstas y otras situaciones.
Método de Delphi Una de las técnicas cualitativas de pronóstico más usadas es el método de Delphi, elaborado por un grupo de investigadores de Rand Corporation. En este método se trata de obtener un pronóstico mediante un “consenso de grupo”. En su modo usual de aplicación, se le pide a un panel de
18Ander(765-811).qxd 2/29/08 11:46 AM Page 799
Resumen
799
expertos —que no se conocen entre sí y que se encuentran separados unos de otros— que respondan una serie de cuestionarios. Las respuestas del primer cuestionario se tabulan y se usan para elaborar un segundo cuestionario que contiene información y opiniones de todo el grupo. Después se le pide a cada uno de los participantes que reconsidere, y si es necesario, modifique su respuesta anterior a la luz de la información del grupo. Este proceso continúa hasta que el coordinador considere que se ha alcanzado cierto grado de consenso. El objetivo del método de Delphi no es dar como resultado una sola respuesta, sino una gama reducida de opiniones en las que coincidan la mayor parte de los expertos.
Opinión de un experto Las evidencias empíricas y los argumentos teóricos indican que en pronósticos obtenidos mediante la opinión de un experto deben intervenir entre 5 y 20 expertos. Sin embargo, en situaciones en las que interviene el crecimiento exponencial, los pronósticos obtenidos mediante la opinión de un experto pueden no ser apropiados.
Los pronósticos cualitativos suelen estar basados en la opinión de un solo experto o representar el consenso de un grupo de expertos. Por ejemplo, cada año un grupo de expertos de Merril Lynch se reúnen para pronosticar el promedio industrial Dow Jones y su tipo de interés preferencial para el año siguiente. Para esto, cada uno de los expertos analiza información que considera con influencia sobre el mercado de acciones y sobre las tasas de interés; después combinan sus informaciones en un pronóstico. No se emplea ningún modelo formal y es poco probable que dos expertos analicen la misma información de la misma manera. La opinión de los expertos es un método de pronóstico que suele recomendarse cuando es poco probable que las condiciones del pasado se presenten en el futuro. Aun cuando no se usa ningún modelo cuantitativo formal, este método ha dado buenos pronósticos en muchas situaciones.
Escenarios futuros El método cualitativo conocido como escenarios futuros consiste en elaborar un escenario conceptual del futuro con base en un conjunto bien definido de suposiciones. Distintos conjuntos de suposiciones llevan a diferentes escenarios. La persona que debe tomar las decisiones tiene que decidir cuán probable es cada escenario y tomar las decisiones de acuerdo con ese escenario.
Métodos intuitivos Los métodos subjetivos o cualitativos intuitivos se basan en que la mente humana tiene la capacidad de procesar una gran cantidad de información que, en la mayoría de los casos, sería difícil de cuantificar. Estas técnicas suelen usarse en trabajos de grupo, en donde un comité o panel trata de desarrollar ideas nuevas o de resolver problemas complejos a través de una “sesión de lluvia de ideas”. En estas sesiones las personas son liberadas de las usuales restricciones o presiones de grupo y de las críticas, ya que pueden exponer cualquier idea u opinión sin importar su relevancia y, lo que es más importante, sin miedo a la crítica.
Resumen En este capítulo se presentó una introducción a los métodos básicos de análisis de series de tiempo y de pronóstico. Primero se indicó que para explicar el comportamiento de una serie de tiempo, es útil entenderla como formada por cuatro componentes: un componente de tendencia, un componente estacional, un componente cíclico y un componente irregular. Al aislar estos componentes y medir su efecto, es posible pronosticar valores futuros de la serie de tiempo. Se vio cómo emplear los métodos de suavizamiento para pronosticar una serie de tiempo que no presente efectos significativos de tendencia, estacionales o cíclicos. El método de los promedios móviles consiste en calcular un promedio de los valores de los datos del pasado y después usar ese promedio como pronóstico para el periodo siguiente. El método de suavizamiento exponencial, usa un promedio ponderado de los valores pasados de la serie de tiempo para calcular un pronóstico. Se mostró cómo usar el análisis de regresión para hacer proyecciones de tendencia cuando la serie de tiempo únicamente muestra una tendencia a largo plazo. Cuando una serie de tiempo tiene tanto una influencia de tendencia como una influencia estacional significativas, se mostró cómo aislar los efectos de estos dos factores para obtener mejores pronósticos. Por último, se
18Ander(765-811).qxd 2/29/08 11:46 AM Page 800
800
Capítulo 18
Pronóstico
describió el análisis de regresión como un procedimiento para obtener modelos causales de pronóstico. Un modelo causal de pronóstico es un modelo que relaciona los valores de la serie de tiempo (variable dependiente) con otras variables independientes que se cree explican (causan) el comportamiento de la serie de tiempo. Los modelos cualitativos de pronóstico se trataron como modelos útiles cuando no se cuenta con datos históricos o cuando se cuenta con pocos datos históricos. Estos métodos también se usan cuando se espera que el patrón pasado de la serie de tiempo no sea el mismo en el futuro.
Glosario Serie de tiempo Conjunto de observaciones correspondientes a los valores de una variable, medidas en puntos sucesivos a lo largo del tiempo o durante periodos sucesivos de tiempo. Pronóstico Es la predicción de los valores futuros de una serie de tiempo. Tendencia Desplazamiento o movimiento de la serie de tiempo a largo plazo, observable a través de varios periodos. Componente cíclico El componente de una serie de tiempo que hace que ésta muestre un comportamiento que consiste en tendencias periódicas de aumento y disminución, tendencias que tienen una duración de más de un año. Componente estacional El componente de una serie de tiempo que muestra que en ella existe un patrón periódico que dura un año o menos. Componente irregular El componente de una serie de tiempo que corresponde a las variaciones aleatorias que se observan en los valores de la misma, variaciones que no son explicadas por los componentes de tendencia, cíclicos o estacionales. Promedios móviles Método para obtener pronósticos o para suavizar una serie de tiempo, en el que como pronóstico para cada periodo siguiente se usa el promedio de los valores de los n datos más recientes de la serie de tiempo. Cuadrado medio debido al error (CME) Es una medida de la exactitud que se obtiene con un método de pronóstico. Esta medida es el promedio de la suma de los cuadrados de las diferencias entre los valores pronosticados para la serie de tiempo y sus valores reales. Promedios móviles ponderados Método que se emplea para obtener pronósticos o para suavizar una serie de tiempo mediante un promedio ponderado de los valores de datos pasados. La suma de los pesos empleados debe ser uno. Suavizamiento exponencial Técnica de pronóstico en la que se emplea un promedio ponderado de valores pasados de la serie de tiempo. Constante de suavizamiento Es el parámetro que se emplea en el modelo de suavizamiento exponencial como peso para el valor más reciente de la serie de tiempo. Modelo multiplicativo para series de tiempo Modelo en el que se multiplican los diversos componentes de una serie de tiempo para obtener así el valor real de la serie de tiempo. Cuando los cuatro componentes, de tendencia, cíclico, estacional e irregular están presentes, se obtiene Yt Tt Ct St It . Cuando el componente cíclico no está modelado se obtiene Yt Tt St It. Serie de tiempo desestacionalizada Serie de tiempo de la que se ha eliminado el efecto estacional. Esto se hace al dividir cada observación de la serie de tiempo original entre su correspondiente índice estacional. Métodos causales de pronóstico Métodos para obtener pronósticos en los que una serie de tiempo se relaciona con otras variables que se considera explican o causan el comportamiento de la serie de tiempo. Modelo autorregresivo Modelo para predecir valores futuros de una serie de tiempo en el que se usa una relación de regresión con base en valores pasados de la serie de tiempo. Método de Delphi Método cualitativo de pronóstico en el que los pronósticos se obtienen mediante consensos de grupo. Escenarios futuros Método cualitativo de pronóstico que consiste en desarrollar un escenario conceptual futuro a partir de un conjunto bien definido de suposiciones.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 801
801
Ejercicios complementarios
Fórmulas clave Promedio móvil Promedio móvil
兺(de los valores de los n datos más recientes) n
(18.1)
Modelo de suavizamiento exponencial Ft 1 αYt (1 α)Ft
(18.2)
Tt b0 b1t
(18.5)
Ecuación de tendencia lineal
Modelo multiplicativo para series de tiempo con los componentes de tendencia, estacional e irregular Yt Tt St It
(18.9)
Modelo multiplicativo para series de tiempo con los componentes de tendencia, cíclico, estacional e irregular Yt Tt Ct St It
(18.10)
Ejercicios complementarios 27. Los promedios móviles suelen usarse para identificar movimientos en los precios de las acciones (en dólares por acción). A continuación se presentan los precios de cierre de IBM desde el 24 de agosto de 2004 hasta 16 de agosto de 2005 (Compustat, 26 de febrero de 2006).
Día 24 de agosto 25 de agosto 26 de agosto 29 de agosto 30 de agosto 31 de agosto 1 de septiembre 2 de septiembre 6 de septiembre
archivo CD en IBM
a. b.
c.
Precio ($) 81.32 81.10 80.38 81.34 80.54 80.62 79.54 79.46 81.02
Día 7 de septiembre 8 de septiembre 9 de septiembre 12 de septiembre 13 de septiembre 14 de septiembre 15 de septiembre 16 de septiembre
Precio ($) 80.98 80.80 81.44 81.48 80.75 80.48 80.01 80.33
Use un promedio móvil de tres días para suavizar la serie de tiempo. Pronostique el precio de cierre del 19 de septiembre del 2005 (que es el siguiente día de operaciones). Emplee el suavizamiento exponencial con α = 0.6 como constante de suavizamiento para suavizar la serie de tiempo. Pronostique el precio de cierre del 19 de septiembre del 2005 (que es el siguiente día de operaciones). ¿Cuál de los dos métodos prefiere? ¿Por qué?
18Ander(765-811).qxd 2/29/08 11:46 AM Page 802
802
Capítulo 18
Pronóstico
28. En el 2005 los ingresos que obtuvo Xerox Corporation por sus productos y servicios de color fueron de $4.6 mil millones, 30% del total de sus ingresos. En la tabla siguiente se presentan las variaciones porcentuales trimestrales a lo largo de 12 trimestres (Democrat and Chronicle, 5 de marzo de 2006).
Año
Trimestre
Crecimiento (%)
2003
1 2 3 4 1 2 3 4 1 2 3 4
15 19 15 20 26 17 18 21 15 17 22 17
2004
2005
a. b.
Use el suavizamiento exponencial para pronosticar la serie de tiempo. Emplee las constantes de suavizamiento α 0.1, α 0.2, α 0.3. ¿Con cuál de estos valores de suavizamiento se obtiene un mejor pronóstico?
29. En la tabla siguiente se presentan los porcentajes de acciones en un portafolio estándar a lo largo de nueve trimestres que van desde el 2005 hasta el 2007.
Trimestre
Acciones (%)
1-2005 2-2005 3-2005 4-2005 1-2006 2-2006 3-2006 4-2006 1-2007
a.
b.
29.8 31.0 29.9 30.1 32.2 31.5 32.0 31.9 30.0
Emplee el suavizamiento exponencial para esta serie de tiempo. Utilice las constantes de suavizamiento α 0.2, α 0.3 y α 0.4. ¿Con cuál de estos valores de la constante de suavizamiento se obtiene un mejor pronóstico? Pronostique, para el segundo trimestre de 2007, el porcentaje de acciones en un portafolio estándar.
30. Una cadena de tiendas de abarrotes registró la demanda semanal (en cajas) de un determinado detergente para trastos. Estos datos se presentan en la tabla siguiente. Emplee el suavizamiento exponencial con α = 0.2 y obtenga un pronóstico para la semana 11.
Semana 1 2 3 4 5
Demanda
Semana
Demanda
22 18 23 21 17
6 7 8 9 10
24 20 19 18 21
18Ander(765-811).qxd 2/29/08 11:46 AM Page 803
803
Ejercicios complementarios
31. United Dairies, Inc., es el proveedor de leche de varias empresas de abarrotes en el condado Dade de Florida. Los gerentes de United Dairies desean contar con un pronóstico del número de medios galones de leche que se venden por semana. A continuación se presentan los datos de las ventas en las últimas 12 semanas. Semana
Ventas
Semana
Ventas
1 2 3 4 5 6
2750 3100 3250 2800 2900 3050
7 8 9 10 11 12
3300 3100 2950 3000 3200 3150
Use el suavizamiento exponencial con α 0.4 para obtener un pronóstico de demanda para la semana 13. 32. El grupo Garden Avenue Seven vende discos compactos de sus presentaciones. En la tabla siguiente se presentan las ventas (en unidades) en los últimos 18 meses. El administrador del grupo desea contar con un método exacto para pronosticar las ventas.
archivo CD en CDSales
a. b. c.
Mes
Ventas
Mes
Ventas
Mes
Ventas
1 2 3 4 5 6
293 283 322 355 346 379
7 8 9 10 11 12
381 431 424 433 470 481
13 14 15 16 17 18
549 544 601 587 644 660
Emplee el suavizamiento exponencial con α 0.3, 0.4, y 0.5. ¿Con cuál de estos valores de α obtiene mejores pronósticos? Haga un pronóstico mediante la proyección de tendencia. Dé el valor del CME. ¿Qué método de pronóstico le recomendaría usted al administrador? ¿Por qué?
33. La tienda departamental Mayfair, que se encuentra en Davenport, Iowa (Estados Unidos), necesita determinar la pérdida de ventas que tuvo durante los meses de julio y agosto, en los que tuvo que cerrar a causa de los daños sufridos por el desbordamiento del río Mississippi. A continuación se presentan los datos de las ventas desde enero hasta junio. Mes Enero Febrero Marzo
a.
b. c.
Ventas ($ miles)
Mes
Ventas ($ miles)
185.72 167.84 205.11
Abril Mayo Junio
210.36 255.57 261.19
Emplee el suavizamiento exponencial con α = 0.4 y obtenga un pronóstico para julio y agosto. (Sugerencia: para obtener el pronóstico para agosto, emplee el pronóstico para julio como ventas reales de julio.) Dé un comentario sobre el uso del suavizamiento exponencial para pronosticar más de un periodo futuro. Use la proyección de tendencia para pronosticar las ventas en julio y agosto. La aseguradora de Mayfair propuso una liquidación de $240 000 por la pérdida de las ventas de julio y agosto. ¿Es una cantidad justa? Si no es así, ¿qué cantidad recomendaría usted como contraoferta?
34. Canton Supplies, Inc., es una empresa de servicios que emplea a 100 individuos, aproximadamente. A los gerentes de la empresa les preocupa el cumplimiento de sus obligaciones en efecti-
18Ander(765-811).qxd 2/29/08 11:46 AM Page 804
804
Capítulo 18
Pronóstico
vo por lo que desean obtener un pronóstico de los requerimientos mensuales de efectivo. Debido a un cambio reciente en la política de operación, únicamente se consideran relevantes los últimos siete meses. A partir de la proyección de tendencia y los datos históricos siguientes, pronostique los requerimientos de efectivo en los dos próximos meses. Mes Efectivo requerido ($ miles)
1
2
3
4
5
6
7
205
212
218
224
230
240
246
35. A continuación se presentan los saldos mínimos promedio en cuentas de cheques que pagan intereses para evitar tener que pagar cargos; éstos fueron los saldos mínimos vigentes desde el año 2000 hasta el año 2006 (USA Today, 6 de diciembre de 2005).
archivo CD en AcctBal
a. b. c.
Fecha
Saldo ($)
Primavera 2000 Otoño 2000 Primavera 2001 Otoño 2001 Primavera 2002 Otoño 2002 Primavera 2003 Otoño 2003 Primavera 2004 Otoño 2004 Primavera 2005 Otoño 2005
1 522.41 1 659.63 1 678.34 1 707.55 1 767.36 1 866.17 2 015.04 2 257.82 2 425.83 2 086.93 2 295.85 2 294.61
Grafique esta serie de tiempo. ¿Parece haber una tendencia lineal? Obtenga la ecuación de tendencia lineal para esta serie de tiempo. Utilice la ecuación de tendencia para pronosticar el saldo promedio mínimo para evitar pagar recargos en la primavera de 2006.
36. La empresa Costello Music tiene cinco años de existencia. En este lapso las ventas de pianos aumentaron de 12 pianos en el primer año a 76 pianos en el último año. Fred Costello, el dueño de la empresa, desea pronosticar la venta de pianos del año próximo. A continuación se presentan los datos históricos.
a. b.
Año
1
2
3
4
5
Ventas
12
28
34
50
76
Grafique esta serie de tiempo. ¿Parece seguir una tendencia lineal? Obtenga la ecuación para el componente de tendencia de esta serie de tiempo. ¿Cuál es el crecimiento anual promedio que ha tendido la empresa?
37. Durante los últimos siete años, la empresa Hudson Marine ha sido distribuidor autorizado de los radios náuticos de C&D. En la tabla siguiente se da el número de radios vendidos por año por esa empresa.
a. b. c.
Año
1
2
3
4
5
6
7
Número vendido
35
50
75
90
105
110
130
Trace la gráfica de esta serie de tiempo. Obtenga la ecuación de tendencia lineal de esta serie de tiempo. A partir de la ecuación de tendencia lineal obtenida en el inciso b pronostique las ventas anuales del año 8.
38. La League of American Theatres and Producers, Inc., recaba diversos datos estadísticos sobre los espectáculos que se presentan en Broadway, como ingreso bruto, tiempo que se mantiene el es-
18Ander(765-811).qxd 2/29/08 11:46 AM Page 805
805
Ejercicios complementarios
pectáculo en escena y número de producciones nuevas. En la tabla siguiente se presenta la audiencia, por temporada (en millones), en los espectáculos de Broadway desde 1990 hasta 2001 (The World Almanac, 2002).
a. b. c. d.
Temporada
Audiencia (en millones)
1990 -1991 1991-1992 1992-1993 1993-1994 1994-1995 1995-1996
7.3 7.4 7.9 8.1 9.0 9.5
Temporada
Audiencia (en millones)
1996-1997 1997-1998 1998-1999 1999-2000 2000-2001
10.6 11.5 11.7 11.4 11.9
Trace la gráfica de esta serie de tiempo y diga si es adecuado considerar que hay una tendencia lineal. Dé la ecuación para el componente de tendencia lineal de esta serie de tiempo. En esta serie de tiempo, ¿cuál es el incremento promedio, por temporada, que hay en la audiencia? Emplee la ecuación de tendencia para pronosticar la audiencia en la temporada 2001- 2002.
39. En los últimos 25 años, la United States Golg Association (USGA) ha probado miles de pelotas de golf para ver si satisfacen los requerimientos de distancia. En la tabla siguiente se presenta el número de pelotas de golf probadas anualmente por la USGA desde 1992 hasta 2002 (Golf Journal, octubre de 2002). Año
Número
Año
Número
1992 1993 1994 1995 1996
465 602 646 755 807
1997 1998 1999 2000 2001
919 916 861 834 821
Grafique esta serie de tiempo y haga un comentario si observa una tendencia lineal. ¿Qué tipo de función cree usted que sería la más adecuada para el patrón de tendencia que se observa en esta serie? 40. Regrese al ejercicio 37 sobre la empresa Hudson Marine. Suponga que las ventas trimestrales en los siete años de datos históricos son las siguientes.
Año
Trimestre 1
Trimestre 2
Trimestre 3
Trimestre 4
Total de ventas anuales
1 2 3 4 5 6 7
6 10 14 19 22 24 28
15 18 26 28 34 36 40
10 15 23 25 28 30 35
4 7 12 18 21 20 27
35 50 75 90 105 110 130
a. b. c.
Para esta serie dé los promedios móviles de cuatro trimestres. En una misma gráfica, trace tanto la serie de tiempo original como la serie de promedios móviles. Calcule el índice estacional de los cuatro trimestres. ¿Cuándo la empresa Hudson Marine experimenta el mayor efecto estacional? ¿Es razonable? Explique.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 806
806
Capítulo 18
Pronóstico
41. Vuelva al ejercicio 36 que trata de la empresa Costello Music. A continuación se presentan los datos de las ventas trimestrales.
Año
Trimestre 1
Trimestre 2
Trimestre 3
Trimestre 4
Ventas anuales totales
1 2 3 4 5
4 6 10 12 18
2 4 3 9 10
1 4 5 7 13
5 14 16 22 35
12 28 34 50 76
a. Calcule los índices estacionales de los cuatro trimestres. b. ¿Cuándo experimenta el mayor efecto estacional? ¿Es razonable? Explique. 42. Vuelva a los datos de la empresa Hudson Marine presentados en el ejercicio 40. a. Desestacionalice los datos y emplee la serie de tiempo desestacionalizada para determinar la tendencia. b. Emplee los resultados del inciso a para obtener un pronóstico trimestral para el año próximo a partir de la tendencia. c. Emplee los índices estacionales obtenidos en el ejercicio 40 para ajustar los pronósticos obtenidos en el inciso b de acuerdo con los efectos estacionales. 43. Regrese al ejercicio 41 sobre la empresa Costello Music. a. Desestacionalice los datos y emplee la serie de tiempo desestacionalizada para determinar la tendencia. b. Con los resultados del inciso a obtenga un pronóstico trimestral para el año próximo con base en la tendencia. c. Emplee los índices estacionales obtenidos en el ejercicio 41 para ajustar los pronósticos obtenidos en el inciso b de acuerdo con los efectos estacionales.
Caso problema 1
Pronóstico para las ventas de alimentos y bebidas El restaurante Vintage, en la Isla Captiva, cerca de Fort Myers, Florida, es operado por su dueña Karen Payne. Este restaurante acaba de cumplir tres años de funcionamiento. Durante este tiempo, Karen ha tratado de que el restaurante se dé a conocer como un establecimiento de alta calidad, especializado en mariscos frescos. Gracias al esfuerzo de Karen y su equipo, este restaurante se ha convertido en uno de los restaurantes mejores y de mayor crecimiento de la isla. Karen considera que para planear el crecimiento del restaurante en el futuro, necesita elaborar un sistema que le permita pronosticar las ventas mensuales de alimentos y bebidas con hasta un año de anticipación. Karen ha reunido los datos siguientes sobre las ventas totales de alimentos y bebidas (dados en miles de dólares) durante estos tres años de funcionamiento. Mes
archivo CD en Vintage
Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
Primer año
Segundo año
Tercer año
242 235 232 178 184 140 145 152 110 130 152 206
263 238 247 193 193 149 157 161 122 130 167 230
282 255 265 205 210 160 166 174 126 148 173 235
18Ander(765-811).qxd 2/29/08 11:46 AM Page 807
Caso problema 2
807
Pronóstico de pérdidas de ventas
Informe administrativo Analice estos datos del restaurante Vintage. Redacte un informe para Karen en el que resuma sus hallazgos, pronósticos y sugerencias. El informe debe contener: 1. Una gráfica de la serie de tiempo. 2. El análisis de la estacionalidad de los datos. Indique el índice estacional para cada mes y comente sobre las ventas mensuales en las estaciones baja y alta. 3. Un pronóstico de ventas, de enero a diciembre, para el cuarto año. 4. Una sugerencia de cuándo deben actualizarse los datos de manera que se tomen en cuenta los nuevos datos de las ventas. 5. En un apéndice muestre todos los detalles de los cálculos. Suponga que en enero del cuarto año las ventas resultan ser de $295 000. ¿De cuánto fue su error de pronóstico? Si este error es grande, a Karen le desconcertará esta diferencia entre su pronóstico y las ventas reales. ¿Qué puede hacer para despejar sus dudas sobre el procedimiento de pronóstico?
Caso problema 2
Pronóstico de pérdidas de ventas La tienda de departamentos Carlson sufrió severos daños con la llegada del huracán del 31 de agosto de 2006. La tienda tuvo que permanecer cerrada cuatro meses (desde septiembre de 2006 hasta diciembre de 2006) y ahora se encuentra inmersa en una disputa, con su aseguradora, sobre el monto de las ventas perdidas durante el tiempo que permaneció cerrada. Los dos puntos más importantes a resolver son: 1) el monto de las ventas que hubiera hecho Carlson si no hubiera ocurrido el huracán y 2) si Carlson debe recibir una compensación por las ventas extra debidas al aumento de la actividad comercial después del huracán. El condado recibió más de 8 mil millones de dólares en ayuda federal para desastres y por el pago de seguros, lo que produjo un aumento de las ventas en tiendas departamentales y en muchos otros negocios. En la tabla 18.13 se presentan los datos de las ventas de Carlson en los 48 meses antes del huracán. En la tabla 18.14 aparece el total de ventas en todas las tiendas departamentales en los 48 meses antes del huracán, así como el total de ventas en el condado en los cuatro meses en que estuvo cerrada la tienda departamental Carlson. Los gerentes de Carlson le piden a usted que analice estos datos y obtenga una estimación de la pérdida en ventas que sufrió Carlson en los cuatro meses que estuvo cerrada, de septiembre a diciembre de 2006. También le piden que determine TABLA 18.13
Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
VENTAS DE LA TIENDA DEPARTAMENTAL CARLSON DESDE SEPTIEMBRE DE 2002 HASTA AGOSTO DE 2006 ($ MILLONES) 2002
2003
2004
2005
2006
2.31 1.89 2.02 2.23 2.39 2.14 2.27 2.21 1.89 2.29 2.83 4.04
2.31 1.99 2.42 2.45 2.57 2.42 2.40 2.50 2.09 2.54 2.97 4.35
2.56 2.28 2.69 2.48 2.73 2.37 2.31 2.23
1.71 1.90 2.74 4.20
1.45 1.80 2.03 1.99 2.32 2.20 2.13 2.43 1.90 2.13 2.56 4.16
18Ander(765-811).qxd 2/29/08 11:46 AM Page 808
808
Capítulo 18
TABLA 18.14
Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
Pronóstico
VENTAS EN LAS TIENDAS DEPARTAMENTALES DEL CONDADO, DESDE SEPTIEMBRE DE 2002 HASTA DICIEMBRE DE 2006 ($ MILLONES) 2002
2003
2004
2005
2006
55.8 56.4 71.4 117.6
46.8 48.0 60.0 57.6 61.8 58.2 56.4 63.0 57.6 53.4 71.4 114.0
46.8 48.6 59.4 58.2 60.6 55.2 51.0 58.8 49.8 54.6 65.4 102.0
43.8 45.6 57.6 53.4 56.4 52.8 54.0 60.6 47.4 54.6 67.8 100.2
48.0 51.6 57.6 58.2 60.0 57.0 57.6 61.8 69.0 75.0 85.2 121.8
si se puede solicitar un pago por las ventas extras relacionadas con el huracán. Si se puede solicitar este pago, Carlson debe recibir una compensación por lo que hubiera ganado por las ventas extras además de sus ventas normales.
Informe administrativo Redacte un informe para los directivos de la tienda departamental Carlson, en el que resuma sus hallazgos, sus pronósticos y sus sugerencias. El informe debe contener: 1. Una estimación de las ventas que se hubieran hecho de no haber habido huracán. 2. Una estimación de las ventas en las tiendas de departamentos de todo el condado si no se hubiera presentado el huracán. 3. Una estimación de la pérdida en ventas que sufrió la tienda departamental Carlson desde septiembre hasta diciembre de 2006. Además, use las ventas reales en las tiendas departamentales de todo el condado, de septiembre a diciembre de 2006, y la estimación de la parte 2 para solicitar una indemnización por las ventas extra relacionadas con el huracán.
Apéndice 18.1
Pronósticos con Minitab En este apéndice se muestra el uso de Minitab para hacer pronósticos con tres métodos de pronóstico: promedios móviles, suavizamiento exponencial y proyección de tendencia.
Promedios móviles
archivo CD en Gasoline
Para mostrar cómo usar Minitab para obtener pronósticos mediante el método de promedios móviles se emplearán los datos presentados en la tabla 18.1 y en la figura 18.5 de la serie de tiempo de las ventas de gasolina. Los datos de las ventas de gasolina en las 12 semanas se ingresan en la columna 2 de la hoja de cálculo. Para obtener un pronóstico para la semana 13, para promedios móviles de tres semanas, se siguen los pasos que se presentan a continuación. Paso 1. Seleccionar el menú Stat Paso 2. Elegir Time Series Paso 3. Elegir Moving Average
18Ander(765-811).qxd 2/29/08 11:46 AM Page 809
Apéndice 18.1
Pronósticos con Minitab
809
Paso 4. Cuando aparezca el cuadro de diálogo Moving Average: Ingresar C2 en el cuadro Variable Ingresar 3 en el cuadro MA length Seleccionar Generate forecasts Ingresar 1 en el cuadro Number of forecasts Ingresar 12 en el cuadro Starting from origin Clic en OK En la ventana de la sesión aparecerá el pronóstico para la semana 13 obtenido mediante promedios móviles de tres semanas. En los resultados de Minitab, el cuadrado medio debido al error, que es 10.22 aparece junto al rótulo MSD. Minitab cuenta con otras muchas opciones para dar los resultados, como dar una tabla resumen similar a la tabla 18.2 o una gráfica similar a la de la figura 18.6.
Suavizamiento exponencial
archivo CD en Gasoline
Para mostrar cómo usar Minitab para obtener pronósticos mediante el método de suavizamiento exponencial se emplearán nuevamente los datos presentados en la tabla 18.1 y en la figura 18.5 de la serie de tiempo de las ventas de gasolina. Los datos de las ventas de gasolina, en las 12 semanas, se ingresan en la columna 2 de la hoja de cálculo. Para obtener un pronóstico para la semana 13, usando como constante de suavizamiento α 0.2, se siguen los pasos que se presentan a continuación. Paso 1. Paso 2. Paso 3. Paso 4.
Seleccionar el menú Stat Elegir Time Series Elegir Single Exp Smoothing Cuando aparezca el cuadro de diálogo Single Exp Smoothing: Ingresar C2 en el cuadro Variable Seleccionar la opción Use como Weight to Use in Smoothing Ingresar 0.2 en el cuadro Use Seleccionar Generate forecasts Ingresar 1 en el cuadro Number of forecasts Ingresar 12 en el cuadro Starting from origin Seleccionar Options Paso 5. Cuando aparezca el cuadro de diálogo Single Exp Smoothing – Options: Ingresar 1 en el cuadro Use average of first Clic en OK Paso 6. Cuando aparezca el cuadro de diálogo Single Exp Smoothing: Clic en OK
En la ventana de la sesión aparecerá el pronóstico para la semana 13 obtenido mediante suavizamiento exponencial. En los resultados de Minitab, el cuadrado medio del error aparece junto al rótulo MSD.* Minitab cuenta con otras muchas opciones para presentar los resultados, como dar una tabla resumen similar a la tabla 18.3 o una gráfica similar a la figura 18.7.
Proyección de tendencia
archivo CD en Bicycle
Para mostrar cómo usar Minitab para obtener pronósticos mediante la proyección de tendencia se emplearán los datos, presentados en la tabla 18.6 y en la figura 18.8, correspondientes a la serie de tiempo de las ventas de bicicletas. En la columna C1 se ingresa el número de años y en C2 los datos de las ventas. Para obtener un pronóstico para el año 11, emplee la proyección de tendencia, se siguen los pasos que se presentan a continuación.
*El valor MSD que da Minitab no es el mismo que el valor CME que parece en la tabla 18.4. Minitab usa el 17 como pronóstico para la semana 1, así que, para calcular el valor de MSD usa los datos de los 12 periodos de tiempo. En cambio, en la sección 18.2 el valor del CME se calculó empleando únicamente los datos desde las semanas 2 hasta 12, debido a que no se contaba con un valor pasado con el cual obtener un pronóstico para la semana 1.
18Ander(765-811).qxd 2/29/08 11:46 AM Page 810
810
Capítulo 18
Paso 1. Paso 2. Paso 3. Paso 4.
Pronóstico
Seleccionar el menú Stat Elegir Time Series Elegir Trend Analysis Cuando aparezca el cuadro de diálogo Trend Analysis: Ingresar C2 en el cuadro Variable Elegir Linear como Model Type Seleccionar Generate forecasts Ingresar 1 en el cuadro Number of forecasts Ingresar 10 en el cuadro Starting from origin Clic en OK
En la ventana de la sesión aparecerá la ecuación de tendencia lineal y el pronóstico para el periodo siguiente.
Apéndice 18.2
Pronósticos con Excel En este apéndice se muestra el uso de Excel para hacer pronósticos empleando tres métodos de pronóstico: promedios móviles, suavizamiento exponencial y proyección de tendencia.
Promedios móviles
archivo CD en Gasoline
Para mostrar cómo usar Excel para obtener pronósticos mediante el método de promedios móviles se emplearán los datos presentados en la tabla 18.1 y en la figura 18.5 pertenecientes a la serie de tiempo de las ventas de gasolina. Los datos de las ventas de gasolina en las 12 semanas se ingresan en los renglones 2 a 13 de la columna B de la hoja de cálculo. Para obtener un promedio móvil de tres semanas, se siguen los pasos que se presentan a continuación. Paso 1. Seleccionar el menú Herramientas Paso 2. Elegir Análisis de datos Paso 3. Elegir Media móvil en la lista Funciones para análisis Clic en Aceptar Paso 4. Cuando aparezca el cuadro de diálogo Media móvil: Ingresar B2:B13 en el cuadro Rango de entrada Ingresar 3 en el cuadro Intervalo Ingresar C2 en el cuadro Rango de salida Clic en Aceptar En la columna B de la hoja de cálculo aparecerán los pronósticos obtenidos mediante promedios móviles de tres semanas. También se pueden obtener pronósticos para periodos de una longitud distinta ingresando otro valor en el cuadro Intervalo.
Suavizamiento exponencial
archivo CD en Gasoline
Para mostrar cómo usar Excel para obtener pronósticos mediante el método de suavizamiento exponencial se emplearán nuevamente los datos presentados en la tabla 18.1 y en la figura 18.5 de la serie de tiempo de las ventas de gasolina. Los datos de las ventas de gasolina en las 12 semanas se ingresan en los renglones 2 a 13 de la columna B de la hoja de cálculo. Para obtener un pronóstico con la constante de suavizamiento α 0.2, se siguen los pasos que se presentan a continuación. Paso 1. Seleccionar el menú Herramientas Paso 2. Elegir Análisis de datos Paso 3. Elegir Suavizamiento exponencial en la lista Funciones para análisis Clic en Aceptar Paso 4. Cuando aparezca el cuadro de diálogo Suavizamiento exponencial: Ingresar B2:B13 en el cuadro Rango de entrada Ingresar 0.8 en el cuadro Factor de suavizamiento Ingresar C2 en el cuadro Rango de salida Clic en Aceptar
18Ander(765-811).qxd 2/29/08 11:46 AM Page 811
Apéndice 18.2
Pronósticos con Excel
811
En la ventana de la sesión aparecerán los pronósticos obtenidos mediante suavizamiento exponencial. Observe que el valor ingresado como Factor de suavizamiento es 1 α; para obtener pronósticos con otras constantes de suavizamiento es necesario ingresar un valor diferente para 1 α en el cuadro para el Factor de suavizamiento.
Proyección de tendencia
archivo CD en Bicycle
Para mostrar cómo usar Excel para la proyección de tendencia se emplearán los datos, presentados en la tabla 18.6 y en la figura 18.8, correspondientes a la serie de tiempo de las ventas de bicicletas. Los datos, con sus correspondientes rótulos en el renglón 1, se ingresan en los renglones 1 a 11 de las columnas A y B. Para obtener un pronóstico para el año 11 con la proyección de tendencia se siguen los pasos que se presentan a continuación. Paso 1. Paso 2. Paso 3. Paso 4.
Seleccionar cualquier celda vacía de la hoja de cálculo Seleccionar el menú Insertar Elegir Función Cuando aparezca el cuadro de diálogo Pegar función Elegir Estadísticas del cuadro Categoría de la función Elegir Pronóstico, del cuadro Nombre de la función Clic en OK Paso 5. Cuando aparezca el cuadro de diálogo Pronóstico Ingresar 11 en el cuadro x Ingresar B2:B11 en el cuadro Conocido_y Ingresar A2:A11 en el cuadro Conocido_x Clic en OK El pronóstico para el año 11, en este caso, 32.5, aparecerá en la celda elegida en el paso 1.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 812
CAPÍTULO
19
Métodos no paramétricos CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: WEST SHELL REALTORS 19.1 PRUEBA DE LOS SIGNOS Caso de muestras pequeñas Caso de muestras grandes Prueba de hipótesis acerca de la mediana 19.2 PRUEBA DE LOS RANGOS CON SIGNO DE WILCOXON
19.3 PRUEBA DE MANNWHITNEY-WILCOXON Caso de muestras pequeñas Caso de muestras grandes 19.4 PRUEBA DE KRUSKAL-WALLIS 19.5 CORRELACIÓN DE RANGOS Prueba de significancia de la correlación de rangos
19Ander(812-845).qxd 2/29/08 12:08 PM Page 813
813
La estadística en la práctica
LA ESTADÍSTICA
en LA PRÁCTICA
WEST SHELL REALTORS* CINCINNATI, OHIO
La empresa West Shell Realtors fue fundada en 1958 y en ese entonces contaba con una oficina y un equipo de ventas formado por tres personas. En 1964 inició un programa de expansión a largo plazo durante el cual, casi anualmente, abrió nuevas oficinas. Con el tiempo, West Shell creció hasta convertirse en la mayor empresa inmobiliaria de Greater Cincinnati y ahora cuenta con oficinas en el suroeste de Ohio, en el sureste de Indiana y en el norte de Kentucky. A las empresas de bienes raíces, como West Shell, el análisis estadístico les sirve para monitorear el curso de sus ventas. Cada mes se presenta un informe de cada una de las oficinas de West Shell, así como del total de la empresa. Resumen estadístico sobre la cantidad total de dólares en ventas, número de unidades vendidas y precio mediano de venta por unidad son esenciales para mantener informados, tanto a los gerentes de las distintas oficinas, como a los gerentes generales sobre el progreso y los problemas de la organización. Además de los resúmenes mensuales sobre el curso de las operaciones, la empresa emplea diversas consideraciones estadísticas como guía para sus planes y estrategias. West Shell ha implementado una estrategia de expansión planeada. Cada vez que, debido a este plan de expansión, se quiere abrir una nueva oficina de ventas, la empresa tiene que decidir dónde abrir la nueva oficina. El tipo de datos usados para evaluar y comparar las distintas alternativas para la ubicación de una nueva oficina son los precios de venta de las casas, las tasas de facturación y los volúmenes de ventas pronosticados. Con el fin de identificar si existía alguna diferencia entre los patrones de ventas de estas dos áreas, West Shell se valió de métodos estadísticos no paramétricos. En una ocasión West Shell tenía dos zonas posibles para abrir una nueva oficina; Clifton y Roselawn. Al com* Los autores agradecen a Rodney Fightmaster de West Shell Realtors por proporcionar este artículo para La estadística en la práctica.
Para mantener su competitividad, West Shell realiza análisis estadísticos de los precios de las casas. © Cortesía de Coldwell Banker West Shell.
parar las dos zonas se tomaron en consideración diversos factores, entre ellos, los precios de venta de las casas. A partir de muestras de 25 ventas en Clifton y 18 ventas en Roselawn se eligió la prueba de la suma de los rangos de Mann-Whitney Wilcoxon como la prueba estadística adecuada para las diferencias entre los patrones de ventas. Con un nivel de significancia de 0.05, la prueba de MannWhitney-Wilcoxon no permitió rechazar la hipótesis nula de que las dos poblaciones de precios de venta fueran idénticas. Por tanto, West Shell tuvo que buscar otros criterios, distintos a los precios de venta de las casas, para su proceso de selección de la ubicación de su nueva oficina. En este capítulo se mostrará cómo aplicar pruebas estadísticas no paramétricas como la prueba de Mann-WhitneyWilcoxon. También se discutirá la interpretación adecuada de dichas pruebas.
Los métodos estadísticos hasta ahora presentados en este libro se conocen como métodos paramétricos. En este capítulo se presentan varios métodos no paramétricos. Estos métodos suelen ser aplicables en las situaciones en que los métodos paramétricos no lo son. Los métodos no paramétricos suelen requerir suposiciones menos restrictivas acerca del nivel de medición de los datos y menos suposiciones acerca de la forma de las distribuciones de probabilidad generadas por los datos muestrales. Una de las consideraciones para determinar si lo apropiado es un método paramétrico o un método no paramétrico es la escala de medición empleada para generar los datos. Todos los datos son generados por una de las cuatro escalas de medición: nominal, ordinal, de intervalo o de razón. Por tanto, todos los análisis estadísticos se realizan con datos ya sea nominales, ordinales, de intervalo o de razón.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 814
814
Capítulo 19
Métodos no paramétricos
A continuación se definen y se proporcionan ejemplos de cada una de las cuatro escalas de medición.
En el capítulo 1 se dijo que con las escalas nominal y ordinal se obtienen datos cualitativos. Con las escalas de intervalo y de razón se obtienen datos cuantitativos.
Si el nivel de medición de los datos es nominal u ordinal, calcular la media, la varianza y la desviación estándar no tiene sentido. Por tanto, con este tipo de datos, muchos de los procedimientos estadísticos discutidos previamente no pueden emplearse.
1. Escala nominal. Una escala de medición es nominal si los datos son etiquetas o categorías que se usan para definir un atributo de un elemento. Los datos nominales pueden ser numéricos o no numéricos. Ejemplos. El mercado en el que cotiza una acción (NYSE, NASDAQ o AMEX) es un dato nominal no numérico. El número de seguro social de una persona es un dato nominal numérico. 2. Escala ordinal. Una escala de medición es ordinal si los datos pueden usarse para jerarquizar u ordenar las observaciones. Los datos ordinales pueden ser numéricos o no numéricos. Ejemplos. Las medidas pequeño, mediano y grande para dar el tamaño de un objeto son datos ordinales no numéricos. El lugar de los individuos en una clase 1, 2, 3, … son datos ordinales numéricos. 3. Escala de intervalo. Una escala de medición es de intervalo si los datos tienen las propiedades de los datos ordinales y los intervalos entre observaciones se expresan en términos de una unidad de medición fija. Los datos de intervalo tienen que ser numéricos. Ejemplos. Las mediciones de temperatura son datos de intervalo. Suponga que la temperatura en un lugar es de 21°C y en otro es de 4°C. Estos lugares se pueden jerarquizar de acuerdo con lo calurosos que son: el primero es más caliente que el segundo. La unidad fija de medición, 1 C, permite decir cuán más caliente es el primer lugar: 17°C. 4. Escala de razón. Una escala de medición es de razón si los datos tienen las propiedades de los datos de intervalo y el cociente (o razón) entre dos medidas tiene sentido. Los datos de razón tienen que ser numéricos. Ejemplos. Variables como la distancia, la altura, el peso y el tiempo se miden con una escala de razón. Las mediciones de temperatura no son datos de razón debido a que no existe un punto cero definido intrínsecamente. Por ejemplo, el punto de congelación del agua en la escala Fahrenheit es 32 grados y en la escala Celsius es 0 grados. Los cocientes entre datos de temperatura no tienen sentido. Por ejemplo, no tiene sentido decir que cuando la temperatura ambiente es de 20 grados hace el doble de calor que cuando es de 10 grados. La mayor parte de los métodos estadísticos conocidos como métodos paramétricos requieren el uso de datos de las escalas de intervalo o de razón. Con estos niveles de medición, tienen sentido las operaciones aritméticas y medias, varianzas, desviaciones estándar, etc., pueden calcularse, interpretarse y usarse en el análisis. Con datos nominales y ordinales no es apropiado calcular medias, varianzas ni desviaciones estándar; por tanto, no pueden emplearse los métodos paramétricos. La única manera de analizar esos datos para obtener conclusiones estadísticas es emplear los métodos no paramétricos. En general, para que un método estadístico se clasifique como método no paramétrico, debe satisfacer, por lo menos, una de las condiciones siguientes.* 1. Ser un método que pueda ser usado con datos nominales. 2. Ser un método que pueda ser usado con datos ordinales. 3. Ser un método que pueda ser usado con datos de intervalo o de razón cuando no sea posible hacer suposiciones acerca de la forma de la distribución de la población. Si el nivel de medición de los datos es de intervalo o de razón y si las suposiciones necesarias sobre la distribución de probabilidad de la población son apropiadas, con los métodos paramétricos se obtienen procedimientos estadísticos más potentes y más refinados. En muchos de los casos en que se puede aplicar tanto un método paramétrico como un método no paramétrico, el método no paramétrico es casi tan bueno o casi tan potente como el método paramétrico. En los casos en que los datos son nominales y ordinales o en los casos en que las suposiciones requeridas por los métodos paramétricos son inapropiadas, sólo se cuenta con los métodos no pa*Véase W. J. Conover, Practical Nonparametric Statistics, 3. ed. (John Wiley & Sons, 1998).
19Ander(812-845).qxd 2/29/08 12:08 PM Page 815
19.1
815
Prueba de los signos
ramétricos. Debido a que en los métodos no paramétricos se requieren mediciones de los datos menos restrictivas y menos suposiciones acerca de la distribución de la población, se considera que tienen una aplicación más general que los métodos paramétricos. Los métodos no paramétricos que se presentan en este capítulo son la prueba de los signos, la prueba de los rangos con signo de Wilcoxon, la prueba de Mann-Whitney-Wilcoxon, la prueba de Kruskal-Wallis y la correlación de los rangos de Spearman.
19.1
Prueba de los signos En una aplicación de investigación de mercado de la prueba de los signos se usa una muestra de n clientes potenciales para que indiquen su preferencia por una de dos marcas de un producto, por ejemplo, de un café, de un detergente o de un refresco. Las n expresiones de preferencia son datos nominales, ya que el consumidor simplemente nombra una preferencia. Dados estos datos, el objetivo es determinar si existe diferencia en las preferencias entre los dos artículos que se comparan. Como se verá, la prueba de los signos es un procedimiento estadístico no paramétrico para responder esta pregunta.
Caso de muestras pequeñas El caso de la muestra pequeña es siempre que n 20. A continuación, mediante un estudio realizado para Sun Coast Farms, se ilustra el uso de la prueba de los signos para el caso de una muesTABLA 19.1 tra pequeña; Sun Coast produce un jugo de naranja comercializado bajo el nombre Citrus Valley. Un competidor de Sun Coast Farms produce también un jugo de naranja que comercializa bajo PROBABILIDADES el nombre de Tropical Orange. En un estudio acerca de las preferencias de los consumidores resBINOMIALES CON pecto a estas dos marcas, a 12 individuos se les dieron muestras, sin marca, de cada uno de los n 12, p 0.50 productos. La marca que cada individuo probó primero fue seleccionada aleatoriamente. Después Número de signos más Probabilidad de probar los dos productos, se pidió a estas personas que indicaran su preferencia por una de las dos marcas. En este estudio, el objetivo es ver si hay una preferencia de los consumidores por 0 0.0002 uno de los dos productos. Sea p la proporción de la población de consumidores que prefiere Ci1 0.0029 2 0.0161 trus Valley; las hipótesis que se quiere probar son las siguientes. 3 4 5 6 7 8 9 10 11 12
0.0537 0.1208 0.1934 0.2256 0.1934 0.1208 0.0537 0.0161 0.0029 0.0002
Las probabilidades binomiales exactas para tamaños de muestra menores o iguales a 20 se encuentran en la tabla 5 del apéndice B.
H0: p 0.50 Ha: p 0.50 Si no se rechaza H0, no se tendrán evidencias que indiquen la existencia de alguna diferencia en las preferencias de los consumidores por estas dos marcas de jugos de naranja. Sin embargo, si se rechaza H0, se podrá concluir que las preferencias de los consumidores hacia estas marcas son diferentes. En ese caso, la marca seleccionada por el mayor número de consumidores se considerará que es la marca preferida. A continuación se muestra el uso de la versión para muestras pequeñas de la prueba de los signos al probar estas hipótesis para obtener una conclusión acerca de la preferencia de los consumidores. Para registrar los datos de la preferencia de los 12 individuos que participan en el estudio, se emplea un signo más si el individuo prefiere Citrus Valley y un signo menos si el individuo prefiere Tropical Orange. Debido a que los datos se registran en términos de signos más y menos, a esta prueba paramétrica se le conoce como prueba de los signos. El número de signos más es el estadístico de prueba. Bajo la suposición de que H0 es verdadera (p 0.50), la distribución muestral del estadístico de prueba es una distribución binomial con p 0.50. En la tabla 5 del apéndice B se encuentran las probabilidades de la distribución binomial para n 12 y p 0.50, las cuales se reproducen en la tabla 19.1. La figura 19.1 es la gráfica de esta distribución muestral binomial. En esta tabla se presenta la probabilidad para cada número de signos más, bajo la suposición de que H0 es verdadera. Ahora se realiza la prueba para determinar si hay diferencia en las preferencias del público por estas marcas de jugos de naranja. Como nivel de significancia se usará 0.05. En la tabla 19.2 se presentan los datos obtenidos sobre la preferencia. Los dos signos más, indican que dos consumidores prefirieron Citrus Valley. Ahora se pueden usar las distribuciones binomiales para determinar el valor-p de la prueba. Como es una prueba de dos colas, el valor-p se encuentra al duplicar la probabilidad en una cola de la distribución muestral binomial. El nú-
19Ander(812-845).qxd 2/29/08 12:08 PM Page 816
Capítulo 19
FIGURA 19.1
Métodos no paramétricos
DISTRIBUCIÓN MUESTRAL BINOMIAL PARA EL NÚMERO DE SIGNOS MÁS CON n 12 Y p 0.50
.20
Probabilidad
816
.10
0
1
2
3
4
5
6
7
8
9
10
11
12
Cantidad de signos +
mero de signos más para Sun Coast Farms (2) se encuentra en la cola inferior de la distribución. De manera que la probabilidad en esa cola es la probabilidad de 2, 1 y 0 signos más. Al sumar estas probabilidades se obtiene 0.0161 0.0029 0.0002 0.0192. Al duplicar este valor se obtiene el valor-p 2(0.0192) 0.0384. Como el valor-p α 0.05, se rechaza H0. Esta prueba de sabores proporciona evidencias de que las preferencias de los consumidores difieren significativamente entre estas dos marcas de jugo de naranja. Se le informará a Sun Coast Farms que los consumidores prefieren Tropical Orange. La prueba de hipótesis para Sun Coast Farms fue una prueba de dos colas. Como resultado el valor-p se halló al duplicar la probabilidad en una de las colas de la distribución binomial. También se puede hacer una prueba de signo de una cola. Si la prueba es de la cola inferior, el valor-p es la probabilidad de que el número de signos más sea menor o igual al número observado. Si la prueba es de la cola superior, el valor-p es la probabilidad de que el número de signos más sea mayor o igual al número observado. TABLA 19.2
DATOS DE PREFERENCIAS EN LA PRUEBA DE SUN COAST FARMS Individuo
Marca preferida
Dato registrado
1 2 3 4 5 6 7 8 9 10 11 12
Tropical Orange Tropical Orange Citrus Valley Tropical Orange Tropical Orange Tropical Orange Tropical Orange Tropical Orange Citrus Valley Tropical Orange Tropical Orange Tropical Orange
19Ander(812-845).qxd 2/29/08 12:08 PM Page 817
19.1
817
Prueba de los signos
En la prueba de sabores de Sun Coast Farms, los 12 individuos establecieron su preferencia por una de las dos marcas de jugo de naranja. En otras aplicaciones de la prueba de los signos, puede ocurrir que uno o más de los individuos de la muestra no puedan establecer su preferencia. Si una preferencia no puede ser establecida, se descarta de la muestra esa respuesta y la prueba de los signos se basará en la muestra de menor tamaño. Por último, las probabilidades binomiales que se presentan en la tabla 5 del apéndice B pueden usarse para pruebas de los signos con tamaños de muestras hasta n 20. Para tamaños de muestra mayores, se usa la aproximación normal de las probabilidades binomiales.
Caso de muestras grandes La prueba de los signos con muestras grandes es equivalente a una proporción poblacional con p 0.50, como las presentadas en el capítulo 9.
Si la hipótesis nula es H0: p 0.50 y el tamaño de la muestra es n 20, la distribución muestral del número de signos más se aproxima mediante una distribución normal.
APROXIMACIÓN NORMAL DE LA DISTRIBUCIÓN MUESTRAL DEL NÚMERO DE SIGNOS MÁS CUANDO H0: p 0.50
Media: μ 0.50n Desviación estándar: σ 兹0.25n
(19.1) (19.2)
Forma de la distribución: aproximadamente normal siempre que n 20.
Los casos de empate se eliminan del análisis
A continuación se considera una aplicación de la prueba de los signos en la que se hace un sondeo político. En un sondeo realizado durante una campaña para elecciones presidenciales se pidió a 200 votantes registrados que evaluaran a los candidatos demócrata y republicano con relación a su política exterior. El resultado obtenido fue: 72 de los encuestados evaluaron mejor al candidato demócrata, 103 evaluaron mejor al republicano y 25 no encontraron diferencia entre los candidatos. ¿Con este sondeo puede observarse que exista una diferencia significativa, entre los candidatos, en términos de la opinión pública acerca de su política exterior? Se tiene que n 200 25 175 fueron las personas que pudieron indicar qué candidato consideraban que tenía una mejor política exterior. Mediante la prueba de los signos y las ecuaciones (19.1) y (19.2) se puede hallar que la distribución muestral del número de signos más tiene las propiedades siguientes. μ 0.50n 0.50(175) 87.5 σ 兹0.25n 0.25(175) 6.6 Además, como n 175, se puede asumir que la distribución muestral es aproximadamente normal. En la figura 19.2 se muestra esta distribución. Ahora se procede a realizar la prueba de los signos con un nivel de significancia de 0.05, para obtener las conclusiones. Con base en el número de signos más (x 72) que corresponden al número de personas que evaluaron como mejor la política exterior del candidato demócrata, se obtiene el valor siguiente para el estadístico de prueba z
Si se usa el número de personas que evaluaron mejor al candidato republicano, z 2.35, se llegará al mismo resultado.
x μ 72 87.5 2.35 σ 6.6
En las tablas de probabilidad normal estándar se encuentra que el área en la cola, a la izquierda de z 2.35 es 0.0094. Como se trata de una prueba de dos colas, el valor-p = 2(0.0094) = 0.0188. Como se obtiene que valor-p α 0.05, se rechaza H0. Como resultado de este estudio se encuentra que los candidatos difieren en términos de la opinión pública acerca de su política exterior.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 818
818
Capítulo 19
FIGURA 19.2
Métodos no paramétricos
DISTRIBUCIÓN DE PROBABILIDAD PARA EL NÚMERO DE SIGNOS MÁS EN UNA PRUEBA DE LOS SIGNOS EN LA QUE n 175
σ = 6.6
87.5 Cantidad de signos +
Prueba de hipótesis acerca de la mediana En el capítulo 9 se describió el uso de las pruebas de hipótesis para inferencias acerca de la media poblacional. Ahora se muestra cómo realizar una prueba de hipótesis acerca de la mediana poblacional. Recuerde que la mediana divide a la población de manera que 50% de los valores son mayores o iguales que la mediana y 50% de los valores son menores o iguales a la mediana. Cuando se utiliza la prueba de los signos se anota un signo más por cada dato muestral que sea mayor al valor de la mediana hipotética y un signo menos por cada dato muestral que sea menor al valor de la mediana hipotética. Los datos iguales al valor de la mediana hipotética, se descartan. Los cálculos en esta prueba de los signos se hacen igual. Como ejemplo se realiza la siguiente prueba de hipótesis acerca del precio mediano de las casas nuevas en una determinada región. H0: Mediana $230 000 Ha: Mediana $230 000 En una muestra de 62 casas, 34 tuvieron un precio mayor al de la mediana, 26 tuvieron un precio menor al de la mediana y el precio de 2 de ellas fue exactamente $230 000. Mediante las ecuaciones (19.1) y (19.2) con n 60 casas, cuyos precios son diferentes a $230 000, se obtiene μ 0.50 n 0.50(60) 30 σ 兹0.25 n 兹0.25(60) 3.87 Como el número de signos más es x 34, el estadístico de prueba es z
34 30 x μ 1.03 σ 3.87
Al aplicar las tablas de la probabilidad normal estándar con z = 1.03, se encuentra que el valor-p para dos colas es 2(1 0.8485) 0.303. Como el valor-p 0.05, no se puede rechazar H0. De
19Ander(812-845).qxd 2/29/08 12:08 PM Page 819
19.1
819
Prueba de los signos
acuerdo con los datos muestrales, no es posible rechazar la hipótesis nula que establece que el precio mediano de una casa nueva es $230 000.
Ejercicios
Métodos
Auto examen
1. En la tabla siguiente se presentan las preferencias de 10 personas respecto a dos marcas de un producto.
Persona
Marca A frente a marca B
Persona
Marca A frente a marca B
1 2 3 4 5
6 7 8 9 10
Emplee α 0.05 y pruebe si existe alguna diferencia significativa en las preferencias por estas dos marcas. Un signo más indica preferencia por la marca A sobre la marca B.
Auto examen
2. Realice la prueba de hipótesis siguiente. H 0: Mediana 150 H a: Mediana 150 En una muestra de tamaño 30 se obtuvieron 22 casos cuyo valor fue mayor que 150, tres cuyo valor fue exactamente 150 y cinco cuyo valor fue menor que 150. Con α 0.01 realice una prueba de hipótesis.
Aplicaciones 3. ¿Las divisiones de acciones son benéficas para los accionistas? La empresa SNL Securities estudió, a lo largo de 18 meses, las divisiones de acciones de la industria de la banca y encontró que las divisiones de las acciones tienden a incrementar el valor de las acciones de un individuo. Admita que en una muestra de 20 recientes divisiones de acciones, 14 hayan llevado a un aumento de su valor, cuatro hayan llevado a una disminución de su valor y dos no hayan ocasionado ningún cambio. Suponga que realiza un estudio para determinar si las divisiones de acciones aún benefician a los poseedores de acciones bancarias. a. ¿Cuáles son las hipótesis nula y alternativa? b. ¿A qué conclusión se llega con α 0.05?
Auto examen
4. En un sondeo a 1 253 personas se les hizo una serie de preguntas acerca de la economía y del futuro de sus hijos. Una de las preguntas era, “¿Espera que sus hijos tengan una vida mejor a la que usted ha tenido, una vida peor o una vida más o menos igual de buena a la que usted ha tenido?” Las respuestas fueron, 34% mejor, 29% peor, 33% más o menos igual y 4% no supo contestar. Mediante la prueba de los signos y 0.05 como nivel de significancia, determine si el número de adultos que prevén un mejor futuro para sus hijos es mayor al número de adultos que prevén un futuro peor para sus hijos. ¿A qué conclusión llega? 5. La empresa Nielson Media Research identificó a American Idol y a Dancing with the Stars como los dos programas de televisión de mayor rating en febrero de 2006 (www.nielsenmedia.com, 10 de marzo de 2006). En un estudio local acerca del programa de televisión preferido, de 750 encuestados 330 votaron por American Idol, 270 por Dancing with the Stars y 150 por otro programa de televisión. Con 0.05 como nivel de significancia pruebe la hipótesis de que American Idol y Dancing with the Stars tienen el mismo nivel de preferencia. ¿A qué conclusión llega?
19Ander(812-845).qxd 2/29/08 12:08 PM Page 820
820
Capítulo 19
Métodos no paramétricos
6. En el mercado de las computadoras personales la competencia es intensa. En una muestra de 500 compras, se encontró que 202 eran compras de la marca A, 158 de la marca B y 140 de otras marcas. Con un nivel de significancia de 0.05 pruebe la hipótesis de que las marcas A y B tienen la misma participación en el mercado de las computadoras personales. ¿Cuál es la conclusión? 7. El ingreso mediano anual de los suscriptores de la revista Barron es $131 000 (barrons.mag.com, 28 de julio de 2000). Suponga que en una muestra de 300 suscriptores a The Wall Street Journal, 165 suscriptores posean un ingreso mayor que $131 000 y 135 posean un ingreso menor que $131 000. ¿Puede concluir que hay diferencia entre los ingresos medianos de los dos grupos de suscriptores? Emplee α 0.05 como nivel de significancia, ¿a qué conclusión llega? 8. En una muestra de 150 partidos de básquetbol universitario, el equipo de casa ganó 98 partidos. Realice una prueba para determinar si los datos sustentan la hipótesis de que en el básquetbol universitario el equipo de casa tiene ventaja. ¿A qué conclusión llega con α 0.05? 9. El año pasado, en una determinada ciudad, la mediana del número de empleados de tiempo parcial en un restaurante de comida rápida era 15. Es posible que esta cantidad esté aumentando. En una muestra de nueve restaurantes de comida rápida se encontró que en siete de ellos trabajaban más de 15 empleados de tiempo parcial, en uno había exactamente 15 empleados que trabajaban de tiempo parcial y en otro más había menos de 15 empleados que trabajaban de tiempo parcial. Realice una prueba con α 0.05 para determinar si el número mediano de empleados que trabaja de tiempo parcial ha aumentado. 10. De acuerdo con un estudio nacional, el ingreso anual mediano que los adultos dicen haría realidad sus sueños es $152 000. Suponga que en Ohio, de 225 personas tomadas en una muestra, 122 indican que el ingreso necesario para hacer realidad sus sueños sea menor que $152 000, y 103 informen que esta cantidad sea mayor que $152 000. Pruebe la hipótesis nula de que en Ohio, el ingreso medio anual para que una persona haga realidad sus sueños es $152 000. Use α 0.05. ¿A qué conclusión llega? 11. El ingreso medio anual de los estudiantes con una licenciatura (en Estados Unidos) es $37 700 (The New York Times Almanac, 2006). A continuación se presentan los datos muestrales (en miles de dólares) de estudiantes universitarios en la zona de Chicago. Con los datos muestrales pruebe H0: mediana 37.7 y Ha: mediana 37.7 para la población de estudiantes con grado de licenciatura que trabajan en la zona de Chicago. Use α 0.05 como nivel de significancia. ¿Cuál es su conclusión?
archivo CD en Annual
19.2
47.8 47.2 55.5 41.2 21.3 42.4 51.9 32.8 30.2 38.5
41.7 42.6 127.8 45.7 42.4 25.0 25.3 24.4 60.6 31.1
31.4 105.3 73.7 37.7 61.2 43.2 39.3 69.0 43.4 91.0
56.9 38.8 25.2 30.4 23.8 36.2 65.0 25.1 34.9 23.6
55.2 30.0 68.4 91.1 34.1 76.7 38.0 48.7 37.7 56.1
Prueba de los rangos con signo de Wilcoxon La prueba de los rangos con signo de Wilcoxon es la alternativa no paramétrica al método paramétrico de las muestras por pares (o apareadas) presentado en el capítulo 10. En la situación de las muestras por pares, cada unidad experimental genera dos observaciones, una correspondiente a la población 1 y otra correspondiente a la población 2. Las diferencias entre los pares de observaciones permiten apreciar la diferencia entre las dos poblaciones. En una fábrica se desea determinar cuál de dos métodos de producción difiere en el tiempo que se requiere para realizar una tarea. Se selecciona una muestra de 11 trabajadores y cada trabajador realiza la tarea con uno de estos dos métodos de producción. El método de producción
19Ander(812-845).qxd 2/29/08 12:08 PM Page 821
19.2
821
Prueba de los rangos con signo de Wilcoxon
TABLA 19.3
TIEMPO EN MINUTOS PARA LA REALIZACIÓN DE UNA TAREA DE PRODUCCIÓN Método Trabajador
1
2
Diferencia
1 2 3 4 5 6 7 8 9 10 11
10.2 9.6 9.2 10.6 9.9 10.2 10.6 10.0 11.2 10.7 10.6
9.5 9.8 8.8 10.1 10.3 9.3 10.5 10.0 10.6 10.2 9.8
0.7 0.2 0.4 0.5 0.4 0.9 0.1 0.0 0.6 0.5 0.8
que usa primero cada trabajador es seleccionado de manera aleatoria. De manera que cada uno de los trabajadores de la muestra proporciona un par de observaciones como aparece en la tabla 19.3. Una diferencia positiva entre los tiempos de realización de la tarea indica que el método 1 requiere más tiempo, y una diferencia negativa entre los tiempos indica que el método 2 requiere más tiempo. ¿Los datos obtenidos indican que estos métodos son significativamente diferentes en términos del tiempo que se requiere para realizar la tarea? En efecto, se tienen dos poblaciones de tiempos requeridos para realizar una tarea, cada población corresponde a cada uno de los métodos; las hipótesis a probar son las siguientes. H0: Las poblaciones son idénticas Ha: Las poblaciones no son idénticas Si no se puede rechazar H0, no se contará con evidencia para concluir que los dos métodos difieren en los tiempos requeridos para realizar la tarea. Pero, si H0 puede ser rechazada, se concluirá que los dos métodos difieren en los tiempos para realizar la tarea. El primer paso en la prueba de los rangos con signo de Wilcoxon es ordenar los valores absolutos de las diferencias entre los dos métodos y asignarles un rango. Toda diferencia que sea igual a cero se descarta y las diferencias restantes se ordenan y se les asigna un rango. A las diferencias que tengan un mismo valor, el rango que se les asigna es el promedio de los números de sus posiciones en el conjunto de datos ordenados. En la última columna de la tabla 19.4 se muestran los rangos asignados a los valores absolutos de las diferencias. Observe que la diferencia cero obtenida por el trabajador 8 se descarta; después, a la diferencia absoluta más pequeña, que es 0.1 se le asigna el rango 1. Se continúa ordenando las diferencias absolutas hasta asignarle a la mayor diferencia absoluta, que es 0.9, el rango 10. El rango que se le asigna a cada una de las diferencias absolutas de los trabajadores 3 y 5, que son iguales, es el promedio de sus posiciones en el conjunto ordenado de las diferencias absolutas 3.5 y el rango para cada una de las diferencias absolutas iguales de los trabajadores 4 y 10 es el promedio de las posiciones que les corresponden en el conjunto ordenado de los datos, 5.5. Una vez determinados los rangos de las diferencias absolutas, se les antepone el signo de la diferencia original entre los datos. Por ejemplo, a la diferencia 0.1 del trabajador 7, a la que se le ha asignado el rango 1 se le da el valor 1, ya que la diferencia observada entre los dos métodos es positiva. A la diferencia 0.2, que se le asignó el rango 2, se le da el valor 2 ya que la diferencia observada entre los dos métodos es negativa. En la última columna de la tabla 19.4 se encuentra la lista completa de todos los rangos así como la suma de todos ellos. Ahora se vuelve a la hipótesis original de que las poblaciones de los tiempos necesarios para realizar la tarea, con cada uno de estos dos métodos, son iguales. Si las poblaciones que re-
19Ander(812-845).qxd 2/29/08 12:08 PM Page 822
822
Capítulo 19
TABLA 19.4
RANGOS DE LAS DIFERENCIAS ABSOLUTAS ACERCA DEL TIEMPO NECESARIO PARA REALIZAR UNA TAREA DE PRODUCCIÓN
Trabajador 1 2 3 4 5 6 7 8 9 10 11
Métodos no paramétricos
Diferencia
Valor absoluto de la diferencia
Rango
Rango con signo
0.7 0.2 0.4 0.5 0.4 0.9 0.1 0.0 0.6 0.5 0.8
0.7 0.2 0.4 0.5 0.4 0.9 0.1 0.0 0.6 0.5 0.8
8 2 3.5 5.5 3.5 10 1 — 7 5.5 9
8 2 3.5 5.5 3.5 10 1 — 7 5.5 9
Suma de los rangos con signo
44.0
presentan los tiempos requeridos para realizar la tarea con cada uno de los métodos fueran idénticas, se esperaría que los rangos positivos y los rangos negativos se compensaran unos con otros y se anularan, de manera que la suma de los valores de los rangos con signo sería aproximadamente cero. Por tanto, en la prueba de los rangos con signo de Wilcoxon, la prueba de significancia consiste en determinar si la suma de los rangos con signo ( 44 en este caso) es significativamente distinta de cero. Sea T la suma de los valores de los rangos con signo en una prueba de los rangos con signo de Wilcoxon. Si las dos poblaciones son idénticas y si el número de pares de datos es 10 o mayor, es posible demostrar que la distribución muestral de T puede ser aproximada mediante una distribución normal. DISTRIBUCIÓN MUESTRAL DE T PARA POBLACIONES IDÉNTICAS (19.3)
Media: μ T 0 Desviación estándar: σT
冑
n(n 1)(2n 1) 6
Forma de la distribución: aproximadamente normal siempre que n
(19.4)
10.
En el ejemplo, después de descartar la observación en que la diferencia es cero (la del trabajador 8), se tiene n = 10. Por tanto, si emplea la ecuación (19.4), tiene σT
冑
10(11)(21) 19.62 6
En la figura 19.3 se presenta la distribución muestral de T bajo la suposición de que las dos poblaciones son idénticas. Ahora se procede a realizar la prueba de los rangos con signo de Wilcoxon con 0.05 como nivel de significancia, para llegar a una conclusión. Con la suma de los valores de los signos con rango T 44, se obtiene el valor siguiente para el estadístico de prueba. z
T μT 44 0 2.24 σT 19.62
A partir de las tablas de probabilidad normal estándar y z 2.24, se halla que para dos colas el valor-p 2(1 0.9875) 0.025. Como el valor-p α 0.05, se rechaza H0 y se concluye que
19Ander(812-845).qxd 2/29/08 12:08 PM Page 823
19.2
823
Prueba de los rangos con signo de Wilcoxon
FIGURA 19.3
DISTRIBUCIÓN MUESTRAL DE LA T DE WILCOXON DEL TIEMPO PARA LA REALIZACIÓN DE UNA TAREA DE PRODUCCIÓN
Distribución muestral de T
σ
T
= 19.62
T
0
las dos poblaciones no son idénticas y que los métodos difieren en el tiempo requerido para realizar la tarea. Como 8 trabajadores obtuvieron tiempos más cortos con el método 2, se concluye que el método 2 es el método de producción que se preferirá.
Ejercicios
Aplicaciones
Auto examen
12. Con objeto de determinar su efecto en el rendimiento de la gasolina en millas por galón en los automóviles de pasajeros, se prueban dos aditivos para gasolina. A continuación aparecen los resultados de esta prueba en 12 automóviles; en cada automóvil se probaron los dos aditivos. Use α = 0.05 y la prueba de los rangos con signo de Wilcoxon para determinar si existe una diferencia significativa entre estos dos aditivos. Aditivo Automóvil 1 2 3 4 5 6
Auto examen
Aditivo
1
2
Automóvil
1
2
20.12 23.56 22.03 19.15 21.23 24.77
18.05 21.77 22.57 17.06 21.22 23.80
7 8 9 10 11 12
16.16 18.55 21.87 24.23 23.21 25.02
17.20 14.98 20.03 21.15 22.78 23.70
13. Para medir el tiempo que necesitaban para quedarse dormidos, un estudio probó el efecto de un relajante para hombres. Los datos siguientes corresponden a los minutos que requirieron cada uno de los 10 hombres de la muestra para quedarse dormidos. Use como nivel de significancia α = 0.05 y determine si el relajante reduce el tiempo que se requiere para quedarse dormido. ¿Cuál es su conclusión?
Sujeto
Sin relajante
Con relajante
Sujeto
Sin relajante
Con relajante
1 2 3 4 5
15 12 22 8 10
10 10 12 11 9
6 7 8 9 10
7 8 10 14 9
5 10 7 11 6
19Ander(812-845).qxd 2/29/08 12:08 PM Page 824
824
Capítulo 19
Métodos no paramétricos
14. En 10 de los principales aeropuertos se muestrearon los precios de la gasolina para automóviles rentados. A continuación se presentan los datos correspondientes a las empresas Avis y Budget (USA Today, 4 de abril de 2000). Aeropuerto Boston Logan Chicago O’Hare Chicago Midway Denver Fort Lauderdale Los Ángeles Miami Nueva York (JFK) Orange County, CA Washington (Dulles)
Avis 1.58 1.60 1.53 1.55 1.57 1.80 1.62 1.69 1.75 1.55
Budget 1.39 1.55 1.55 1.51 1.58 1.74 1.60 1.60 1.59 1.54
Use α 0.05 para probar la hipótesis de que no hay diferencia entre las dos poblaciones. ¿Cuál es su conclusión? 15. Dos servicios nocturnos de paquetería fueron probados; se formaron dos muestras idénticas, de manera que a los dos servicios de paquetería se les notificara al mismo tiempo que se requerían sus servicios. A continuación se presentan los tiempos requeridos en cada entrega. ¿Estos datos sugieren que existe diferencia entre los tiempos que requiere cada uno de estos servicios? Servicio Entrega 1 2 3 4 5 6 7 8 9 10 11
1 24.5 26.0 28.0 21.0 18.0 36.0 25.0 21.0 24.0 26.0 31.0
2 28.0 25.5 32.0 20.0 19.5 28.0 29.0 22.0 23.5 29.5 30.0
16. El campeonato de los jugadores de la PGA tuvo lugar, del 23 al 26 de marzo de 2006, en el campo de golf TPC Sawgrass en Ponte Vedra Beach, Florida. A continuación se presentan las puntuaciones obtenidas, en la primera y segunda rondas, por 11 golfistas de una muestra. Use α 0.05 y determine si existe una diferencia significativa entre las puntuaciones obtenidas por los golfistas en la primera y en la segunda rondas. ¿Cuál es su conclusión? Golfista Fred Couples John Daly Ernie Els Jim Furyk Phil Mickelson Rocco Mediate Nick Price Vijay Singh Sergio Garcia Mike Weir Tiger Woods
Primera ronda
Segunda ronda
69 70 72 65 70 69 72 68 70 71 72
73 73 70 71 73 74 71 70 68 71 69
19Ander(812-845).qxd 2/29/08 12:08 PM Page 825
19.3
825
Prueba de Mann-Whitney-Wilcoxon
17. Como parte de una investigación de mercado que tenía por objeto evaluar la efectividad de una campaña de publicidad, se seleccionaron 10 ciudades para una prueba de mercado. Las ventas en dólares en cada una de estas ciudades, en la semana anterior a la campaña, se registraron. Después, se realizó la campaña durante dos semanas y se registraron las ventas que hubo en la primera semana, inmediatamente después de la campaña.
Ciudad Kansas City Dayton Cincinnati Columbus Cleveland Indianapolis Louisville St. Louis Pittsburgh Peoria
Ventas antes de la campaña
Ventas después de la campaña
130 100 120 95 140 80 65 90 140 125
160 105 140 90 130 82 55 105 152 140
Use α = 0.05. ¿A qué conclusión llega acerca del valor de la campaña?
19.3
Prueba de Mann-Whitney-Wilcoxon En esta sección se presenta otro método no paramétrico que se usa para determinar si hay diferencia entre dos poblaciones. Esta prueba, a diferencia de la prueba de los rangos con signo, no se basa en una muestra por pares. Aquí se usan dos muestras independientes, una de cada población. Esta prueba fue creada conjuntamente por Mann, Whitney y Wilcoxon. Algunas veces se le llama prueba de Mann-Whitney y otras veces prueba de la suma de rangos de Wilcoxon. Las dos versiones de esta prueba, la de Mann-Whitney y la de Wilcoxon son equivalentes. Aquí se le llamará prueba de Mann-Whitney-Wilcoxon (MWW). La prueba no paramétrica de MWW no requiere que los datos sean de intervalo ni tampoco que las poblaciones estén distribuidas normalmente. El único requisito es que la escala de medición de los datos sea por lo menos ordinal. Después, en lugar de probar las diferencias entre las medias de las dos poblaciones, la prueba de MWW determina si las dos poblaciones son idénticas. Las hipótesis en la prueba de MWW son las siguientes. H0: Las dos poblaciones son idénticas Ha: Las dos poblaciones no son idénticas
Caso de muestras pequeñas La prueba de MWW para el caso de muestras pequeñas se usa siempre que los tamaños de las muestras de ambas poblaciones sean menores o iguales a 10. El uso de la prueba de MWW para muestras pequeñas se ilustrará mediante un ejemplo sobre la preparación académica de los alumnos de la escuela Johnston. La mayoría de los alumnos de la escuela Johnston provienen de la escuela Garfield o de la escuela Mulberry. La cuestión que desean resolver los directivos de la escuela Johnston es si la población de los estudiantes que provenían de la escuela Garfield es idéntica, en términos de preparación académica, a la población de los estudiantes que provenían de la escuela Mulberry. Las hipótesis son las siguientes. H0: Las dos poblaciones son idénticas en términos de preparación académica H0: Las dos poblaciones no son idénticas en términos de preparación académica
19Ander(812-845).qxd 2/29/08 12:08 PM Page 826
826
Capítulo 19
TABLA 19.5
Métodos no paramétricos
DATOS DE NIVEL ACADÉMICO Escuela Garfield Estudiante Nivel académico Fields Clark Jones Tibbs
8 52 112 21
Escuela Mulberry Estudiante Nivel académico Hart Phipps Kirkwood Abbott Guest
70 202 144 175 146
Los directivos de la escuela Johnston toman una muestra aleatoria de cuatro estudiantes provenientes de la escuela Garfield y otra muestra aleatoria de cinco estudiantes provenientes de la escuela Mulberry. De cada uno de los nueve estudiantes tomados para el estudio se registra su actual nivel académico. En la tabla 19.5 se presentan los niveles académicos de estos nueve estudiantes. El primer paso en la prueba de MWW es reunir en un solo conjunto todos los datos y ordenarlos de menor a mayor. Al valor menor (nivel académico 8) se le da el rango 1 y al valor mayor (nivel académico 202) se le da el rango 9. En la tabla 19.6 se presentan los nueve estudiantes con sus rangos y ordenados de acuerdo con ellos. El paso siguiente es sumar los rangos de cada muestra, por separado. Esto se muestra en la tabla 19.7. En la prueba de MWW se puede usar la suma de cualquiera de las muestras. Aquí se usará la suma de la muestra de los cuatro estudiantes de la escuela Garfield. Esta suma se denota con el símbolo T. De manera que en este ejemplo, T 11. ¿Cuáles son las propiedades de la suma de los rangos en la muestra de Garfield? Puede ocurrir que los cuatro estudiantes en la muestra de Garfield sean los cuatro estudiantes que tengan los primeros rangos en este estudio, si este fuera el caso, T 1 2 3 4 10 sería el menor valor que podría tener T, la suma de los rangos. Pero también puede ocurrir que los estudiantes de Garfield fueran los cuatro estudiantes que obtuvieran los últimos rangos, en cuyo caso T = 6 7 8 9 30 sería el mayor valor que podría tomar T. Por tanto, en la muestra de la escuela Garfield, el valor T estará entre 10 y 30. Observe que valores de T cercanos a 10 significan que la escuela Garfield tiene los estudiantes significativamente mejores, o con rangos más altos, mientras que valores de T cercanos a 30 significan que la escuela Garfield tiene los estudiantes significativamente peores, o con rangos más bajos. Por tanto, si las dos poblaciones de estudiantes fueran idénticas, en términos de preparación académica, se esperaría que los valores de T fueran aproximadamente iguales al promedio de estos dos valores, o sea (10 30)/2 20. En la tabla 8 del apéndice B se presentan los valores críticos para el estadístico T en la prueba de MWW para el caso en que los tamaños de ambas muestras son menores o iguales a 10. En esta tabla n1 corresponde al tamaño de la muestra cuya suma de los rangos se está empleando en la prueba. El valor de TL se lee directamente en la tabla y el valor de TU se calcula con la ecuación (19.5). TABLA 19.6
ESTUDIANTES ORDENADOS POR RANGOS
Rangos dados Nivel a las dos Estudiante académico muestras juntas Fields Tibbs Clark Hart Jones
8 21 52 70 112
1 2 3 4 5
Estudiante Kirkwood Guest Abbott Phipps
Rangos dados Nivel a las dos académico muestras juntas 144 146 175 202
6 7 8 9
19Ander(812-845).qxd 2/29/08 12:08 PM Page 827
19.3
TABLA 19.7
827
Prueba de Mann-Whitney-Wilcoxon
SUMAS DE LOS RANGOS DE LOS ESTUDIANTES PROVENIENTES DE CADA UNA DE LAS ESCUELAS
Estudiantes de la escuela Garfield Nivel Rango en Estudiante académico la muestra
Estudiantes de la esucela Mulberry Nivel Rango en Estudiante académico la muestra
Fields Clark Jones Tibbs
Hart Phipps Kirkwood Abbott Guest
8 52 112 21
Suma de los rangos
1 3 5 2
70 202 144 175 146
4 9 6 8 7
11
34
Ni los valores de TL ni los de TU se encuentran en la zona de rechazo. La hipótesis nula de que las poblaciones son idénticas debe rechazarse sólo si T es estrictamente menor que TL o estrictamente mayor que TU. Por ejemplo, para el nivel de significancia 0.05, en la tabla 8 del apéndice B se encuentra que el valor crítico en la cola inferior para el estadístico de prueba en la prueba de MWW con n1 4 (Garfield) y n2 5 (Mulberry) es TL 12. El valor crítico en la cola superior para el estadístico de prueba en la prueba de MWW obtenido con la ecuación (19.5) es TU 4(4 5 1) 12 28 En consecuencia, la regla de decisión de esta prueba de MWW indica que la hipótesis nula de que las poblaciones son idénticas puede rechazarse si la suma de los rangos de la primera muestra (Garfield) es menor que 12 o mayor que 28. La regla de rechazo puede expresarse como Rechazar H0 si T < 12 o T > 28 Al realizar la prueba con la suma de los rangos de los estudiantes de la escuela Mulberry, se tiene n1 5, n2 4, TL 17, TU 33 y T 34. Como T TU, se llega también a la misma conclusión, rechazar H0.
En la tabla 19.7 se ve que T 11. Por tanto, se rechaza la hipótesis H0 y se concluye que la población de los estudiantes de la escuela Garfield es diferente de la población de los estudiantes de Mulberry en términos de preparación académica. Como los estudiantes de la escuela Garfield obtuvieron las mejores puntuaciones académicas, eso indica que los estudiantes de la escuela Garfield están mejor preparados que los estudiantes de la escuela Mulberry.
Caso de muestras grandes Cuando los tamaños de las dos muestras son mayores o iguales a 10, para realizar la prueba de MWW se puede usar la aproximación normal de la distribución de T. Para ilustrar este caso de las muestras grandes se empleará un ejemplo del Third National Bank. El Third National Bank tiene dos sucursales. En la tabla 19.8 se presentan los datos obtenidos de dos muestras aleatorias independientes, una de cada sucursal. ¿Estos datos muestran que son idénticas las poblaciones de saldos en las cuentas de cheques de las dos sucursales? El primer paso en la prueba de MWW es reunir en un solo conjunto, todos los datos y ordenarlos de menor a mayor. En la tabla 19.8, de los 22 datos, se observa que el menor es $750 (sexto elemento de la muestra 2), a este dato se le asigna el rango 1. Al terminar con la asignación de rangos se llega a la lista siguiente. Saldo ($)
Elemento
Rango asignado
750 800 805
6o. de la muestra 2 5o. de la muestra 2 7o. de la muestra 1
1 2 3 (continúa)
19Ander(812-845).qxd 2/29/08 12:08 PM Page 828
828
Capítulo 19
Métodos no paramétricos
Saldo ($)
Elemento
Rango asignado
850 . . . 1195 1200
2o. de la muestra 2 . . . 4o. de la muestra 1 3o. de la muestra 1
4 . . . 21 22
Al ordenar los datos, una vez reunidos en un solo conjunto, puede ocurrir que los valores de dos o más datos sean iguales. En este caso, el rango que se le asigna a cada uno es el promedio de sus posiciones en el conjunto de los datos ordenados. Por ejemplo, al saldo $945 (octavo elemento de la muestra 1) se le asignará el rango 11. Pero, los siguientes dos datos del conjunto son iguales, su valor es $950 (sexto elemento de la muestra 1 y cuarto elemento de la muestra 2); a cada uno de estos dos datos, que les corresponden las posiciones 12 y 13, el rango que se les asigna es 12.5. Al siguiente dato cuyo valor es $955, continuando con el proceso de asignación de rangos, se le asigna el rango 14. En la tabla 19.9 se presenta el conjunto de datos con los rangos asignados a cada observación. El paso siguiente en la prueba de MWW es sumar los rangos de cada muestra. Estas sumas se presentan en la tabla 19.9. La prueba se puede basar en la suma de los rangos de cualquiera de las muestras. Aquí se usará la suma de los rangos de la sucursal 1. Así, en este ejemplo, T 169.5. Dado que los tamaños de las muestras son n1 12 y n2 10 se puede usar la aproximación normal de la distribución muestral de la suma de los rangos T. La distribución muestral está determinada por las expresiones siguientes.
DISTRIBUCIÓN MUESTRAL DE T PARA POBLACIONES IDÉNTICAS
Media: μ T ¹ ₂ n1(n1 n 2 1)
(19.6)
Desviación estándar: σT 兹 ¹ ₁₂ n1n 2(n1 n 2 1) Forma de la distribución: aproximadamente normal siempre que n1
TABLA 19.8
(19.7)
10 y n2
10.
SALDOS EN LAS CUENTAS DE DOS SUCURSALES DEL BANCO THIRD NATIONAL BANK Sucursal 1 Cuenta Saldo ($) 1 2 3 4 5 6 7 8 9 10 11 12
1095 955 1200 1195 925 950 805 945 875 1055 1025 975
Sucursal 2 Cuenta Saldo ($) 1 2 3 4 5 6 7 8 9 10
885 850 915 950 800 750 865 1000 1050 935
19Ander(812-845).qxd 2/29/08 12:08 PM Page 829
19.3
829
Prueba de Mann-Whitney-Wilcoxon
TABLA 19.9
Cuenta 1 2 3 4 5 6 7 8 9 10 11 12
RANGOS CORRESPONDIENTES A LOS DATOS (REUNIDOS EN UN SOLO CONJUNTO) DE LAS DOS MUESTRAS DEL THIRD NATIONAL BANK Sucursal 1 Saldo ($) 1095 955 1200 1195 925 950 805 945 875 1055 1025 975 Suma de rangos
Rango
Cuenta
20 14 22 21 9 12.5 3 11 6 19 17 15
1 2 3 4 5 6 7 8 9 10
Sucursal 2 Saldo ($) 885 850 915 950 800 750 865 1000 1050 935
Rango 7 4 8 12.5 2 1 5 16 18 10
Suma de rangos
83.5
169.5
Para la sucursal 1 se tiene .
μ T ¹ ₂ 12(12 10 1) 138 σT 兹 ¹ ₁₂ 12(10)(12 10 1) 15.17
La figura 19.4 es la distribución muestral de T. Ahora se procede a realizar la prueba de MWW con un nivel de significancia, para llegar a una conclusión, 0.05. Como para la sucursal 1, la suma de los rangos es T 169.5, el valor del estadístico de prueba es el siguiente. z
T μT 169.5 138 2.08 σT 15.17
En la tabla de la distribución normal estándar, dado que z = 2.08, se encuentra que el valor-p para las dos colas es 2(1 0.9812) = 0.376. Como el valor-p α 0.05, se rechaza H0 y se
FIGURA 19.4
DISTRIBUCIÓN MUESTRAL DE T PARA EL EJEMPLO DE THIRD NATIONAL BANK
Distribución muestral de T cuando las poblaciones son idénticas
σ
138
T
= 15.17
T
19Ander(812-845).qxd 2/29/08 12:08 PM Page 830
830
Capítulo 19
Métodos no paramétricos
concluye que estas dos poblaciones no son idénticas; las poblaciones de los saldos en las cuentas de las dos sucursales no son una misma población. En resumen, la prueba de la suma de los rangos de Man-Whitney-Wilcoxon para determinar si dos muestras aleatorias independientes pertenecen a poblaciones idénticas consiste en los pasos siguientes. 1. Reunir en un solo conjunto las observaciones muestrales y ordenarlas de menor a mayor al asignarles un rango; a las observaciones muestrales que tengan un mismo valor se les asigna, a cada una, el promedio de los lugares que les corresponden en la lista ordenada de menor a mayor. 2. Calcular T, la suma de los rangos de la primera muestra. 3. En el caso de muestras grandes, para probar si existen diferencias significativas entre las dos poblaciones, el valor obtenido para T se compara con la distribución muestral de T para poblaciones idénticas con las ecuaciones (19.6) y (19.7). Para decidir si se rechaza H0 se emplea el valor del estadístico de prueba estandarizado z y el valor-p. En el caso de muestras pequeñas, se usa la tabla 9 del apéndice B para hallar los valores críticos para la prueba. NOTAS Y COMENTARIOS La prueba no paramétrica vista en esta sección se utiliza para determinar si dos poblaciones son idénticas. Con las pruebas estadísticas paramétricas vistas en el capítulo 10 se prueba la igualdad de dos medias poblacionales. Cuando se rechaza la hipótesis de que las medias sean iguales, se concluye que las poblaciones difieren en sus medias. En la prueba de MWW, cuando se rechaza la hipó-
tesis de que las poblaciones sean idénticas, no se puede decir en qué difieren. Las poblaciones pueden tener diferentes medias, diferentes medianas, diferentes varianzas o diferentes formas. No obstante, si se considera que las poblaciones son iguales en todos los aspectos con excepción de las medias, rechazar H0 mediante este método no paramétrico implica que las medias son diferentes.
Ejercicios
Aplicaciones
Auto examen
Auto examen
18. Para probar el efecto de dos aditivos sobre el rendimiento de la gasolina, siete automóviles usan el aditivo 1 y nueve automóviles el aditivo 2. En los datos siguientes se presenta el rendimiento en millas por galón obtenido con cada uno de los dos aditivos. Use α 0.05 y la prueba de MWW para determinar si existe una diferencia significativa en el efecto que tienen los dos aditivos sobre el rendimiento. Aditivo 1
Aditivo 2
17.3 18.4 19.1 16.7 18.2 18.6 17.5
18.7 17.8 21.3 21.0 22.1 18.7 19.8 20.7 20.2
19. A continuación se presentan los datos muestrales de los salarios iniciales de contadores públicos y planificadores financieros. Los salarios anuales están dados en miles de dólares.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 831
19.3
831
Prueba de Mann-Whitney-Wilcoxon
a. b.
Contador público
Planificador financiero
Contador público
Planificador financiero
45.2 53.8 51.3 53.2 49.2
44.0 44.2 48.1 50.9 46.9
50.0 45.9 54.5 52.0 46.9
48.6 44.7 48.9 46.8 43.9
Use 0.05 como nivel de significancia y pruebe la hipótesis de que no hay diferencia entre los salarios anuales iniciales de los contadores públicos y de los planificadores financieros. Proporcione las medias muestrales de los salarios iniciales en estas dos profesiones.
20. La brecha entre los salarios de hombres y mujeres con la misma preparación disminuye cada vez más, pero aún no se ha cerrado totalmente. A continuación se presentan datos muestrales de siete hombres y siete mujeres con licenciatura. Los datos se dan en miles de dólares.
a. b.
Hombre
30.6
75.5
45.2
62.2
38.2
49.9
55.3
Mujer
44.5
35.4
27.9
40.5
25.8
47.5
24.8
¿Cuál es el salario mediano de los hombres? ¿Cuál el de las mujeres? Use α 0.05 y realice una prueba de hipótesis para determinar si las dos poblaciones son iguales. Dé su conclusión.
21. Cada año, en diciembre, NRF/BIG Research realiza un estudio sobres el gasto que hacen las personas en las vacaciones de invierno. A continuación se presentan los datos muestrales sobre el gasto en las vacaciones de invierno en 2004 y 2005 (USA Today, 20 de diciembre de 2005).
a. b.
2004
2005
623 687 748 638 713 645 726 700 794 662 814 674
752 582 781 805 723 728 674 766 908 737 796 724
Use α 0.05 y realice una prueba para determinar si en 2005 hubo un incremento en comparación con 2004. ¿Cuál es su conclusión? Para cada uno de estos años calcule la media muestral del gasto en vacaciones. Dé el porcentaje en que aumentó o disminuyó el gasto en 2005.
22. Business Week publica estadísticas anuales sobre las 1 000 empresas más grandes. El cociente P/E (cociente de rendimiento por acción) de una empresa es el precio actual de las acciones de la empresa dividido entre la ganancia por acción en los últimos 12 meses. En la tabla 19.10 se presenta el cociente P/E de 10 empresas japonesas y 12 empresas estadounidenses de una muestra. ¿Es significativa la diferencia entre los dos países? Use la prueba de MWW y α 0.01 para dar sus conclusiones.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 832
832
Capítulo 19
TABLA 19.10
Métodos no paramétricos
COCIENTE P/E DE ALGUNAS EMPRESAS JAPONESAS Y ESTADOUNIDENSES Japón
Empresa Sumitomo Corp. Kinden Heiwa NCR Japan Suzuki Motor Fuji Bank Sumitomo Chemical Seibu Railway Shiseido Toho Gas
Estados Unidos Cociente P/E 153 21 18 125 31 213 64 666 33 68
Empresa Gannet Motorola Schlumberger Oracle Systems Gap Winn-Dixie Ingersoll-Rand American Electric Power Hercules Times Mirror WellPoint Health Northern States Power
Cociente P/E 19 24 24 43 22 14 21 14 21 38 15 14
23. Los números de delitos por día reportados a la policía durante el verano y el invierno son los siguientes. Use 0.05, como nivel de significancia, para determinar si existe una diferencia significativa entre verano e invierno, en términos del número de crímenes reportados.
Invierno
Verano
18 20 15 16 21 20 12 16 19 20
28 18 24 32 18 29 23 38 28 18
24. Los hornos de microondas de una determinada marca se venden en Dallas y en San Antonio. Los precios se presentan a continuación. Use α = 0.05 y pruebe si los precios en Dallas y en
San Antonio son los mismos.
Dallas
San Antonio
445 489 405 485 439 449 436 420 430 405
460 451 435 479 475 445 429 434 410 422 425 459 430
19Ander(812-845).qxd 2/29/08 12:08 PM Page 833
19.4
833
Prueba de Kruskal-Wallis
25. La National Association of Home Buiders proporciona datos sobre los más frecuentes proyectos de remodelación. Use la prueba de MWW para determinar si se puede concluir que el costo de remodelación de una cocina difiera del costo de remodelación de una recámara. Use 0.05 como nivel de significancia.
19.4
Cocina
Recámara
25 200 17 400 22 800 21 900 19 700 23 000 19 700 16 900 21 800 23 600
18 000 22 900 26 400 24 800 26 900 17 800 24 600 21 000
Prueba de Kruskal-Wallis La prueba de MWW, vista en la sección 19.3 se puede usar para probar si dos poblaciones son idénticas. Kruskal y Wallis extendieron esta prueba a tres o más poblaciones. La hipótesis en la prueba de Kruskal-Wallis para k 3 poblaciones se expresa como sigue. H0: Todas las poblaciones son idénticas Ha: No todas las poblaciones son idénticas
Esta prueba es una alternativa a la ANOVA presentada en el capítulo 13, en la que se prueba la igualdad de la media de k poblaciones.
TABLA 19.11
CALIFICACIONES DE DESEMPEÑO DADAS A 20 EMPLEADOS DE WILLIAMS Univer- Univer- Universidad sidad sidad A B C 25 70 60 85 95 90 80
60 20 30 15 40 35
50 70 60 80 90 70 75
La prueba de Kruskal-Wallis se basa en el análisis de muestras aleatorias independientes de cada una de las k poblaciones. En el capítulo 13 se mostró que el análisis de varianza (ANOVA) suele usarse para probar la igualdad de las medias de tres o más poblaciones. En el ANOVA se requieren datos de intervalo o de razón y se requiere suponer que las k poblaciones tienen una distribución normal. La prueba no paramétrica de Kruskal-Wallis se puede usar tanto con datos ordinales como con datos de intervalo o de razón. Además, en la prueba de Kruskal-Wallis no es necesario suponer que las poblaciones tienen una distribución normal. De manera que siempre que los datos de k 3 poblaciones sean ordinales o siempre que la suposición de que las poblaciones tengan una distribución normal sea cuestionable, la prueba de Kruskal-Wallis proporciona un método estadístico alternativo para probar si las poblaciones son idénticas. Esta prueba de Kruskal-Wallis se demostrará con un ejemplo de selección de empleados. Los empleados que contrata la empresa Williams Manufacturings para su departamento administrativo provienen de tres universidades. Recién el departamento de personal de la empresa ha empezado a revisar el desempeño anual para determinar si hay diferencia en el desempeño de los empleados provenientes de estas tres universidades. Se cuenta con los datos de muestras independientes de clasificación de acuerdo con su desempeño de siete empleados provenientes de la universidad A, seis de la universidad B y siete de la universidad C. En la tabla 19.11 se presentan estos datos; la calificación de acuerdo con su desempeño se da en una escala de 0 a 100. Suponga que se desea probar si las tres poblaciones son idénticas respecto a las calificaciones por su desempeño. Como nivel de significancia se usará 0.05. El estadístico de prueba de Kruskal-Wallis se basa en la suma de los rangos de cada muestra y se calcula como se indica a continuación.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 834
834
Capítulo 19
Métodos no paramétricos
ESTADÍSTICO DE PRUEBA DE KRUSKAL-WALLIS
W
k 12 R 2i 3(n T 1) T 1) i 1 ni
冤n (n T
兺 冥
(19.8)
donde k número de poblaciones ni número de elementos en la muestra i n T 兺ni número total de los elementos en todas las muestras Ri suma de los rangos de la muestra i
En la prueba de KruskalWallis únicamente se usa el rango ordinal de los datos.
Kruskal y Wallis mostraron que bajo la suposición de la hipótesis nula de que las poblaciones son idénticas, la distribución muestral de W puede ser aproximada por una distribución chicuadrada con k 1 grados de libertad. Esta aproximación suele ser aceptable siempre que el tamaño de cada una de las muestras sea mayor o igual a cinco. Si el valor del estadístico de prueba es grande, se rechaza la hipótesis nula de que las poblaciones son idénticas. De manera que se usa una prueba de la cola superior. Para calcular el valor del estadístico W en esta prueba, primero es necesario ordenar los 20 elementos de menor a mayor y asignarles un rango. Al valor menor de estos datos, 15 y que se encuentra en la muestra de la universidad B, se le asigna el rango 1, mientras que al valor mayor, 95 y que se encuentra en la muestra de la universidad A, se le asigna el rango 20. En la tabla 19.12 se presentan los valores de estos datos, sus rangos correspondientes y la suma de los rangos de cada una de las tres muestras. Observe que a los elementos que tienen un mismo valor se les ha asignado un rango promedio;* por ejemplo, los valores 60, 70, 80 y 90 se encuentran repetidos. Los tamaños de las muestras son n1 7
n2 6
n3 7
y n T 兺ni 7 6 7 20 Mediante la ecuación (19.8) se calcula el estadístico W. W
En los procesos con computadora que se presentan en el apéndice F, al final del libro, se muestra el uso de Minitab y Excel para calcular el valor-p.
(95)2 (27)2 (88)2 12 3(20 1) 8.92 20(21) 7 6 7
冤
冥
Ahora se emplea la tabla de la distribución chi-cuadrada (tabla 3 del apéndice B) para determinar el valor-p en esta prueba. Con k 1 3 1 2 grados de libertad, se encuentra que para χ 2 7.378, el área en la cola superior de la distribución chi-cuadrada es 0.025 y para χ 2 9.21, el área en la cola superior de la distribución chi-cuadrada es 0.01. Como W 8.92 se encuentra entre 7.378 y 9.21, se concluye que el área en la cola superior de la distribución está entre 0.025 y 0.01. Dado que se trata de una prueba de la cola superior, se concluye que el valor-p se encuentra entre 0.025 y 0.01. Con Minitab o con Excel se encuentra que el valor-p = 0.0116. Como el valor-p α 0.05, se rechaza H0 y se concluye que las poblaciones no son idénticas. *Si hay muchos valores repetidos, es necesario modificar la ecuación (19.8); la fórmula modificada se encuentra en Practical Nonparametric Statistics de W. J. Conover.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 835
19.4
835
Prueba de Kruskal-Wallis
TABLA 19.12
RANGOS PARA LOS 20 EMPLEADOS DE WILLIAMS
Universidad A Rango 25 70 60 85 95 90 80
3 12 9 17 20 18.5 15.5
Universidad B
Rango
Universidad C
Rango
60 20 30 15 40 35
9 2 4 1 6 5
50 70 60 80 90 70 75
7 12 9 15.5 18.5 12 14
Suma de los rangos 95
27
88
El desempeño de los administradores difiere significativamente dependiendo de la universidad de que provienen. Además, dado que las calificaciones al desempeño de los empleados que provienen de la universidad B son las más bajas, sería prudente que la empresa dejara de reclutar empleados de la universidad B o por lo menos los evaluara con más cuidado.
NOTAS Y COMENTARIOS En el ejemplo usado para ilustrar el procedimiento que se sigue en la prueba de Kruskal-Wallis, lo primero que se hizo fue obtener los datos de nivel de intervalo de las calificaciones del desempeño de los empleados. El procedimiento se hubiera podido realizar también si los datos fueran la clasificación or-
dinal de los 20 empleados. En ese caso, la prueba de Kruskal-Wallis se hubiera aplicado directamente a los datos originales; el paso de obtención de los rangos a partir de la calificación al desempeño se hubiera omitido.
Ejercicios
Métodos
Auto examen
26. Las calificaciones dadas a tres productos por un panel de 15 consumidores son las siguientes.
Producto A
B
C
50 62 75 48 65
80 95 98 87 90
60 45 30 58 57
Use la prueba de Kruskal-Wallis y α 0.05 para determinar si existe una diferencia significativa entre las calificaciones dadas a los tres productos. 27. Para un examen de admisión se evalúan tres programas de preparación. Las calificaciones obtenidas por las 20 personas de una muestra empleada para probar los programas de preparación son las siguientes. Use la prueba de Kruskal-Wallis para determinar si hay una diferencia significativa entre los tres programas de preparación. Use α 0.01.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 836
836
Capítulo 19
Métodos no paramétricos
Programa A
B
C
540 400 490 530 490 610
450 540 400 410 480 370 550
600 630 580 490 590 620 570
Aplicaciones
Auto examen
28. Para bajar de peso basta con practicar una de las siguientes actividades tres veces por semana durante cuarenta minutos. En la tabla siguiente se muestra la cantidad de calorías que se quema con 40 minutos de cada una de estas actividades. ¿Estos datos indican que exista diferencia en la cantidad de calorías quemadas con cada una de estas actividades? Dé su conclusión.
Natación
Tenis
Andar en bicicleta
408 380 425 400 427
415 485 450 420 530
385 250 295 402 268
29. La revista Condé Nast Traveler realiza cada año un estudio para evaluar los 80 principales barcos cruceros del mundo (Condé Nast Traveler, febrero de 2006). A continuación se dan las evaluaciones dadas a los cruceros de una muestra de las líneas Holland America, Princess y Royal Caribbean; la evaluación máxima es 100. Use la prueba de Kruskal-Wallis con α 0.05 para determinar si hay diferencia significativa en las evaluaciones de los barcos de las tres líneas.
Holland America Embarcación Evaluación
Princess Embarcación Evaluación
Royal Caribbean Embarcación Evaluación
Amsterdam Maasdam Ooterdam Volendam Westerdam
Coral Dawn Island Princess Star
Adventure Jewel Mariner Navigator Serenade
84.5 81.4 84.0 78.5 80.9
85.1 79.0 83.9 81.1 83.7
84.8 81.8 84.0 85.9 87.4
30. Una empresa grande envía a muchos de sus administrativos de primer nivel a un curso sobre habilidades de supervisión. Este curso se ofrece en cuatro centros educativos y la empresa desea determinar si éstos difieren en la calidad de la capacitación que ofrecen. Para lo cual toma una muestra de 20 de los empleados que han asistido a estos cursos y la muestra se ordena de acuerdo con sus habilidades para la supervisión, dando un rango a cada uno de los componentes de la muestra. Los resultados obtenidos se presentan a continuación. Curso 1 2 3 4
Rango de acuerdo con sus habilidades como supervisor 3 2 19 20
14 7 16 4
10 1 9 15
12 5 18 6
13 11 17 8
19Ander(812-845).qxd 2/29/08 12:08 PM Page 837
19.5
837
Correlación de rangos
Observe que el supervisor que obtuvo el mejor rango asistió al curso 2 y el supervisor que obtuvo el peor rango asistió al curso 4. Use α 0.05 y realice una prueba para determinar si hay una diferencia significativa entre la capacitación ofrecida por estos cuatro cursos. 31. Los dulces más vendidos tienen muchas calorías. Los datos siguientes muestran el contenido de calorías en muestras de M&M, Kit Kat y Milky Way II. Pruebe si hay una diferencia significativa en el contenido de calorías de estos tres dulces. Emplee como nivel de significancia 0.05, ¿cuál es su conclusión?
19.5 El coeficiente de correlación de rangos de Spearman es igual al coeficiente de correlación de Pearson, pero se emplea para datos ordinales.
M&Ms
Kit Kat
Milky Way II
230 210 240 250 230
225 205 245 235 220
200 208 202 190 180
Correlación de rangos El coeficiente de correlación es una medida de la relación lineal entre dos variables para las cuales se cuenta con datos de intervalo o de razón. En esta sección se estudia una medida de la relación entre dos variables en el caso de datos ordinales. El coeficiente de correlación por rangos de Spearman rs se usa en estos casos.
COEFICIENTE DE CORRELACIÓN DE SPEARMAN
rs 1
6 兺d 2i n(n2 1)
(19.9)
donde n xi yi di
número de elementos o individuos a los que se les va a asignar un rango rango del elemento i respecto de una variable rango del elemento i respecto de la otra variable xi yi
A continuación se ilustra el uso del coeficiente de correlación por rangos de Spearman mediante un ejemplo. Una empresa desea determinar si las personas que, en el momento de ser contratadas, generaron expectativas de muy buenos vendedores, en realidad han tenido los mejores registros de ventas. Para esto, el gerente de personal revisa cuidadosamente las entrevistas de trabajo, los antecedentes académicos y las cartas de recomendación de 10 de los vendedores de la empresa. Después de esta revisión, ordena a estas 10 personas de acuerdo con su potencial de éxito, y les da un rango con base en la información disponible al momento de contratarlos. A continuación obtiene una lista del número de unidades vendidas por cada una de estas personas en el transcurso de los primeros dos años y los reordena con un rango de acuerdo con su desempeño real en ventas. En la tabla 19.13 se dan los datos relevantes y los dos rangos. La cuestión es-
19Ander(812-845).qxd 2/29/08 12:08 PM Page 838
838
Capítulo 19
TABLA 19.13
Métodos no paramétricos
POTENCIAL DE VENTAS Y VENTAS REALIZADAS EN DOS AÑOS POR 10 VENDEDORES
Vendedor
Rango de acuerdo con su potencial
Ventas en dos años (unidades)
Rango de acuerdo con sus ventas en dos años
A B C D E F G H I J
2 4 7 1 6 3 10 9 8 5
400 360 300 295 280 350 200 260 220 385
1 3 5 6 7 4 10 8 9 2
tadística es si los rangos, de acuerdo con su potencial de ventas al momento de la contratación, coinciden con los rangos de acuerdo con las ventas realizadas durante los dos primeros años. Con los datos de la tabla 19.13 se calcula el coeficiente de correlación de rangos de Spearman. En la tabla 19.14 se resumen estos cálculos. Es claro que el coeficiente de correlación por rangos 0.73 es positivo. El coeficiente de correlación por rangos de Spearman varía de 1.0 a 1.0 y se interpreta igual que un coeficiente de correlación muestral, en que el valor positivo cercano a 1.0 indica una fuerte relación entre los rangos: si un rango crece el otro crece. Las correlaciones por rangos cercanas a 1.0 indican una fuerte relación pero negativa entre los rangos: cuando un rango crece el otro disminuye. El valor rs 0.73 indica una correlación positiva entre el desempeño potencial y real. Los individuos con un rango alto de potencial tienden a un alto desempeño.
TABLA 19.14
Vendedor A B C D E F G H I J
CÁLCULO DEL COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN ENTRE EL POTENCIAL DE VENTAS Y EL DESEMPEÑO EN VENTAS xi ⴝ Rango de acuerdo con el potencial
yi ⴝ Rango de acuerdo con el desempeño en ventas
di ⴝ xi ⴚ yi
d 2i
2 4 7 1 6 3 10 9 8 5
1 3 5 6 7 4 10 8 9 2
1 1 2 5 1 1 0 1 1 3
1 1 4 25 1 1 0 1 1 9 兺d 2i 44
rs 1
6 兺d 2i 6(44) 1 0.73 n(n2 1) 10(100 1)
19Ander(812-845).qxd 2/29/08 12:08 PM Page 839
19.5
839
Correlación de rangos
Prueba de significancia de la correlación de rangos Hasta aquí se ha visto cómo usar los resultados muestrales para calcular el coeficiente de correlación por rangos. Como ocurre con muchos otros procedimientos estadísticos, se desea emplear los resultados muestrales para hacer inferencias acerca de la correlación por rangos poblacional S. Para hacer una inferencia acerca de la correlación por rangos poblacionales, se debe probar la hipótesis siguiente. H0: p s 0 Ha: p s 0 Bajo la hipótesis nula de que no existe correlación entre los rangos ( S 0), los rangos son independientes y la distribución muestral de rS es la siguiente. DISTRIBUCIÓN MUESTRAL DE rS (19.10)
Media: μrs 0 Desviación estándar: σrs
冑
1 n 1
(19.11)
Forma de la distribución: aproximadamente normal, siempre que n
10.
El coeficiente de correlación por rangos muestrales entre el potencial de ventas y el desempeño en ventas es rS 0.73. Con este valor se puede probar si hay una correlación por rangos significativa. De acuerdo con la ecuación (19.10) se tiene que μ rs 0 y de acuerdo con la ecua1/(10 1) 0.33 . Si usa como estadístico de prueba la variación (19.11) se tiene que σrs ble aleatoria normal estándar z, tiene rs μrs 0.73 0 z 2.20 σrs 0.33 En las tablas de probabilidad normal estándar, se encuentra que para z 2.20, el valor-p 2(1 0.9861) 0.0278. Dado que el valor-p α 0.05 se rechaza la hipótesis nula de que la correlación de los rangos sea cero. Por tanto, se puede concluir que hay una correlación de rangos significativa entre el potencial de ventas y el desempeño en ventas.
Ejercicios
Métodos
Auto examen
32. Considere los siguientes conjuntos de rangos dados a los 10 elementos de una muestra.
a. b.
Elemento
xi
yi
Elemento
xi
yi
1 2 3 4 5
10 6 7 3 4
8 4 10 2 5
6 7 8 9 10
2 8 5 1 9
7 6 3 1 9
Calcule el coeficiente de correlación por rangos de Spearman. Use α 0.05 y pruebe la significancia de la correlación por rangos. Dé su conclusión.
19Ander(812-845).qxd 2/29/08 12:08 PM Page 840
840
Capítulo 19
Métodos no paramétricos
33. Considere los siguientes seis conjuntos de rangos dados a seis objetos.
Objeto A B C D E F
Caso uno Primer rango 1 2 3 4 5 6
Segundo rango 1 2 3 4 5 6
Objeto A B C D E F
Caso dos Primer rango 1 2 3 4 5 6
Segundo rango 6 5 4 3 2 1
Observe que en el primer caso los rangos son idénticos, mientras que en el segundo los rangos son exactamente opuestos. ¿Cuál es el valor que esperaría para el coeficiente de correlación por rangos de Spearman en cada caso? Explique. Para cada caso calcule el coeficiente de correlación por rangos.
Aplicaciones
Auto examen
34. En la tabla siguiente se presentan los rangos dados para una muestra de 11 estados de acuerdo con el cociente alumnos-profesor (1 más bajo, 11 más alto) y con los desembolsos por alumno (1 más alto, 11 más bajo).
Rango
Estado Arizona Colorado Florida Idaho Iowa Louisiana
Cociente alumnosprofesor 10 8 6 11 4 3
Rango
Desembolso por alumno 9 5 4 2 6 11
Estado Massachusetts Nebraska North Dakota South Dakota Washington
Cociente alumnosprofesor 1 2 7 5 9
Desembolso por alumno 1 7 8 10 3
Emplee como nivel de significancia α 0.05, ¿parece haber relación entre el desembolso por alumno y el cociente alumnos-profesor? 35. En un estudio realizado por Harris Interactive, Inc. se evaluaron las principales empresas de Internet y se evaluó también su reputación. En la lista siguiente se muestra el ranking de 10 empresas de Internet en relación, por un lado, con su reputación y, por otro, con el porcentaje de entrevistados que dijeron estar dispuestos a comprar acciones de esa empresa.
Microsoft Intel Dell Lucent Texas Instruments Cisco Systems Hewlett-Packard IBM Motorola Yahoo
Reputación 1 2 3 4 5 6 7 8 9 10
Probable compra 3 4 1 2 9 5 10 6 7 8
19Ander(812-845).qxd 2/29/08 12:08 PM Page 841
841
Resumen
a. b.
Calcule la correlación por rangos entre reputación y probable compra. Haga una prueba para determinar si existe una correlación por rangos positiva y significativa. ¿Cuál es el valor-p?
c.
Emplee como nivel de significancia 0.05, ¿cuál es su conclusión?
36. A continuación se presenta el ranking de una muestra de golfistas profesionales respecto a “driving distance” y “putting” ¿Cuál es la correlación por rangos entre “driving distance” y “putting”? Como nivel de significancia emplee α 0.10.
Golfista profesional
Driving Distance
Putting
1 5 4 9 6 10 2 3 7 8
5 6 10 2 7 3 8 9 4 1
Fred Couples David Duval Ernie Els Nick Faldo Tom Lehman Justin Leonard Davis Love III Phil Mickelson Greg Norman Mark O’Meara
37. En una determinada universidad, una organización de estudiantes entrevista tanto a estudiantes como a recién egresados para obtener información acerca de la calidad de la enseñanza. Al analizar las respuestas se llega a la siguiente clasificación de los profesores de acuerdo con su habilidad para la enseñanza. ¿Coincide la clasificación dada por los estudiantes con la clasificación dada por los recién egresados? Use α 0.10 y pruebe la significancia de la correlación por rangos.
Clasificación de acuerdo con Profesor
Estudiantes
Recién egresados
1 2 3 4 5 6 7 8 9 10
4 6 8 3 1 2 5 10 7 9
6 8 5 1 2 3 7 9 4 10
Resumen En este capítulo se presentaron varios métodos estadísticos que se clasifican como métodos no paramétricos. Debido a que los métodos no paramétricos pueden aplicarse a datos nominales y ordinales, así como a datos de intervalo o de razón y a que no se requieren suposiciones acerca de la distribución de la población, estos métodos amplían la clase de problemas que pueden ser sometidos al análisis estadístico. La prueba de los signos es un método no paramétrico para identificar diferencias entre dos poblaciones, cuando los datos de que se dispone son datos nominales. En el caso de las muestras pequeñas, para determinar los valores críticos de los signos se emplea la distribución de proba-
19Ander(812-845).qxd 2/29/08 12:08 PM Page 842
842
Capítulo 19
Métodos no paramétricos
bilidad binomial; en el caso de las muestras grandes, se emplea una aproximación normal. La prueba de los rangos con signo de Wilcoxon es un método que se emplea para analizar pares de datos, siempre y cuando los datos de cada par sean datos de intervalo o de razón; no es necesario hacer suposiciones acerca de la distribución de la población. Con el método de Wilcoxon se prueba la hipótesis de que las dos poblaciones que se comparan son idénticas. La prueba de Mann-Whitney-Wilcoxon es un método no paramétrico que se usa para probar la diferencia entre dos poblaciones con base en dos muestras aleatorias independientes; se presentaron tablas para el caso de muestras pequeñas y para el caso de muestras grandes se empleó la aproximación normal. La prueba de Kruskal-Wallis es el análogo no paramétrico a la prueba paramétrica ANOVA para las diferencias entre medias poblacionales. En la última sección de este capítulo se presentó el coeficiente de correlación por rangos de Spearman, que es una medida de la relación entre dos conjuntos de elementos ordinales o datos ordenados por rangos.
Glosario Métodos no paramétricos Métodos estadísticos que requieren pocas o ninguna suposición acerca de la distribución de probabilidad de la población y acerca del nivel de medición. Estos métodos suelen usarse cuando se cuenta con datos nominales y ordinales. Prueba de los signos Prueba estadística no paramétrica para identificar diferencias entre dos poblaciones con base en el análisis de datos nominales. Prueba de los rangos con signo de Wilcoxon Prueba estadística no paramétrica para identificar diferencias entre dos poblaciones con base en el análisis de dos muestras pareadas. Prueba de Mann-Whitney-Wilcoxon (MWW) Prueba estadística no paramétrica para identificar diferencias entre dos poblaciones con base en el análisis de dos muestras independientes. Prueba de Kruskal-Wallis Prueba no paramétrica para identificar diferencias entre tres o más poblaciones. Coeficiente de correlación por rangos de Spearman Medida de la correlación que se basa en los datos ordenados por rangos de dos variables.
Fórmulas clave Prueba de los signos (muestras grandes) Media: μ 0.50n Desviación estándar: σ 兹0.25n
(19.1) (19.2)
Prueba de los rangos con signo de Wilcoxon Media: μ T 0 Desviación estándar: σT
冑
(19.3)
n(n 1)(2n 1) 6
(19.4)
Prueba de Mann-Whitney-Wilcoxon (muestras grandes) Media: μ T ¹ ₂ n1(n1 n 2 1) Desviación estándar: σT 兹 ¹ ₁₂ n1n 2(n1 n 2 1)
(19.6) (19.7)
19Ander(812-845).qxd 2/29/08 12:08 PM Page 843
843
Ejercicios complementarios
Estadístico de prueba Kruskal-Wallis W
冤
k 12 R 2i 3(n T 1) n T (n T 1) i 1 ni
兺 冥
(19.8)
Coeficiente de correlación por rangos de Spearman rs 1
6 兺d 2i n(n2 1)
(19.9)
Ejercicios complementarios 38. En una encuesta se hizo la siguiente pregunta: ¿usted está a favor o en contra de proporcionar vales libres de impuestos o deducciones de impuestos a los padres que envían a sus hijos a escuelas privadas? De los 2 010 encuestados, 905 estuvieron a favor, 1 045 estuvieron en contra y 60 no tuvieron ninguna opinión al respecto. ¿Estos datos indican que existe una diferencia significativa entre las opiniones respecto al apoyo a los padres que envían a sus hijos a escuelas privadas? Como nivel de significancia use 0.05. 39. El precio mediano en Estados Unidos de una vivienda nueva unifamiliar es $230 000 (The Associated Press, 25 de marzo de 2006). Suponga que los siguientes datos son de las ventas de casas unifamiliares ya existentes en Houston y Boston.
Más que $230 000
Igual que $230 000
Menos que $230 000
11 27
2 1
32 13
Houston Boston
a. b.
¿Es el precio mediano de venta en Houston inferior a la mediana estadounidense? Use una prueba estadística con α 0.05 para respaldar su conclusión. ¿Es el precio mediano de venta en Boston superior a la mediana estadounidense? Use una prueba estadística con α 0.05 para respaldar su conclusión.
40. A 12 amas de casa se les pidió que estimaran el precio de venta de dos modelos de refrigeradores. En la tabla siguiente se muestran las estimaciones que dieron. Use estos datos y 0.05 como nivel de significancia y haga una prueba para determinar si existe alguna diferencia entre los dos modelos en términos de la percepción que tienen las amas de casa sobre sus precios.
Ama de casa
Modelo 1
Modelo 2
Ama de casa
Modelo 1
Modelo 2
1 2 3 4 5 6
$650 760 740 700 590 620
$900 720 690 850 920 800
7 8 9 10 11 12
$700 690 900 500 610 720
$890 920 1000 690 700 700
41. Un estudio busca evaluar la ganancia potencial de peso con cierto alimento aviar. Una muestra de 12 aves se usó durante un periodo de seis semanas. Cada una de las aves se pesó antes y después de un periodo de prueba. Las diferencias entre los pesos antes y después observadas en las 12 aves son: 1.5, 1.2, 0.2, 0, 0.5, 0.7, 0.8, 1.0, 0, 0.6, 0.2, 0.01. Valores negativos indican pérdida de peso durante el periodo de prueba y los ceros indican que no hubo ninguna variación durante el
19Ander(812-845).qxd 2/29/08 12:08 PM Page 844
844
Capítulo 19
Métodos no paramétricos
periodo de prueba. Use 0.05 como nivel de significancia y determine si este nuevo alimento parece ocasionar un aumento de peso en las aves. 42. Los datos siguientes son pesos de un producto en dos líneas de producción. Use α 0.05 y haga una prueba para determinar si existe diferencia entre los pesos de las dos líneas de producción.
Línea de producción 1
Línea de producción 2
13.6 13.8 14.0 13.9 13.4 13.2 13.3 13.6 12.9 14.4
13.7 14.1 14.2 14.0 14.6 13.5 14.4 14.8 14.5 14.3 15.0 14.9
43. Un cliente desea saber si hay una diferencia significativa entre los tiempos que se requieren para realizar un programa de evaluación por tres métodos diferentes. A continuación se presentan los tiempos (en horas) requeridos por cada uno de los 18 evaluadores para llevar a cabo el programa de evaluación.
Método 1
Método 2
Método 3
68 74 65 76 77 72
62 73 75 68 72 70
58 67 69 57 59 62
Use α 0.05 y realice una prueba para ver si existe una diferencia significativa entre los tiempos requeridos por los tres métodos. 44. Una muestra de 20 ingenieros que han estado empleados en una empresa durante tres años ha sido ordenada por rangos de acuerdo al potencial administrativo. Algunos de estos ingenieros han asistido a cursos de desarrollo dados por la empresa, otros han asistido a cursos de desarrollo dados por la universidad y los restantes no han asistido a ningún tipo de curso. Emplee α 0.025 y realice una prueba para ver si existe una diferencia significativa entre el potencial administrativo de los tres grupos.
Ningún curso
Curso de la empresa
Curso de la universidad
16 9 10 15 11 13
12 20 17 19 6 18 14
7 1 4 2 3 8 5
19Ander(812-845).qxd 2/29/08 12:08 PM Page 845
845
Ejercicios complementarios
45. A continuación se presentan las calificaciones dadas en la evaluación a cuatro profesores. Use α 0.05 y el método de Kruskal-Wallis para probar si existe diferencia significativa en sus evaluaciones.
Profesor
Calificación en la evaluación del curso
Black Jennings Swanson Wilson
88 87 88 80
80 78 76 85
79 82 68 56
68 85 82 71
96 99 85 89
69 99 82 87
85 84
94 83
81
46. Los 15 alumnos de una muestra obtuvieron los rangos siguientes en el examen de mitad de semestre y en el examen final de un curso de estadística.
Rango
Rango
Rango
Mitad
Final
Mitad
Final
Mitad
Final
1 2 3 4 5
4 7 1 3 8
6 7 8 9 10
2 5 12 6 9
11 12 13 14 15
14 15 11 10 13
Calcule el coeficiente de correlación por rangos de Spearman y emplee α = 0.10, pruebe si hay una correlación significativa.
20Ander(846-878).qxd 2/29/08 12:22 PM Page 846
CAPÍTULO
20
Métodos estadísticos para el control de calidad CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: DOW CHEMICAL COMPANY
20.1 FILOSOFÍAS Y MARCO DE REFERENCIA Malcolm Baldrige National Quality Award ISO 9000 Seis sigma
20.2 CONTROL ESTADÍSTICO DE PROCESOS Cartas de control Cartas x̄: media y desviaciones estándar del proceso conocidas
Cartas x̄: media y desviaciones estándar del proceso desconocidas Cartas R Cartas p Cartas np Interpretación de las cartas de control
20.3 MUESTREO DE ACEPTACIÓN KALI, Inc., un ejemplo de muestreo de aceptación Cálculo de la probabilidad de aceptar un lote Selección de un plan de muestreo de aceptación Planes de muestreo múltiple
20Ander(846-878).qxd 2/29/08 12:22 PM Page 847
847
La estadística en la práctica
LA ESTADÍSTICA
en LA PRÁCTICA
DOW CHEMICAL COMPANY* FREEPORT, TEXAS
En 1940, la empresa Dow Chemical adquirió un terreno de 800 acres en Texas, en la costa del Golfo, para construir una planta de producción de magnesio. La planta original se ha extendido hasta cubrir más de 5 000 acres y engloba uno de los complejos petroquímicos más grandes del mundo. Entre los productos de Dow Texas Operations se encuentran magnesio, estireno, plásticos, adhesivos, solventes, glicol y cloro. Algunos de los productos se obtienen únicamente para usarlos en otros procesos, pero muchos terminan como ingredientes esenciales de productos farmacéuticos, pastas dentales, alimentos para perros, mangueras, refrigeradores, envases de cartón para leche, bolsas para basura, champús y muebles. Dow’s Texas Operations produce más del 30% del magnesio del mundo; el magnesio es un metal extremadamente ligero que se emplea en productos tan diversos como raquetas de tenis y rines de magnesio. El Departamento del Magnesio fue el primer grupo de Texas Operations que capacitó a su personal técnico y a sus administrativos para usar el control estadístico de calidad. Algunos de los primeros acertados empleos del control estadístico de calidad fueron en los procesos químicos. En una aplicación en la que intervenía la operación de un secador, se tomaban muestras del producto a intervalos regulares, se calculaba el promedio de cada muestra y se registraba en una carta x̄. Estas cartas permitían a los analistas de Dow vigilar tendencias en los productos que pudieran indicar que el proceso no se estaba desarrollando correctamente. En una ocasión los analistas empezaron a observar que las medias muestrales presentaban valores que no correspondían a un proceso que se desarrollara den* Los autores agradecen a Clifford B. Wilson, administrador de Magnesium Technical, The Dow Chemical Company, por proporcionar este artículo para La estadística en la práctica.
El control estadístico de calidad ha permitido a la empresa Dow Chemical mejorar sus métodos de producción y sus productos. © PR Newswire Dow Chemical USA. tro de los límites previstos. Mediante un examen más cuidadoso de las cartas de control y de la operación misma, los analistas encontraron que las variaciones podían deberse a algún problema relacionado con el operador. Después de capacitar nuevamente al operador, las cartas x̄ indicaron una mejoría significativa en la calidad del proceso. En cualquier parte que Dow aplica el control estadístico de calidad, se logra una mejora de la calidad. Se han logrado ahorros documentados de cientos de miles de dólares por año y continuamente se han descubierto nuevas aplicaciones. En este capítulo se mostrará cómo elaborar una carta x̄ como las empleadas por Dow. Estas cartas son parte del control estadístico de calidad conocido como control estadístico de procesos. También se verán métodos de control de calidad que se usan en situaciones en que la decisión de aceptar o rechazar un conjunto de artículos se basa únicamente en una muestra.
La American Society for Quality (ASQ) define la calidad como “la totalidad de rasgos y características de un producto o servicio relacionados con su capacidad para satisfacer determinadas necesidades”. Las organizaciones reconocen que en la actual economía global, para ser competitivas tienen que esforzarse por lograr un alto nivel de calidad. De ahí que cada vez se le dé más importancia a los métodos para el monitoreo y el mantenimiento de la calidad. En la actualidad el enfoque orientado al cliente, fundamental para las organizaciones de alto desempeño, ha transformado el ámbito de las cuestiones de calidad, de la simple eliminación de defectos en la línea de producción a la elaboración de estrategias corporativas de calidad con base amplia. La ampliación del ámbito de la calidad conduce, de manera natural, al concepto de calidad total (CT). La calidad total (CT) es un sistema de gestión enfocado a la persona que busca mejorar cada vez más la satisfacción del cliente con costos reales cada vez más bajos. La CT es un sistema (no un
20Ander(846-878).qxd 2/29/08 12:22 PM Page 848
848
Capítulo 20
Métodos estadísticos para el control de calidad
área aparte o un programa de trabajo) y parte integral de una estrategia de alto nivel; la CT funciona a través de todas las funciones y departamentos, involucra a todos los empleados, desde el de más alto nivel hasta el de más bajo y se extiende hacia adelante y hacia atrás incluyendo a la cadena de proveedores y a la cadena de clientes. La CT hace hincapié en el aprendizaje y en la adaptación al cambio continuo como claves para el éxito de una organización.*
Sin importar la manera en que se implemente en las distintas organizaciones, la calidad total se basa en tres principios fundamentales: centrar la atención en el cliente y todos los implicados; participación y trabajo de equipo de toda la organización, y dar especial atención a la mejora continua y al aprendizaje. En la primera sección de este capítulo se presenta una breve introducción acerca de las tres referencias principales en la gestión de calidad: el Malcolm Baldrige Award, los estándares ISO 9000 y la filosofía Seis sigma. En las dos últimas secciones se estudian dos herramientas estadísticas que se usan para monitorear la calidad: el control estadístico de procesos y el muestreo de aceptación.
20.1 Después de la Segunda Guerra Mundial el doctor W. Edwards Deming fue consultor de la industria japonesa; a él se le atribuye haber convencido a los altos directivos japoneses de usar el método del control estadístico de calidad.
Filosofías y marco de referencia Dos personas que han tenido una gran influencia en las cuestiones sobre la calidad son el doctor W. Edwards Deming y Joseph Juran. Estos dos personajes colaboraron, poco después de la Segunda Guerra Mundial, en la educación de los japoneses en gestión de calidad. Aunque la calidad es un asunto del trabajo de todo mundo, Deming hizo hincapié en que el poner especial atención a la calidad debía ser asunto de los gerentes y directivos; elaboró una lista de 14 puntos que él consideraba que representaban las responsabilidades clave de los gerentes y directivos. Por ejemplo, Deming decía que los gerentes y directivos debían abandonar la inspección en masa; acabar con la práctica de hacer negocios con base únicamente en el precio; que debía buscarse la mejora continua de todos los procesos de producción y servicios; fomentar un ambiente orientado al trabajo en equipo, y que debían eliminarse los objetivos, eslóganes y metas de trabajo basados en cuotas numéricas de trabajo. Lo más importante era que los directivos debían crear un ambiente de trabajo en el que, en todos los niveles, se mantuviera un compromiso continuo con la calidad y la productividad. Juran propuso una definición simple de calidad: adecuación al uso. El método de calidad de Juran se concentraba en tres procesos: planeación de la calidad, control de la calidad y mejoramiento de la calidad. A diferencia de la filosofía de Deming, que requería un cambio cultural importante en la organización, los programas de Juran tenían como fin mejorar la calidad al trabajar con el sistema organizacional existente. No obstante, las dos filosofías se parecen en que se centran en la necesidad de que los directivos se involucren y hagan hincapié en la necesidad de un mejoramiento continuo, en la importancia de la capacitación y en el uso de técnicas de control de calidad. Hubo otras muchas personas que tuvieron un papel importante en el movimiento de la calidad. Entre ellos se encuentran Philip B. Crosby, A. V. Feigenbaum, Karou Ishikawa y Genichi Taguchi. En textos especializados, dedicados únicamente al tema de la calidad, se encuentran detalles sobre las contribuciones de cada uno de ellos. Las contribuciones de todos los involucrados en el movimiento de calidad ayudaron a definir el conjunto de las mejores prácticas y llevaron a la creación de numerosos programas de premios y de certificación. Los dos programas más importantes son el Malcolm Baldrige National Quality Award, de Estados Unidos, y el proceso internacional de certificación ISO 9000. En los últimos años ha aumentado también el uso de Seis Sigma, una metodología para el mejoramiento del desempeño organizacional que se basa en la recolección de datos y en el análisis estadístico.
Malcolm Baldrige National Quality Award El Malcolm Baldrige National Quality Award es entregado por el presidente de Estados Unidos a las organizaciones que apliquen y que se les considere destacadas en siete áreas: liderazgo; planeación estratégica; enfoque al cliente y al mercado; gestión de medición, análisis y conocimiento; especial atención al recurso humano; gestión de procesos y resultados económicos. El congreso *J. R. Evans y W. M. Lindsay, The Management and Control of Quality, 6a. ed. (Cincinnati, OH: South-Western, 2005), pp. 18-19.
20Ander(846-878).qxd 2/29/08 12:22 PM Page 849
20.1 El National Institute of Standards and Technology (NIST) dependiente del Departamento de Comercio de Estados Unidos es el que se ocupa del Baldrige National Quality Program. Más información se puede obtener en www.quality.nist.gov.
Filosofías y marco de referencia
849
estableció el programa de este premio en 1987 para reconocer a las organizaciones estadounidenses por sus logros en calidad y desempeño, y para llamar la atención acerca de la importancia de la calidad como ventaja competitiva. Malcolm Baldrige trabajó como secretario de comercio de Estados Unidos, desde 1981 hasta su muerte en 1987; el premio lleva su nombre en su honor. Desde la ceremonia de entrega de los primeros premios en 1988, el Baldrige National Quality Program ha crecido en estatura y en impacto. Desde 1988 se han distribuido aproximadamente 2 millones de copias de los criterios, a lo que se suman las reproducciones en gran escala hechas por las organizaciones y el acceso electrónico. Por octavo año consecutivo, un índice accionario hipotético, formado por empresas estadounidenses que cotizan en la bolsa y que han recibido el Baldrige Award, supera el Standar & Poor’s 500. En el 2003, el “Índice Baldrige” superó al S&P 500 por 4.4 a 1. En la ceremonia de premiación de 2003, Bob Barnett, vicepresidente ejecutivo de Motorola, Inc., dijo, “Ingresamos a este programa de calidad, no con la idea de ganar, sino con el objetivo de obtener la evaluación de los examinadores de Baldrige. Esta evaluación fue cabal, profesional y clara... haciendo de ella la consultoría más rentable y con mayor valor agregado que se puede obtener, actualmente, en todo el mundo.”
ISO 9000 ISO 9000 es una serie de cinco estándares internacionales publicados en 1987 por la Organización Internacional para la Estandarización (ISO), Génova, Suiza. Las empresas pueden usar estos estándares como ayuda, para determinar lo que se necesita para mantener un sistema de conformidad de calidad eficiente, para garantizar que los instrumentos de medición y de prueba sean calibrados regularmente y, para mantener, y adecuar, un sistema apropiado de documentación. El registro ISO 9000 determina si una empresa cumple con su propio sistema de calidad. En general, el registro ISO 9000 cubre menos del 10% de los criterios del Baldrige Award.
Seis Sigma Al final de los años ochenta, Motorola advirtió la necesidad de mejorar la calidad de sus productos y servicios; su objetivo fue lograr un nivel de calidad tan bueno que en cada millón de operaciones no se presentaran más de 3.4 errores. A este nivel de calidad se le conoce como el nivel de calidad seis sigma y a la metodología creada para lograr este objetivo de calidad se le conoce como Seis Sigma. Una organización puede emprender dos tipos de proyectos Seis Sigma:
• •
DMAIC (Definir, Evaluar, Analizar, Mejorar y Controlar) como ayuda para rediseñar procesos ya existentes. DFSS (Diseño para Seis sigma) para diseñar nuevos productos, procesos o servicios.
Para ayudar en el rediseño de procesos ya existentes y en el diseño de nuevos procesos, Seis Sigma hace hincapié en el análisis estadístico y en la evaluación cuidadosa. Actualmente, Seis Sigma es una herramienta importante para ayudar a las organizaciones a alcanzar niveles Baldrige de desempeño en negocios y muchos de los examinadores del Baldrige consideran a Seis Sigma como un método ideal para poner en marcha programas de mejoramiento de Baldrige. Límites de Seis Sigma y defectos por millón de operaciones En la terminología de Seis Sigma, un defecto es un error que llega al cliente. El proceso Seis Sigma define desempeño de calidad en términos de defectos por millones de operaciones (dpmo). Como ya se indicó, Seis sigma representa un nivel de calidad de por lo menos 3.4 dpmo. Para ilustrar cómo se evalúa este nivel de calidad se tomará como ejemplo un caso de la empresa empacadora KJW. KJW tiene una línea de producción en la que llena paquetes de cereal. En este proceso, la media es μ 16.05 onzas y la desviación estándar es σ 0.10 onzas. Suponga que los pesos de llenado siguen una distribución normal. En la figura 20.1 se muestra la distribución de los pesos de llenado. Suponga que los directivos consideran como límites de calidad aceptables para este proceso de 15.45 a 16.65 onzas. Por tanto, todo paquete de cereal que contenga menos que 15.45
20Ander(846-878).qxd 2/29/08 12:22 PM Page 850
850
Capítulo 20
FIGURA 20.1
Métodos estadísticos para el control de calidad
DISTRIBUCIÓN NORMAL DE LOS PESOS DE LLENADO DE LOS PAQUETES DE CEREALES, LA MEDIA ES μ 16.05
σ = 0.10
Defecto
15.45 Límite inferior de calidad
Defecto
16.05 Media μ del proceso
16.65 Límite superior de calidad
o más que 16.65 onzas será considerado como defecto. Mediante Excel o Minitab se puede mostrar que 99.9999998% de los paquetes llenados pesará entre 16.05 – 6(0.10) = 15.45 onzas y 16.05 + 6(0.10) = 16.65 onzas. En otras palabras, sólo 0.0000002% de los paquetes llenados contendrán menos de 15.45 onzas o más de 16.65 onzas. Por tanto, la posibilidad de que en este proceso de llenado, un paquete de cereal sea defectuoso parece ser extremadamente pequeña, ya que en promedio sólo 2 paquetes de cada 10 millones serán defectuosos. Motorola se cercioró, en sus primeros trabajos con Seis Sigma, de que la media de un proceso se puede desplazar en promedio hasta 1.5 desviaciones estándar. Por ejemplo, suponga que la media en el proceso de KJW aumente en 1.5 desviaciones estándar, es decir 1.5(0.10) = 0.15 onzas. Con este desplazamiento, la distribución normal de los pesos de llenado tendrá como centro μ = 16.05 + 0.15 = 16.20 onzas. Cuando la media del proceso es μ = 16.05 onzas, la probabilidad de obtener un paquete de cereal que pese más de 16.65 onzas es extremadamente pequeña. Pero, ¿cuál es esta probabilidad si la media se desplaza a 16.20 onzas? En la figura 20.2 se muestra que en este caso, el límite superior de calidad, 16.65 se encuentra a 4.5 desviaciones estándar a la derecha de la nueva media 16.20 onzas. En Excel o Minitab se ve que con esta media, la probabilidad de que un paquete pese más de 16.65 onzas es 0.0000034. Por tanto, si la media del proceso se desplaza hacia arriba 1.5 desviaciones estándar, aproximadamente 1 000 000(0.0000034) = 3.4 paquetes de cereal sobrepasarán el límite superior de 16.65 onzas. En la terminología de Seis Sigma, se dice que el nivel de calidad del proceso es de 3.4 defectos por millón de operaciones. Si los directivos de KJW consideran que 15.45 a 16.65 onzas son límites de calidad aceptables, este proceso de llenado de KJW será considerado un proceso Seis Sigma. Por tanto, si la media del proceso permanece a no más de 1.5 desviaciones estándar de la media deseada μ = 16.05 onzas, se pueden esperar como máximo 3.4 paquetes defectuosos por millón de paquetes llenados. Las organizaciones que desean alcanzar y mantener un nivel de calidad Seis Sigma deben poner especial cuidado en emplear métodos para la vigilancia y conservación de la calidad. El aseguramiento de la calidad se refiere a todo el conjunto de políticas, procedimientos y lineamientos establecidos por la organización para alcanzar y mantener la calidad. El aseguramiento de la calidad consiste en dos funciones principales: ingeniería de calidad y control de calidad. El objeto de la ingeniería de calidad es incluir la calidad en el diseño de los productos y procesos e identificar los problemas de calidad antes de la producción. El control de calidad consiste en una se-
20Ander(846-878).qxd 2/29/08 12:22 PM Page 851
20.2
851
Control estadístico de procesos
FIGURA 20.2
DISTRIBUCIÓN NORMAL DE LOS PESOS DE LLENADO DE PAQUETES DE CEREAL, LA MEDIA DEL PROCESO ES μ 16.20
σ = 0.10
0.0000034 o 3.4 dpmo
μ = 16.20
Media del proceso que se ha incrementado 1.5 desviaciones estándar
16.65 Límite superior de calidad
rie de inspecciones y mediciones usadas para determinar si se están satisfaciendo los estándares de calidad. Si no es el caso, se pueden tomar medidas correctivas o preventivas para alcanzar y mantener la conformidad. En las dos secciones siguientes se presentan dos métodos estadísticos que se usan en el control de calidad. En el primero, el control estadístico de procesos, se emplean representaciones graficas conocidas como cartas de control para monitorear un proceso; el objetivo es determinar si puede continuar el proceso o si se deben tomar medidas correctivas para lograr el nivel de calidad deseado. El segundo método, el muestreo de aceptación, se emplea cuando la decisión de aceptar o rechazar un conjunto de artículos tiene que basarse en la calidad encontrada en una muestra.
20.2
Uno de los conceptos más importantes en el movimiento de administración de la calidad total es la mejora continua. El principal objetivo de una carta de control es mejorar la calidad.
Control estadístico de procesos En esta sección se estudiarán procesos de control de calidad que se emplean en los procesos de producción en que los bienes se producen de manera continua. Con base en una muestra y en la inspección del producto del proceso se decide si se puede continuar con el proceso de producción o si es necesario ajustarlo para que los artículos o los bienes producidos estén dentro de los estándares de calidad aceptables. Aunque se cuente con estándares altos en las operaciones de fabricación y de producción, invariablemente habrá herramientas y maquinaria que se desgastan, vibraciones que hagan que se desajuste la maquinaria, materiales empleados que puedan presentar anomalías y operadores que cometan errores. Todos estos factores suelen dar como resultado un producto de mala calidad. Por fortuna, existen procedimientos para vigilar la calidad de los productos, mediante los cuales se puede detectar oportunamente una mala calidad y ajustar o corregir el proceso de fabricación. Si las variaciones en la calidad del producto se deben a causas asignables como desgaste de las herramientas, ajuste incorrecto de la maquinaria, materia prima de mala calidad o errores del operador, es necesario ajustar o corregir el proceso lo antes posible. Por otro lado, si las variaciones en la calidad del producto se deben a lo que se conoce como causas comunes —es decir, variaciones que se presentan de manera aleatoria, como variaciones en la temperatura, la humedad, etc., causas que no puede controlar el fabricante—, no es necesario ajustar el proceso. El objetivo
20Ander(846-878).qxd 2/29/08 12:22 PM Page 852
852
Capítulo 20
TABLA 20.1
Métodos estadísticos para el control de calidad
RESULTADOS DEL CONTROL ESTADÍSTICO DE PROCESOS Situación del proceso de producción H0 es verdadera El proceso está bajo control Que continúe el proceso
Decisión correcta
Error tipo II (dejar continuar un proceso que está fuera de control)
Ajustar el proceso
Error tipo I (ajustar un proceso que se encuentra bajo control)
Decisión correcta
Decisión
Los procedimientos de control de procesos están estrechamente relacionados con los procedimientos de prueba de hipótesis, ya antes vistos en este libro. Las cartas de control permiten realizar sobre la marcha pruebas de la hipótesis de que el proceso está bajo control.
A las cartas de control que se basan en datos que se pueden medir en una escala continua se les llama cartas de control de variables. Las cartas x̄ son cartas de control de variables.
H0 es falsa El proceso está fuera de control
principal del control estadístico de procesos es determinar si las variaciones en el producto se deben a causas asignables o a causas comunes. Cuando se detectan causas asignables se dice que el proceso está fuera de control. En tales casos se toman medidas correctivas para hacer que el proceso regrese a los niveles de calidad aceptables. Si las variaciones que se observan en el producto de un proceso de fabricación se deben únicamente a causas comunes, se concluye que el producto se encuentra bajo control estadístico o simplemente bajo control; en esos casos no es necesario hacer modificación o ajuste alguno. Los métodos estadísticos para el control de procesos se basan en la metodología de las pruebas de hipótesis, presentada en al capítulo 9. La hipótesis nula H0 se formula considerando que el proceso de producción está bajo control. La hipótesis alternativa Ha se formula considerando que el proceso de producción está fuera de control. En la tabla 20.1 se muestra cómo se toman las decisiones correctas de dejar que continúe un proceso que está bajo control o de ajustar un proceso que está fuera de control. Como ocurre con las demás pruebas de hipótesis, aquí también es posible cometer un error tipo I (ajustar un proceso que está bajo control) o un error tipo II (permitir que continúe un proceso que está fuera de control).
Cartas de control Las cartas de control constituyen la base para decidir si las variaciones en el producto se deben a causas comunes (en control) o causas asignables (fuera de control). Siempre que se detecte que un proceso está fuera de control es necesario realizar ajustes o tomar medidas correctivas que hagan que el proceso regrese a la situación bajo control. Las cartas de control se clasifican de acuerdo con el tipo de datos que contienen. Se usa una carta x- cuando la calidad del producto de un proceso se mide en términos de una variable, como longitud, peso, temperatura, etc. En tal caso, la decisión de dejar continuar el proceso de producción o de ajustarlo se basa en el valor de la media hallada en una muestra del producto. Para introducir algunos de los conceptos que son comunes a todas las cartas de control, se considerarán algunos de los rasgos característicos de una carta x̄. En la figura 20.3 se presenta la estructura general de una carta x̄. La línea central que se observa en esta carta corresponde a la media del proceso, cuando el proceso está bajo control. La línea vertical identifica la escala de medición para la variable de interés. Cada vez que se toma una muestra del proceso de producción, se obtiene el valor de su media muestral x̄ y se grafica el punto correspondiente al valor de x̄ en la carta de control. Las dos líneas rotuladas como UCL y LCL sirven para determinar si el proceso está bajo control o fuera de control. A estas líneas se les llama límite de control superior y límite de control inferior, respectivamente. Estos límites se eligen de manera que cuando el proceso esté bajo control exista una gran probabilidad de que los valores de x̄ estén entre estos dos límites. Si hay valores que estén fuera de los límites de control, éstos serán evidencias estadísticas claras de que el proceso se encuentra fuera de control y que es necesario tomar medidas correctivas. A medida que pasa el tiempo, se van graficando más y más puntos en la carta de control. El orden en el que se van agregando estos puntos es de izquierda a derecha, a medida que se van toman-
20Ander(846-878).qxd 2/29/08 12:22 PM Page 853
20.2
853
Control estadístico de procesos
FIGURA 20.3
ESTRUCTURA DE UNA CARTA x̄
Media muestral
UCL
Línea central
Media del proceso bajo control
LCL Tiempo
do las muestras del proceso. En esencia, cada vez que se grafica un nuevo punto en una carta de control, se está realizando una prueba de hipótesis para determinar si el proceso está bajo control. Además de las cartas x̄ se pueden usar otras cartas, como cartas para monitorear el rango de las mediciones en la muestra (cartas R) o para monitorear la proporción de defectos en la muestra (cartas p) o para monitorear la cantidad de defectos en la muestra (cartas np). En todos estos casos, las cartas de control tienen una línea inferior de control (LCL, por sus siglas en inglés), una línea central y una línea superior de control (UCL por sus siglas en inglés) como la carta x̄ de la figura 20.3. La principal diferencia entre estas cartas es la que se mide en el eje vertical; por ejemplo, en una carta p la escala de medición, en lugar de denotar la media muestral, denota la proporción de artículos defectuosos existentes en una muestra. A continuación se ilustrará la construcción y el uso de las cartas x̄ , de las cargas R, de las cartas p y de las cartas np.
_ Cartas x: media y desviaciones estándar del proceso conocidas Para ilustrar la construcción de una carta x̄ se empleará el ejemplo de la empacadora KJW. Recuerde que la empresa KJW, cuenta con una de sus líneas de producción en la que llena paquetes de cereal. Cuando el proceso se desarrolla correctamente —y por tanto se encuentra bajo control— el peso medio de llenado es μ 16.05 onzas y la desviación estándar del proceso es σ 0.10 onzas. Se supone, también, que los pesos de llenado siguen una distribución normal. En la figura 20.4 se muestra esta distribución. Para determinar la variación que puede esperarse en los valores de x̄ cuando el proceso está bajo control se usa la distribución muestral de x̄ , vista en el capítulo 7. Se recuerdan brevemente, las propiedades de la distribución muestral de x̄ . recuerde que el valor esperado o la media de los valores de x̄ es igual a μ, el peso medio de llenado si la línea de producción está bajo control. Si las muestras son de tamaño n, la ecuación para obtener la desviación estándar de x̄ , que se conoce como error estándar de la media, es σ σx̄ (20.1) 兹n Además, como los pesos de llenado están distribuidos normalmente, para cualquier tamaño de muestra, la distribución muestral de x̄ es una distribución normal. De manera que la distribución muestral de x̄ es una distribución normal con media μ y desviación estándar σx̄. En la figura 20.5 se presenta esta distribución. La distribución muestral de x̄ se usa para determinar cuáles son valores razonables de x̄ cuando el proceso se halla bajo control. En el control de calidad se suele considerar como razonable todo valor de x̄ que no se aleje de la media, hacia arriba o hacia abajo, más de 3 desviaciones estándar o errores estándar. Recuerde que al estudiar la distribución de probabilidad normal se vio
20Ander(846-878).qxd 2/29/08 12:22 PM Page 854
854
Capítulo 20
FIGURA 20.4
Métodos estadísticos para el control de calidad
DISTRIBUCIÓN NORMAL DE LOS PESOS DE LLENADO DE LOS PAQUETES DE CEREAL
σ = 0.10
16.05 Media μ del proceso
FIGURA 20.5
DISTRIBUCIÓN MUESTRAL DE x̄ PARA UNA MUESTRA DE n PESOS DE LLENADO
σx =
μ
σ
n
x
E(x)
que aproximadamente 99.7% de los valores de una variable aleatoria que tengan una distribución normal se encuentran a no más de 3 desviaciones estándar de su media. Por tanto, si un valor de x̄ se encuentra dentro del intervalo de μ 3σx̄ a μ 3σx̄ se admitirá que el proceso está bajo control. En resumen, los límites de control en una carta x̄ son los siguientes:
LÍMITES DE CONTROL EN UNA CARTA x̄ : MEDIA Y DESVIACIÓN ESTÁNDAR DEL PROCESO CONOCIDAS
UCL μ 3σx̄ LCL μ 3σx̄
(20.2) (20.3)
20Ander(846-878).qxd 2/29/08 12:22 PM Page 855
20.2
855
Control estadístico de procesos
FIGURA 20.6
CARTA x̄ DEL PROCESO DE LLENADO DE LOS PAQUETES DE CEREAL
16.20 UCL Media muestral x
16.15 16.10 16.05
Media del proceso
16.00 15.95 LCL 15.90
Proceso fuera de control 1
2
3
4
5
6
7
8
9
10
Número de muestra
De regreso al ejemplo de la empresa KJW, la distribución de los pesos de llenado se muestra en la figura 20.4 y la distribución muestral de x̄ se muestra en la figura 20.5. Suponga que periódicamente se toman seis paquetes del proceso de llenado y se calcula su media muestral para determinar si el proceso está bajo control o fuera de control. Mediante la ecuación (20.1), se encuentra que el error estándar de la media es σx̄ σ兾兹n 0.10兾兹6 0.04. Por tanto, como la media del proceso es 16.05, los límites de control son UCL 16.05 + 3(0.04) 16.17 y LCL 16.05 3(0.04) 15.93. En la figura 20.6 se muestra la carta de control con los resultados de 10 muestras tomadas a lo largo de un periodo de 10 horas. Para facilitar la lectura, los números correspondientes a las muestras se han colocado en la parte inferior de la carta. Observe que la media de la quinta muestra indica que el proceso está fuera de control. La quinta media muestral se encuentra abajo del LCL (límite de control inferior), lo cual indica que existen causas asignables que ocasionan variación de la calidad del producto y que el llenado se está realizando con una cantidad menor a la estipulada. En este momento, se toman medidas correctivas para hacer que el proceso vuelva a estar bajo control. El hecho de que los demás puntos de la carta x̄ se encuentren dentro de los límites de control inferior y superior, indican que la acción correctiva fue adecuada.
_ Cartas x: media y desviaciones estándar del proceso desconocidas
Es importante controlar tanto la media como la desviación estándar del proceso.
Con el ejemplo de la empresa KJW se mostró cómo elaborar una carta x̄ cuando se conocen la media y la desviación estándar del proceso. Sin embargo, en la mayoría de los casos es necesario estimar la media y la desviación estándar del proceso a partir de muestras tomadas del proceso cuando éste se encuentre bajo control. Por ejemplo, durante 10 días en los que el proceso está bajo control, KJW puede tomar muestras aleatorias de 5 paquetes por las mañanas y 5 por las tardes, calcular la media y la desviación estándar de cada muestra, sacar después los promedios de las medias y de las desviaciones estándar y usarlos para elaborar cartas de control, tanto para la media como para la desviación estándar del proceso. En la práctica, para monitorear la variabilidad del proceso suele emplearse el rango en lugar de la desviación estándar, ya que el rango es más fácil de calcular. El rango puede servir para obtener una buena estimación de la desviación estándar del proceso; de manera que, mediante algunos cálculos, puede emplearse para trazar los límites inferior y superior de las cartas x̄. Para ilustrar esto, se tomará un ejemplo de la empresa Jensen Computer Supplies, Inc. Jensen Computer Supplies (JCS) fabrica discos para computadora de 3.5 pulgadas de diámetro. Su proceso de producción acaba de ser ajustado, de manera que funciona bajo control. Su-
20Ander(846-878).qxd 2/29/08 12:22 PM Page 856
856
Capítulo 20
TABLA 20.2
Métodos estadísticos para el control de calidad
DATOS DEL PROBLEMA DE JENSEN COMPUTER SUPPLIES
Número de la muestra
archivo CD en Jensen
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Observaciones 3.5056 3.4882 3.4897 3.5153 3.5059 3.4977 3.4910 3.4991 3.5099 3.4880 3.4881 3.5043 3.5043 3.5004 3.4846 3.5145 3.5004 3.4959 3.4878 3.4969
3.5086 3.5085 3.4898 3.5120 3.5113 3.4961 3.4913 3.4853 3.5162 3.5015 3.4887 3.4867 3.4769 3.5030 3.4938 3.4832 3.5042 3.4823 3.4864 3.5144
3.5144 3.4884 3.4995 3.4989 3.5011 3.5050 3.4976 3.4830 3.5228 3.5094 3.5141 3.4946 3.4944 3.5082 3.5065 3.5188 3.4954 3.4964 3.4960 3.5053
3.5009 3.5250 3.5130 3.4900 3.4773 3.5014 3.4831 3.5083 3.4958 3.5102 3.5175 3.5018 3.5014 3.5045 3.5089 3.4935 3.5020 3.5082 3.5070 3.4985
3.5030 3.5031 3.4969 3.4837 3.4801 3.5060 3.5044 3.5094 3.5004 3.5146 3.4863 3.4784 3.4904 3.5234 3.5011 3.4989 3.4889 3.4871 3.4984 3.4885
Media muestral x̄j
Rango muestral Rj
3.5065 3.5026 3.4978 3.5000 3.4951 3.5012 3.4935 3.4970 3.5090 3.5047 3.4989 3.4932 3.4935 3.5079 3.4990 3.5018 3.4982 3.4940 3.4951 3.5007
0.0135 0.0368 0.0233 0.0316 0.0340 0.0099 0.0213 0.0264 0.0270 0.0266 0.0312 0.0259 0.0274 0.0230 0.0243 0.0356 0.0153 0.0259 0.0206 0.0259
ponga que durante la primera hora de operación se toma una muestra aleatoria de cinco discos, durante la segunda hora de operación se toma otra muestra aleatoria de cinco discos y así sucesivamente, hasta que se tienen 20 muestras. En la tabla 20.2 se presentan los diámetros de las muestras así como la media x̄j y el rango Rj de cada muestra. La estimación de la media del proceso μ esta dada por la media muestral general.
MEDIA MUESTRAL GENERAL
x̄¯
x̄1 x̄2 . . . x̄k k
(20.4)
donde x̄ j media de la muestra j, j 1, 2, . . . , k k número de muestras
La media muestral general de los datos de JCS, que se presentan en la tabla 20.2, es x̄¯ 3.4995. Este valor será la línea central de la carta x̄. El rango de cada muestra es simplemente la diferencia entre el valor mayor y el valor menor de cada muestra. El rango promedio de las k muestras se calcula como se indica a continuación.
RANGO PROMEDIO
R̄
R1 R 2 . . . R k k
(20.5)
20Ander(846-878).qxd 2/29/08 12:22 PM Page 857
20.2
857
Control estadístico de procesos
donde Rj = rango de la muestra j, j = 1, 2, ..., k k = número de muestras
El rango promedio de los datos de JCS, que se presentan en la tabla 20.2, es R̄ 0.0253. En la sección anterior se mostró que los límites de control superior e inferior de la carta x̄ son x̄ 3 La media muestral general x̄¯ se usa para estimar μ y los rangos muestrales se usan para obtener una estimación de σ.
σ
(20.6)
兹n
Por tanto, para obtener los límites de control para la carta x̄ es necesario estimar μ y σ, la media y la desviación estándar del proceso. Una estimación de μ es dada por x̄¯, y una estimación de σ se obtiene mediante los datos de los rangos. Se puede demostrar que el promedio de los rangos dividido entre d2, una constante que depende del tamaño n de la muestra, es una estimación de la desviación estándar σ del proceso. Es decir, Estimador de σ
R̄ d2
(20.7)
En el Manual on Presentation of Data and Control Chart Analysis de la American Society for Testing and Materials se publican los valores de d2 que se muestran en la tabla 20.3. Por ejemplo, para n = 5, d2 = 2.326 y la estimación de s es el rango promedio dividido entre 2.326. Si en la expresión (20.6) se sustituye s por R̄/d2, los límites de control de la carta x̄ se pueden expresar como x̄¯ 3
R̄兾d 2 3 x̄¯ R̄ x̄¯ A2R̄ 兹n d 2 兹n
(20.8)
Observe que A 2 3/(d2兹n ) es una constante que depende únicamente del tamaño de la muestra; los valores de A2 también se encuentran en la tabla 20.3. Para n 5, A2 0.577; por tanto, los límites de control en la carta x̄ serán 3.4995 (0.577)(0.0253) 3.4995 0.0146 Por tanto, UCL 3.514 y LCL 3.485. En la figura 20.7 se muestra la carta x̄ obtenida para el problema de Jensen Computer Supplies. Esta carta se obtuvo con los datos de la tabla 20.2 y la rutina para cartas de control de Minitab. La línea central se encuentra en el valor de la media muestral general x̄¯ 3.4995. El límite de control superior (UCL) es 3.514 y el límite de control inferior (LCL) es 3.485. En la carta x̄ aparecen las 20 medias muestrales que se fueron graficando. Como todas las medias muestrales se encuentran dentro de los límites de control, se confirma que el proceso ha estado bajo control durante el periodo de muestreo.
Cartas R Ahora se estudiarán las cartas de rango (cartas R) que se emplean para controlar la variabilidad del proceso. Para elaborar una carta R es necesario considerar el rango de una muestra como una variable aleatoria con su media y desviación estándar propias. El rango promedio R̄ proporciona
20Ander(846-878).qxd 2/29/08 12:22 PM Page 858
Capítulo 20
TABLA 20.3
Métodos estadísticos para el control de calidad
FACTORES PARA LAS CARTAS x̄ Y R
Observaciones en la muestra, n
d2
A2
d3
D3
D4
2 3 4 5
1.128 1.693 2.059 2.326
1.880 1.023 0.729 0.577
0.853 0.888 0.880 0.864
0 0 0 0
3.267 2.574 2.282 2.114
6 7 8 9 10
2.534 2.704 2.847 2.970 3.078
0.483 0.419 0.373 0.337 0.308
0.848 0.833 0.820 0.808 0.797
0 0.076 0.136 0.184 0.223
2.004 1.924 1.864 1.816 1.777
11 12 13 14 15
3.173 3.258 3.336 3.407 3.472
0.285 0.266 0.249 0.235 0.223
0.787 0.778 0.770 0.763 0.756
0.256 0.283 0.307 0.328 0.347
1.744 1.717 1.693 1.672 1.653
16 17 18 19 20
3.532 3.588 3.640 3.689 3.735
0.212 0.203 0.194 0.187 0.180
0.750 0.744 0.739 0.734 0.729
0.363 0.378 0.391 0.403 0.415
1.637 1.622 1.608 1.597 1.585
21 22 23 24 25
3.778 3.819 3.858 3.895 3.931
0.173 0.167 0.162 0.157 0.153
0.724 0.720 0.716 0.712 0.708
0.425 0.434 0.443 0.451 0.459
1.575 1.566 1.557 1.548 1.541
Fuente: Adaptada de la tabla 27 de ASTM STP 15D, ASTM Manual on Presentation of Data and Control Chart Analysis. Copyright 1976 American Society for Testing and Materials, Filadelfia, PA. Impreso con autorización.
FIGURA 20.7
CARTA x̄ PARA EL PROBLEMA DE JENSEN COMPUTER SUPPLIES
3.515
Media muestral
858
UCL = 3.514
3.505 x = 3.4995 3.495
3.485
LCL = 3.485 5
10 Número de la muestra
15
20
20Ander(846-878).qxd 2/29/08 12:22 PM Page 859
20.2
859
Control estadístico de procesos
una estimación de la media de esta variable aleatoria. Además, se puede demostrar que una estimación de la desviación estándar del rango es σ̂R d3
R̄ d2
(20.9)
donde d2 y d3 son constantes que dependen del tamaño de la muestra, y cuyos valores se encuentran también en la tabla 20.3. Por tanto, el UCL de la carta R está dado por
冢
d3 d2
冣
(20.10)
冢
d3 d2
冣
(20.11)
R̄ 3σ̂R R̄ 1 3 y el LCL es R̄ 3σ̂R R̄ 1 3 Si se hace d3 d2 d D3 1 3 3 d2 D4 1 3
(20.12) (20.13)
Los límites de control de la carta R se expresan como UCL R̄ D4 LCL R̄ D3
(20.14) (20.15)
Los valores de D3 y D4 se dan también en la tabla 20.3. Observe que para n 5, D3 0 y D4 2.114. Por tanto, como R̄ 0.0253, los límites de control son UCL 0.0253(2.114) 0.053 LCL 0.0253(0) 0 Si la carta R indica que el proceso está fuera de control, la carta x̄ no deberá interpretarse hasta que la carta R indique que la variabilidad del proceso está bajo control.
En la figura 20.8 se muestra la carta R del problema de Jensen Computer Supplies. Esta carta se obtuvo con los datos de la tabla 20.2 y la rutina para cartas de control de Minitab. La línea central aparece en el valor de la media general de los 20 rangos muestrales, R̄ 0.253. El UCL es 0.053 y el LCL es 0.000. En la carta R se observan los 20 rangos muestrales que se fueron graficando. Como los 20 rangos muestrales se encuentran dentro de los límites de control, se confirma que durante el periodo de muestreo el proceso estuvo bajo control.
Cartas p A las cartas de control que se basan en datos que indican la presencia de un defecto o un número de defectos se les llama cartas de control de atributos. Una carta p es una carta de control por atributos.
A continuación se considera el caso en que la calidad del producto se mide a partir de los artículos no defectuosos o los artículos defectuosos. La decisión de dejar que continúe el proceso de producción o que se ajuste se basa en p̄, la proporción de artículos defectuosos encontrados en la muestra. A la carta de control que se usa para conocer la proporción de defectos se le llama carta p. Para ilustrar la elaboración de una carta p, considere el uso de las máquinas automáticas para la clasificación de las cartas que se emplean en las oficinas de correo. Estas maquinas automáticas leen el código postal que aparece en el sobre y asignan la carta a la ruta de entrega correspondiente. Aun cuando la máquina esté funcionando en forma óptima, algunas de las cartas
20Ander(846-878).qxd 2/29/08 12:22 PM Page 860
Capítulo 20
FIGURA 20.8
Métodos estadísticos para el control de calidad
CARTA R PARA EL PROBLEMA DE JENSEN COMPUTER SUPPLIES
0.06 UCL = 0.053
0.05 Rango muestral
860
0.04 0.03 R = 0.0253 0.02 0.01 0.00
LCL = 0.000 5
10
15
20
Número de la muestra
no son asignadas correctamente. Suponga que cuando la máquina está en operación óptima o bajo control, 3% de las cartas no son asignadas correctamente. Entonces, p, la proporción de cartas no asignadas correctamente, con el proceso bajo control, es 0.03. Para determinar la variación que puede esperarse en los valores de p̄, cuando el proceso está bajo control, se usa la distribución muestral de p̄, vista en el capítulo 7. Recuerde que el valor esperado, o la media, de p̄, es p, la proporción de defectos cuando el proceso está bajo control. Si las muestras son de tamaño n, la fórmula para calcular la desviación estándar de p̄, a la cual se le llama error estándar de la proporción, es σp̄
冑
p(1 p) n
(20.16)
En el capitulo 7 se vio también que la distribución muestral de p̄, siempre que el tamaño de las muestras sea grande, es aproximable por medio de una distribución normal. El tamaño de la muestra puede considerarse grande siempre que se satisfagan las dos condiciones siguientes. np n(1 p)
5 5
En resumen, siempre que el tamaño de la muestra sea grande, la distribución muestral de p̄ puede aproximarse mediante una distribución normal en que la media es p y la desviación estándar es σp̄. Esta distribución se presenta en la figura 20.9. Para establecer los límites de control en una carta p, se sigue el mismo procedimiento que se usó para establecer los límites de control en una carta x̄. Es decir, los límites de control se establecen a 3 desviaciones estándar, o errores estándar, arriba y abajo de la proporción de defectos, cuando el proceso está bajo control. Por tanto, se tienen los siguientes límites de control.
LÍMITES DE CONTROL PARA UNA CARTA p
UCL p 3σp̄ LCL p 3σp̄
(20.17) (20.18)
20Ander(846-878).qxd 2/29/08 12:22 PM Page 861
20.2
861
Control estadístico de procesos
FIGURA 20.9
DISTRIBUCIÓN MUESTRAL DE p̄
p(1 – p) n
σp =
p p E(p)
Como p 0.03 y las muestras son de tamaño n 200, al emplear la ecuación (20.16) se obtiene el error estándar, que es
冑
0.03(1 0.03) 0.0121 200 Por tanto, los límites de control son, UCL 0.03 3(0.0121) 0.0663 y LCL 0.03 3(0.0121) 0.0063. Cuando con la ecuación (20.18) se obtiene un valor negativo para el LCL, se toma al cero como LCL para la carta de control. La figura 20.10 es la carta de control del proceso de clasificación de las cartas. Los puntos muestreados son las proporciones muestrales de defectos halladas en las muestras de cartas tomadas del proceso. Todos los puntos se encuentran dentro de los límites de control, lo que indica que no hay evidencias para concluir que el proceso de clasificación de las cartas se encuentre fuera de control. σp̄
FIGURA 20.10
CARTA p PARA LA PROPORCIÓN DE DEFECTOS EN EL PROCESO DE CLASIFICACIÓN DE LAS CARTAS 0.07
UCL = 0.0663
Proporción muestral
0.06 0.05 0.04 Porcentaje de defectos con el proceso bajo control.
0.03 0.02 0.01
LCL = 0
0.00 5
10
15
Número de la muestra
20
25
20Ander(846-878).qxd 2/29/08 12:22 PM Page 862
862
Capítulo 20
Métodos estadísticos para el control de calidad
Cuando no se conoce la proporción de defectos en un proceso que se encuentra bajo control, este valor se puede estimar a partir de datos muestrales. Suponga, por ejemplo, que de un proceso que se encuentra bajo control, se toman k muestras de tamaño n. Después se determina la proporción de defectos en cada muestra. Al considerar todos los datos obtenidos como una sola muestra grande, se calcula la proporción de artículos defectuosos en todos estos datos, y este valor se usa para estimar p, la proporción de artículos defectuosos observada con el proceso bajo control. Observe que dicha estimación de p también permite calcular el error estándar de la proporción, con lo que ya se pueden determinar los límites de control inferior y superior.
Cartas np Una carta np es una carta de control que se usa para determinar el número de artículos defectuosos en una muestra. Aquí, n es el tamaño de la muestra y p es la probabilidad de observar un artículo defectuoso con el proceso bajo control. Siempre que el tamaño de la muestra sea grande, es decir, siempre que np 5 y n(1 p) 5, la distribución del número de artículos defectuosos en una muestra de tamaño n puede aproximarse mediante una distribución normal con media np y desviación estándar 兹np(1 p). Entonces, en el ejemplo de la clasificación de las cartas, como n 200 y p 0.03, el número de artículos defectuosos observados en una muestra de 200 cartas se aproxima mediante una distribución normal con media de 200(0.03) 6 y la desviación estándar 兹200(0.03)(0.97) 2.4125. Los límites de control de una carta np se fijan a 3 desviaciones estándar arriba y abajo del número de artículos defectuosos esperado con el proceso bajo control. Por tanto, se tienen los límites de control siguientes
LÍMITES DE CONTROL EN UNA CARTA np
UCL np 3 兹np(1 p) LCL np 3 兹np(1 p)
(20.19) (20.20)
En el ejemplo de la clasificación de las cartas, como p 0.03 y n 200, los límites de control son UCL 6 3(2.4125) 13.2375 y LCL 6 3(2.4125) 1.2375. Cuando el LCL es negativo, como LCL de la carta de control se toma igual a cero. Por tanto, si el número de cartas que no se asigna a la ruta correcta es mayor que 13, se concluye que el proceso está fuera de control. La información que proporciona una carta np es similar a la información que proporciona una carta p; la única diferencia es que la carta np es la gráfica del número de artículos defectuosos observados, mientras que una carta p es la gráfica de la proporción de artículos defectuosos observados. De manera que si se concluye que un proceso está fuera de control, con base en una carta p, también se concluirá apoyándose en una carta np que el proceso está fuera de control.
Interpretación de las cartas de control La ubicación y el patrón que siguen los puntos en una carta de control permiten determinar, con una pequeña probabilidad de error, si un proceso se encuentra estadísticamente bajo control. Una primera indicación de que un proceso pueda estar fuera de control es que uno de los puntos de los datos se encuentre fuera de los límites de control, como ocurre con el punto 5 de la figura 20.6. Hallar uno de estos puntos es evidencia estadística de que el proceso se encuentra fuera de control. En tales casos deberán tomarse medidas correctivas tan pronto como sea posible. Además de la presencia de puntos fuera de los límites de control, hay ciertos patrones de los puntos, dentro de los límites de control, que pueden ser señales que adviertan de problemas de control de calidad. Por ejemplo, suponga que todos los puntos están dentro de los límites de con-
20Ander(846-878).qxd 2/29/08 12:22 PM Page 863
20.2
Aun cuando todos los puntos se encuentren entre los límites de control inferior y superior, el proceso puede encontrarse fuera de control. Tendencias en los puntos muestrales o secuencias inusualmente largas de puntos que se encuentren sobre o bajo la línea central, también pueden indicar una situación fuera de control.
Control estadístico de procesos
863
trol, pero que muchos de ellos se encuentran de un mismo lado de la línea central. Este patrón puede indicar que existe algún problema en el equipo, que ha habido una variación en los materiales o que alguna otra causa asignable ha ocasionado una variación de la calidad. Será necesario hacer una cuidadosa investigación del proceso para determinar si la calidad ha variado. Otro patrón a observar en una carta de control es si existe un desplazamiento gradual o una tendencia, a lo largo del tiempo. Por ejemplo, debido al desgaste de las herramientas, las dimensiones en la fabricación de una pieza pueden desviarse gradualmente de las medidas establecidas. Variaciones graduales de la temperatura o de la humedad, el deterioro gradual del equipo, la acumulación de suciedad o el cansancio de un operador pueden ocasionar la aparición de tendencias en las cartas de control. Seis o siete puntos consecutivos que muestren una tendencia deberán ser causa de preocupación, aun cuando todos estos puntos se encuentren dentro de los límites de control. Siempre que se observen tales patrones, deberá revisarse el proceso para determinar si hay algún cambio o desplazamiento en la calidad. Puede que sea necesario tomar medidas correctivas para que el proceso vuelva a estar bajo control. NOTAS Y COMENTARIOS 1. Como en las cartas x̄ los límites de control dependen del valor del rango promedio, estos límites no tienen mucho significado a menos que la variabilidad del proceso se encuentre bajo control. En la práctica, la carta R se elabora antes que la carta x̄; si la carta R indica que la variabilidad del proceso está bajo control, entonces se elabora la carta x̄. Con la opción de Minitab Xbar-R se obtienen, simultáneamente,
la carta x̄ y la carta R. En el apéndice 20.1 se describen los pasos a seguir con Minitab para obtener estas cartas. 2. Las cartas np se usan para monitorear un proceso en términos del número de defectos. El nivel de calidad Seis sigma de Motorola tiene como objetivo producir no más de 3.4 defectos por millón de operaciones; este objetivo implica p 0.0000034.
Ejercicios
Métodos 1. En un proceso que está bajo control, la media es μ 12.5 y la desviación estándar es σ 0.8. _ a. Elabore la carta de control x para este proceso; el tamaño de las muestras es 4. b. Repita el inciso a con muestras de tamaño 8 y 16. c. ¿Qué pasa con los límites de la carta de control a medida que aumenta el tamaño de la muestra? Analice por qué esto es razonable. 2. En un proceso que está bajo control se toman 25 muestras de tamaño 5. La suma de todos los datos recolectados fue 677.5 libras. a. Dé una estimación de la media del proceso (en términos de libras por unidad) cuando el proceso está bajo control. _ b. Elabore la carta de control x para este proceso, considere que las muestras son de tamaño 5. Suponga que cuando el proceso está bajo control la desviación estándar del proceso es 0.5 y la media del proceso es la estimación que se obtuvo en el inciso a.
Auto examen
3. Mientras un proceso funcionaba satisfactoriamente se tomaron 25 muestras de 100 artículos cada una. En estas 25 muestras se encontraron 135 artículos defectuosos. a. Dé una estimación de la proporción de defectos que hay cuando el proceso está bajo control. b. ¿Cuál es el error estándar de la proporción si para el control estadístico del proceso se usan muestras de tamaño 100? c. Calcule los límites de control inferior y superior para la carta de control. 4. En un proceso del que se toman 20 muestras de tamaño 8 cada una, x̄¯ 28.5 y R̄ 1.6. Calcule los límites de control inferior y superior de las cartas x̄ y R del proceso.
20Ander(846-878).qxd 2/29/08 12:22 PM Page 864
864
Capítulo 20
Métodos estadísticos para el control de calidad
Aplicaciones 5. Para medir los resultados de un proceso de producción se emplea la temperatura. Cuando el proceso está bajo control, la media del proceso es μ 128.5 y la desviación estándar es σ 0.4. a. Construya la carta x̄ de este proceso con muestras empleadas de tamaño 6. b. Si los datos que se obtienen de una muestra son los siguientes, ¿el proceso está bajo control? 128.8 c.
128.2
129.1
128.7
128.4
129.2
Si los datos que se obtienen de una muestra son los siguientes, ¿está bajo control el proceso? 129.3
128.7
128.6
129.2
129.5
129.0
6. En un proceso de control de calidad se vigila el peso por paquete de detergente envasado. Los límites de control estipulados son UCL 20.12 onzas y LCL 19.90 onzas. En este proceso de muestreo e inspección se emplean muestras de tamaño 5. Dé la media y la desviación estándar del proceso. 7. La empresa Goodman Tire and Rubber hace pruebas periódicas a sus neumáticos para determinar su desgaste. Para estudiar y controlar el proceso de fabricación, durante varios días y de los diferentes turnos se tomaron 20 muestras, cada una de tres neumáticos radiales. Estos datos se presentan a continuación. Si estos datos se obtuvieron cuando se creía que el proceso estaba bajo control, elabore las cartas R y x̄. Muestra
archivo CD en Tires
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Desgaste* 31 26 25 17 38 41 21 32 41 29 26 23 17 43 18 30 28 40 18 22
42 18 30 25 29 42 17 26 34 17 31 19 24 35 25 42 36 29 29 34
28 35 34 21 35 36 29 28 33 30 40 25 32 17 29 31 32 31 28 26
*Centésimas de pulgada
8. A lo largo varias semanas de funcionamiento normal, o bajo control, se tomaron 20 muestras,cada una de 150 paquetes de cuerdas sintéticas para raquetas de tenis, y se probó su resistencia a la rotura. De los 3 000 paquetes probados, 141 no satisficieron las especificaciones del fabricante. a. Dé una estimación de la proporción de defectos en el proceso cuando el proceso se encuentra bajo control. b. Calcule los límites superior e inferior de la carta p. c. De acuerdo con los resultados del inciso b, qué conclusiones puede obtener acerca del proceso si al probar una nueva muestra de 150 paquetes se encuentran 12 defectuosos. ¿Existen algunas causas asignables en esta situación? d. Calcule los límites inferior y superior de la carta np.
20Ander(846-878).qxd 2/29/08 12:22 PM Page 865
20.3
865
Muestreo de aceptación
e. f.
Responda el inciso c, use los resultados del inciso d. ¿Qué carta de control convendrá para esta situación? Explique.
9. Un proveedor de la industria automotriz produce pistones para varios modelos de automóviles. Cuando el proceso se encuentra bajo control se toman 20 muestras, cada una de 200 pistones. A continuación se presenta el número de pistones defectuosos hallados en cada muestra. 8 14 a. b. c. d. e.
20.3
Las ventajas del muestreo de aceptación sobre la inspección 100% son: 1. Mucho menos costoso 2. Menos daño al producto debido a menor manipulación y menos pruebas 3. Se requieren menos inspectores 4. Es la única posibilidad cuando hay que emplear una prueba destructiva
10 10
6 10
4 7
5 5
7 8
8 6
12 10
8 4
15 8
Dé una estimación de la proporción de defectos en el proceso de fabricación cuando el proceso está bajo control. Elabore la carta p de este proceso, si cada muestra tiene 200 pistones. De acuerdo con los resultados del inciso b, ¿cuál es la conclusión si en una muestra de 200 pistones se encuentran 20 defectuosos? Calcule los límites superior e inferior de la carta np. Responda el inciso c, use los resultados del inciso d.
Muestreo de aceptación En el muestreo de aceptación los objetos de interés pueden ser entregas de materias primas o de partes o de bienes terminados. Suponga que desea aceptar o rechazar un conjunto de artículos a partir de determinadas características de calidad. En la terminología del control de calidad, al conjunto de artículos se le conoce como lote, y el muestreo de aceptación es un método estadístico que permite basar la decisión de aceptar o rechazar el lote en la inspección de una muestra de los artículos del lote. En la figura 20.11 se muestran los pasos que, en general, se siguen en el muestreo de aceptación. Después de recibir un lote se toma una muestra de artículos para su inspección. Los resultados de la inspección se comparan con las características de calidad especificadas. Si se satisfacen las características de calidad, el lote se acepta y se envía a producción o al cliente. Si el lote se rechaza, los directivos tendrán que decidir cómo se dispone del lote. En algunos casos la decisión puede ser quedarse con el lote y eliminar los artículos que no son aceptables. En otros casos se devuelve el lote al proveedor, a su cargo; el trabajo extra y los costos que se le cargan al proveedor puede que hagan que el proveedor mejore la calidad de sus productos. Por último, si el lote rechazado consta de bienes terminados, estos bienes tendrán que desecharse o adaptarse a los estándares de calidad aceptables. El procedimiento estadístico del muestreo de aceptación se basa en la metodología de la prueba de hipótesis presentada en el capítulo 9. Las hipótesis nula y alternativa son las siguientes. H0: La calidad del lote es buena Ha: La calidad del lote es mala En la tabla 20.4 se muestran los resultados de la prueba de hipótesis. Observe que las decisiones correctas son aceptar un lote de buena calidad y rechazar un lote de mala calidad. Sin embargo, como en las demás pruebas de hipótesis, hay que tener cuidado de no cometer un error tipo I (rechazar un lote de buena calidad) o un error tipo II (aceptar un lote de mala calidad). La probabilidad de cometer un error tipo I representa un riesgo para el productor del lote y se conoce como el riesgo del productor. Por ejemplo, un riesgo del productor de 0.05 significa que existe 5% de posibilidad de que un lote de buena calidad sea rechazado erróneamente. Por otro lado, la probabilidad de cometer un error tipo II, representa un riesgo para el consumidor del lote y se conoce como riesgo del consumidor. Por ejemplo, un riesgo del consumidor de 0.10 significa que existe 10% de posibilidad de que un lote de mala calidad sea erróneamente aceptado y usado para la producción o para surtir un pedido al cliente. La persona que elabora el procedimiento de aceptación de muestras puede controlar los valores que determinan el riesgo del productor y el riesgo del consumidor. Para ilustrar cómo se determinan estos valores de riesgo se tomará un problema que se le presentó a la empresa KALI, Inc.
20Ander(846-878).qxd 2/29/08 12:22 PM Page 866
866
Capítulo 20
FIGURA 20.11
Métodos estadísticos para el control de calidad
PROCEDIMIENTO DE MUESTREO DE ACEPTACIÓN
Recepción del lote
Selección de muestra
Inspección de la calidad de la muestra
La calidad es satisfactoria
Comparación de los resultados con las características de calidad especificadas
La calidad no es satisfactoria
Aceptar el lote
Rechazar el lote
Envío a producción o al cliente
Decidir cómo se dispone del lote
KALI, Inc., un ejemplo de muestreo de aceptación KALI, Inc., fabrica aparatos para el hogar que se venden bajo diferentes marcas. KALI no fabrica todos los componentes que usa en sus productos, varios de ellos los compra. Por ejemplo, uno de los componentes que compra KALI es uno que emplea en sus equipos para aire acondicionado, se trata de un protector de sobrecarga, un dispositivo que desconecta la compresora cuando ésta se sobrecalienta. Si el protector de sobrecarga no funciona adecuadamente, la compresora puede sufrir un grave daño, por lo que KALI pone mucha atención a la calidad de estos protectores de sobrecarga. Una manera de asegurarse de la calidad adecuada de estos dispositivos es probar cada uno de ellos con un método que se conoce como inspección 100%. Sin embargo,
TABLA 20.4
RESULTADOS DEL MUESTREO DE ACEPTACIÓN Estado de lote H0 verdadera La calidad de lote es buena
H0 falsa La calidad de lote es mala
Aceptar el lote
Desición correcta
Rechazar el lote
Error tipo I Decisión correcta (rechazar un lote de buena calidad)
Decisión
Error tipo II (aceptar un lote de mala calidad)
20Ander(846-878).qxd 2/29/08 12:22 PM Page 867
20.3
867
Muestreo de aceptación
para esto, el protector de sobrecarga debería someterse a pruebas que cuestan tiempo y dinero, y KALI encuentra justificable probar cada protector de carga que compra. Lo que hace KALI es emplear un plan de muestreo de aceptación para monitorear la calidad de los protectores de sobrecarga. Para el plan de muestreo de aceptación se requiere que los inspectores de control de calidad de KALI elijan y prueben una muestra de protectores de sobrecarga de cada pedido que reciben. Si en la muestra sólo se encuentran unas cuantas unidades defectuosas, es probable que la calidad del lote sea buena y entonces se aceptará. Pero, si en la muestra se encuentra un gran número de unidades defectuosas, es probable que la calidad del lote sea mala y deberá rechazarse. Un plan para un muestreo de aceptación consta de un tamaño n de muestra y un criterio de aceptación c. El criterio de aceptación es el número máximo de artículos defectuosos que se puede encontrar en una muestra para que el lote se considere aceptable. Por ejemplo, en el caso de KALI, suponga que de cada lote o pedido que se reciba se tomará una muestra de 15 artículos. Además, el gerente de control de calidad decide que los lotes sólo se pueden aceptar si no se encuentra ningún artículo defectuoso. En tal caso el plan de muestreo de aceptación establecido por el gerente de control es n 15 y c 0. Este plan de muestreo de aceptación será fácil de realizar para los inspectores de control de calidad: simplemente tienen que tomar una muestra de 15 artículos, realizar la prueba y llegar a una conclusión con base en la siguiente regla de decisión.
• Aceptar el lote si encuentran cero artículos defectuosos • Rechazar el lote si encuentran uno o más artículos defectuosos. Antes de poner en marcha este plan de muestreo de aceptación, el gerente de control de calidad quiere evaluar los riesgos o posibles errores que se pueden tener en este plan. Para poner el plan en marcha es necesario que tanto el riesgo del productor (error tipo I) como el riesgo del consumidor (error tipo II) estén controlados en niveles razonables.
Cálculo de la probabilidad de aceptar un lote La clave para analizar tanto el riesgo del productor como el riesgo del consumidor es un análisis del tipo “y qué pasa si”. Es decir, se supone que el lote tiene un determinado número de artículos defectuosos y se calcula la probabilidad de aceptar el lote con un determinado plan de muestreo. Al variar el porcentaje de artículos defectuosos que se está dispuesto a aceptar, es posible examinar el efecto del plan de muestreo sobre los dos tipos de riesgos. Para empezar, si se ha recibido un pedido grande de protectores de sobrecarga y 5% de los protectores de sobrecarga de este pedido están defectuosos. ¿Cuál es la probabilidad de que con el plan de aceptación n 15, c 0 se acepte un lote en que 5% de los artículos está defectuoso? Como cada protector de sobrecarga que se prueba estará defectuoso o no estará defectuoso y como el lote es grande, el número de artículos defectuosos en una muestra de tamaño 15 tendrá una distribución binomial. A continuación se presenta la función de distribución binomial que se presentó en el capítulo 5. FUNCIÓN DE ACEPTACIÓN BINOMIAL PARA EL MUESTREO DE ACEPTACIÓN
f(x)
n! p x(1 p)(n x) x!(n x)!
(20.21)
donde n p x f (x)
tamaño de la muestra proporción de artículos defectuosos en el lote número de artículos defectuosos en la muestra probabilidad de que haya x artículos defectuosos en la muestra
20Ander(846-878).qxd 2/29/08 12:22 PM Page 868
868
Capítulo 20
Métodos estadísticos para el control de calidad
En el plan de muestreo de aceptación de KALI, n 15; por tanto, con un lote en el que hay 5% de defectos (p 0.05), se tiene f(x)
15! (0.05) x(1 0.05)(15 x) x!(15 x)!
(20.22)
Mediante la ecuación (20.22) con f(0) se obtendrá la probabilidad de que 0 de los protectores de sobrecarga estén defectuosos y de que el lote sea aceptado. Al usar la ecuación (20.22) recuerde que 0! 1. El cálculo de la probabilidad f(0) es 15! (0.05) 0(1 0.05)(15 0) 0!(15 0)! 15! (0.05) 0(0.95)15 (0.95)15 0.4633 0!(15)!
f (0)
Las probabilidades binomiales también se calculan usando Excel o Minitab.
Ahora ya sabe que con el plan de muestreo n 15 y c 0 la probabilidad de aceptar un lote con 5% de defectos es 0.4633. Por tanto la probabilidad correspondiente de rechazar un lote con 5% de defectos es 1 0.4633 0.5367. El uso de las tablas de probabilidad binomial (véase tabla 5 del apéndice B) facilita los cálculos para determinar la probabilidad de aceptar un lote. En la tabla 20.5 se presentan algunas probabilidades binomiales para n 15 y n 20. Con esta tabla se puede determinar que si el lote
TABLA 20.5
ALGUNAS PROBABILIDADES BINOMIALES PARA MUESTRAS DE TAMAÑO 15 Y 20
n
x
0.01
0.02
0.03
0.04
p 0.05
0.10
0.15
0.20
0.25
15
0 1 2 3 4 5 6 7 8 9 10
0.8601 0.1303 0.0092 0.0004 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.7386 0.2261 0.0323 0.0029 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.6333 0.2938 0.0636 0.0085 0.0008 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
0.5421 0.3388 0.0988 0.0178 0.0022 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000
0.4633 0.3658 0.1348 0.0307 0.0049 0.0006 0.0000 0.0000 0.0000 0.0000 0.0000
0.2059 0.3432 0.2669 0.1285 0.0428 0.0105 0.0019 0.0003 0.0000 0.0000 0.0000
0.0874 0.2312 0.2856 0.2184 0.1156 0.0449 0.0132 0.0030 0.0005 0.0001 0.0000
0.0352 0.1319 0.2309 0.2501 0.1876 0.1032 0.0430 0.0138 0.0035 0.0007 0.0001
0.0134 0.0668 0.1559 0.2252 0.2252 0.1651 0.0917 0.0393 0.0131 0.0034 0.0007
20
0 1 2 3 4 5 6 7 8 9 10 11 12
0.8179 0.1652 0.0159 0.0010 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.6676 0.2725 0.0528 0.0065 0.0006 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.5438 0.3364 0.0988 0.0183 0.0024 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.4420 0.3683 0.1458 0.0364 0.0065 0.0009 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.3585 0.3774 0.1887 0.0596 0.0133 0.0022 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.1216 0.2702 0.2852 0.1901 0.0898 0.0319 0.0089 0.0020 0.0004 0.0001 0.0000 0.0000 0.0000
0.0388 0.1368 0.2293 0.2428 0.1821 0.1028 0.0454 0.0160 0.0046 0.0011 0.0002 0.0000 0.0000
0.0115 0.0576 0.1369 0.2054 0.2182 0.1746 0.1091 0.0545 0.0222 0.0074 0.0020 0.0005 0.0001
0.0032 0.0211 0.0669 0.1339 0.1897 0.2023 0.1686 0.1124 0.0609 0.0271 0.0099 0.0030 0.0008
20Ander(846-878).qxd 2/29/08 12:22 PM Page 869
20.3
869
Muestreo de aceptación
TABLA 20.6
PROBABILIDADES DE ACEPTAR EL LOTE DEL PROBLEMA DE KALI CON n 15 Y c 0
Porcentaje de defectos en un lote
Probabilidad de aceptar el lote
1 2 3 4 5 10 15 20 25
0.8601 0.7386 0.6333 0.5421 0.4633 0.2059 0.0874 0.0352 0.0134
contiene 10% de artículos defectuosos la probabilidad de aceptarlo con el plan de muestreo n 15 y c 0 es 0.2059. En la tabla 20.6 se presentan las probabilidades de que el plan de muestreo n 15 y c 0 lleve a la aceptación de un lote con 1%, 2%, 3%, … artículos defectuosos. Con las probabilidades de la tabla 20.6, se puede trazar la gráfica de la probabilidad de aceptar un lote frente al porcentaje de defectos en el lote como se muestra en la figura 20.12. A esta gráfica o a esta curva se le conoce como curva característica de operación (curva CO) del plan de muestreo de aceptación n 15 y c 0. Quizá se deban considerar otros planes de muestreo, planes con otros tamaños de muestra n o con otros criterios de aceptación c. Considere primero el caso en que el tamaño de la muestra aún es n = 15, pero el criterio de aceptación aumenta de c 0 a c 1. Es decir, ahora se aceptará el lote si en la muestra se encuentran cero o un componente defectuoso. En un lote con 5% de artículos defectuosos (p = 0.05), en la tabla 20.5 se encuentra que para n 15 y p 0.05, FIGURA 20.12
CURVA CARACTERÍSTICA DE OPERACIÓN PARA EL PLAN DE MUESTREO DE ACEPTACIÓN N 15, C 0
1.00
Probabilidad de aceptar el lote
0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0
5
10
15
Porcentaje de defectos en el lote
20
25
20Ander(846-878).qxd 2/29/08 12:22 PM Page 870
Capítulo 20
Métodos estadísticos para el control de calidad
FIGURA 20.13
CURVAS CARACTERÍSTICAS DE OPERACIÓN DE CUATRO PLANES DE MUESTREO DE ACEPTACIÓN
1.00 0.90 Probabilidad de aceptar el lote
870
n = 15, c = 1
0.80 0.70 0.60 0.50 0.40
n = 20, c = 1
0.30 n = 20, c = 0
0.20 0.10
n = 15, c = 0 0
5
10
15
20
25
Porcentaje de defectos en el lote
f(0) 0.4633 y f (1) 0.3658. Por tanto, la probabilidad de que el plan n 15, c 1, lleve a la aceptación de un lote con 5% de defectos es 0.4633 0.3658 0.8291. Al continuar con estos cálculos se obtiene la figura 20.13, en la que se presentan las curvas características de operación de cuatro planes de muestreo de aceptación para el caso de KALI. Se consideraron muestras de tamaños 15 y 20. Observe que sea cual sea la proporción de defectos en un lote, con el plan de muestreo n 15, c 1 se tiene la mayor probabilidad de aceptar el lote. Con el plan n 20, c 0 se tienen la menor probabilidad de aceptar el lote. Pero con este plan se tiene también la mayor probabilidad de rechazar el lote.
Selección de un plan de muestreo de aceptación Ahora que ya se sabe usar la distribución binomial para calcular la probabilidad de aceptar un lote con una determinada proporción de defectos, ya es posible elegir los valores de n y c que determinen el plan de muestreo de aceptación deseado para el caso en estudio. Para obtener el plan, los directivos tendrán que especificar dos valores para la proporción de defectos en el lote. Un valor, denotado p0, que se usa para determinar el riesgo del productor y otro valor, denotado p1, que se usa para determinar el riesgo del consumidor. Se usará la notación siguiente: α riesgo del productor; probabilidad de rechazar el lote con una proporción p0 artículos defectuosos β riesgo del consumidor; probabilidad de aceptar el lote con una proporción p1 artículos defectuosos
Suponga que en el caso de KALI, los directivos especifican p0 0.03 y p1 0.15. En la figura 20.14, en la curva CO para n 15, c 0, se observa que con p0 0.03 el riesgo del productor es, aproximadamente, 1 0.63 0.37 y con p1 0.15 el riesgo del consumidor es, aproximadamente, 0.09. Por tanto, si los directivos están dispuestos a tolerar, tanto una probabilidad de
20Ander(846-878).qxd 2/29/08 12:22 PM Page 871
20.3
871
Muestreo de aceptación
FIGURA 20.14
CURVA CARACTERÍSTICA DE OPERACIÓN PARA n 15, c 0 CON p0 0.03 Y p1 0.15
1.00
Probabilidad de aceptar el lote
0.90 α = riesgo del productor
α
0.80
(probabilidad de cometer un error tipo I)
0.70 0.60 0.50
β = riesgo del consumidor
(probabilidad de cometer un error tipo II)
(1 – α)
0.40 0.30 0.20 0.10 β
0
5
10
p0
15
20
25
p1 Porcentaje de defectos en el lote
En el ejercicio 13, que se encuentra al final de esta sección, se pedirá calcular el riesgo del productor y el riesgo del consumidor para el plan de muestreo n 20, c 1.
0.37 de rechazar un lote con 3% de artículos defectuosos (riesgo del productor) como una probabilidad de 0.09 de aceptar un lote con 15% de artículos defectuosos (riesgo del consumidor), entonces el plan de muestreo de aceptación n 15, c 0 será aceptable. Pero, si los directivos desean que el riesgo del productor sea α 0.10 y que el riesgo del consumidor sea β 0.20. Como se ve, con el plan de muestreo n 15, c 0, el riesgo del consumidor es mejor de lo deseado, pero el riesgo del productor es demasiado grande y no se puede aceptar. El que α 0.37 significa que 37% de los lotes se rechazarán erróneamente cuando tengan sólo 3% de artículos defectuosos. El riesgo del productor es demasiado alto y se tendrá que considerar otro plan de muestreo de aceptación. En la figura 20.13 se ve que para p0 = 0.3, α 0.10, p1 0.15 y β 0.20, el plan de aceptación n 20 y c 1 está más cerca de los requerimientos para los riesgos del productor y del consumidor. Como se muestra en esta sección, se necesitarán varios cálculos y diversas curvas de operación para determinar el plan de muestreo con los riesgos deseados para el productor y para el consumidor. Por fortuna existen tablas de planes de muestreo. Por ejemplo, en la American Military Standard Table, MIL-STD-105D, se encuentra útil información para el diseño de planes de muestreo de aceptación. El uso de estas tablas se describe en textos más avanzados sobre el control de calidad, como los citados en la bibliografía. En los textos más avanzados se estudia también la importancia del costo del muestreo al determinar el plan de muestreo óptimo.
Planes de muestreo múltiple El procedimiento de muestreo de aceptación presentado para el caso de KALI es un plan sencillo de muestreo. Se le llama plan sencillo de muestreo porque sólo se usa una muestra o un escenario. Una vez determinado el número de defectos en la muestra, hay que tomar la decisión de
20Ander(846-878).qxd 2/29/08 12:22 PM Page 872
872
Capítulo 20
Métodos estadísticos para el control de calidad
aceptar o rechazar el lote. Una alternativa al plan sencillo de muestreo es el plan de muestreo múltiple, en el que se usan dos o más etapas de muestreo. En cada etapa hay que decidirse entre tres posibilidades: dejar de muestrear y aceptar el lote, dejar de muestrear y rechazar el lote o continuar muestreando. Aun cuando son más complejos, los planes de muestreo múltiples suelen dar como resultado tamaños de muestra más pequeños que los planes de muestreo sencillos con las mismas probabilidades a y b. En la figura 20.15 se muestra la lógica del plan de las dos etapas, o de la doble muestra. Al inicio se toma una muestra de n1 artículos. Si el número de elementos defectuosos x1 es menor o igual a c1, se acepta el lote. Si x1 es mayor o igual a c2, se rechaza el lote. Si x1 se encuentra entre c1 y c2 (c1 x1 c2), se toma una segunda muestra de n2 artículos. Se determina la suma de los artículos defectuosos en la primer (x1) y segunda (x2) muestras. Si x1 + x2 c3 se acepta el lote, si no es así se rechaza el lote. El plan de doble muestra es más complicado, ya que los taFIGURA 20.15
PLAN DE MUESTREO DE ACEPTACIÓN DE DOS ETAPAS
Muestra de n1 artículos
Encontrar x artículos defectuosos en esta muestra
Es x1 ≤ c1 ?
Sí
No Rechazar el lote
Sí
¿Es x1 ≥ c2 ? No Muestrear n2 artículos más
Encontrar x2 artículos defectuosos en esta muestra
No
¿Es x1 + x2 ≤ c3 ?
Sí
Aceptar el lote
20Ander(846-878).qxd 2/29/08 12:22 PM Page 873
20.3
Muestreo de aceptación
873
maños muestrales n1 y n2 y los números de aceptación c1¸ c2 y c3 deben satisfacer los riesgos deseados del consumidor y del productor. NOTAS Y COMENTARIOS 1. El uso de la distribución binomial en el muestreo de aceptación se basa en la suposición de que los lotes sean grandes. Si los lotes son pequeños, la distribución adecuada es la distribución hipergeométrica. Los expertos en el campo del control de calidad indican que la distribución de Poisson proporciona una buena aproximación en el muestreo de aceptación, cuando el tamaño de la muestra es por lo menos 16, el tamaño del lote es por lo menos 10 veces el tamaño de la muestra y p es menor a 0.10. Cuando se tienen muestras grandes se puede usar la aproximación normal a la distribución binomial. 2. En las tablas para muestreo MIL-ST-105D, a p0 se le llama el nivel de calidad aceptable (AQL, por sus siglas en inglés) En algunas tablas de muestreo, a p1 se le llama tolerancia de porcentaje de defectos en el lote (LTPD, por sus siglas en inglés) o el nivel de calidad rechazable (RQL. por sus siglas en inglés). En muchos de los pla-
nes de muestreo publicados también se usan índices de calidad como el nivel de calidad de indiferencia (IQL, por sus siglas en inglés) y el límite de calidad del promedio saliente (AOQL, por sus siglas en inglés). Textos más avanzados, listados en la bibliografía, proporcionan un análisis completo de estos índices. 3. En esta sección se presentó una introducción a los planes de muestreo por atributos. En estos planes cada artículo se clasifica como no defectuoso o defectuoso. En los planes de muestreo de variables se toma una muestra y se miden sus características de calidad. Por ejemplo, en el caso de joyería de oro, una medida de su calidad podría ser la cantidad de oro que contiene. Para decidir si aceptar o rechazar un lote podría emplearse un estadístico sencillo, como la cantidad promedio de oro en una muestra de joyas, el cual se compararía con la cantidad admitida de oro.
Ejercicios
Métodos
Auto examen
10. Determine la probabilidad de aceptar un lote que tiene 2% de defectos, si el plan de muestreo que se emplea es n 25, c 0. ¿Cuál será la probabilidad de aceptar el lote si el porcentaje de defectos es 6%? 11. Dado el plan de muestreo n 20, c 0, calcule el riesgo del productor en cada una de las situaciones siguientes. a. El porcentaje de defectos en el lote es 2%. b. El porcentaje de defectos en el lote es 6%. 12. Repita el ejercicio 11 con el plan de aceptación n 20, c 1. ¿Qué pasa con el riesgo del productor cuando aumenta el criterio de aceptación c? Explique.
Aplicaciones 13. Remítase al problema de KALI que se presentó en esta sección. El gerente de control de calidad requiere que el riesgo del productor sea 0.10 y p0 0.3 y que el riesgo del consumidor sea 0.20 y p1 0.15. En el plan de aceptación el tamaño de la muestra es 20 y el criterio de aceptación es 1. Resuelva las preguntas siguientes. a. ¿Cuál es el riesgo del productor, si el plan de aceptación es n 20 y c 1? b. ¿Cuál es el riesgo del consumidor, si el plan de aceptación es n 20 y c 1? c. ¿El plan de muestreo n 20, c 1 satisface los requisitos establecidos por el gerente de control de calidad? Analice. 14. Para inspeccionar un pedido de materia prima, recibido por una empresa, se piensa en usar muestras de tamaño 10, 15 y 20. Use las probabilidades binomiales de la tabla 5 del apéndice B para elegir un plan de muestreo con el riesgo del productor α 0.03 y p0 0.05 y el riesgo del consumidor β 0.12 y p1 0.30.
20Ander(846-878).qxd 2/29/08 12:22 PM Page 874
874
Capítulo 20
Métodos estadísticos para el control de calidad
15. Un fabricante de relojes le compra cristales de cuarzo a una empresa suiza. Estos cristales se surten en lotes de 1 000 piezas. Para el proceso de muestreo de aceptación se toman 20 cristales elegidos aleatoriamente. a. Trace las curvas características para los criterios de aceptación 0, 1 y 2. b. Si p0 0.01 y p1 0.08, ¿cuáles son los riesgos del consumidor y del productor con cada uno de los planes de muestreo del inciso a?
Resumen En este capítulo se vio cómo usar los métodos estadísticos como ayuda en el control de calidad. _ Primero se presentaron las cartas de control x , R, p y np que ayudan en el monitoreo de la calidad de los procesos. En cada una de estas cartas se establecen límites de control, se toman muestras de manera periódica y se grafican los puntos correspondientes en las cartas de control. Si hay puntos que caigan fuera de los límites de control, eso indica que el proceso está fuera de control y que se deben tomar las medidas correctivas correspondientes. También, algunos patrones que suelen seguir los datos, dentro de los límites de control, pueden indicar posibles problemas de control de calidad y sugerir que se tomen medidas correctivas. Además se vio la técnica conocida como muestreo de aceptación. Esta técnica consiste en tomar una muestra e inspeccionarla. Un lote se acepta o rechaza, de acuerdo con el número de defectos encontrados en la muestra. El tamaño de la muestra y el criterio de aceptación pueden ajustarse para controlar tanto el riesgo del productor (error tipo I) como el riesgo del consumidor (error tipo II).
Glosario Calidad total (CT) Sistema para mejorar la satisfacción del cliente y bajar los costos reales mediante una estrategia de mejoramiento y aprendizaje continuos. Seis Sigma Metodología que emplea mediciones y análisis estadísticos para alcanzar un nivel de calidad tan bueno que en cada millón de operaciones no haya más de 3.4 defectos. Control de calidad Una serie de inspecciones y mediciones que determinan si se han alcanzado los estándares de calidad establecidos. Causas asignables Variaciones en los resultados de un proceso debidas a desgaste de la maquinaria, mala calidad de los materiales, errores de los operadores, etc. Cuando se detecta que la variación se debe a causas asignables, es necesario tomar medidas correctivas. Causas comunes Variaciones naturales o normales en los resultados de un proceso, que son debidas, únicamente, a la casualidad. Cuando las variaciones en los resultados de un proceso se deben a causas comunes, no es necesario tomar ninguna medida. Carta de control Herramienta gráfica que se usa como ayuda para determinar si un proceso está bajo control o fuera de control. _ Carta x Carta de control que se usa cuando se mide la calidad de los resultados de un proceso en términos de longitud, peso, temperatura, etcétera. Carta R Carta de control que se usa cuando se mide la calidad de los resultados de un proceso en términos del rango de una variable. Carta p Carta de control que se usa cuando se mide la calidad de los resultados de un proceso en términos de la proporción de defectos. Carta np Carta de control que se usa para monitorear la calidad de los resultados de un proceso mediante el número de artículos defectuosos. Lote Conjunto de artículos, como pedidos recibidos de materias primas, de piezas o de bienes terminados para obtener un producto final. Muestreo de aceptación Método estadístico en el que el número de elementos defectuosos que se encuentran en una muestra se usa para determinar si se acepta o se rechaza un lote. Riesgo del productor Es el riesgo de rechazar un lote de buena calidad; error tipo I. Riesgo del consumidor Es el riesgo de aceptar un lote de mala calidad; error tipo II.
20Ander(846-878).qxd 2/29/08 12:22 PM Page 875
875
Fórmulas clave
Criterio de aceptación El número máximo de artículos defectuosos que se pueden encontrar en una muestra, para que a pesar de ello se acepte un lote. Curva característica de operación (CO) Gráfica en la que se muestra la probabilidad de aceptar un lote, en función del porcentaje de artículos defectuosos encontrados en el lote. Esta curva se emplea para determinar si un plan de muestreo de aceptación satisface las exigencias tanto del consumidor como del productor. Plan de muestreo múltiple Una forma de muestreo de aceptación en la que se usa más de una muestra o etapas. De acuerdo con el número de artículos defectuosos que se encuentran en una muestra, se decide si aceptar el lote, rechazar el lote o seguir con el muestreo.
Fórmulas clave Error estándar de la media σx̄
σ 兹n
(20.1)
Límites de control en una carta x: media del proceso y desviación estándar conocidas –
UCL μ 3σx̄ LCL μ 3σx̄
(20.2) (20.3)
Media muestral general x̄¯
x̄1 x̄ 2 . . . x̄ k k
(20.4)
R̄
R1 R 2 . . . R k k
(20.5)
Rango promedio
Límites de control en una carta x: media del proceso y desviación estándar desconocidas –
x̄¯ A2R̄
(20.8)
Límites de control en una carta R UCL R̄ D4 LCL R̄ D3 Error estándar de la proporción σp̄
冑
p(1 p) n
(20.14) (20.15)
(20.16)
Límites de control en una carta p UCL p 3σp̄ LCL p 3σp̄
(20.17) (20.18)
Límites de control en una carta np UCL np 3 兹np(1 p) LCL np 3 兹np(1 p)
(20.19) (20.20)
20Ander(846-878).qxd 2/29/08 12:22 PM Page 876
876
Capítulo 20
Métodos estadísticos para el control de calidad
Distribución de probabilidad binomial para un muestreo de aceptación f(x)
n! p x(1 p)(n x) x!(n x)!
(20.21)
Ejercicios complementarios 16. En un proceso de producción que se considera bajo control, las muestras de 5 elementos arrojaron las medias muestrales siguientes. 95.72 95.44 95.40 95.50 95.56 95.72 95.60 a. b.
c.
95.24 95.46 95.44 95.80 95.22 94.82 95.78
95.18 95.32 95.08 95.22 95.04 95.46
Con base en estos datos dé la estimación de la media cuando el proceso está bajo control. _ Si la desviación estándar del proceso es σ 0.50, elabore la carta de control x de este proceso de producción. Como media del proceso considere la estimación obtenida en el inciso a. ¿Alguna de las 20 medias muestrales indica que el proceso está fuera de control?
17. En un proceso los pesos de llenado tienen una distribución normal, la media es de 350 gramos y la desviación estándar de 15 gramos. _ a. Obtenga los límites de control de la carta x para muestras de tamaño 10, 20 y 30. b. ¿Qué pasa con los límites de control a medida que aumenta el tamaño de la muestra? c. ¿Qué pasa cuando se comete un error tipo I? d. ¿Qué pasa cuando se comete un error tipo II? e. Calcule la probabilidad de cometer un error tipo I con muestras de los tamaños: 10, 20 y 30. f. En las cartas de control, ¿qué ventaja tiene incrementar los tamaños de la muestra? ¿Qué probabilidad de error se reduce a medida que se incrementa el tamaño de la muestra? 18. A partir de muestras de tamaño 5 se obtuvo x̄¯ 5.42 y R̄ 2.0. Calcule los límites de control de las cartas x̄ y R, y estime la desviación estándar del proceso. 19. Los siguientes datos de control de calidad se obtuvieron en un proceso de fabricación de la empresa Kensport Chemical. Estos datos son temperaturas en grados centígrados medidas en cinco momentos del ciclo de producción. La empresa está interesada en emplear cartas de control para monitorear la temperatura durante su proceso de fabricación. Construya las cartas x̄ y R . ¿Qué se puede concluir acerca de la calidad del proceso?
Muestra
x̄
R
Muestra
x̄
R
1 2 3 4 5 6 7 8 9 10
95.72 95.24 95.18 95.44 95.46 95.32 95.40 95.44 95.08 95.50
1.0 0.9 0.8 0.4 0.5 1.1 0.9 0.3 0.2 0.6
11 12 13 14 15 16 17 18 19 20
95.80 95.22 95.56 95.22 95.04 95.72 94.82 95.46 95.60 95.74
0.6 0.2 1.3 0.5 0.8 1.1 0.6 0.5 0.4 0.6
20Ander(846-878).qxd 2/29/08 12:22 PM Page 877
877
Ejercicios complementarios
20. Los siguientes datos se obtuvieron del proceso de producción de Master Blend Coffee y son los pesos de llenado de latas de café de 3 libras. Con estos datos construya las tablas x̄ y R. ¿Qué se puede concluir acerca de la calidad de este proceso de producción?
Observaciones
archivo CD en Coffee
Muestra
1
2
3
4
5
1 2 3 4 5 6 7 8 9 10
3.05 3.13 3.06 3.09 3.10 3.08 3.06 3.11 3.09 3.06
3.08 3.07 3.04 3.08 3.06 3.10 3.06 3.08 3.09 3.11
3.07 3.05 3.12 3.09 3.06 3.13 3.08 3.07 3.08 3.07
3.11 3.10 3.11 3.09 3.07 3.03 3.10 3.07 3.07 3.09
3.11 3.10 3.10 3.07 3.08 3.06 3.08 3.07 3.09 3.07
21. Considere la situación siguiente y diga si hay razones para preocuparse por la calidad del proceso. a. En una carta p, se tiene LCL 0 y UCL 0.068. Cuando el proceso está bajo control, la proporción de defectos es 0.033. En esta carta de control grafique los siguientes siete resultados muestrales: 0.035, 0.062, 0.055, 0.049, 0.058, 0.066 y 0.055. Analice. b. En una carta x̄ , se tiene LCL 22.2 y UCL 24.5. Cuando el proceso está bajo control, la media es μ 23.35. En esta carta grafique los siguientes siete resultados muestrales: 22.4, 22.6, 22.65, 23.2. 23.4, 23.85 y 24.1. Analice. 22. A veces al mes, los gerentes de 1 200 comercios minoristas hacen pedidos de reabastecimiento a la casa matriz. De acuerdo con la experiencia se sabe que cerca de 4% de los pedidos que se surten presentan algún error, como envío de una mercancía distinta a la solicitada, envío de una cantidad distinta a la solicitada o, simplemente, no se surte la mercancía solicitada. Cada mes se toman muestras de 200 hojas de pedido y se verifica si fueron surtidas con precisión. a. Construya la carta de control correspondiente a esta situación. b. En los datos de los últimos seis meses las cantidades de pedidos con uno o más errores son: 10, 15, 6, 13, 8 y 17. Grafique estos datos en la carta de control. ¿Qué dice esta carta acerca de este proceso? 23. Se tiene el plan de muestreo de aceptación n 10, c 2. Suponga que p0 0.05 y p1 0.20. a. Para este plan de muestreo de aceptación calcule el riesgo del consumidor. b. ¿Estará inconforme el productor, el consumidor o ambos con el plan de muestreo propuesto? c. ¿Recomendaría usted alguna modificación al plan de muestreo? ¿Cuál? 24. Se elaboró el plan de muestreo de aceptación n 15, c 1 con un riesgo para el productor de 0.075. a. ¿Cuál es al valor de p0, 0.01, 0.02, 0.03, 0.04 o 0.05? ¿Qué significa este valor? b. ¿Cuál es el riesgo del consumidor con este plan si p1 0.25? 25. Una empresa produce carne enlatada. Sea p la proporción de lotes que no satisfacen las especificaciones de calidad del producto. Como plan de muestreo de aceptación se va a usar n = 25, c = 0. a. Calcule los puntos que en la curva característica de operación corresponden a p 0. 01, 0.03, 0.10 y 0.20. b. Grafique la curva característica de operación. c. ¿Cuál es la probabilidad de que con este plan de muestreo de aceptación se rechace un lote que contenga 0.01 defectos?
20Ander(846-878).qxd 2/29/08 12:22 PM Page 878
878
Capítulo 20
Apéndice 20.1
archivo CD en Jensen
Métodos estadísticos para el control de calidad
Cartas de control con Minitab En este apéndice se describen los pasos necesarios para generar cartas de control con Minitab, a partir de los datos muestrales de la empresa Jensen, presentados en la tabla 20.1. Los números de las muestras se encuentran en la columna C1, la primera observación se encuentra en la columna C2, la segunda, en la columna C3 y así sucesivamente. Mediante los pasos siguientes, Minitab genera simultáneamente las cartas x̄ y R. Paso 1. Paso 2. Paso 3. Paso 4. Paso 5.
Seleccionar el menú Stat Elegir Control Charts Elegir Variables Charts for Subgroups Elegir Xbar-R Cuando aparezca el cuadro de diálogo Xbar-R Chart: Seleccionar Observations for a subgroup are in one row of columns En el cuadro que se encuentra debajo ingresar C2-C6 Seleccionar Xbar-R Options Paso 6. Cuando aparezca el cuadro de diálogo Xbar-R Options: Seleccionar la pestaña Tests Elegir One point > 3.0 standard deviations from center line* Clic en OK Paso 7. Cuando aparezca el cuadro de diálogo Xbar-R Chart: Clic en OK
En los resultados de Minitab aparecerán, juntas, la carta R y la carta x̄. En el paso 3 de este procedimiento aparecen diversas opciones que permiten el acceso a diferentes tipos de cartas de control. Por ejemplo, se puede seleccionar que las cartas x̄ y R aparezcan por separado. Otras de las opciones son obtener una carta p, una carta np, etcétera.
* Minitab proporciona otras pruebas para detectar causas especiales de variación y situaciones fuera de control. El usuario puede elegir simultáneamente varias de estas pruebas
21Ander(879-914).qxd 2/28/08 7:23 PM Page 879
CAPÍTULO
21
Análisis de decisión CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: OHIO EDISON COMPANY 21.1 FORMULACIÓN DEL PROBLEMA Tablas de recompensa Árboles de decisión 21.2 TOMA DE DECISIONES CON PROBABILIDADES Método del valor esperado Valor esperado de la información perfecta
21.3 ANÁLISIS DE DECISIÓN CON INFORMACIÓN MUESTRAL Árbol de decisión Estrategia de decisión Valor esperado de la información muestral 21.4 CÁLCULO DE LAS PROBABILIDADES DE RAMA MEDIANTE EL TEOREMA DE BAYES
21Ander(879-914).qxd 2/28/08 7:23 PM Page 880
880
LA ESTADÍSTICA
Capítulo 21
Análisis de decisión
en LA PRÁCTICA
OHIO EDISON COMPANY* AKRON, OHIO
Ohio Edison Company es una empresa de FirstEnergy Corporation. Ohio Edison y su subsidiaria Pensilvania Power Company, suministran energía eléctrica a más de 1 millón de usuarios en el centro y noreste de Ohio y en el oeste de Pensilvania. La mayor parte de la electricidad la generan mediante plantas de combustión de carbón. Debido a los requerimientos de control de la contaminación, Ohio Edison se embarcó en un programa para renovar su equipo para el control de la contaminación en la mayor parte de sus plantas generadoras. Para satisfacer los nuevos límites de emisión de dióxido de azufre en una de sus plantas más grandes, Ohio Edison decidió quemar carbono con bajo contenido de azufre en cuatro de las unidades más pequeñas de la planta e instalar filtros de tela en esas unidades para controlar la emisión de partículas. Los filtros de tela usan miles de bolsas de tela para retener las partículas y funcionan de manera muy parecida a las aspiradoras caseras. En las tres unidades más grandes de la planta se consideró la posibilidad de quemar carbón de medio a alto contenido de azufre. Estudios preliminares redujeron las opciones de equipo para retención de partículas para estas unidades más grandes a filtros de tela y precipitadores electrostáticos (que eliminan las partículas que se encuentran suspendidas en el humo al pasarlo a través de un fuerte campo eléctrico). Entre las incertidumbres al tomar una decisión final estaba la manera en que pueden interpretarse algunas leyes y normas, los potenciales cambios en las leyes y normas sobre calidad del aire y las fluctuaciones en los costos de construcción. Debido a la complejidad del problema, el alto grado de incertidumbre relacionado con los factores que afectaban la decisión y el impacto de los costos para Ohio Edison, se empleó el análisis de decisión. Entonces se elaboró una descripción gráfica del problema, a la que se conoce como árbol de decisión. Para evaluar los resultados mostrados por el árbol de decisión se consideraron las necesidades de ingreso anual de las tres unidades grandes por el resto de su vida útil. Las necesidades de ingreso anual eran los dineros que debían obtenerse de los usuarios para recobrar el costo de la instalación del nuevo equipo para el control de la * Los autores agradecen a Thomas J. Madden y a M. S. Hyrnick de Ohio Edison por proporcionar este artículo para La estadística en la práctica.
Las plantas de Ohio Edison suministran energía eléctrica a más de 1 millón de usuarios. © Getty Images/PhotoDisc.
contaminación. Mediante el análisis del árbol de decisión se llegó a las conclusiones siguientes.
• El valor esperado de las necesidades de ingreso
• •
anual del precipitador electrostático era aproximadamente 1 millón de dólares inferior al de las necesidades para los filtros de tela. Los filtros de tela tenían una probabilidad mayor de necesidades de ingreso alto que los precipitadores electrostáticos. Los precipitadores electrostáticos tenían una probabilidad de casi 0.8 de tener necesidades de ingreso anual menores.
Estas conclusiones llevaron a Ohio Edison a decidirse por los precipitadores electrostáticos para las unidades generadoras en cuestión. Si no se hubiera empleado el análisis de decisión, la toma de decisión se hubiera basado principalmente en el costo de la inversión, lo cual hubiera llevado a resolverse por el equipo de los filtros de tela. El uso del análisis de decisión permitió identificar la opción que tenía tanto las menores necesidades de ingreso esperadas como el menor riesgo. En este capítulo se verá la metodología del análisis de decisión empleada por Ohio Edison. La atención se centra en mostrar cómo el análisis de decisión permite identificar la mejor alternativa ante un panorama lleno de riesgos por eventos futuros.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 881
21.1
En el apéndice 21.1 se presenta un ejemplo del software para análisis de decisión TreePlan.
21.1
Formulación del problema
881
El análisis de decisión se usa para elaborar una estrategia óptima de decisión ante diversas alternativas y ante un conjunto de eventos futuros inciertos y llenos de riesgos. Para iniciar el estudio del análisis de decisión se emplearán problemas de decisión en los que las alternativas de decisión y los inciertos eventos futuros sean razonablemente pocos. Se presentarán las tablas de recompensa con objeto de dar una estructura a los problemas de decisión. Después se introducirán los árboles de decisión con objeto de mostrar la naturaleza secuencial de los problemas. Los árboles de decisión se usan para analizar problemas más complejos y para identificar una secuencia óptima de decisiones, a la que se le conoce como estrategia óptima de decisión. En la última sección se muestra cómo usar el teorema de Bayes, presentado en el capítulo 4, para calcular las probabilidades de las ramas de los árboles de decisión. En el sitio de la red de ASW, http: //asw.swlearning.com., se proporciona TreePlan, el complemento de Excel para el análisis de decisiones y se dan las indicaciones para su empleo.
Formulación del problema El primer paso en el análisis de decisión es formular el problema. Se empieza por hacer un planteamiento verbal del mismo. Después se identifican las alternativas de decisión, los eventos futuros inciertos, conocidos como eventos aleatorios, y las consecuencias de cada combinación de una alternativa de decisión con uno de los resultados del evento aleatorio. Como ejemplo se considerará un proyecto de construcción de la empresa Pittsburgh Development Corporation. Pittsburgh Development Corporation (PDC) compró un terreno para construir un lujoso complejo de condominios. El lugar tiene una vista espectacular sobre el centro de Pittsburgh y el Golden Triangle formado por los ríos Allegheny y Monongahela que se unen para formar el río Ohio. PDC desea vender cada condominio en un precio entre $300 000 y $1 400 000. Para empezar, PDC ha encargado tres proyectos arquitectónicos de distintos tamaños: uno de 30 condominios, otro de 60 condominios y el tercero de 90 condominios. El éxito del proyecto dependerá tanto del tamaño del complejo como del evento aleatorio de la demanda que pueda haber por los condominios. El problema de decisión de PDC es elegir el tamaño del complejo que conduzca a las mayores ganancias, dada la incertidumbre relativa en la demanda de los condominios. De acuerdo con este planteamiento del problema, es claro que la decisión es el tamaño adecuado del condominio. PDC tiene las siguientes tres alternativas para su decisión: d1 un complejo pequeño de 30 condominios d 2 un complejo mediano de 60 condominios d3 un complejo grande de 90 condominios Un factor importante en la elección de la mejor alternativa es la incertidumbre relacionada con el evento aleatorio de la demanda que pueda haber por el condominio. Al preguntarse por las posibilidades de demanda, el presidente de PDC reconoce que existe una amplia gama, pero considera la ocurrencia de dos eventos aleatorios: una demanda alta y una demanda baja. En el análisis de decisión, a los posibles resultados de un evento aleatorio se les conoce como estados. Los estados se definen de tal manera que uno y sólo uno de los estados pueda presentarse. En el problema de PDC, el evento aleatorio de la demanda de los condominios tiene dos estados: s1 una demanda alta de los condominios s2 una demanda baja de los condominios
21Ander(879-914).qxd 2/28/08 7:23 PM Page 882
882
Capítulo 21
Análisis de decisión
Los directivos elegirán, primero, una alternativa de decisión (tamaño del complejo), después seguirá un estado (demanda por los condominios) y por último se tendrá una consecuencia. En este caso, la consecuencia son las ganancias que obtendrá PDC.
Tablas de recompensa
Las recompensas se pueden expresar en términos de ganancias, costos, tiempo, distancia o cualquier otra cantidad apropiada para el problema de decisión que se analice.
Dadas las tres alternativas de decisión y los dos estados, ¿qué tamaño de condominio debe elegirse? Para responder esta pregunta, PDC necesita conocer las consecuencias de cada una de las combinaciones de alternativa de decisión y un estado. En el análisis de decisión, a cada una de las consecuencias de la combinación de una alternativa de decisión y un estado se le conoce como recompensa. A la tabla en la que se muestran las recompensas de todas las combinaciones de alternativa de decisión y un estado, se le conoce como tabla de recompensas. Como PDC desea elegir el tamaño de complejo que le proporcione mayores ganancias, las ganancias se usarán como consecuencia. En la tabla 21.1 se muestra la tabla de recompensa, que expresa las ganancias en millones de dólares. Observe que si el tamaño del condominio es mediano y la demanda es alta las ganancias serán de $14 millones. La recompensa correspondiente a cada combinación de una alternativa de decisión i y un estado j se denotará Vij. Así, de acuerdo con la tabla 21.1, V31 20 significa que habrá una recompensa de $20 millones si la decisión es construir un complejo grande (d3) y la demanda que se presenta es alta (s1). De manera similar V32 9 significa que habrá una pérdida de $9 millones si la decisión es construir un complejo grande (d3) y la demanda que se presenta baja (s2).
Árboles de decisión En un árbol de decisión se muestra gráficamente el carácter secuencial del proceso de toma de decisión. En la figura 21.1 se presenta el árbol de decisión para el caso del problema de PDC; en el árbol de decisión se muestra la progresión lógica o natural en el tiempo. Primero, PDC tendrá que tomar una decisión respecto al tamaño del complejo de condominios (d1, d2 o d3). Después de llevar a cabo lo que se haya decidido, se dará el estado s1 o el estado s2. El número que aparece en cada punto terminal del árbol es la recompensa correspondiente a la secuencia dada. Por ejemplo, la recompensa 8, que es la que se encuentra más arriba, significa que se espera una ganancia de $8 millones si PDC construye un complejo pequeño (d1) y la demanda resulta ser alta (s1). La recompensa siguiente, que es 7, significa que se espera una ganancia de $7 millones si PDC construye un complejo pequeño (d1) y la demanda resulta ser baja (s2). De esta manera, en este árbol de decisión se muestran gráficamente las secuencias de alternativas de decisión y estados con los que se llega a las seis recompensas posibles. El árbol de decisión de la figura 21.1 tiene cuatro nodos, numerados del 1 al 4, que representan las decisiones y los eventos aleatorios. Para representar nodos de decisión se emplean cuadrados y para representar nodos aleatorios se emplean círculos. Así, el nodo 1 es un nodo de decisión, y los nodos 2, 3 y 4 son nodos aleatorios. Las ramas que salen del nodo de decisión son las alternativas de decisión. Las ramas que salen de cada nodo aleatorio son estados. Las recompensas aparecen al final de las de los estados. Ahora se vuelve a la pregunta: ¿cómo puede,
TABLA 21.1
TABLA DE RECOMPENSA PARA EL PROYECTO DEL CONDOMINIO DE PDC (RECOMPENSAS EN MILLONES DE DÓLARES) Estado
Alternativa de decisión Complejo pequeño, d1 Complejo mediano, d2 Complejo grande, d3
Demanda alta s1
Demanda baja s2
8 14 20
7 5 9
21Ander(879-914).qxd 2/28/08 7:23 PM Page 883
21.2
883
Toma de decisiones con probabilidades
FIGURA 21.1
ÁRBOL DE DECISIÓN PARA EL PROYECTO DEL CONDOMINIO DE PDC (RECOMPENSAS EN MILLONES DE DÓLARES) Alta (s1) Pequeño (d1)
2
Baja (s2)
Alta (s1) 1
Mediano (d2)
3
Baja (s2)
Alta (s1) Grande (d3)
4
Baja (s2)
8
7
14
5
20
–9
la persona que toma la decisión, usar la información de la tabla de recompensa o del árbol de decisión para elegir la mejor alternativa de decisión?
NOTAS Y COMENTARIOS 1. Los expertos en solución de problemas coinciden en que el primer paso en la resolución de un problema complejo es descomponerlo en una serie de subproblemas menores. Los árboles de decisión sirven para mostrar cómo descomponer el problema y también para mostrar el carácter secuencial del proceso de decisión.
21.2
2. Las personas suelen ver un mismo problema desde diferentes perspectivas. Por tanto, la discusión sobre la elaboración de un árbol de decisión puede proporcionar mayor claridad acerca del problema.
Toma de decisiones con probabilidades Una vez definidas las alternativas de decisión y los estados de los eventos aleatorios, se determinan las probabilidades de los estados. Para determinar estas probabilidades se puede usar cualquiera de los métodos estudiados en el capítulo 4, el método clásico, el método de las frecuencias relativas o el método subjetivo. A continuación se muestra cómo usar, una vez determinadas las probabilidades, el método del valor esperado para identificar la mejor alternativa de decisión o la decisión recomendada para el problema dado.
Método del valor esperado Se empezará por definir el valor esperado de una alternativa de decisión. Sea N = cantidad de estados P(sj) = probabilidad del estado sj
21Ander(879-914).qxd 2/28/08 7:23 PM Page 884
884
Capítulo 21
Análisis de decisión
Como únicamente puede presentarse uno y sólo uno de los N estados, las probabilidades deben satisfacer dos condiciones: Las probabilidades asignadas a los estados deben satisfacer los requisitos básicos de la asignación de probabilidades presentados en el capítulo 4.
P(sj)
0
para todos los estados
(21.1)
N
兺 P(s ) P(s ) P(s ) . . . P(s ) 1 j
1
2
N
(21.2)
j 1
El valor esperado (VE) de una alternativa de decisión di es el siguiente.
VALOR ESPERADO N
VE (di)
兺 P(s )V j
ij
(21.3)
j 1
donde Vij = valor de la recompensa para la alternativa de decisión di y el estado sj. Es decir, el valor esperado de una alternativa de decisión es la suma de las recompensas ponderadas que hay para esa alternativa de decisión. El peso de ponderación para una recompensa es la probabilidad de que dicha recompensa ocurra. Para ver cómo se emplea el método del valor esperado se vuelve al problema de PDC. PDC ve con optimismo el potencial del lujoso complejo de condominios. Este optimismo lo lleva a una evaluación inicial, mediante el método de probabilidad subjetiva, y asigna la probabilidad 0.8 al evento de que la demanda sea alta (s1) y 0.2 al evento de que la demanda sea baja (s2). Por tanto, P(s1) 0.8 y P(s2) 0.2. Con los valores de recompensa de la tabla 21.1 y la ecuación (21.3), el valor esperado de cada una de las tres alternativas de decisión se calcula como sigue. VE(d1) 0.8(8) 0.2(7) 7.8 VE(d 2) 0.8(14) 0.2(5) 12.2 VE(d3) 0.8(20) 0.2( 9) 14.2
Para la construcción de árboles de decisión más complejos existen paquetes de software.
De esta manera, con el método del valor esperado, se encuentra que el complejo grande, cuyo valor esperado es 14.2 millones de dólares, es la decisión recomendada. Los cálculos para identificar la alternativa de decisión que tiene el mejor valor esperado pueden realizarse en un árbol de decisión. En la figura 21.2 se muestra el árbol de decisión del problema de PDC con las probabilidades en las ramas de los estados. Al recorrer el árbol de decisión de atrás para adelante, se calcula primero el valor esperado en cada nodo aleatorio; es decir, para cada nodo aleatorio se ponderan las posibles recompensas al multiplicarlas por probabilidad de ocurrencia. De esta manera se obtiene el valor esperado para los nodos 2, 3 y 4, como se muestra en la figura 21.3. Como el que toma la decisión controla la rama que sale del nodo 1 de decisión y como se trata de maximizar las ganancias esperadas, la mejor alternativa de decisión en el nodo 1 es d3. Por tanto, el análisis del árbol de decisión lleva a la recomendación de d3, cuyo valor esperado es $14.2 millones. Observe que con el método del valor esperado en conjunción con la tabla de recompensas se obtiene la misma recomendación. Los problemas de decisión pueden ser bastante más complejos que el problema de decisión de PDC, pero siempre que la cantidad de alternativas de decisión y de estados sea razonable, se podrá emplear el método de árbol de decisión aquí descrito. Primero se dibuja un árbol de decisión que consista únicamente en los nodos de decisión, los nodos aleatorios y las ramas que describen el carácter secuencial del problema. Si se usa el método del valor esperado, el paso siguiente es determinar las probabilidades de cada uno de los estados y calcular el valor esperado
21Ander(879-914).qxd 2/28/08 7:23 PM Page 885
21.2
885
Toma de decisiones con probabilidades
FIGURA 21.2
ÁRBOL DE DECISIÓN PARA EL PROBLEMA DE PDC CON LAS PROBABILIDADES EN LAS RAMAS DE ESTADO Alta (s1) Pequeño (d1)
P(s1) = 0.8
2
Baja (s2) P(s2) = 0.2 Alta (s1)
1
Mediano (d2 )
P(s1) = 0.8
3
Baja (s2)
8
7
14
5
P(s2) = 0.2 Alta (s1) Grande (d3)
20
P(s1) = 0.8
4
Baja (s2) P(s2) = 0.2
–9
en cada nodo aleatorio. A continuación se elige la rama de decisión que lleva al nodo aleatorio que tenga el mayor valor esperado. La alternativa de decisión correspondiente a esta rama es la decisión recomendada.
Valor esperado de la información perfecta Suponga que PDC tiene la oportunidad de realizar un estudio de investigación de mercado que le ayudará a evaluar el interés del público por el proyecto del condominio y que proporcionará a los directivos información para mejorar su evaluación de las probabilidades de los estados. Para determinar el valor potencial de esta información, se comenzará por suponer que el estudio puede proporcionar información perfecta sobre los estados; es decir, se acepta, por el momento, que FIGURA 21.3
APLICACIÓN DEL MÉTODO DEL VALOR ESPERADO MEDIANTE UN ÁRBOL DE DECISIÓN Pequeño (d1)
1
2
VE(d1) = 0.8(8) + .2(7) = $7.8
3
VE(d2) = 0.8(14) + .2(5) = $12.2
4
VE(d3) = 0.8(20) + .2(–9) = $14.2
Mediano (d2)
Grande (d3)
21Ander(879-914).qxd 2/28/08 7:23 PM Page 886
886
Capítulo 21
Análisis de decisión
PDC podría determinar con certeza, antes de tomar una decisión, qué estado va a ocurrir. Para aprovechar esta información perfecta, se elaborará una estrategia de información, la cual seguirá PDC una vez que sepa qué estado se presenta. Una estrategia de decisión es simplemente una regla de decisión que especifica la alternativa de decisión a elegir una vez que se cuente con más información. Como ayuda para determinar la estrategia de decisión de PDC, en la tabla 21.2 se reproduce la tabla de recompensas de PDC. Observe que si PDC supiera con certeza que el estado s1 fuera a ocurrir, la mejor alternativa de decisión sería d3, cuya recompensa es de 20 millones de dólares. De manera similar, si PDC supiera con certeza que el estado s2 es el que va a ocurrir, la mejor alternativa de decisión sería d1, cuya recompensa es 7 millones de dólares. Por tanto, se puede establecer la estrategia óptima de decisión si PDC llega a contar con la información perfecta como sigue: Si s1, se elige d3 y se obtiene una recompensa de $20 millones. Si s2, se elige d1 y obtiene una recompensa de $7 millones. ¿Cuál es el valor esperado con esta estrategia de decisión? Para calcular el valor esperado con información perfecta se vuelve a las probabilidades originales de los estados: P(s1) 0.8 y P(s2) 0.2. Por tanto, hay una probabilidad de 0.8 de que la información perfecta indique el estado s1 y la decisión alternativa resultante d3 proporcionará $20 millones de ganancias. De manera similar, si 0.2 es la probabilidad del estado s2¸ la alternativa óptima de decisión d1 proporcionará $7 millones de ganancia. De esta manera, con la ecuación (21.3), el valor esperado de la estrategia de decisión basada en la información perfecta es 0.8(20) 0.2(7) 17.4
El valor de que PDC conozca el nivel de aceptación en el mercado antes de elegir una alternativa de decisión es $3.2 millones.
A este valor esperado de $17.4 millones se le conoce como el valor esperado con información perfecta (VEcIP). Ya antes, en esta sección, se había indicado que la decisión recomendada usando el método del valor esperado era la alternativa de decisión d3, con un valor esperado de $14.2 millones. Como la recomendación de esta decisión y el cálculo del valor esperado se hizo sin la ventaja de la información perfecta, a los $14.2 millones de dólares se les conoce como valor esperado sin información perfecta (VEsIP). El valor esperado con información perfecta es $17.4 millones y el valor esperado sin información perfecta es $14.2 millones; por tanto, el valor esperado de la información perfecta (VEIP) es $17.4 $14.2 $3.2 millones. En otras palabras, $3.2 millones representan el valor esperado adicional que se puede obtener si se cuenta con información perfecta acerca del estado. En general, un estudio de investigación de mercado no proporciona información “perfecta”; pero si el estudio de mercado es bueno, la información obtenida bien puede valer una buena porción de los $3.2 millones. Dado que el VEIP es de $3.2 millones, PDC puede considerar seriamente un estudio de investigación de mercado con objeto de obtener más información acerca del estado.
TABLA 21.2
TABLA DE RECOMPENSA PARA EL PROYECTO DE LOS CONDOMINIOS DE PDC (MILLONES DE DÓLARES) Estado
Alternativa de decisión Complejo pequeño, d1 Complejo mediano, d2 Complejo grande, d3
Demanda alta s1
Demanda baja s2
8 14 20
7 5 9
21Ander(879-914).qxd 2/28/08 7:23 PM Page 887
21.2
887
Toma de decisiones con probabilidades
El valor esperado de la información perfecta se calcula en general como sigue:
VALOR ESPERADO DE LA INFORMACIÓN PERFECTA
VEIP |VEcIP – VEsIP|
(21.4)
donde VEIP valor esperado de la información perfecta VEcIP valor esperado con información perfecta acerca del estado VEsIP valor esperado sin información perfecta acerca del estado Observe el papel del valor absoluto en la ecuación (21.4). En problemas de minimización, la información ayuda a reducir y bajar los costos; de manera que el valor esperado con información perfecta es menor o igual al valor esperado sin información perfecta. En este caso, VEIP es la magnitud de la diferencia entre VEcIP y VEsIP o el valor absoluto de la diferencia como se muestra en la ecuación (21.4).
Ejercicios
Métodos
Auto examen
1. En la tabla de recompensa siguiente se muestran las ganancias en un problema de análisis de decisión en el que se tienen dos alternativas de decisión y tres estados.
Estados
a. b.
Alternativas de decisión
s1
s2
s3
d1 d2
250 100
100 100
25 75
Construya un árbol de decisión para este problema. Suponga que la persona que debe tomar la decisión obtiene las probabilidades P(s1) 0.65, P(s2) 0.15 y P(s3) 0.20. Emplee el método del valor esperado para determinar la mejor decisión.
2. Una persona que debe tomar una decisión y que se encuentra ante cuatro alternativas de decisión y cuatro estados elabora la tabla de recompensa siguiente:
Estados Alternativas de decisión
s1
s2
s3
s4
d1 d2 d3 d4
14 11 9 8
9 10 10 10
10 8 10 11
5 7 11 13
Esta persona obtiene información que le permite hacer las siguientes evaluaciones de las probabilidades: P(s1) 0.5, P(s2) 0.2, P(s3) 0.2 y P(s4) 0.1. a. Emplee el método del valor esperado para determinar la solución óptima. b. Suponga que las entradas en la tabla de recompensa son costos. Use el método del valor esperado para determinar la decisión óptima.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 888
888
Capítulo 21
Análisis de decisión
Aplicaciones
Auto examen
3. Hudson Corporation está en consideración de tres opciones para el procesamiento de sus datos: continuar con su propio personal, contratar una empresa externa para que lo haga (lo que se conoce como outsourcing) o una combinación de ambas cosas. El costo depende de la demanda futura. El costo anual de cada opción (en miles de dólares) depende de la demanda futura.
Demanda
a.
b.
Opciones
Alta
Media
Baja
Personal propio Empresa externa Combinación
650 900 800
650 600 650
600 300 500
Si las probabilidades para la demanda son 0.2, 0.5 y 0.3, respectivamente, ¿qué alternativa de decisión minimizará el costo del procesamiento de datos? ¿Cuál es el costo anual esperado de su recomendación? ¿Cuál es el valor esperado de la información perfecta?
4. Myrtle Air Express ha decidido ofrecer un servicio directo de Cleveland a Myrtle Beach. Los directivos deben decidir entre un servicio de primera a precios normales usando la nueva flota de jet de la empresa o servicio de bajo precio usando los aviones regionales de menor capacidad. Es claro que la mejor elección depende de la reacción del mercado al servicio que ofrece Myrtle Air. Los administradores han elaborado estimaciones de la contribución a las ganancias que tendría cada tipo de servicio con base en dos niveles de demanda del servicio a Myrtle Beach: alta o baja. En la tabla siguiente se muestran las ganancias trimestrales estimadas (en miles de dólares).
Demanda del servicio Servicio De primera De bajo precio
a. b.
c.
Alta
Baja
$960 $670
$490 $320
¿Qué es lo que hay que decidir? ¿Cuál es el evento aleatorio y cuál es la consecuencia? ¿Cuántas alternativas de decisión hay? ¿Cuántos resultados tiene el evento aleatorio? Suponga que el gerente de Myrtle Air cree que la probabilidad de que la demanda sea alta es 0.7 y que la probabilidad de que la demanda sea baja es 0.3. Emplee el método del valor esperado para determinar cuál es la decisión óptima. Suponga que la probabilidad de que la demanda sea alta es 0.8 y la probabilidad de que la demanda sea baja es 0.2. Emplee el método del valor esperado para determinar cuál es la decisión óptima.
5. La distancia de Potsdam a los grandes mercados y el limitado servicio aéreo ha impedido que este pueblo tenga un atractivo desarrollo industrial. Air Express, una importante empresa de servicio nocturno de transporte de paquetería, está considerando establecer un centro de distribución regional en Potsdam. Pero Air Express sólo establecerá este centro si el aeropuerto local aumenta la longitud de su pista. Otra empresa que pretende establecerse en esa localidad es Diagnostic Research, Inc. (DRI), uno de los principales productores de equipo para pruebas médicas. DRI pretende instalar una nueva planta de fabricación en el lugar. Para DRI no es condición el que se aumente la longitud de la pista aérea, pero la comisión de planificación local considera que eso serviría para convencer a DRI de abrir su nueva fábrica en Potsdam.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 889
21.2
889
Toma de decisiones con probabilidades
Si esta localidad aumenta la longitud de su pista aérea, la comisión de planificación local considera que se tendrían las probabilidades que se muestran en la tabla siguiente.
Centro de Air Express Sin centro de Air Express
Planta de DRI
Sin planta de DRI
0.30 0.40
0.10 0.20
Por ejemplo, la probabilidad de que Air Express establezca un centro de distribución y DRI construya una nueva planta en el lugar es 0.30. Los ingresos anuales estimados para la localidad, una vez deducidos los costos de aumentar la longitud de la pista aérea, son los siguientes:
Centro de Air Express Sin centro de Air Express
Planta de DRI
Sin planta de DRI
$600 000 $250 000
$150 000 $200 000
Si no se realiza el proyecto de expansión de la pista aérea, la comisión de planificación estima que la probabilidad de que DRI no establezca su nueva planta en ese lugar es 0.6, en este caso el ingreso anual estimado del lugar será de $450 000. Si no se realiza el proyecto de expansión de la pista aérea y DRI no establece su nueva planta en ese lugar, el ingreso anual será $0, ya que no se incurrirá en ningún gasto y no habrá ningún ingreso. a. ¿Cuál es la decisión a tomar, cuál es el evento aleatorio y cuál es la consecuencia? b. Calcule el ingreso anual esperado correspondiente a la alternativa de decisión de aumentar la longitud de la pista aérea. c. Calcule el ingreso anual esperado correspondiente a la alternativa de decisión de no aumentar la longitud de la pista aérea. d. ¿El pueblo debe elegir aumentar la longitud de la pista aérea? Explique. e. Suponga que las probabilidades relacionadas con el aumento de la longitud de la pista aérea fueran las siguientes:
Centro de Air Express Sin centro de Air Express
Planta de DRI
Sin planta de DRI
0.40 0.30
0.10 0.20
¿Este cambio de las probabilidades tendría algún efecto sobre la decisión recomendada? 6. La empresa vitivinícola Seneca Hill Winery acaba de adquirir una propiedad con objeto de crear un nuevo viñedo. La dirección está considerando dos variedades de uva blanca: Chardonnay y Riesling. Con las uvas Chardonnay se produciría un vino Chardonnay seco y con las uvas Riesling se produciría un vino Riesling semiseco. Se necesitan aproximadamente cuatro años desde que se planta la uva hasta que puede ser cosechada. Este tiempo hace que se tenga una gran incertidumbre respecto a la demanda futura, y dificulta la decisión de qué tipo de uva sembrar. Se consideran tres posibilidades: sembrar únicamente uva Chardonnay, sembrar únicamente uva Riesling o sembrar ambas, Chardonnay y Riesling. Los directivos de Seneca han decidido que para los propósitos de la planeación bastará considerar únicamente dos posibilidades de deman-
21Ander(879-914).qxd 2/28/08 7:23 PM Page 890
890
Capítulo 21
Análisis de decisión
da para cada tipo de vino: alta y baja. Al tener únicamente dos posibilidades para cada tipo de vino, es necesario evaluar cuatro probabilidades. Con ayuda de algunos pronósticos de publicaciones industriales, la dirección ha estimado las probabilidades siguientes.
Demanda de Riesling Demanda de Chardonnay Baja Alta
Baja
Alta
0.05 0.25
0.50 0.20
Las proyecciones de ingresos muestran una contribución anual de $20 000 a las ganancias, si Seneca planta únicamente uva Chardonnay y la demanda de vino Chardonnay es baja, y $70 000 si planta únicamente uva Chardonnay y la demanda de vino Chardonnay es alta. Si únicamente planta uva Riesling, la proyección del ingreso anual es de $25 000 si la demanda de vino Riesling es baja y $45 000 si la demanda de vino Riesling es alta. Si Seneca planta ambos tipos de uva, las proyecciones de ganancias anuales son las que se muestran en la tabla siguiente.
Demanda de Riesling Demanda de Chardonnay Baja Alta
a. b. c. d.
e.
Baja
Alta
$22 000 $26 000
$40 000 $60 000
¿Cuál es la decisión a tomar, cuál es el evento aleatorio y cuál es la consecuencia? Elabore un árbol de decisión. Emplee el método del valor esperado para recomendar qué alternativa debe tomar Seneca para maximizar la ganancia anual. Suponga que a la dirección le interesan las probabilidades estimadas para el caso de que la demanda de vino Chardonnay sea alta. Algunos suponen que en este caso la demanda de Riesling también será alta. Suponga que la probabilidad de que la demanda de Chardonnay sea alta y que la demanda de Riesling sea baja es 0.05 y que la probabilidad de que la demanda de Chardonnay sea alta y la demanda de Riesling también lo sea es 0.40. ¿Cómo modifica esto la decisión recomendada? Suponga que las probabilidades de que la demanda de Chardonnay sea baja siguen siendo 0.05 y 0.50. Otros miembros del equipo directivo esperan que el mercado de Chardonnay se sature en algún momento del futuro haciendo bajar los precios. Suponga que las proyecciones de ganancia anual caigan a $50 000 si la demanda de Chardonnay es alta y sólo se siembran uvas Chardonnay. Con las estimaciones de probabilidades iniciales, determine cómo afecta este cambio a la decisión óptima.
7. El consejo municipal de Lake Placid ha decidido construir un nuevo centro comunitario que será usado para convenciones, conciertos y otros eventos públicos, pero existen controversias respecto a su tamaño. Muchos de los ciudadanos influyentes desean que sea grande para que sirva de escaparate para la zona. Pero el alcalde cree que si la demanda no lo justifica, la comunidad perderá una gran cantidad de dinero. Para facilitar la decisión, el consejo municipal ha reducido las alternativas de construcción a tres tamaños: pequeño, mediano y grande. Todo mundo coincide en que el factor relevante para elegir el tamaño es la cantidad de personas que usarán estas nuevas instalaciones. Un asesor en planeación regional proporciona estimaciones de la demanda en tres escenarios: en el peor de los casos, en el caso base y en el mejor de los casos. El peor de los casos corresponde a la situación en que el turismo baje significativamente; el caso base corresponde a la situación en que Lake Placid siga atrayendo la misma cantidad de visitantes que hasta ahora, y el mejor de los casos corresponde a un aumento significativo del turismo. El asesor ha
21Ander(879-914).qxd 2/28/08 7:23 PM Page 891
21.3
891
Análisis de decisión con información muestral
proporcionado las siguientes probabilidades estimadas, 0.10, 0.60 y 0.30 para el peor de los casos, el caso base y el mejor de los casos, respectivamente. El consejo municipal ha sugerido el flujo de caja neto en un horizonte a cinco años como criterio para decidir cuál es el tamaño adecuado. Un asesor elaboró las proyecciones siguientes de flujo de caja neto (en miles de dólares) a un horizonte de cinco años. Todos los costos, incluyendo los honorarios del asesor, están incluidos.
Escenario de demanda Tamaño del centro Pequeño Mediano Grande
a. b. c.
d.
21.3
Peor caso
Caso base
Mejor caso
400 250 400
500 650 580
660 800 990
¿Cuál es la decisión que deberá tomar Lake Placid con el método del valor esperado? Calcule el valor esperado de la información perfecta. ¿Cree usted que valdría la pena tratar de obtener más información acerca de qué escenario tiene más posibilidades de presentarse? Suponga que la probabilidad del escenario del peor de los casos aumentara a 0.2, la probabilidad del escenario del caso base disminuyera 0.5 y la probabilidad del escenario del mejor caso permaneciera igual. ¿Estos cambios tendrían algún efecto en la recomendación para la toma de decisión? El asesor sugiere que un gasto de $150 000 en una campaña promocional a lo largo del horizonte de planeación reduciría a cero la probabilidad del escenario del peor caso. Si se espera que esta campaña también aumente la probabilidad del escenario del mejor de los casos a 0.4, ¿es una buena inversión?
Análisis de decisión con información muestral Al aplicar el método del valor esperado, se mostró cómo la información de la probabilidad de los estados afecta al valor esperado y, por tanto, a la recomendación sobre la decisión. Suele ocurrir que quien debe tomar la decisión cuente con evaluaciones de probabilidad preliminar o probabilidad previa para los estados que son los mejores valores de probabilidad de que se dispone en ese momento. Sin embargo, para tomar la mejor decisión posible, la persona que tomará la decisión suele tratar de obtener más información acerca de los estados. Esta nueva información sirve para revisar o actualizar las probabilidades previas, de modo que la decisión final se sustente en probabilidades más certeras de los estados. Lo más frecuente es que se obtenga más información mediante experimentos diseñados para proporcionar información muestral acerca de los estados. El muestreo de materia prima, la prueba de productos y los estudios de investigación de mercado son ejemplos de experimentos (o estudios) que permiten a los directivos modificar o actualizar las probabilidades de los estados. A estas probabilidades actualizadas se les llama probabilidades posteriores. De regreso al ejemplo de PDC, suponga que el director considera la posibilidad de hacer un estudio de investigación de mercado de seis meses de duración para conocer mejor la aceptación potencial en el mercado del proyecto de los condominios de PDC. El director prevé que el estudio de la investigación de mercado proporcionará uno de los dos siguientes resultados: 1. Informe favorable: Una cantidad significativa de las personas entrevistadas expresó interés por comprar un condominio de PDC. 2. Informe desfavorable: Muy pocas de las personas entrevistadas expresaron interés por comprar un condominio de PDC.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 892
892
Capítulo 21
Análisis de decisión
Árbol de decisión En la figura 21.4 se presenta el árbol de decisión para el problema de PDC con información muestral, en el que se observa la secuencia lógica de las decisiones y de los eventos aleatorios. Primero, el director de PDC debe decidir si llevar a cabo el estudio de la investigación de mercado. Si se realiza este estudio, el director de PDC debe estar preparado para tomar una decisión acerca del tamaño del complejo de condominios en caso de que el informe del estudio de la investigación de mercado sea favorable y, tal vez, otra decisión distinta acerca del tamaño del complejo si el informe de la investigación de mercado es desfavorable. FIGURA 21.4
ÁRBOL DE DECISIÓN DE PDC QUE COMPRENDE EL ESTUDIO DE INVESTIGACIÓN DE MERCADO Alta (s1) Pequeño (d1)
6
Baja (s2) Alta (s1)
Informe favorable
3
Mediano (d2)
7
Baja (s2) Alta (s1)
Grande (d3)
Estudio de investigación de mercado
8
2
Baja (s2) Alta (s1)
Pequeño (d1)
9
Baja (s2) Alta (s1)
1
Informe desfavorable
4
Mediano (d2)
10
Baja (s2) Alta (s1)
Grande (d3)
11
Baja (s2) Alta (s1)
Pequeño (d1)
12
Baja (s2) Alta (s1)
Sin estudio de investigación de mercado
5
Mediano (d2)
13
Baja (s2) Alta (s1)
Grande (d3)
14
Baja (s2)
8 7 14 5 20 9 8 7 14 5 20 9 8 7 14 5 20 9
21Ander(879-914).qxd 2/28/08 7:23 PM Page 893
21.3
En la sección 21.4 se explica cómo obtener estas probabilidades.
Análisis de decisión con información muestral
893
En la figura 21.4 los cuadrados indican nodos de decisión y los círculos indican nodos aleatorios. En cada nodo de decisión, la rama que se siga depende de la decisión que se tome. En cada nodo aleatorio, la rama que se siga depende de la probabilidad. Por ejemplo, el nodo de decisión 1 indica que PDC debe decidir si realiza el estudio de investigación de mercado. Si realiza el estudio de investigación de mercado, el nodo aleatorio 2 indica que las ramas del informe favorable y del informe desfavorable no se encuentran bajo control de PDC y estarán determinadas por la casualidad. El nodo 3 es de decisión e indica que si el informe de la investigación de mercado es favorable, PDC debe decidir si el complejo que construya será pequeño, mediano o grande. El nodo 4 es un nodo de decisión que indica que si el reporte de la investigación de mercado es desfavorable, PDC debe decidir si el complejo que construya será pequeño, mediano o grande. El nodo 5 es un nodo de decisión que indica que si PDC no realiza la investigación de mercado debe decidir si el complejo que construya será pequeño, mediano o grande. Los nodos 6 a 14 son aleatorios e indican que las ramas de los estados alta demanda o baja demanda serán determinadas por la casualidad. Para el análisis de un árbol de decisión y para la elección de una estrategia óptima es necesario que se conozcan todas las probabilidades de rama de todos los nodos aleatorios. PDC tiene las siguientes probabilidades de rama. Si se realiza el estudio de investigación de mercado P(Informe favorable) P(F) 0.77 P(Informe desfavorable) P(D) 0.23 Si el informe de la investigación de mercado es favorable P(Demanda alta dado un informe favorable) P(s1|F) 0.94 P(Demanda baja dado un informe favorable) P(s2|F) 0.06 Si el informe de la investigación de mercado es desfavorable P(Demanda alta dado un informe desfavorable) P(s1|D) 0.35 P(Demanda baja dado un informe desfavorable) P(s2|D) 0.65 Si no se realiza la investigación de mercado, se pueden emplear las probabilidades previas. P(Demanda alta) P(s1) 0.80 P(Demanda baja) P(s2) 0.20 En el árbol de decisión de la figura 21.5, sobre el árbol de decisión, se muestran las probabilidades de rama.
Estrategia de decisión Una estrategia de decisión es una secuencia de decisiones y resultados aleatorios, donde las decisiones que se toman dependen de los resultados, por conocer, de los eventos aleatorios. El método que se emplea para determinar la estrategia óptima de decisión se basa en recorrer el árbol de decisión en sentido regresivo, de atrás para adelante, debe seguir los pasos que se indican a continuación: 1. En los nodos aleatorios se calcula su valor esperado al multiplicar la recompensa que aparece al final de cada rama por la correspondiente probabilidad de la rama. 2. En los nodos de decisión, se elige la rama de decisión que conduzca al mayor valor esperado. Este valor esperado será el valor esperado del nodo de decisión.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 894
894
Capítulo 21
FIGURA 21.5
Análisis de decisión
ÁRBOL DE DECISIÓN DE PDC QUE MUESTRA LAS PROBABILIDADES DE RAMA
Pequeño (d1)
Alta (s1) 0.94 6
Baja (s2) 0.06 Alta (s1)
0.94 Informe Mediano (d2) 7 favorable 0.77 3 Baja (s2) 0.06 Alta (s1) Grande (d3)
Estudio de investigación de mercado
0.94 8
Baja (s2) 0.06 Alta (s1)
2 Pequeño (d1)
0.35 9
Baja (s2) 0.65 Alta (s1)
1
0.35 Mediano (d2) Informe 10 desfavorable 4 Baja (s2) 0.23 0.65 Alta (s1) Grande (d3)
0.35 11 Baja (s ) 2 0.65
Pequeño (d1)
12
5
Mediano (d2)
5 20 9 8 7 14 5 20 9
Baja (s2) 0.20
7
Baja (s2) 0.20 Alta (s1)
Grande (d3)
14
8
0.80 13
7
Alta (s1) 0.80
Alta (s1) Sin estudio de investigación de mercado
8
0.80 14 Baja (s ) 2 0.20
14 5 20 9
21Ander(879-914).qxd 2/28/08 7:23 PM Page 895
21.3
895
Análisis de decisión con información muestral
Al comenzar el recorrido regresivo con el cálculo de los valores esperados de los nodos 6 a 14 se obtienen los resultados siguientes: VE(Nodo 6) VE(Nodo 7) VE(Nodo 8) VE(Nodo 9) VE(Nodo 10) VE(Nodo 11) VE(Nodo 12) VE(Nodo 13) VE(Nodo 14)
0.94(8) 0.94(14) 0.94(20) 0.35(8) 0.35(14) 0.35(20) 0.80(8) 0.80(14) 0.80(20)
0.06(7) 0.06(5) 0.06( 9) 0.65(7) 0.65(5) 0.65( 9) 0.20(7) 0.20(5) 0.20( 9)
7.94 13.46 18.26 7.35 8.15 1.15 7.80 12.20 14.20
En la figura 21.6 se presenta el árbol de decisión reducido, una vez calculados los valores esperados de estos nodos aleatorios. Después se continúa con los nodos 3, 4, y 5. En cada uno de estos nodos se elige la rama de la alternativa de decisión que conduzca al mayor valor esperado. Por ejemplo, en el nodo 3 se puede elegir entre las ramas del complejo pequeño para la que VE(Nodo 6) 7.49, la del complejo mediano para la que VE(Nodo 7) 13.46 y la del complejo grande para la que VE(Nodo 8) 18.26. Se elegirá la rama de la alternativa de decisión del complejo grande y el valor esperado del nodo 3 será, VE(Nodo 3) 18.26. En el nodo 4 hay que elegir, entre los nodos 9, 10 y 11, el que tenga el mayor valor esperado. La mejor alternativa de decisión es la rama del complejo mediano, con la que se obtiene VE(Nodo 4) 8.15. En el nodo 5 la elección es entre los nodos 12, 13 y 14, el que tenga el mayor valor esperado. La mejor alternativa de decisión es la rama con la que se obtiene VE(Nodo 5) 14.20. En la figura 21.7 se presenta el árbol de decisión reducido una vez que en los nodos 3, 4, y 5 se han elegido, o tomado, las mejores decisiones. Ahora se puede calcular el valor esperado del nodo 2, de la manera siguiente: VE(Nodo 2) 0.77VE(Nodo 3) 0.23VE(Nodo 4) 0.77(18.26) 0.23(8.15) 15.93 Con estos cálculos el árbol de decisión se reduce a un árbol que tiene únicamente dos ramas de decisión que salen del nodo 1 (véase la figura 21.8). Por último, en el nodo 1 se puede llegar a una decisión al elegir entre los nodos 2 y 5, el que tenga el mayor valor esperado. Esto lleva a la alternativa de decisión de realizar el estudio de investigación de mercado, con el cual se obtendrá un valor esperado de 15.93. Para PDC, la decisión óptima es realizar el estudio de investigación de mercado y después seguir la siguiente estrategia de decisión: Si la investigación de mercado es favorable, construir el complejo grande. Si la investigación de mercado es desfavorable, construir el complejo mediano. Este análisis del árbol de decisión de PDC ilustra los métodos que pueden usarse para analizar problemas secuenciales de decisiones más complejos. Primero, se dibuja el árbol de decisión que consta de nodos de decisión, nodos aleatorios y ramas que describen el carácter secuencial del problema. Se determinan las probabilidades de todos los resultados aleatorios. Después procediendo en forma regresiva a través del árbol de decisión se calcula el valor esperado de todos los nodos aleatorios y en cada uno de los nodos de decisión se elige la rama que conduzca a la mejor decisión. La secuencia de ramas de decisiones óptimas determina la estrategia de la decisión óptima para el problema.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 896
896
Capítulo 21
FIGURA 21.6
Análisis de decisión
ÁRBOL DE DECISIÓN DE PDC UNA VEZ CALCULADOS LOS VALORES ESPERADOS DE LOS NODOS DE DECISIÓN 6 A 14 Pequeño (d1)
Informe favorable 0.77
3
Mediano (d2)
Grande (d3)
Estudio de investigación de mercado
6
VE = 7.94
7
VE = 13.46
8
VE = 18.26
9
VE = 7.35
10
VE = 8.15
11
VE = 1.15
12
VE = 7.80
13
VE = 12.20
14
VE = 14.20
2 Pequeño (d1)
1
Informe desfavorable 0.23
4
Mediano (d2)
Grande (d3)
Pequeño (d1)
Sin estudio de investigación de mercado
5
Mediano (d2)
Grande (d3)
El VEIM $1.73 millones sugiere que PDC deberá estar dispuesto a pagar hasta $1.73 millones por la realización del estudio de la investigación de mercado.
Valor esperado de la información muestral En el problema de PDC, la información muestral que se usa para determinar la estrategia óptima de decisión es el estudio de la investigación de mercado. El valor esperado del estudio de la investigación de mercado es $15.93. En la sección 21.3 se mostró que si no se realiza la investigación de mercado, el mejor valor esperado es $14.20. Por tanto, se concluye que la diferencia $15.93 14.20 $1.73 es el valor esperado de la información muestral (VEIM). En otras
21Ander(879-914).qxd 2/28/08 7:23 PM Page 897
21.3
897
Análisis de decisión con información muestral
FIGURA 21.7
ÁRBOL DE DECISIÓN DE PDC, UNA VEZ ELEGIDAS LAS MEJORES DECISIONES EN LOS NODOS 3, 4 Y 5 Informe favorable 0.77
Estudio de mercado
1
3
VE = 18.26; d3
4
VE = 8.15; d2
5
VE = 14.20; d3
2
Informe desfavorable 0.23
Sin estudio de mercado
palabras, realizar el estudio de la investigación de mercado agrega $1.73 millones al valor esperado de PDC. En general, el valor esperado de la información muestral es el siguiente:
VALOR ESPERADO DE LA INFORMACIÓN MUESTRAL
VEIM |VEcIM – VEsIM|
(21.5)
donde VEIM valor esperado de la información muestral VEcIM valor esperado con información muestral acerca del estado VEsIM valor esperado sin información muestral acerca del estado
Note el papel del valor absoluto en la ecuación (21.5). En problemas de minimización, el valor esperado con información muestral es siempre menor que el valor esperado sin información
21Ander(879-914).qxd 2/28/08 7:23 PM Page 898
898
Capítulo 21
FIGURA 21.8
Análisis de decisión
ÁRBOL DE DECISIÓN DE PDC REDUCIDO A DOS RAMAS DE DECISIÓN Estudio de investigación 2 de mercado
VE = 15.93
1
Sin estudio de investigación de mercado
5
VE = 14.20
muestral. En ese caso VEIM es la magnitud de la diferencia entre VEcIM y VEsIM; de esta manera, al tomar el valor absoluto de la diferencia, como se muestra en la ecuación (21.5), se pueden tratar tanto los casos de maximización como los de minimización con una sola ecuación.
Ejercicios
Métodos
Auto examen
8. Se considerará una variación del árbol de decisión de PDC mostrado en la figura 21.5. Lo primero que tiene que decidir la empresa es si llevar a cabo, o no, el estudio de la investigación de mercado. Si se realiza el estudio de la investigación de mercado, los resultados pueden ser favorables (F) o desfavorables (D). Ahora suponga que sólo se tienen dos alternativas de decisión, d1 y d2, y dos estados, s1 y s2. En la tabla de recompensas siguiente se muestran las ganancias: Estado
a. b.
Alternativa de decisión
s1
s2
d1 d2
100 400
300 200
Presente el árbol de decisión. A partir de las probabilidades siguientes proporcione la estrategia óptima de decisión. P (F) 0.56 P (D) 0.44 4
P(s1 冷 F) 0.57 P (s2 冷 F) 0.43
P(s1 冷 D) 0.18 P(s2 冷 D) 0.82
P(s1) 0.40 P(s2) 0.60
21Ander(879-914).qxd 2/28/08 7:23 PM Page 899
21.3
899
Análisis de decisión con información muestral
Aplicaciones 9. Un inversionista de bienes raíces tiene la oportunidad de comprar un terreno en una zona que actualmente es residencial. Si en el lapso de un año, la junta de administración local aprueba la solicitud de modificar el uso de esta propiedad a propiedad comercial, el inversionista podrá rentar el terreno a una tienda de descuento que desea abrir una sucursal en ese lugar. Pero si esta modificación no es aprobada, el inversionista tendría que vender la propiedad y tener una pérdida. En la siguiente tabla de recompensa se presentan las ganancias posibles (en miles de dólares). Estado Alternativas de decisión Comprar, d1 No comprar, d2
a. b.
Aprobación s1
No aprobación s2
600 0
200 0
Si la probabilidad de que se acepte la modificación es 0.5, ¿cuál es la decisión que se recomienda? Al comprar el terreno el inversionista accede a una opción, la cual le concede el derecho de comprar el terreno dentro de los próximos tres meses, tiempo en el que tendrá oportunidad de obtener más información acerca de la resistencia de los habitantes de la zona a la modificación solicitada. Las probabilidades son las siguientes: Sea M mucha resistencia a la modificación P poca resistencia a la modificación P(M) 0.55 P(P) 0.45
c.
P(s1 冷 M) 0.18 P(s1 冷 P) 0.89
P(s2 冷 M) 0.82 P(s2 冷 P) 0.11
¿Cuál es la estrategia optima de decisión si el inversionista aprovecha el periodo que le da la opción, para obtener más información acerca de la resistencia de los habitantes de la zona, antes de tomar una decisión sobre la compra? Si para adquirir la opción, el inversionista tiene que gastar $10 000 más, ¿deberá adquirir la opción? ¿Por qué sí o por qué no? ¿Cuál será la máxima cantidad que el inversionista estará dispuesto a pagar por la opción?
10. La empresa Dante Development Corporation considera la posibilidad de concursar por un contrato para la construcción de un nuevo complejo de oficinas. En la figura 21.9 se presenta el árbol de decisión elaborado por uno de los analistas de Dante. En el nodo 1 la empresa tiene que decidir si concursa o no por el contrato. Prepararse para el concurso cuesta $200 000. La rama superior del nodo 2 indica que, si la empresa concursa, la probabilidad de ganar el contrato es 0.8. Si la empresa gana el contrato, tendrá que pagar $2 000 000 para convertirse en socio del proyecto. El nodo 3 muestra que, entonces, la empresa, antes de empezar con la construcción, tendrá que considerar la posibilidad de realizar un estudio de investigación de mercado para pronosticar la demanda que tendrán las oficinas. El costo de este estudio es de $150 000. El nodo 4 es aleatorio y señala los posibles resultados del estudio de la investigación de mercado. Los nodos 5, 6 y 7 son todos similares entre sí, ya que todos son nodos de decisión en los que Dante tiene que decidir si construir las oficinas o vender el derecho sobre el proyecto a otra empresa. Si se decide a construir el complejo, tendrá un ingreso de $5 000 000 si la demanda es alta, y $3 000 000, si la demanda es moderada. Si Dante decide vender sus derechos sobre el proyecto a otra empresa, se estima que el ingreso por la venta será $3 500 000. Las probabilidades en los nodos 4, 8 y 9 están basadas en los resultados del estudio de la investigación de mercado. a. Verifique las proyecciones de ganancias que se presentan al final de las ramas del árbol de decisión, calcule las recompensas de $2 650 000 y $650 000 de los dos primeros resultados. b. ¿Cuál es la estrategia óptima de decisión para Dante, y cuál es la ganancia esperada en este proyecto? c. ¿De cuánto tendrá que ser el costo del estudio de la investigación de mercado para que Dante se decida a realizar el estudio?
21Ander(879-914).qxd 2/28/08 7:23 PM Page 900
900
Capítulo 21
FIGURA 21.9
Análisis de decisión
ÁRBOL DE DECISIÓN PARA LA EMPRESA DANTE DEVELOPMENT CORPORATION Ganancia (miles)
Pronóstico muy bueno 0.6 Investigación de mercado
Concursar
5
Demanda moderada 0.15
650
Vender
1150
Construir el complejo
Sin investigación de mercado
9
6
Demanda alta 0.225
2650
Demanda moderada 0.775
650
Vender
3
2
8
2650
4 Pronóstico moderado 0.4
Obtener el contrato 0.8
Construir el complejo
Demanda alta 0.85
1150
Construir el complejo 7
10
Demanda alta 0.6
2800
Demanda moderada 0.4
800
Vender 1 No concursar
1300
No obtener el contrato 0.2
200 0
11. La empresa Hale’s TV Productions considera producir un programa piloto de una serie de televisión que espera vender a una cadena de televisión. Puede ser que la cadena rechace la serie, pero también que decida comprar los derechos de la serie por uno o dos años. En este momento, Hale tiene que producir la muestra y esperar a la decisión de la cadena de televisión o transferirle los derechos sobre el piloto y sobre la serie a un competidor por $100 000. En la tabla siguiente se muestran las alternativas de decisión y las ganancias de Hale.
Alternativas de decisión Producir la muestra, d1 Vender a la competencia, d2
Rechazo, s1 100 100
Estado 1 año, s2 50 100
2 años, s3 150 100
Las probabilidades de los estados son P(s1) 0.2, P(s2) 0.3 y P(s3) 0.5. Mediante un pago de $5 000, una agencia puede revisar los planes de la serie e indicar las posibilidades de que la cadena de televisión tenga una reacción favorable. La revisión de la agencia puede dar resultados favorables (F) o desfavorables (D); suponga que las probabilidades sean las siguientes. P (F) 0.69 P (D) 0.31 a. b.
P (s 1 冷 F) 0.90 P (s 2 冷 F) 0.26 P (s 3 冷 F) 0.65
P(s1 冷 D) 0.45 P(s2 冷 D) 0.39 P(s3 冷 D) 0.16
Construya un árbol de decisión para este problema. ¿Cuál es la decisión recomendada si no se usa la opinión de la agencia? ¿Cuál es el valor esperado?
21Ander(879-914).qxd 2/28/08 7:23 PM Page 901
21.3
901
Análisis de decisión con información muestral
c. d. e. f. g.
¿Cuál es el valor esperado de la información perfecta? ¿Cuál es la estrategia óptima de decisión para Hale si usa la información de la agencia? ¿Cuál es el valor esperado de la información de la agencia? ¿La información de la agencia vale los $5 000 que hay que pagarle? ¿Cuál es la cantidad máxima que Hale estará dispuesta a pagar por la información? ¿Cuál es la decisión recomendada?
12. Martin’s Service Station está considerando participar, el próximo invierno, en el negocio de quitar la nieve. Martin puede comprar una cuchilla aditamento para su camión pick-up o un camión quitanieves para trabajo pesado. Después de analizar la situación, Martin encuentra que cualquier alternativa será una inversión rentable si hay nevadas fuertes. Si las nevadas son moderadas, la rentabilidad puede ser pequeña y si las nevadas son muy ligeras, puede tener pérdidas. En la tabla siguiente se muestran las ganancias y las pérdidas
Estado Alternativas de decisión Aditamento, d1 Quitanieves, d2
Fuerte, s1
Moderada, s2
Ligera, s3
3500 7000
1000 2000
1500 9000
Las probabilidades de los estados son P(s1) 0.4, P(s2) 0.3 P(s3) 0.3. Suponga que Martin decide esperar hasta septiembre antes de tomar una decisión. Las probabilidades estimadas de que en septiembre haga un frío normal (N) o un frío inesperado (I) son las siguientes: P(N ) 0.8 P(U ) 0.2
a. b. c. d.
P(s1 冷 N ) 0.35 P(s2 冷 N ) 0.30 P(s3 冷 N ) 0.35
P(s1 冷 U ) 0.62 P(s2 冷 U ) 0.31 P(s3 冷 U ) 0.07
Construya un árbol de decisión para este problema. ¿Cuál es la decisión recomendada si Martin no espera hasta septiembre? ¿Cuál es el valor esperado? ¿Cuál es el valor esperado de la información perfecta? ¿Cuál es la estrategia óptima de decisión si no se toma la decisión sino hasta que se haya determinado el clima en septiembre? ¿Cuál es el valor esperado de esta estrategia?
13. La tienda departamental Lawson tiene que decidir si compra un producto estacional, el cual puede tener una demanda alta, moderada o baja. Lawson puede ordenar 1, 2, o 3 lotes, antes de la estación, pero después ya no podrá comprar otro lote. Las proyecciones de las ganancias (en miles de dólares) son las que se muestran a continuación.
Estado Alternativas de decisión
Demanda alta s1
Demanda moderada s2
Demanda baja s3
Ordenar 1 lote, d1 Ordenar 2 lotes, d2 Ordenar 3 lotes, d3
60 80 100
60 80 70
50 30 10
a. b.
Si las probabilidades previas de los tres estados son 0.3, 0.3 y 0.4, respectivamente, ¿cuál es la cantidad de lotes recomendada? En todas las reuniones preestacionales de ventas, el vicepresidente de la empresa da su opinión respecto a la demanda potencial de los productos. Debido al carácter entusiasta y optimista del vicepresidente, los pronósticos de las condiciones del mercado siempre han sido
21Ander(879-914).qxd 2/28/08 7:23 PM Page 902
902
Capítulo 21
Análisis de decisión
o “excelentes” (E) o “muy buenas” (M). Las probabilidades son las siguientes. ¿Cuál es la estrategia óptima de decisión? P(E ) 0.7 P(M ) 0.3
c.
21.4
P(s1 冷 E ) 0.34 P(s2 冷 E ) 0.32 P(s3 冷 E ) 0.34
P(s1 冷 M ) 0.20 P(s2 冷 M ) 0.26 P(s3 冷 M ) 0.54
Calcule el VEIP y el VEIM. Analice si la empresa debería consultar a un experto que le proporcionara un pronóstico independiente de la situación del mercado respecto al producto.
Cálculo de las probabilidades de rama mediante el teorema de Bayes En la sección 21.3 las probabilidades de rama de los nodos aleatorios del árbol de decisión fueron especificadas en la descripción del problema. Para determinar estas probabilidades no fue necesario realizar ningún cálculo. En esta sección se muestra cómo usar el teorema de Bayes, ya visto en el capítulo 4, para calcular las probabilidades de rama de un árbol de decisión. En la figura 21.10 se presenta nuevamente el árbol de decisión de PDC. Sea F Informe favorable de la investigación de mercado D Informe desfavorable de la investigación de mercado s1 Demanda alta (estado 1) s2 Demanda baja (estado 2) En el nodo aleatorio 2, se necesitan conocer las probabilidades de rama P(F) y P(D). En los nodos aleatorios 6, 7 y 8 se necesitan conocer las probabilidades de rama, P(s1|F) probabilidad del estado 1 dado un informe favorable de la investigación de mercado y P(s2|F) probabilidad del estado 2 dado un informe favorable de la investigación de mercado. A P(s1|F) y P(s2|F) se les conoce como probabilidades posteriores debido a que son probabilidades condicionales basadas en el resultado de la información muestral. En los nodos 9, 10 y 11 se necesitan conocer las probabilidades de rama P(s1|D) y P(s2|D); observe que éstas también son probabilidades posteriores que denotan las probabilidades de dos estados dado que el informe de la investigación de mercado es desfavorable. Por último, en los nodos 12, 13 y 14 se necesitan las probabilidades de los estados P(s1) y P(s2) si no se realiza el estudio de la investigación de mercado. Para calcular las probabilidades, se necesita saber cuáles son los valores que PDC da a las probabilidades de los estados P(s1) y P(s2), que son las probabilidades previas, como ya se vio antes. Además, se necesita conocer la probabilidad condicional de los resultados de la investigación de mercado (información muestral) dado cada uno de los estados. Por ejemplo, se necesita conocer la probabilidad condicional de un informe favorable de la investigación de mercado dado que existe una alta demanda por el proyecto de PDC; observe que esta probabilidad condicional de F dado s1 se expresa P(F|s1). Para calcular estas probabilidades, se necesitan las probabilidades condicionales de todos los resultados muestrales dados cada uno de los estados, es decir, P(F|s1), P(F|s2), P(D|s1) y P(D|s2). En el caso del problema de PDC se supone que se cuenta con las estimaciones de las siguientes probabilidades condicionales.
Estado
Investigación de mercado Favorable, F Desfavorable, D
Demanda alta, s1 Demanda baja, s2
P(F 冷 s1) 0.90 P(F 冷 s2 ) 0.25
P(U 冷 s1) 0.10 P(U 冷 s2 ) 0.75
21Ander(879-914).qxd 2/28/08 7:23 PM Page 903
21.4
903
Cálculo de las probabilidades de rama mediante el teorema de Bayes
FIGURA 21.10
ÁRBOL DE DECISIÓN DE PDC Alta (s1) Pequeño (d1)
6
P(s1 F)
Baja (s2) P(s2 F)
Alta (s1) Informe favorable P(F)
3
Mediano (d2)
7
P(s1 F)
Baja (s2) P(s2 F)
Alta (s1) Grande (d3)
8
P(s1 F)
Baja (s2) P(s2 F)
Estudio de 2 investigación de mercado
Alta (s1) Pequeño (d1)
9
P(s1 U)
Baja (s2) P(s2 U)
Alta (s1) 1
Informe desfavorable P(D)
4
Mediano (d2)
10
P(s1 U)
Baja (s2) P(s2 U)
Alta (s1) Grande (d3)
11
P(s1 U)
Baja (s2) P(s2 U)
Alta (s1) Pequeño (d1)
12
P(s1)
Baja (s2)
8 7 14 5 20 9 8 7 14 5 20 9 8 7
P(s2)
Alta (s1) Sin estudio de investigación de mercado
5
Mediano (d2)
13
P(s1)
Baja (s2) P(s2)
Alta (s1) Grande (d3)
14
P(s1)
Baja (s2) P(s2)
14 5 20 9
Observe que las estimaciones anteriores proporcionan una confianza razonable en el estudio de la investigación de mercado. Si el verdadero estado es s1, la probabilidad de que el informe de la investigación de mercado sea favorable es 0.90 y la probabilidad de que el informe de la investigación de mercado sea desfavorable es 0.10. Si el verdadero estado es s2, la probabilidad de que el informe de la investigación de mercado sea favorable es 0.25 y la probabilidad de que el informe de la investigación de mercado sea desfavorable es 0.75. La razón de que la probabilidad de un potencialmente engañoso informe favorable de mercado sea 0.25 para el estado s2 es que cuando los compradores potenciales oyen por primera vez hablar del nuevo proyecto del
21Ander(879-914).qxd 2/28/08 7:23 PM Page 904
904
Capítulo 21
TABLA 21.3
Análisis de decisión
PROBABILIDADES DE RAMA PARA EL PROYECTO DEL CONDOMINIO DE PDC BASADAS EN UN REPORTE FAVORABLE DE LA INVESTIGACIÓN DE MERCADO
Estados sj
Probabilidades previas P(sj)
Probabilidades condicionales P(F | sj)
Probabilidades conjuntas P(F 傽 sj)
Probabilidades posteriores P(sj | F)
s1 s2
0.8 0.2
0.90 0.25
0.72 0.05
0.94 0.06
P(F) 0.77
1.00
1.0
condominio el entusiasmo puede llevarlos a exagerar su verdadero interés por los condominios. La respuesta inicialmente favorable de un comprador potencial puede convertirse rápidamente en un “no gracias” cuando se encuentra ante la situación de firmar un contrato de compra y tener que hacer un pago. En el análisis siguiente, para calcular las probabilidades se emplea un método tabular. En la tabla 21.3 se presentan en forma resumida los cálculos para el problema de PDC cuando de la investigación de mercado se obtiene un informe favorable (F). Los pasos para elaborar esta tabla son los siguientes. Paso 1. En la columna 1 se ingresan los estados. En la columna 2 se ingresan las probabilidades previas de los estados. En la columna 3 se ingresan las probabilidades condicionales correspondientes a un informe favorable de la investigación de mercado (F) dado cada estado. Paso 2. En la columna 4 se calculan las probabilidades conjuntas al multiplicar los valores de las probabilidades previas de la columna 2 por los correspondientes valores de probabilidad condicional de la columna 3. Paso 3. Las probabilidades conjuntas de la columna 4 se suman para obtener la probabilidad de un reporte favorable de la investigación de mercado, P(F). Paso 4. Cada probabilidad conjunta de la columna 4 se divide entre P(F) 0.77 para obtener las probabilidades posteriores, P(s1兩F) y P(s2兩F). En la tabla 21.3 se observa que la probabilidad de que el informe de la investigación de mercado sea favorable es P(F) 0.77. Además, P(s1兩F) 0.94 y P(s2兩F) 0.06. En particular, que si el informe de la investigación de mercado es favorable, la probabilidad posterior de que la demanda por el condominio sea alta será 0.94. El procedimiento para calcular las probabilidades en forma tabular deberá repetirse con cada uno de los resultados de la información muestral. En la tabla 21.4 se presenta el cálculo de las probabilidades de rama cuando el informe del mercado es desfavorable. Observe que la probabilidad de que el informe de la investigación de mercado sea desfavorable es P(D) 0.23. Si TABLA 21.4
PROBABILIDADES DE RAMA PARA EL PROYECTO DEL CONDOMINIO DE PDC BASADAS EN UN REPORTE DESFAVORABLE DE LA INVESTIGACIÓN DE MERCADO
Estados sj
Probabilidades previas P(sj)
Probabilidades condicionales P(D | sj)
Probabilidades conjuntas P(D 艚 sj)
Probabilidades posteriores P(sj | D)
s1 s2
0.8 0.2
0.10 0.75
0.08 0.15
0.35 0.65
P(U) 0.23
1.00
1.0
21Ander(879-914).qxd 2/28/08 7:23 PM Page 905
21.4
En el ejercicio 14 se pide calcular probabilidades posteriores.
Cálculo de las probabilidades de rama mediante el teorema de Bayes
905
el informe de la investigación de mercado es desfavorable, la probabilidad posterior de que la demanda sea alta s1, es 0.35 y la probabilidad posterior de que la demanda sea baja, s2 es 0.65. Las probabilidades de rama de las tablas 21.3 y 21.4 se presentaron en el árbol de decisión de PDC de la figura 21.5. Lo visto en esta sección indica que existe una relación entre las probabilidades de las diferentes ramas de un árbol de decisión. No sería correcto suponer otras probabilidades previas P(s1) y P(s2) y no determinar cómo tal modificación alteraría P(F) y P(D), así como a las probabilidades posteriores P(s1兩F), P(s2兩F), P(s1兩D) y P(s2兩D).
Ejercicios
Métodos
Auto examen
14. Se presenta la situación de una decisión en la que existen tres estados s1, s2 y s3. Las probabilidades previas son P(s1) 0.2, P(s2) 0.5 y P(s3) 0.3. Con la información muestral P(I 兩 s1) 0.1, P(I 兩 s2) 0.05 y P(I 兩 s3) 0.2. Calcule las probabilidades posteriores P(s1 兩 I), P(s2 兩 I) y P(s3 兩 I). 15. Las cantidades en una tabla de recompensa para un problema de decisión son ganancias. En este problema se tienen dos estados y tres alternativas de decisión. Las probabilidades previas de s1 y s2 son P(s1) 0.8, y P(s2) 0.2
Estado
a. b. c.
Alternativa de decisión
s1
s2
d1 d2 d3
15 10 8
10 12 20
¿Cuál es la decisión óptima? Hallar el VEIP. Si se obtiene la información muestral y que P(I 兩 s1) 0.20 y P(I 兩 s2) 0.75. Halle las probabilidades posteriores P(s1 兩 I ) y P(s2 兩 I ). Con base en estas probabilidades recomiende una alternativa de decisión.
Aplicaciones 16. Para economizar, Rona y Jerry se han puesto de acuerdo para irse juntos, en el coche de uno de ellos, al trabajo. Rona prefiere irse por la avenida Queen, que aunque es un poco más larga, es más segura. Jeery prefiere ir por la autopista, porque es más rápido. Deciden que cuando la autopista esté muy congestionada se irán por la avenida Queen. En la siguiente tabla de recompensa se dan los tiempos en minutos de este recorrido
Estados
Alternativas de decisión Avenida Queen, d1 Autopista, d2
Autopista sin tráfico s1
Autopista congestionada s2
30 25
30 45
21Ander(879-914).qxd 2/28/08 7:23 PM Page 906
906
Capítulo 21
Análisis de decisión
De acuerdo con su experiencia, Rona y Jerry piensan que la probabilidad de que la autopista esté congestionada es 0.15. Además, coinciden en que el clima parece afectar la circulación en la autopista Sea D despejado N nublado L lluvioso Las probabilidades condicionales son las siguientes P(C 冷 s1) 0.8 P(C ( 冷 s2 ) 0.1 a.
b. c.
P(O 冷 s1) 0.2 P(O 冷 s2 ) 0.3
P( L 冷 s1) 0.0 P( L 冷 s2 ) 0.6
Use el teorema de Bayes para calcular la probabilidad de cada una de las condiciones y las probabilidades condicionales de que la autopista esté despejada, s1, o congestionada, s2, dadas cada una de las condiciones climáticas. Presente el árbol de decisión para este problema. Dé la estrategia óptima de decisión y el tiempo de viaje esperado.
17. La empresa Gorman Manufacturing Company tiene que decidir si fabrica una pieza en su planta de Milan, Michigan, o si la compra a un proveedor. Las ganancias dependerán de la demanda del producto. En la siguiente tabla de recompensa se presentan las ganancias proyectadas (en dólares).
Estado Alternativa de decisión Fabricarla, d1 Comprarla, d2
Demanda baja s1
Demanda media s2
Demanda alta s3
20 10
40 45
100 70
Las probabilidades de los estados son P(s1) 0.35, P(s2) 0.35 y P(s3) 0.30. a. Use el árbol de decisión para recomendar una decisión. b. Use el VEIP para determinar si Gorman deberá tratar de obtener una mejor estimación de la demanda. c. Un estudio de mercado de la demanda potencial del producto dará como resultado que la situación es favorable (F) o desfavorable (D). Las probabilidades son: P(F 冷 s1) 0.10 P(F 冷 s2 ) 0.40 P(F 冷 s3) 0.60 d. e.
P(D 冷 s1) 0.90 P(D 冷 s2 ) 0.60 P(D 冷 s3) 0.40
¿Cuál es la probabilidad de que la investigación de mercado arroje un informe favorable? ¿Cuál es la estrategia óptima para Gorman? ¿Cuál es el valor esperado de la información de la investigación de mercado?
Resumen El análisis de decisión se usa para determinar una alternativa de decisión recomendada o una estrategia óptima de decisión ante un panorama de eventos futuros inciertos y riesgosos. El objetivo del análisis de decisión es identificar la mejor alternativa de decisión o la estrategia óptima de decisión dada cierta información acerca de los eventos inciertos y de las posibles consecuencias o recompensas. A los eventos futuros inciertos se les conoce como eventos aleatorios y a los resultados de los eventos aleatorios se les conoce como estados.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 907
Glosario
El complemento de Excel TreePlan se encuentra en el disco compacto que se distribuye con el libro.
907
Se mostró el uso de las tablas de recompensa y de los árboles de decisión para estructurar un problema de decisión y para describir las relaciones entre las decisiones, los eventos aleatorios y las consecuencias. Con las estimaciones para las probabilidades de los estados, el método del valor esperado se empleó para identificar la alternativa de decisión recomendada o la estrategia de decisión. En los casos en que se puede disponer de información muestral acerca de los eventos aleatorios, hay una secuencia de decisiones que tomar. Primero se decide si obtener, o no, la información muestral. Si la respuesta a esta decisión es sí, habrá que elaborar una estrategia óptima de decisión basada en la información muestral específica. En este caso, los árboles de decisión y el método del valor esperado pueden usarse para determinar la estrategia óptima de decisión. El complemento de Excel TreePlan suele emplearse para elaborar árboles de decisión y para resolver los problemas de decisión presentados en este capítulo. El software TreePlan y el manual para el uso de TreePlan se encuentran en el sitio de la Red de ASW. En el apéndice, al final del capítulo, se presenta un ejemplo en el que se muestra cómo usar TreePlan para resolver el problema de PDC presentado en la sección 21.1.
Glosario Evento aleatorio Evento futuro incierto que afecta a la consecuencia, o recompensa, relacionada con una decisión. Consecuencia Resultado obtenido de la elección de una alternativa de decisión y la ocurrencia de un evento aleatorio. A una medida de la consecuencia se le suele denominar recompensa. Estados Los resultados posibles de los eventos aleatorios que afectan la recompensa correspondiente a una alternativa de decisión. Recompensa Una medida de la consecuencia de una decisión, por ejemplo, ingresos, costos, tiempo. Para cada combinación de una alternativa de decisión y un estado está asociada una recompensa (consecuencia). Tabla de recompensa Representación tabular de las recompensas en un problema de decisión. Árbol de decisión Representación gráfica de un problema de decisión que muestra el carácter secuencial del proceso de toma de la decisión. Nodo Punto de intersección o de encuentro en un diagrama de influencia o en un árbol de decisión. Nodos de decisión Nodos que indican puntos en los que hay que tomar una decisión. Nodos aleatorios Indican los puntos donde existe incertidumbre respecto a la ocurrencia de un evento. Rama Líneas que indican las alternativas que salen de los nodos de decisión y resultados que salen de los nodos aleatorios. Método del valor esperado Método para elegir una alternativa de decisión, que se basa en el valor esperado de cada alternativa de decisión. La alternativa de la decisión recomendada es la que proporciona el mejor valor esperado. Valor esperado (VE) En un nodo aleatorio, es el promedio ponderado de las recompensas. Los pesos son las probabilidades de los estados. Valor esperado de la información perfecta (VEIP) Valor esperado de la información que le diría, con exactitud, a quien tiene que tomar la decisión cuál es el estado que va a ocurrir (es decir, información perfecta). Probabilidades previas Las probabilidades de los estados antes de obtener la información muestral. Información muestral Información nueva obtenida a través de la investigación o de la experimentación y que permite actualizar o modificar las probabilidades de los estados. Probabilidades posteriores Las probabilidades de los estados una vez modificadas las probabilidades previas con base en la información muestral.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 908
908
Capítulo 21
Análisis de decisión
Estrategia de decisión Estrategia en la que interviene una secuencia de decisiones y resultados aleatorios para obtener una decisión óptima a un problema de decisión. Valor esperado de la información muestral (VEIM) Es la diferencia entre el valor esperado de una estrategia óptima basada en una información muestral y el “mejor” valor esperado sin ninguna información muestral. Teorema de Bayes Teorema que permite el uso de la información muestral para modificar probabilidades previas. Probabilidad condicional Probabilidad de un evento dado que se conoce el resultado de otro evento (posiblemente) relacionado. Probabilidad conjunta Probabilidad de que tanto la información muestral como un determinado estado ocurran simultáneamente.
Fórmulas clave Valor esperado N
VE (di)
兺 P(s )V j
ij
(21.3)
j 1
Valor esperado de la información perfecta VEIP 冷 VEcIP VEsIP 冷
(21.4)
Valor esperado de la información muestral VEIM 冷 VEcIM VEsIM 冷
Caso problema:
(21.5)
Estrategia de defensa en un juicio John Campbell, empleado de Manhattan Construction Company, afirma haberse lastimado la espalda como resultado de una caída que sufrió mientras reparaba el techo del edificio de departamentos Eastview. En una demanda contra Doug Reynolds, propietario del edificio Eastview, en la que solicita una indemnización por $1 500 000, John afirma que el techo tenía secciones podridas y que esa caída podía haberse evitado si el señor Reynolds hubiera informado del problema a Manhattan Construction. El señor Reynolds notificó de la demanda a su compañía de seguros, Allied Insurance. Allied tiene que defender al señor Reynolds y decidir las medidas que tomará respecto a la demanda. Después de algunas declaraciones y discusiones entre ambas partes, John Campbell accedió a aceptar una indemnización de $750 000. De esta manera, una opción para Allied es pagarle a John los $750 000 y resolver el caso. Pero, Allied está tratando de hacerle a John una contraoferta por $400 000, esperando que acepte una cantidad menor evitándose así los costos y la pérdida de tiempo de un juicio. Las primeras investigaciones de Allied indican que el caso de John es un caso severo; a Allied le preocupa que rechace la contraoferta y prefiera irse a juicio. Los abogados de Allied analizan cuál puede ser la reacción de John si le hacen la contraoferta de $400 000. Los abogados concluyen que puede haber tres reacciones de John frente a la contraoferta de los $400 000: 1) que John acepte la contraoferta y se cierre el caso; 2) que John rechace la contraoferta y prefiera que un tribunal determine el monto de la indemnización, o 3) que John haga a Allied una contraoferta por $600 000. En el caso que John haga una contraoferta, Allied ha de-
21Ander(879-914).qxd 2/28/08 7:23 PM Page 909
Apéndice 21.1
Solución del problema PDC con TreePlan
909
cidido que no hará más contraofertas; aceptarán la contraoferta de John por $600 000 o irán a los tribunales. Si el caso llega a los tribunales, Allied prevé tres resultados posibles: 1) que el tribunal rechace la demanda de John y Allied no tenga que pagar nada; 2) que el tribunal esté a favor de John y le conceda una indemnización de $750 000, o 3) que el tribunal concluya que el caso de John es un caso severo y le conceda $1 500 000. Consideraciones clave en el desarrollo de la estrategia de Allied, son las probabilidades correspondientes a las posibles respuestas de John a la contraoferta de Allied por los $400 000, así como las probabilidades de los tres posibles resultados en los tribunales. Los abogados de Allied consideran que la probabilidad de que John acepte la contraoferta por $400 000 de Allied es 0.10, la probabilidad de que John rechace la contraoferta de $400 000 es 0.40 y la probabilidad de que John haga una contraoferta a Allied por $600 000 es 0.50. Si el caso llega a los tribunales, los abogados consideran que la probabilidad de que el tribunal conceda a John una indemnización por $1 500 000 es 0.30, la probabilidad de que el tribunal conceda a John una indemnización por $750 000 es 0.50 y la probabilidad de que el tribunal no conceda a John ninguna indemnización es 0.20.
Informe administrativo Realice un análisis del problema en que se encuentra Allied Insurance y elabore un informe en el que resuma sus hallazgos y recomendaciones. No deje de incluir en este informe lo siguiente: 1. Un árbol de decisión. 2. Una recomendación sobre si Allied debe aceptar la oferta inicial de John de resolver la demanda con $750 000. 3. La estrategia de decisión que deba seguir Allied si decide hacer una contraoferta a John por $400 000. 4. Un perfil de riesgos para la estrategia que recomienda.
Apéndice 21.1
Solución del problema PDC con TreePlan TreePlan* es un complemento de Excel que se puede usar para elaborar árboles de decisión para problemas de análisis de decisión. El paquete de software se encuentra en el sitio de la Red de ASW, http://asw.swlwarning.com. También se encuentra un manual sobre cómo poner en marcha y usar TreePlan. En el ejemplo siguiente se muestra cómo usar TreePlan para construir un árbol de decisión para el problema de PDC, presentado en la sección 21.1. En la figura 21.11 se presenta el árbol de decisión para el problema de PDC.
Para empezar: un primer árbol de decisión Para empezar se supondrá que ya se ha instalado TreePlan y que ya se ha abierto un libro de Excel. Para obtener una versión en TreePlan del árbol de decisión para PDC se procede como sigue: Paso 1. Seleccionar la celda A1 Paso 2. Seleccionar el menú Herramientas y elegir Decision Tree Paso 3. Cuando aparezca el cuadro de diálogo TreePlan New: Clic en NewTree
*TreePlan fue elaborado por el profesor Michael R. Middleton de la Universidad de San Francisco y modificado por el profesor James E. Smith de la Duke University. El sitio en la red de TreePlan es www.treeplan.com.
21Ander(879-914).qxd 2/28/08 7:23 PM Page 910
910
Capítulo 21
FIGURA 21.11
Análisis de decisión
ÁRBOL DE DECISIÓN PARA PDC Alta (s1) Pequeño (d1)
8
P(s1) = 0.8
2
Baja (s2)
7
P(s2) = 0 .2 Alta (s1) Mediano (d2 )
1
14
P(s1) = 0.8
3
Baja (s2)
5
P(s2) = 0.2 Alta (s1) Grande (d3)
20
P(s1) = 0.8
4
Baja (s2)
–9
P(s2) = 0.2
Aparecerá un árbol de decisión con un nodo de decisión y dos ramas:
A 1 2 3 4 5 6 7 8 9
B
C
D
E
F
G
Decision 1 0 0
0
1 0 Decision 2 0 0
0
Agregar una rama En el problema de PDC hay tres alternativas de decisión (un complejo pequeño, mediano o grande), de manera que es necesario agregarle al árbol una rama de decisión. Paso 1. Seleccionar la celda B5 Paso 2. Seleccionar el menú Herramientas y elegir Decision Tree Paso 3. Cuando aparezca el cuadro de diálogo TreePlan: Seleccionar Add branch Clic en OK En la hoja de cálculo de Excel aparecerá un árbol modificado con tres ramas de decisión.
Dar nombre a las alternativas de decisión A las alternativas de decisión se les puede dar un nombre al seleccionar las celdas que contienen los rótulos Decision 1, Decision 2 y Decision 3 e ingresando después los nombres correspondientes que se tienen en el problema de PDC, Grande (Large), Mediano (Medium) y Pequeño (Small). Una vez que se ha dado nombre a las alternativas, el árbol de decisión de PDC con tres ramas se verá como sigue:
21Ander(879-914).qxd 2/28/08 7:23 PM Page 911
Apéndice 21.1
911
Solución del problema PDC con TreePlan
A 1 2 3 4 5 6 7 8 9 10 11 12 13 14
B
C
D
E
F
G
Small 0 0
0
0
0
0
0
Medium 1
0
0
Large 0
Agregar un nodo aleatorio En el problema de PDC un evento aleatorio es la demanda de los condominios, la cual puede ser alta o baja. De manera que es necesario agregar un nodo aleatorio con dos ramas al final de cada rama de una alternativa de decisión. Paso 1. Seleccionar la celda F3 Paso 2. Seleccionar el menú Herramientas y elegir Decision Tree Paso 3. Cuando aparezca el cuadro de diálogo TreePlan New: Seleccionar Change to event node Seleccionar Two en la sección Branches Clic en OK Ahora aparecerá el árbol siguiente:
A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
B
C
D
E
F
G
H
I
J
K
0.5 Event 4 0 Small
0 0
0
0
0.5 Event 5 0 0
0
1 0
Medium 0 0
0
0
0
Large 0
21Ander(879-914).qxd 2/28/08 7:23 PM Page 912
912
Capítulo 21
Análisis de decisión
A continuación se seleccionan las celdas que contienen Event 4 y Event 5 y se les cambia el nombre a Alta (Strong) y Baja (Weak), para tener los nombres correspondientes a los estados del problema de PDC. Una vez hecho, se copia el árbol del nodo aleatorio en la celda F5 a las otras dos ramas de decisión para terminar la estructura del árbol de decisión para PDC. Paso 1. Seleccionar la celda F5 Paso 2. Seleccionar el menú Herramientas y elegir Decision Tree Paso 3. Cuando aparezca el cuadro de diálogo TreePlan: Seleccionar Copy subtree Clic en OK Paso 4. Seleccionar la celda Fl5 Paso 5. Seleccionar el menú Herramientas y elegir Decision Tree Paso 6. Cuando aparezca el cuadro de diálogo TreePlan: Seleccionar Paste subtree Clic en OK Mediante este procedimiento de copiar/pegar (copy/paste) se coloca un nodo aleatorio al final de la rama de decisión Mediano (Medium). Repitiendo este procedimiento de copiar/pegar (copy/ paste) con la rama de decisión Alta (Large) se obtiene la estructura completa del árbol de decisión que aparece en la figura 21.12. FIGURA 21.12
ÁRBOL DE DECISIÓN DE PDC OBTENIDO MEDIANTE TREEPLAN
A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
B
C
D
E
F
G
H
I
J
K
0.5 Strong 0 Small
0 0
0
0
0.5 Weak 0 0
0
0.5 Strong 0 Medium
0
0
1 0
0
0
0.5 Weak 0 0
0
0.5 Strong 0 Large
0 0
0
0
0.5 Weak 0 0
0
21Ander(879-914).qxd 2/28/08 7:23 PM Page 913
Apéndice 21.1
913
Solución del problema PDC con TreePlan
Inserción de probabilidades y recompensas Con TreePlan puede insertar probabilidades y recompensas en el árbol de decisión. En la figura 21.12 se observa que TreePlan asigna, de manera automática, la probabilidad 0.5 a todos los estados. En el problema de PDC, la probabilidad de que la demanda sea alta es 0.8 y la probabilidad de que la demanda sea baja es 0.2. Si selecciona las celdas H1, H6, H11, H16, H21 y H26 se pueden insertar las probabilidades adecuadas. Las recompensas de los resultados aleatorios se han insertado en las celdas H4, H9, H14, H19, H24 y H29. Una vez insertadas las probabilidades y las recompensas, el árbol de decisión de PDC se verá como se muestra en la figura 21.13. Observe que las recompensas aparecen también en el margen derecho del árbol de decisión. Las recompensas en el margen derecho se calculan mediante una fórmula que agrega las recompensas a todas las ramas que llevan al nodo terminal correspondiente. En el problema de PDC no hay recompensas para las ramas de las decisiones alternativas, por lo que en las celdas D6, D16 y D26 se ha dejado el valor cero que es el que aparece por defecto. Con esto queda terminado el árbol de decisión para PDC.
FIGURA 21.13
archivo CD en PDCTree
A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
ÁRBOL DE DECISIÓN DE PDC CON RAMAS DE PROBABILIDAD Y RECOMPENSAS
B
C
D
E
F
G
H
I
J
K
0.8 Strong 8 Small
8 0
7.8
8
0.2 Weak 7 7
7
0.8 Strong 14 Medium
14
14
3 14.2
0
12.2
0.2 Weak 5 5
5
0.8 Strong 20 Large
20 0
14.2
20
0.2 Weak -9 -9
-9
21Ander(879-914).qxd 2/28/08 7:23 PM Page 914
914
Capítulo 21
Análisis de decisión
Interpretación de los resultados Si se insertan las probabilidades y las recompensas, TreePlan realiza automáticamente, en forma regresiva, los cálculos necesarios para obtener los valores esperados y determinar la solución óptima. Las decisiones óptimas se identifican mediante su número en el nodo de decisión correspondiente. En la figura 21.13, en el árbol de decisión de PDC el nodo de decisión se encuentra en la celda B15. Observe que en ese nodo aparece un 3, lo que indica que la rama 3 de las alternativas de decisión proporciona la decisión óptima. Es decir, el análisis de decisión recomienda que PDC construya el complejo grande. El valor esperado de esta decisión aparece al principio del árbol en la celda A16. Como se ve, el valor óptimo esperado es $14.2 millones. El valor esperado de las otras alternativas aparece al final de las correspondientes ramas de decisión. En las celdas E6 y E16 se ve que el valor esperado para el complejo pequeño es $7.8 millones y el valor esperado para el complejo mediano es $12.2 millones.
Otras opciones Por defecto, el objetivo de TreePlan es una maximización. Cuando el objetivo es una minimización se siguen los pasos que se presentan a continuación: Paso 1. Seleccionar el menú Herramientas y elegir Decision Tree Paso 2. Seleccionar Options Paso 3. Elegir Minimize (costs) Clic en OK Con TreePlan se pueden modificar las probabilidades y las recompensas y ver rápidamente el impacto de estos cambios sobre la solución óptima. Con el tipo “y si” de análisis de sensibilidad se pueden identificar modificaciones de las probabilidades y de las recompensas que modifiquen la decisión óptima. Además, como TreePlan es un complemento de Excel, la mayor parte de las posibilidades de Excel pueden emplearse. Por ejemplo, se pueden usar negritas para resaltar el nombre de la alternativa óptima de decisión. En el manual de TreePlan se encuentran otras muchas opciones con las que cuenta TreePlan. Paquetes de software como TreePlan facilitan el análisis meticuloso de los problemas de decisión.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 915
CAPÍTULO Encuestas muestrales CONTENIDO LA ESTADÍSTICA EN LA PRÁCTICA: DUKE ENERGY 22.1 TERMINOLOGÍA EMPLEADA EN LAS ENCUESTAS MUESTRALES 22.2 TIPOS DE ENCUESTAS Y MÉTODOS DE MUESTREO 22.3 ERRORES EN UNA ENCUESTA Errores no muestrales Error muestral 22.4 MUESTREO ALEATORIO SIMPLE Media poblacional Total poblacional Proporción poblacional Determinación del tamaño de la muestra
22.5 MUESTREO ALEATORIO SIMPLE ESTRATIFICADO Media poblacional Total poblacional Proporción poblacional Determinación del tamaño de la muestra 22.6 MUESTREO POR CONGLOMERADOS Media poblacional Total poblacional Proporción poblacional Determinación del tamaño de la muestra 22.7
MUESTREO SISTEMÁTICO
22
22Ander(915-950).qxd 2/29/08 10:58 AM Page 916
916
Capítulo 22
LA ESTADÍSTICA
Encuestas muestrales
en LA PRÁCTICA
DUKE ENERGY* CHARLOTTE, CAROLINA DEL NORTE
Duke Energy es una empresa diversificada de energía con un portafolio de negocios en gas natural y electricidad y una empresa inmobiliaria afiliada. En el 2006, Duke Energy se fusionó con Cinergy de Cincinnati, Ohio, y formaron una de las empresas de energía más grandes de Estados Unidos, con un activo que asciende a más de $70 mil millones. En la actualidad, Duke Energy da servicio a más de 5.5 millones de usuarios de gas y electricidad en Carolina del Norte, Carolina del Sur, Ohio, Kentucky, Indiana y Ontario, Canadá. Para dar un mejor servicio, Duke Energy constantemente está atenta a las necesidades emergentes de sus clientes. En el ejemplo siguiente se verá cómo esta empresa realizó una encuesta acerca de las características de los edificios para conocer mejor los requerimientos de energía de los edificios comerciales en el área de servicio de Cincinnati, Ohio. La empresa buscó información diversa acerca de los edificios comerciales como arquitectura, cantidad de empleados, uso final dado a la energía, antigüedad del edificio, tipo de materiales de construcción y medidas para la conservación de la energía. Durante los preparativos de la encuesta, los analistas determinaron que en el área de servicio de Cincinnati había aproximadamente 27 000 edificios comerciales en función. De acuerdo con los recursos disponibles y con la precisión deseada para la encuesta, se recomendó tomar una muestra de 616 edificios comerciales. El tipo de muestreo que se eligió fue un muestreo aleatorio simple estratificado. La empresa contaba con registros sobre el consumo de energía total en los años recientes de cada uno de los edificios en el área de servicio de Cincinnati y, dado que muchas de las características que interesaban de los edificios (tamaño, cantidad de empleados, etc.) estaban relacionadas con el consumo, ése fue el criterio empleado para dividir la población de edificios en seis estratos. El primer estrato estaba constituido por los edificios que eran los 100 principales consumidores de energía; todos los * Los autores agradecen a Jim Ruddle de Duke Energy por proporcionar este artículo para La Estadística en la práctica.
22.1
En Cincinnati, Ohio, se llevó a cabo una encuesta muestral sobre las necesidades de electricidad en los edificios comerciales. © Getty Images/PhotoDisc.
edificios de este estrato fueron incluidos en la muestra. Aunque estos edificios constituían únicamente el 0.2% de la población, consumían el 14.4% de toda la energía eléctrica. De los otros estrados, el número de edificios muestreados se determinó en función de la obtención de la mayor precisión posible por costo unitario. La empresa elaboró un cuestionario que se probó antes de realizar la encuesta. Los datos se obtuvieron a través de entrevistas personales. De los 616 edificios comerciales de la muestra se obtuvieron 526 cuestionarios completamente contestados. Esta tasa de respuesta de 85.4% fue excelente. La empresa usó los resultados de la encuesta para pronosticar la demanda de energía y para mejorar el servicio prestado a sus clientes comerciales. En este capítulo, el lector conocerá los tópicos que consideran los estadísticos para el diseño y realización de una encuesta muestral como la realizada por Duke Energy. Las encuestas muestrales suelen emplearse para obtener perfiles de los clientes de una empresa; también son empleados por los gobiernos y por otras instituciones para conocer diversos segmentos de la población.
Terminología empleada en las encuestas muestrales En el capítulo 1 se dieron las siguientes definiciones de elemento, población y muestra.
• Elemento es la entidad de la que se toman los datos. • Población es la colección de todos los elementos que interesan. • Muestra es un subconjunto de la población.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 917
22.2
Las inferencias obtenidas a partir de una muestra son válidas, si la población muestreada es representativa de la población objetivo.
22.2
Tipos de encuestas y métodos de muestreo
917
Para ilustrar estos conceptos considere la situación siguiente. Dunning Microsystems, Inc. (DMI), fabricante de computadoras personales y periféricos, desea obtener datos acerca de las características de las personas que le han comprado sus computadoras personales. Para esto, debe realizar una encuesta muestral a los poseedores de una computadora personal DMI. En esta encuesta muestral los elementos son cada uno de los individuos que hayan comprado una computadora personal DMI. La población es el conjunto de todas las personas que hayan comprado una computadora personal DMI y la muestra será el subconjunto de poseedores de una computadora personal que se tome para la encuesta. En las encuestas muestrales es necesario distinguir entre la población objetivo y la población muestreada. La población objetivo es la población acerca de la cual se desean hacer inferencias, mientras que la población muestreada es la población de la que, realmente, se toma la muestra. Es importante entender que estas dos poblaciones no siempre son una misma. En el ejemplo de DMI, la población objetivo consta de todas las personas que han comprado una computadora personal DMI. La población muestreada, en cambio, puede que sea, por ejemplo, todos los poseedores de una computadora personal DMI que hayan enviado a DMI la tarjeta de registro para la garantía. No todos los que compran una computadora personal DMI envían la tarjeta de registro para la garantía, de manera que la población muestreada es diferente de la población objetivo. Las conclusiones que se obtienen de una encuesta muestral sólo son válidas para la población muestral. El que estas conclusiones puedan o no ampliarse a la población objetivo depende del criterio del analista. El punto clave es si entre la población muestreada y la población objetivo existe una semejanza suficiente respecto a la característica de interés como para permitir ampliar las conclusiones. Antes del muestreo, se divide la población en unidades muestrales. En algunos casos las unidades muestrales son simplemente los elementos. En otros casos, las unidades muestrales son grupos de elementos. Por ejemplo, suponga que se desea hacer una encuesta a los ingenieros que trabajan en el diseño de sistemas de calefacción y de aire acondicionado para edificios comerciales. Si se tuviera una lista de todos estos ingenieros, las unidades muestrales serían los ingenieros que se desea investigar. Si no se cuenta con tal lista, es necesario hallar otra alternativa. Una alternativa puede ser la lista de las empresas de ingeniería que se dedican al diseño de sistemas de calefacción y aire acondicionado que se encuentran en un directorio telefónico comercial. Dada tal lista se toma una muestra de estas empresas para la encuesta; en cada empresa tomada para la encuesta se entrevista a todos los ingenieros. En este caso las unidades muestrales serán las empresas de ingeniería y los elementos serán los ingenieros entrevistados. A la lista de las unidades muestrales tomadas para un estudio particular se le conoce como el marco. En la encuesta a los ingenieros el marco está definido por todas las empresas de ingeniería enumeradas en el directorio telefónico; el marco no es una lista de todos los ingenieros porque no se cuenta con tal lista. El marco que se elija y, por tanto, la definición de las unidades muestrales, suele estar determinado por la lista de que se disponga y la confiabilidad de la misma. En la práctica la elección del marco suele ser uno de los pasos más difíciles e importantes al realizar una encuesta muestral.
Tipos de encuestas y métodos de muestreo Los tres tipos de encuestas muestrales más comunes son las encuestas por correo, las encuestas por teléfono y las encuestas a través de entrevistas personales. Hay otros tipos de investigaciones que se emplean para recabar datos en los que no se emplean cuestionarios. Por ejemplo, para muestrear el inventario de bienes de una empresa con objeto de estimar el valor de inventario en el balance general de la empresa suele contratarse a una empresa de contadores. En estas investigaciones, una persona simplemente cuenta los artículos y anota los resultados. En las encuestas en que se usan cuestionarios, el diseño del cuestionario es relevante. Al hacer el diseño de un cuestionario hay que resistirse a incluir preguntas que pueden ser de interés, ya que cada pregunta agregada al cuestionario lo hace más largo. Los cuestionarios largos no sólo conducen al cansancio del entrevistado, sino también al del entrevistador, en especial cuando se trata de encuestas por correo o por teléfono. Cuando se emplean entrevistas personales, es po-
22Ander(915-950).qxd 2/29/08 10:58 AM Page 918
918
Capítulo 22
Los costos de las encuestas por correo o por teléfono son más bajos, pero las entrevistas personales, cuando se cuenta con entrevistadores bien capacitados, suelen dar tasas de respuesta más altas y permitir cuestionarios más largos. En el caso del estudio presentado en el artículo de La estadística en la práctica de este capítulo, dada la cantidad de datos que se deseaba recabar de cada elemento, la única posibilidad de hacerlo era mediante entrevistas personales.
sible hacer cuestionarios más largos y más complejos. Ya existe una gran cantidad de conocimientos sobre la redacción y secuencia de las preguntas para un cuestionario, así como sobre la manera de agruparlas. Estos temas corresponden a libros especializados sobre encuestas muestrales; en la bibliografía se citan varias fuentes en las que se encontrará este tipo de información. Las encuestas muestrales también se clasifican de acuerdo con el método de muestreo que se utilice. Los muestreos probabilísticos permiten calcular la probabilidad de obtener cada una de las posibles muestras; en los muestreos no probabilísticos esto no es posible. Los métodos no probabilísticos de muestreo no deben usarse cuando el investigador desea determinar la precisión de las estimaciones. En cambio, los métodos probabilísticos de muestreo se emplean para obtener intervalos de confianza con los que se pueden obtener límites para el error muestral. En las secciones siguientes se estudiarán cuatro de los métodos de muestreo probabilístico más usados: el muestreo aleatorio simple, el muestreo aleatorio simple estratificado, el muestreo por conglomerados y el muestreo sistemático. Aunque los especialistas en estadística prefieren usar los métodos probabilísticos de muestreo, los métodos no probabilísticos de muestreo también suelen ser necesarios. Las ventajas de los métodos de muestreo no probabilísticos son su bajo costo y su fácil realización. La desventaja es que no se puede decir de una manera estadística válida cuál es la precisión de la estimación. Dos de los métodos probabilísticos más usados son el muestreo de conveniencia y el muestreo subjetivo. En el muestreo de conveniencia las unidades que se toman en la muestra, se toman por su accesibilidad. Por ejemplo, cuando un profesor de una universidad que realiza una investigación suele solicitar alumnos voluntarios que participen en el estudio, estos alumnos participan en la muestra sólo porque son alumnos del profesor. En este caso a la muestra de estudiantes se le conoce como muestra de conveniencia. En algunos casos el muestreo de conveniencia es la única posibilidad práctica. Por ejemplo, para muestrear un cargamento de naranjas, el investigador tomará de manera aleatoria naranjas de varias cajas ya que no sería práctico etiquetar todas las naranjas del cargamento para obtener un marco y emplear un método de muestreo probabilístico. Otros ejemplos de muestreos de conveniencia son los estudios sobre la flora y fauna salvajes y los paneles de voluntarios en las investigaciones de mercado. Aun cuando el muestreo de conveniencia es una manera relativamente sencilla de seleccionar una muestra y obtener los datos deseados, es imposible estimar la “bondad” de los estadísticos muestrales obtenidos como estimaciones de los parámetros poblacionales que interesan. Un muestreo de conveniencia puede o no dar buenos resultados; no hay ningún procedimiento estadísticamente justificado que permita hacer inferencias muestrales a partir de los resultados muestrales. A pesar de esto, algunas veces, los investigadores aplican métodos probabilísticos, diseñados para muestras probabilísticas, a datos obtenidos mediante un muestreo de conveniencia. En tales casos, el investigador suele argumentar que la muestra de conveniencia puede ser considerada como una muestra aleatoria en el sentido de que es representativa de la población. Pero, hay que cuestionar este argumento; se debe ser muy cuidadoso al emplear muestras de conveniencia para hacer inferencias estadísticas acerca de los parámetros poblacionales. En la técnica de muestreo conocida como muestreo subjetivo, una persona, con conocimientos en la materia de estudio, selecciona las unidades muestrales que considera más representativas de la población. El muestreo subjetivo suele ser una manera relativamente sencilla para tomar una muestra, sin embargo, los usuarios de los resultados de tales encuestas deben aceptar que la calidad de los resultados es dependiente del criterio de la persona que selecciona la muestra. Por tanto, se debe tener mucho cuidado al usar muestras subjetivas para hacer inferencias estadísticas acerca de los parámetros poblacionales. En general, conviene no hacer aseveraciones estadísticas acerca de la precisión de los resultados obtenidos de una muestra subjetiva. Para tomar una muestra se pueden usar tanto métodos probabilísticos como no probabilísticos. La ventaja de los métodos no probabilísticos es que, por lo general, no son caros y son fáciles de usar. Pero cuando se necesita indicar la precisión de las estimaciones, será necesario emplear métodos probabilísticos de muestreo. En casi todas las encuestas muestrales grandes se emplean métodos probabilísticos.
En el caso de los métodos de muestreo no probabilístico, cuando se pueden emplear métodos que garanticen que se ha obtenido una muestra representativa, las estimaciones puntuales basadas en la muestra pueden ser útiles. Sin embargo, incluso en estos casos no se puede conocer la precisión de los resultados.
Encuestas muestrales
22Ander(915-950).qxd 2/29/08 10:58 AM Page 919
22.3
22.3
Errores en una encuesta
919
Errores en una encuesta Al realizar una encuesta se pueden presentar dos tipos de errores. Uno, el error muestral, que es la magnitud de la diferencia entre el estimador puntual insesgado obtenido de la muestra y el parámetro poblacional. En otras palabras, el error muestral es el error que se presenta debido a que no se investigan todos los elementos de la población. El segundo error es el error no muestral, que se refiere a todos los demás tipos de errores que se presentan cuando se realiza una encuesta, como errores de medición, errores del entrevistador y errores de procesamiento. Los errores muestrales sólo pueden presentarse en una encuesta muestral; los errores no muestrales ocurren tanto en un censo como en una encuesta muestral.
Errores no muestrales
Los errores no muestrales se minimizan mediante una capacitación adecuada de los entrevistadores, un buen diseño de los cuestionarios, que deben ser probados antes de ser empleados en la encuesta, y cuidado en el proceso de codificación y transferencia de los datos a la computadora.
En el censo llevado a cabo en Estados Unidos en 1990, 25.9% de los hogares no respondieron. En el censo de 2000 se hizo un estudio muestral de los que no respondían al censo con objeto de estimar las características de esta porción de la población.
Uno de los errores no muestrales más comunes se presenta cuando una característica de interés es medida de forma incorrecta. Los errores de medición ocurren tanto en un censo como en una encuesta muestral. En cualquier tipo de encuesta es necesario tener cuidado de que todos los instrumentos de medición (por ejemplo, los cuestionarios) estén adecuadamente calibrados y de que las personas que hagan las mediciones estén debidamente capacitadas. Poner atención a los detalles es la mejor precaución en la mayor parte de las situaciones. Los errores debidos a la falta de respuestas preocupan tanto al especialista en estadística, que es el responsable del diseño de la encuesta, como al ejecutivo que usará los resultados de la misma. Este tipo de error no muestral se presenta siempre que no es posible obtener, de algunas de las unidades de la encuesta, los datos deseados, o cuando únicamente se obtienen datos parciales. Un problema más serio es cuando se crea un sesgo. Por ejemplo, si se realizan entrevistas para evaluar la opinión de las mujeres respecto de que las mujeres trabajen fuera de casa y se llama a los hogares únicamente durante el día, se creará un sesgo obvio, debido a que las mujeres que trabajan fuera de casa quedarán excluidas de la muestra. En encuestas técnicas son comunes los errores no muestrales que se deben a falta de conocimientos de los entrevistados. Por ejemplo, suponga que se hace una encuesta entre los administradores de edificios para obtener información detallada acerca del tipo de sistemas de ventilación que se usan en los edificios de oficinas. Los administradores de edificios grandes de oficinas tendrán buenos conocimientos acerca de tales sistemas, ya que es probable que hayan asistido a seminarios y obtengan apoyos para mantenerse informados y al día. En cambio, es posible que los administradores de edificios pequeños tengan menos conocimientos acerca de tales sistemas, debido a la gran variedad de tareas que deben realizar. Esta diferencia en los conocimientos afecta significativamente los resultados de la encuesta. Otros dos tipos de errores no muestrales son el error de selección y el error de procesamiento. El error de selección se presenta cuando en la muestra se incluye algún elemento que no sea adecuado. Suponga que se diseña una encuesta muestral para obtener el perfil de un hombre con barba; si algunos entrevistadores entienden que entre los “hombres con barba” están comprendidos los hombres con bigote, mientras que otros entienden que no lo están, los datos resultantes serán deficientes. Los errores de procesamiento se presentan cuando los datos son anotados con incorrecciones o cuando son transferidos de manera incorrecta, por ejemplo, de los cuestionarios a la computadora. Aun cuando algunos de los errores no muestrales se presentan en la mayor parte de las encuestas, es posible minimizarlos mediante una planeación cuidadosa. Debe tener cuidado de que haya una estrecha correspondencia entre la población muestreada y la población objetivo; que se sigan los buenos principios para la formulación de cuestionarios; que los entrevistadores estén bien capacitados, etc. En el informe final de una encuesta es recomendable incluir un análisis sobre el impacto que pueden tener los errores no muestrales sobre los resultados.
Error muestral Recuerde la encuesta muestral de Dunning Microsystems (DMI). Suponga que DMI desea estimar la edad promedio de las personas que compran una computadora personal. Si se pudiera investigar a toda la población de personas que poseen una computadora DMI (hacer un censo) y
22Ander(915-950).qxd 2/29/08 10:58 AM Page 920
920
Capítulo 22
El error muestral se minimiza al elegir un diseño adecuado para la muestra.
22.4
Encuestas muestrales
no se cometiera ningún error no muestral, se podría determinar esta edad promedio con toda exactitud. Pero, ¿qué pasa si no se puede investigar el 100% de todos los propietarios de una computadora DMI? En este caso, es posible que exista alguna diferencia entre la media muestral y la media poblacional; al valor absoluto de esta diferencia se le conoce como error muestral. En la práctica no es posible determinar cuál es el error muestral en una muestra determinada, ya que no es posible conocer la media poblacional, sin embargo, sí es posible dar una estimación probabilística acerca del tamaño del error muestral. Como ya se dijo, el error muestral se debe a que la encuesta se hace a partir de una muestra y no de toda la población. Aun cuando el error muestral no puede evitarse, sí es controlable. Una manera de controlar este tipo de error es elegir un método o diseño apropiado de muestreo. En las secciones siguientes se verán cuatro métodos de muestreo probabilístico: aleatorio simple, aleatorio estratificado, por conglomerados y sistemático.
Muestreo aleatorio simple La definición de muestreo aleatorio simple se presentó en el capítulo 7: Una muestra aleatoria simple de tamaño n tomada de una población finita de tamaño N es una muestra que se elige de tal manera que todas las muestras posibles de tamaño n tengan la misma probabilidad de ser elegidas.
Para realizar una encuesta muestral usando el muestreo aleatorio simple, se empieza por elaborar un marco o lista de todos los elementos de la población muestral. A continuación se emplea un procedimiento de selección que se basa en el uso de números aleatorios, para garantizar que todos los elementos de la población muestral tengan la misma probabilidad de ser elegidos para la muestra. En esta sección se verá cómo se obtienen estimaciones de la media, del total y de la proporción poblacionales cuando en una encuesta muestral se usa el muestreo aleatorio simple.
Media poblacional En el capítulo 8 se vio que la media muestral x̄ es una estimación de la media poblacional μ y que la desviación estándar muestral s es una estimación de la desviación estándar poblacional σ. Un intervalo de estimación para μ, dada una muestra de tamaño n y empleando la distribución t, es el siguiente. s x̄ tα/2 (22.1) 兹n En la expresión (22.1), s兾兹n es la estimación de σx̄ , el error estándar de la media. Cuando la muestra aleatoria simple de tamaño n se toma de una población finita de tamaño N, la estimación del error estándar de la media se obtiene mediante la fórmula siguiente
冑
N n s (22.2) N 兹n Al usar sx̄ como estimación de σx̄ el intervalo de estimación para la media poblacional se convierte en x̄ tα/2sx̄ (22.3) sx̄
冢 冣
En las encuestas muestrales se acostumbra emplear el valor t = 2 para obtener una estimación por intervalo. Por tanto, cuando se emplea el muestreo aleatorio simple, el intervalo de confianza de aproximadamente 95% para estimar la media poblacional es el dado por la expresión siguiente. INTERVALO DE CONFIANZA DE APROXIMADAMENTE 95% PARA ESTIMAR LA MEDIA POBLACIONAL
x̄ 2 sx̄
(22.4)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 921
22.4
921
Muestreo aleatorio simple
Considere, por ejemplo, el caso de la editorial de la revista Great Lakes Recreation, una revista regional especializada en navegación y pesca. En la actualidad, la revista cuenta con 8 000 suscriptores. En una muestra aleatoria simple de n 484 suscriptores el ingreso anual medio encontrado fue $30 500 y la desviación estándar $7 040. Una estimación insesgada del ingreso anual medio de todos los suscriptores es x̄ $30 500. Con estos resultados muestrales y la ecuación (22.2) se obtiene la estimación siguiente para el error estándar de la media. sx̄
冑
8000 484 7040 8000
冢兹484冣 310
Por tanto, de acuerdo con la fórmula (22.4), un intervalo de confianza de aproximadamente 95% para el ingreso anual medio de los suscriptores, es 30 500 2(310) 30 500 620 es decir, $29 880 a $31 120. El número que se le suma y se le resta a la estimación puntual para obtener el intervalo de estimación, se conoce como cota del error muestral. Por ejemplo, en la encuesta muestral de Great Lakes Recreation, una estimación del error estándar del estimador puntual es sx̄ $310, y la cota del error muestral es 2($310) $620. El procedimiento anterior también sirve para calcular intervalos de estimación para otros parámetros poblacionales, como, por ejemplo, para el total poblacional y para la proporción poblacional. En estos casos, un intervalo de confianza de aproximadamente 95% puede expresarse de la manera siguiente Estimador puntual ± 2(Estimación del error estándar del estimador puntual)
Total poblacional Considere el problema que se le plantea a la empresa Northeast Electric and Gas (NEG). Como parte de un estudio sobre el consumo de energía, NEG necesita estimar el área total, en pies cuadrados, de las 500 escuelas públicas en su área de servicio. Esta área total de las 500 escuelas públicas se denotará como X; en otras palabras, X denota la población total. Observe que si se conociera μ, el promedio en pies cuadrados de las 500 escuelas públicas, al multiplicar N por μ se obtendría el valor de X. Pero, como no se conoce μ, una estimación puntual de X es la que se obtiene al multiplicar N por x̄. El estimador puntual de X se denota X̂.
ESTIMADOR PUNTUAL DEL TOTAL POBLACIONAL
X̂ Nx̄
(22.5)
La estimación del error estándar de este estimador puntual está dada por sX̂ Nsx̄
(22.6)
donde sx̄
冑
N n s N 兹n
冢 冣
(22.7)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 922
922
Capítulo 22
Encuestas muestrales
Observe que la ecuación (22.7) es la fórmula obtenida para la estimación de error estándar de la media. Para obtener un intervalo de confianza de aproximadamente 95% para estimar el total poblacional se emplea este error estándar y la ecuación (22.6).
INTERVALO DE CONFIANZA DE APROXIMADAMENTE 95% PARA ESTIMAR EL TOTAL POBLACIONAL
Nx̄ 2 sX̂
(22.8)
Suponga que en el estudio de NEG se toma una muestra aleatoria de n 50 escuelas públicas de la población de N 500 escuelas; la media muestral es x̄ 22 000 pies cuadrados y la desviación estándar muestral es s 4 000 pies cuadrados. Mediante la ecuación (22.5) se obtiene X̂ (500)(22 000) 11 000 000 Para obtener una estimación del error estándar de la media se emplea la ecuación (22.7). sx̄
冑
500 50 4 000 500
冢 兹50 冣 536.66
Después, con la ecuación (22.6), se obtiene una estimación del error estándar de X̂. sX̂ (500)(536.66) 268 330 Por tanto, con la expresión (22.8), se encuentra que un intervalo de confianza de aproximadamente 95% para el total de pies cuadrados de las 500 escuelas públicas en el área de servicio de NEG es 11 000 000 2(268 330) 11 000 000 536 660 es decir, 10 463 340 a 11 536 660 pies cuadrados.
Proporción poblacional Una proporción poblacional p es la fracción de elementos de la población que posee alguna característica de interés. Por ejemplo, en un estudio de investigación de mercado el interés puede ser la proporción de consumidores que prefieren determinada marca de un producto. La proporción muestral p̄ es un estimador puntual insesgado de la proporción poblacional. Un estimador del error estándar de la proporción es el dado por sp̄
冑冢
N n N
冣冢
p̄(1 p̄) n 1
冣
(22.9)
Un intervalo de confianza de aproximadamente 95% para estimar la proporción muestral es el dado por la expresión siguiente.
INTERVALO DE CONFIANZA DE APROXIMADAMENTE 95% PARA ESTIMAR LA PROPORCIÓN POBLACIONAL
p̄ 2 sp̄
(22.10)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 923
22.4
923
Muestreo aleatorio simple
Como ejemplo, suponga que en el problema de muestreo de Northeast Electric and Gas, también quiere estimar la proporción de las 500 escuelas públicas, en su área de servicio, que emplean gas natural para la calefacción. Si 35 de las 50 escuelas muestreadas indican que usan gas natural, la estimación puntual de la proporción poblacional, en las 500 escuelas de la población que usan gas natural, es p̄ 35/50 0.70. Mediante la ecuación (22.9), se calcula la estimación del error estándar de la proporción. sp̄
冑冢
500 50 500
冣冢
冣
0.7(1 0.7) 0.0621 50 1
Por tanto, con la expresión (22.10) se encuentra que un intervalo de confianza de aproximadamente 95% para la proporción poblacional es 0.7 2(0.0621) 0.7 0.1242 es decir, 0.5758 a 0.8242. Como se ve en este ejemplo, en una estimación de la proporción poblacional la amplitud del intervalo de confianza puede ser bastante grande. En general, para obtener estimaciones precisas de las proporciones poblacionales se necesitan tamaños de muestra grandes. Louis Harris & Associates en un informe de una encuesta muestral de 529 inversionistas de fondos mutualistas, dice: “Los resultados deben tener una exactitud de 4.3 puntos porcentuales.” Esto significa que el intervalo de confianza de aproximadamente 95% tiene una amplitud de 0.086. En poblaciones grandes, muestras de n 200, o más, son frecuentes.
Determinación del tamaño de la muestra Una consideración importante en el diseño de la muestra es la elección de su tamaño. Lo mejor suele ser un compromiso entre costo y precisión. Las muestras mayores permiten una mejor precisión (cotas más estrechas del error muestral) pero son más costosas. Con frecuencia, lo que dicta el tamaño de la muestra es el presupuesto con que se cuenta para el proyecto. En otras ocasiones, el tamaño de la muestra debe ser lo suficientemente grande para que permita obtener un determinado nivel de precisión. El método que suele emplearse para determinar el tamaño de la muestra es, primero, especificar la precisión deseada y después determinar el menor tamaño de muestra con el que se obtiene esa precisión. En el presente contexto, el término precisión se refiere al tamaño del intervalo de confianza aproximado; intervalos de confianza más pequeños proporcionan mayor precisión. Como el tamaño del intervalo de confianza aproximado depende de la cota B del error muestral, elegir un nivel de precisión equivale a elegir un valor para B. A continuación se muestra este método para la elección del tamaño de muestra necesario para estimar la media poblacional. La ecuación (22.2) indica que la estimación del error estándar de la media es sx̄
冑
N n s N 兹n
冢 冣
Recuerde que la cota del error muestral es “2 multiplicado por la estimación del error estándar del estimador puntual”. Por tanto,
冑
B 2
N n s N 兹n
冢 冣
(22.11)
Al despejar n en la ecuación (22.11), se obtiene una cota del error muestral igual a B. De esta manera n
Ns 2 B2 N s2 4
冢 冣
(22.12)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 924
924
Capítulo 22
Encuestas muestrales
Una vez elegido el nivel de precisión (un valor para B), al aplicar la ecuación (22.12) se obtiene el valor de n que permite obtener la precisión deseada. Pero el empleo de la ecuación (22.12) para elegir el valor de n presenta algunos problemas, pues además de especificar el valor de la cota deseada B del error muestral, se necesita el valor de la varianza muestral s2, pero s2 no se puede conocer sino hasta que se tome la muestra. Cochran,* sugiere varias maneras prácticas para obtener el valor de s2. Tres de ellas son las siguientes: 1. Tomar la muestra en dos etapas. Usar en la ecuación (22.12) el valor de s2 hallado en la etapa 1; el valor que se obtenga para n es el tamaño que debe tener la muestra. Después, en la etapa 2 tomar el número de unidades adicionales necesarias para alcanzar el tamaño total de la muestra, determinada en la etapa 1. 2. Usar los resultados de una encuesta piloto o de una prueba preliminar para estimar s2. 3. Usar la información de una muestra previa. A continuación se verá un ejemplo en el que se estiman los salarios medios iniciales de los egresados de una determinada universidad. Suponga que hay 5 000 egresados y se quiere obtener un intervalo de confianza de aproximadamente 95% cuya amplitud sea, a lo más, $1 000. Para obtener este intervalo de confianza se requiere que B 500. Antes de usar la ecuación (22.12) para estimar el tamaño de la muestra, se necesita estimar s2. Suponga que en un estudio similar realizado el año anterior se encontró s $3 000. Para estimar s2 se pueden emplear los datos de esa muestra anterior. Ahora ya se puede usar la ecuación (22.12), con B 500, s 3 000 y N 5 000, para determinar el tamaño de la muestra. 5 000(3 000) 2 (500) 2 5 000 (3 000) 2 4 139.97
n
冢
冣
Al redondear hacia arriba, se halla que para obtener un intervalo de confianza de aproximadamente 95% cuya amplitud sea $1 000, se necesita que el tamaño de la muestra sea de 140. Pero hay que tener presente que estos cálculos se hicieron con base en la estimación inicial s $3 000. Si en la encuesta muestral de este año, s resulta ser más grande, la amplitud del intervalo de confianza que se obtenga será mayor que $1 000. En consecuencia, si el presupuesto lo permite, se deberá elegir una muestra de, por ejemplo, 150 para garantizar que el intervalo de confianza que se obtenga tenga una amplitud menor que $1 000. La fórmula para determinar el tamaño de muestra necesario para estimar el total poblacional, dada una cota B del error muestral, es la siguiente.
n
Ns 2 B2 s2 4N
冢 冣
(22.13)
En el ejemplo de arriba se quería estimar el salario medio inicial con una cota del error muestral B 500. Suponga que también se desea estimar el salario total de los 5 000 egresados y que la cota sea $2 millones. Con la ecuación (22.13) con B 2 000 000 se obtendrá el tamaño de muestra necesario para obtener esa cota para el total poblacional.
*William G. Cochram, Sampling Techniques, 3a. ed., Wiley, 1977.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 925
22.4
925
Muestreo aleatorio simple
5 000(3 000) 2 (2 000 000)2 (3 000) 2 4(5 000) 215.31
n
Al redondear hacia arriba se ve que para obtener un intervalo de confianza de aproximadamente 95%, cuya cota sea $2 millones, el tamaño de la muestra deberá ser de 216. Hay que hacer notar que si en esta misma encuesta se desea tener una cota de $500 para la media poblacional y una cota de $2 millones para el total poblacional, será necesario usar una muestra cuyo tamaño sea, por lo menos, 216. Con este tamaño de muestra se obtendrá una cota más estrecha de lo necesario para la media poblacional y la precisión mínima necesaria para el total poblacional. El tamaño de la muestra para una estimación de la proporción poblacional, se determina con una fórmula similar a la de la media poblacional; sustituya en la ecuación (22.12) s2 por p̄(1 p̄), con lo que obtiene
n
Np̄(1 p̄) B2 N p̄(1 p̄) 4
冢 冣
(22.14)
Para usar la ecuación (22.14) hay que especificar la cota B deseada y una estimación de p̄. Si no se cuenta con una estimación de p̄, se puede usar p̄ 0.5; con este valor de p̄ se garantiza que el intervalo de confianza que se obtenga tenga una cota del error muestral tan pequeña, por lo menos, como la deseada.
Ejercicios
Métodos
Auto examen
1. Para obtener una muestra de n 50 de una población de N 800, se empleó el muestreo aleatorio simple. Se halló una media muestral x̄ 215 y una desviación estándar muestral s 20. a. Estime la media poblacional. b. Estime el error estándar de la media. c. Obtenga un intervalo de confianza de aproximadamente 95% para la media poblacional. 2. Para obtener una muestra de n 80 de una población de N 400, se empleó el muestreo aleatorio simple. Se halló una media muestral x̄ 75 y una desviación estándar muestral s 8. a. Estime el total poblacional. b. Estime el error estándar del total poblacional. c. Obtenga un intervalo de confianza de aproximadamente 95% para el total poblacional. 3. Para obtener una muestra de n 100 de una población de N 1 000, se empleó el muestreo aleatorio simple. Se halló una proporción muestral de p̄ 0.30. a. Estime la proporción poblacional. b. Estime el error estándar de la proporción. c. Obtenga un intervalo de confianza de aproximadamente 95% para la proporción poblacional. 4. Se va a tomar una muestra para obtener un intervalo de confianza de aproximadamente 95% para estimar la media poblacional. La población consta de 450 elementos y en un estudio piloto se encontró s 70. ¿De qué tamaño deberá ser la muestra para que la amplitud del intervalo sea 30?
22Ander(915-950).qxd 2/29/08 10:58 AM Page 926
926
Capítulo 22
Encuestas muestrales
Aplicaciones
Auto examen
5. En 1996 la Small Business Administration (SBA) concedió 771 créditos a pequeñas empresas en Carolina del Norte (The Wall Street Journal Almanac, 1998). Suponga que en una muestra de 50 pequeñas empresas el promedio de los créditos fue de $149 670 y la desviación estándar de $73 420 y que 18 de las empresas de la muestra hayan sido empresas de fabricación. a. Obtenga un intervalo de confianza de aproximadamente 95% para la media de los créditos. b. Estime un intervalo de confianza de aproximadamente 95% para el valor total de los 771 créditos en Carolina del Norte. c. Obtenga un intervalo de confianza de aproximadamente 95% para la proporción de créditos otorgados a empresas de fabricación. 6. En un condado de California se tienen 724 declaraciones de impuestos corporativos. El ingreso anual medio reportado es de $161 220 con una desviación estándar de $31 300. ¿De qué tamaño deberá ser la muestra el siguiente año para obtener un intervalo de confianza de aproximadamente 95% para el ingreso corporativo anual medio? La precisión deseada es de una amplitud de intervalo no mayor que $5 000.
22.5
Muestreo aleatorio simple estratificado En el muestreo aleatorio simple estratificado, primero se divide la población en H grupos, a los que se llama estratos. A continuación de cada estrato h se toma una muestra aleatoria simple de tamaño nh. Los datos de las H muestras aleatorias simples se juntan para obtener una estimación del parámetro poblacional de interés como de la media, del total o de la proporción poblacionales. Si la variabilidad dentro de cada estrato es menor que la variabilidad entre los estratos, la precisión que se obtiene con una muestra aleatoria simple estratificada puede ser muy buena (intervalos de confianza estrechos para los parámetros poblacionales). La base para la formación de los estratos depende del criterio de quien diseña la muestra. De acuerdo con la aplicación, una población puede estratificarse por departamentos, por ubicación, según la edad, el tipo de producto, el tipo de industria, la cantidad de ventas, etcétera. Por ejemplo, suponga que el College of Business del Lakeland College desea realizar una encuesta a los egresados ese año para conocer sus salarios iniciales. En este College hay cinco áreas principales: contaduría, finanzas, sistemas de la información, marketing y administración de operaciones. De los N 1 500 estudiantes egresados ese año, N1 500 pertenecieron a contaduría, N2 350 a finanzas, N3 200 a sistemas de la información, N4 300 a marketing y N5 150 a administración de operaciones. Los datos de análisis previos sugieren que existe mayor variabilidad entre los salarios iniciales de las distintas áreas que dentro de cada área. Por tanto, se toma una muestra aleatoria simple estratificada de n 180 estudiantes; 45 de los 180 estudiantes pertenecen a contaduría (n1 45), 40 a finanzas (n2 40), 30 a sistemas de la información (n3 30), 35 a marketing (n4 35) y 30 a administración de operaciones (n5 30).
Media poblacional En los muestreos estratificados para obtener una estimación insesgada de la media poblacional se calcula el promedio ponderado de las medias muestrales de los estratos. Para ponderar se usa la proporción de la población que representa cada estrato. El estimador puntual que se obtiene de esta manera y que se denota x̄st , está definido como sigue.
ESTIMADOR PUNTUAL DE LA MEDIA POBLACIONAL H
x̄st
兺 冢 N 冣x̄ Nh
h
h 1
(22.15)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 927
22.5
927
Muestreo aleatorio simple estratificado
donde H número de estratos x̄h media muestral del estrato h Nh número de elementos en el estrato h N número total de elementos en la población; N N1 N2 . . . NH En el muestreo aleatorio simple estratificado, la fórmula para obtener una estimación del error estándar de la media es función de sh, la desviación estándar muestral del estrato h. sx̄ st
冑
1 H s 2h N (N n ) h h h N 2 h 1 nh
兺
(22.16)
Con esta fórmula el intervalo de confianza de aproximadamente 95% para estimar la media poblacional está dado por la siguiente expresión.
INTERVALO DE CONFIANZA DE APROXIMADAMENTE 95% PARA ESTIMAR LA MEDIA POBLACIONAL
x̄st 2 sx̄ st
(22.17)
Suponga que en la encuesta realizada a los 180 egresados del College Business del Lakeland College se obtuvieron los resultados muestrales que se presentan en la tabla 22.1. Las medias muestrales en cada área o estrato son $35 000 para contaduría, $33 500 para finanzas, $41 500 para sistemas de la información, $32 000 para marketing y $36 000 para administración de operaciones. Con estos resultados y la ecuación (22.15) se obtiene una estimación puntual para la media poblacional. x̄st
冢1 500冣(35 000) 冢1 500冣(33 500) 冢1 500冣(41 500) 300 150 冢1 500冣(32 000) 冢1 500冣(36 000) 35 017 500
350
200
Los cálculos necesarios para estimar el error estándar se presentan en la tabla 22.2; observe que 5
兺 N (N h
h
TABLA 22.1
h
nh )
1
s 2h nh
42 909 037 698
ENCUESTA MUESTRAL SOBRE LOS SALARIOS INICIALES DE LOS EGRESADOS DEL LAKELAND COLLEGE
Área (h) Contaduría Finanzas Sistemas de la información Marketing Administración de operaciones
x̄h
sh
Nh
nh
$35 000 $33 500 $41 500 $32 000 $36 000
2000 1700 2300 1600 2250
500 350 200 300 150
45 40 30 35 30
22Ander(915-950).qxd 2/29/08 10:58 AM Page 928
928
Capítulo 22
TABLA 22.2
Encuestas muestrales
CÁLCULOS PARCIALES PARA LA ESTIMACIÓN DEL ERROR ESTÁNDAR DE LA MEDIA EN LA ENCUESTA MUESTRAL DEL LAKELAND COLLEGE Nh(Nh ⴚ nh)
s2h nh
Área
h
Contaduría
1
500(500 45)
(2 000)2 20 222 222 222 45
Finanzas
2
350(350 40)
(1 700)2 7 839 125 000 40
Sistemas de la información
3
200(200 30)
(2 300)2 5 995 333 333 30
Marketing
4
300(300 35)
(1 600)2 5 814 857 143 35
Administración de operaciones
5
150(150 30)
(2 250)2 3 037 500 000 30 42 909 037 698
5
兺 N (N h
h
nh )
h 1
s 2h nh
Por tanto, sx̄ st
冑冢
冣
1 (42 909 037 698) 兹19 070.68 138 (1 500) 2
De esta manera, con la ecuación (22.17), un intervalo de confianza de aproximadamente 95% para la estimación de la media poblacional es 35 017 2(138) 35.017 276, es decir, $34 741 a $35 293.
Total poblacional La estimación puntual del total poblacional (X) se obtiene al multiplicar N por x̄st. ESTIMADOR PUNTUAL DEL TOTAL POBLACIONAL
X̂ Nx̄st
(22.18)
Una estimación del error estándar de este estimador puntual es sX̂ Nsx̄st
(22.19)
Por tanto, un intervalo de confianza de aproximadamente 95% es el dado por la expresión siguiente.
INTERVALO DE CONFIANZA DE APROXIMADAMENTE 95% PARA ESTIMAR EL TOTAL POBLACIONAL
Nx̄st 2 sX̂
(22.20)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 929
22.5
929
Muestreo aleatorio simple estratificado
Ahora suponga que el College of Business del ejemplo anterior desea estimar también el ingreso total de los 1 500 egresados con objeto de estimar su impacto en la economía. Mediante la ecuación (22.18), se obtiene una estimación insesgada del total de ingresos. X̂ (1 500)35 017 52 525 500 Una estimación del error estándar del total poblacional se obtiene con la ecuación (22.19). sX̂ 1 500(138) 207 000 En conclusión, con la ecuación (22.20), se determina que un intervalo de confianza de aproximadamente 95% para estimar los ingresos totales de los 1 500 egresados es 52 525 500 2(207 000) 52 525 500 414 000, es decir $52 111 500 a $52 939 500.
Proporción poblacional Una estimación insesgada de la proporción poblacional, p, cuando se emplea el muestreo aleatorio simple estratificado, es un promedio ponderado de las proporciones de cada estrato. Para ponderar se usan las fracciones de la población que corresponden a cada estrato. El estimador puntual que se obtiene, denotado p̄st , se define como sigue.
ESTIMADOR PUNTUAL DE LA PROPORCIÓN POBLACIONAL H
p̄st
兺 冢 N 冣p̄ Nh
(22.21)
h
h 1
donde H p̄h Nh N
número de estratos proporción muestral del estrato h número de elementos de la población que pertenecen al estrato h número total de elementos en la población: N N1 N2 . . . NH
Una estimación del error estándar de p̄st es la dada por sp̄st
冑
1 H p̄ (1 p̄h) Nh(Nh nh) h 2 N h 1 nh 1
冤
兺
冥
(22.22)
Por tanto, un intervalo de confianza de aproximadamente 95% para estimar la proporción poblacional es el dado por la expresión siguiente.
INTERVALO DE CONFIANZA DE APROXIMADAMENTE 95% PARA ESTIMAR LA PROPORCIÓN POBLACIONAL
p̄st 2sp̄st
(22.23)
Suponga que en este ejemplo se desea conocer la proporción de recién egresados que obtuvo un salario inicial de $36 000 o más. En los resultados de la encuesta muestral de los 180 recién egresados se observa que 63 de ellos obtuvieron un salario inicial de $36 000 o más y que 16 de los
22Ander(915-950).qxd 2/29/08 10:58 AM Page 930
930
Capítulo 22
Encuestas muestrales
63 corresponden a contaduría, 3 a finanzas, 29 a sistemas de la información, 0 a marketing y 15 a administración de operaciones. Con la ecuación (22.21) se calcula la proporción de egresados que obtuvo un salario inicial de $36 000 o más. p̄st
冢1 500冣冢45冣 冢1 500冣冢40冣 冢1 500冣冢30冣 冢1 500冣冢35冣 冢1 500冣冢30冣 500
16
350
3
200
29
300
0
150
15
0.3149 Los cálculos necesarios para estimar el error estándar se muestran en la tabla 22.3; observe que 5
兺 N (N h
h
nh)
h 1
冤
p̄h(1 p̄h) 1570.6913 nh 1
冥
Por tanto,
冑
1 (1570.6913) (1 500) 2 0.0264
sp̄st
Con la expresión (22.23), se encuentra que un intervalo de confianza de aproximadamente 95% para la proporción de egresados que tienen un salario inicial de $36 000 o más es 0.3149 2(0.0264) 0.3149 0.0528, es decir 0.2621 a 0.3677.
Determinación del tamaño de la muestra Cuando se emplea un muestreo aleatorio simple estratificado, la elección del tamaño de la muestra se entiende como un proceso de dos pasos. Primer paso, se elige un tamaño total n para la muestra. Segundo paso, se decide cuántas unidades muestrales tomar de cada estrato. Otra alternativa es decidir primero de qué tamaño se tomará la muestra de cada estrato y después sumar TABLA 22.3
CÁLCULOS PARCIALES PARA LA ESTIMACIÓN DEL ERROR ESTÁNDAR DE p̄st EN LA ENCUESTA MUESTRAL DE LOS ESTUDIANTES DEL LAKELAND Nh(Nh ⴚ nh)
冤
p̄h(1 p̄h) nh ⴚ 1
冥
Área
h
Contaduría
1
Finanzas
2
350(350
Sistemas de la información
3
200(200
30)
(29/30)(1/30) 30 1
37.7778
Marketing
4
300(300
35)
(0/35)(35/35) 35 1
0.0000
Administración de operaciones
5
(15/30)(15/30) 30 1
155.1724
500(500
150(150
(16/45)(29/45) 45 1 (3/40)(37/40) 40) 40 1
45)
30)
1 184.7363 193.0048
1 570.6913 5
兺 N (N h
h 1
h
nh)
冤
p̄h(1 p̄h) nh 1
冥
22Ander(915-950).qxd 2/29/08 10:58 AM Page 931
22.5
931
Muestreo aleatorio simple estratificado
los tamaños muestrales de los estratos para obtener el tamaño total de la muestra. Con frecuencia interesa obtener estimaciones de la media, el total y la proporción de cada estrato; por tanto se suele emplear una combinación de estos dos métodos. Se determina un tamaño general n de la muestra y una asignación con la que se obtenga la precisión necesaria para los parámetros poblacionales generales de interés. Después, si los tamaños de las muestras de algunos de los estratos no son lo suficientemente grandes para obtener la precisión necesaria en las estimaciones para el estrato, se aumentan los tamaños de las muestras de esos estratos. En esta subsección se verán algunos de los aspectos relacionados con la asignación de toda la muestra a los diferentes estratos y se presentará un método para elegir el tamaño total de la muestra y hacer la asignación. La asignación consiste en decidir qué fracción del total de la muestra le será asignada a cada estrato. Esta fracción determina cuán grande será la muestra aleatoria simple de cada estrato. Los factores más importantes para hacer la asignación son los siguientes: 1. El número de elementos en cada estrato. 2. La varianza de los elementos dentro de cada estrato. 3. El costo de la selección de los elementos de cada estrato. En general, se asignan muestras más grandes a los estratos más grandes y a los estratos que tienen mayor varianza. En sentido inverso, para obtener la mayor información por un costo dado, a los estratos que tienen un costo por unidad muestreada mayor se les asignan muestras más pequeñas. Las varianzas de cada uno de los estratos suelen ser muy diferentes. Por ejemplo, suponga que en un determinado estudio se desee determinar la cantidad media de empleados por edificio; como la variabilidad será mayor en un estrato que tenga edificios grandes que en un estrato que tenga edificios pequeños, en tales estratos se tomará una muestra proporcionalmente mayor. El costo de la selección puede ser una consideración importante cuando el entrevistador tiene que hacer recorridos significativos entre las unidades muestrales de unos estratos, pero no entre las de otros; esta situación suele surgir cuando algunos de los estratos comprenden zonas rurales y otras ciudades. En muchas encuestas el costo por unidad de muestreo es aproximadamente el mismo en todos los estratos (por ejemplo, en las encuestas por correo o por teléfono); en tales casos el costo del muestreo puede ignorarse al hacer la asignación. Aquí se presentan las fórmulas apropiadas para elegir el tamaño de la muestra y para hacer la asignación en tales casos. En los libros más avanzados sobre muestreo se proporcionan las fórmulas para el caso en el que los costos de muestreo varían significativamente entre los estratos. Las fórmulas que se presentan en esta sección minimizan el costo total de muestreo dado un nivel de precisión. Este método conocido como asignación de Neyman asigna el total de la muestra n a los diversos estratos como sigue.
冢兺 冣 Nh sh
nh n
H
(22.24)
Nh sh
h 1
La ecuación (22.24) indica que el número de unidades asignadas a un estrato aumenta con el tamaño del estrato y la desviación estándar. Observe que para hacer esta asignación primero se necesita determinar el tamaño total n de la muestra. Dada una determinada precisión B, para elegir el tamaño de la muestra para la determinación de la media poblacional y del total poblacional se emplean las fórmulas siguientes.
TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA POBLACIONAL
冢 兺N s 冣 H
2
h h
n
h 1
H B2 N2 Nh s 2h 4 h 1
冢 冣 兺
(22.25)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 932
932
Capítulo 22
Encuestas muestrales
TAMAÑO DE LA MUESTRA PARA ESTIMAR EL TOTAL POBLACIONAL
冢兺 冣 H
2
Nh sh
n
h 1
2
H B Nh s 2h 4 h 1
兺
(22.26)
Por ejemplo, suponga que un vendedor de Chevrolet desea hacer una encuesta a los clientes que compran un Corvette o un Cavalier o un Geo Prizm para obtener información que él considera puede ser útil para la publicidad futura. Suponga que este vendedor desea estimar el ingreso medio mensual de estos clientes y que la cota del error muestral sea $100. Los 600 clientes de este vendedor se dividen en tres estratos: 100 que poseen un Corvette, 200 que poseen un Geo Prizm y 300 que poseen un Cavalier. Para estimar la desviación estándar de cada estrato se empleó una encuesta piloto; los resultados son s1 $1 300, s2 $900 y s3 $500 para los poseedores de un Corvette, un Geo Prizm y un Cavalier, respectivamente. El primer paso para elegir el tamaño de la muestra es usar la ecuación (22.25) para determinar el tamaño total de la muestra que se necesita para tener una cota B $100 en la estimación de la media poblacional. Primero, se calcula 3
兺N s
h h
100(1 300) 200(900) 300(500) 460 000
h 1
Después se calcula 3
兺N s
2 h h
100(1 300) 2 200(900)2 300(500)2 406 000 000
h 1
Al sustituir estos valores en la ecuación (22.25), se obtiene el tamaño total de la muestra que se requiere para que la cota del error muestral sea B $100. n
(460 000)2 162 (600) (100)2 406 000 000 4 2
Por tanto, el tamaño total de la muestra para obtener la precisión deseada es 162. Para la asignación del total de la muestra a los tres estratos se emplea la ecuación (22.24).
冢 460 000 冣 46 200(900) 162 冢 63 460 000 冣 300(500) 162 冢 53 460 000 冣
n1 162 n2 n3
100(1 300)
De manera que la recomendación será: 46 propietarios de Corvette, 62 de Geo Prizm y 53 de Cavalier que hacen un tamaño total de la muestra de 162 clientes.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 933
22.5
933
Muestreo aleatorio simple estratificado
Para determinar el tamaño de la muestra necesario para la estimación de la proporción poblacional, simplemente se sustituye en la ecuación (22.25) sh por 兹p̄h(1 p̄h ); el resultado es
冢 兺 N 兹p̄ (1 p̄ )冣 H
2
h
h
h
h 1
n N
2
(22.27)
H B2 Nh p̄h(1 p̄h ) 4 h 1
冢 冣 兺
Una vez que se ha determinado el tamaño total de la muestra necesario para la estimación de la proporción poblacional, la asignación a los varios estratos se hace otra vez con la ecuación (22.25) al sustituir sh por 兹p̄h(1 p̄h ) .
NOTAS Y COMENTARIOS 1. Una ventaja del muestreo aleatorio simple estratificado es que automáticamente, como consecuencia del procedimiento de muestreo, se obtienen estimaciones de los parámetros poblacionales de cada estrato. Por ejemplo, además de obtener una estimación del salario inicial promedio en el problema de los egresados de administración, se obtuvo también una estimación del salario inicial promedio de los egresados de cada área. Como cada una de las estimaciones de los salarios iniciales se hizo con base en una muestra aleatoria simple de cada estrato, se puede emplear el procedimiento para obtener un intervalo de confianza cuando se toma una muestra aleatoria simple (véase la ecuación (22.4)) para calcular una estimación de la media de cada estrato mediante un intervalo de confianza de aproximadamente 95% para estimar la media de cada estrato. De manera similar, se obtienen intervalos
de confianza para estimar el total poblacional y la proporción poblacional de cada estrato con las ecuaciones (22.8) y (22.10), respectivamente. 2. Otro tipo de asignación que se usa cuando se hace un muestreo aleatorio simple estratificado es la asignación proporcional. Con este método el tamaño de la muestra asignada a cada estrato está dado por la fórmula siguiente. nh n
冢N冣 Nh
(22.28)
La asignación proporcional debe usarse cuando las varianzas de los estratos son todas aproximadamente iguales y el costo por unidad muestreada es casi el mismo en todos los estratos. En los casos en que las varianzas de los estratos son iguales, la asignación proporcional y el procedimiento de Neyman dan las mismas asignaciones.
Ejercicios
Métodos 7. Los resultados obtenidos de una muestra aleatoria simple estratificada fueron los siguientes.
Auto examen Estrato (h)
x̄h
sh
p̄h
Nh
nh
1 2 3
138 103 210
30 25 50
0.50 0.78 0.21
200 250 100
20 30 25
a. b. c.
Proporcione una estimación de la media poblacional de cada estrato. Dé un intervalo de confianza de aproximadamente 95% para la media poblacional de cada estrato. Encuentre un intervalo de confianza de aproximadamente 95% para la media poblacional de toda la población.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 934
934
Capítulo 22
Encuestas muestrales
8. Reconsidere los resultados muestrales del ejercicio 7. a. Encuentre una estimación del total poblacional de cada estrato. b. Dé una estimación puntual del total de los 550 elementos de la población. c. Proporcione un intervalo de confianza de aproximadamente 95% para el total poblacional. 9. Regrese a los resultados muestrales del ejercicio 7. a. Proporcione un intervalo de confianza de aproximadamente 95% para la proporción de cada estrato. b. Dé una estimación puntual de la proporción poblacional para los 550 elementos de la población. c. Estime el error estándar de la proporción poblacional. d. Encuentre un intervalo de aproximadamente 95% para la proporción poblacional. 10. Una población fue dividida en tres estratos N1 300, N2 600 y N3 500. De una encuesta anterior se tienen las estimaciones siguientes de la desviación estándar en cada uno de los estratos: s1 150, s2 75 y s3 100. a. Suponga que se necesita una estimación de la media poblacional con una cota del error de estimación de B 20. ¿De qué tamaño deberá ser la muestra? ¿Cuántos elementos deberán ser tomados de cada estrato? b. Admita que se requiere que la cota sea B 10 ¿De qué tamaño deberá ser la muestra? ¿Cuántos elementos deberán ser tomados de cada estrato? c. Suponga que se quiere tener una estimación del total poblacional y que la cota sea B 15 000. ¿De qué tamaño deberá ser la muestra? ¿Cuántos elementos deberán ser tomados de cada estrato?
Aplicaciones 11. Una cadena de farmacias tiene tiendas en cuatro ciudades: 38 tiendas en Indianápolis, 45 en Louisville, 80 en St. Louis y 70 en Memphis. Las ventas en las cuatro ciudades varían considerablemente debido a la competencia. De una encuesta muestral se tienen los datos siguientes (en miles de dólares). Cada una de las ciudades se consideró como un estrato y se tomó una muestra aleatoria simple estratificada.
a. b. c. d.
Indianápolis
Louisville
St. Louis
Memphis
50.3 41.2 15.7 22.5 26.7 20.8
48.7 59.8 28.9 36.5 89.8 96.0 77.2 81.3
16.7 38.4 51.6 42.7 45.0 59.7 80.0 27.6
14.7 88.3 94.2 76.8 35.1 48.2 57.9 18.8 22.0 74.3
Estime la media de las ventas en cada ciudad (estrato). Obtenga un intervalo de confianza de aproximadamente 95% para la media de las ventas en cada ciudad. Estime la proporción de farmacias cuyas ventas son de $50 000 o más. Obtenga un intervalo de confianza de aproximadamente 95% para la proporción de farmacias cuyas ventas son de $50 000 o más.
12. Reconsidere los resultados de la encuesta muestral del ejercicio 11. a. Estime el total poblacional de las ventas en St. Louis. b. Valore el total poblacional de las ventas en Indianápolis. c. Obtenga un intervalo de confianza de aproximadamente 95% para la media de las ventas de la cadena de farmacias.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 935
22.6
Muestreo por conglomerados
d.
935
Encuentre un intervalo de confianza de aproximadamente 95% para el total de las ventas de la cadena de farmacias.
13. Una empresa de contadores tiene clientes en la industria bancaria, en la de seguros y en la de corretaje: N1 50 bancos, N2 38 empresas de seguros y N2 35 empresas de corretaje. Esta empresa ha contratado a una empresa que se dedica al marketing para que realice una encuesta entre sus clientes en estas tres industrias. En la encuesta se harán diversas preguntas relacionadas, tanto con el negocio de los clientes como con su satisfacción con el servicio que reciben de la empresa de contadores. Suponga que se desea un intervalo de confianza de aproximadamente 95% para estimar el número promedio de empleados en los 123 clientes con una cota en el error de estimación B 30. a. Suponga que en un estudio piloto se encuentra s1 80, s2 150 y s3 45. Determine el tamaño total de la muestra y explique los tamaños de las muestras asignados a los tres estratos. b. Suponga que se duda del estudio piloto y que para determinar el tamaño de la muestra se decide suponer que todos los estratos tienen la misma desviación estándar de 100. Determine el tamaño de la muestra y diga cuántos elementos deben tomarse de cada estrato.
22.6
Muestreo por conglomerados En el muestreo por conglomerados se requiere que la población se divida en N grupos de elementos llamados conglomerados, de manera que cada elemento de la población pertenezca a uno y sólo un conglomerado. Por ejemplo, suponga que se quiere investigar a los votantes registrados del estado de Ohio. Un método de muestreo puede ser elaborar un marco con todos los votantes registrados del estado de Ohio y, de este marco, tomar una muestra aleatoria simple. De manera alternativa, para el muestreo por aglomerados se define el marco como la lista de los N 88 condados del estado (véase figura 22.1). Con este método, cada condado o conglomerado consiste en un grupo de votantes registrados y cada votante registrado del estado pertenece a uno y sólo un conglomerado. Suponga que de los 88 condados se toma una muestra aleatoria simple de n 12 condados. Ahora se pueden recolectar los datos de todos los votantes registrados de cada uno de los 12 conglomerados, método que se conoce como muestreo por conglomerados en una sola etapa o se puede tomar una muestra aleatoria simple de los votantes registrados en cada uno de los 12 conglomerados muestreados, método que se conoce como muestreo por conglomerados en dos etapas. En cualquier caso existen fórmulas para usar los resultados muestrales en la obtención de estimaciones puntuales o por intervalo de estimación de parámetros poblacionales como la media, el total o la proporción poblacionales. En este capítulo se considerará únicamente el muestreo por conglomerados en una sola etapa; en libros más avanzados sobre muestreo se encuentra la información sobre el muestreo por conglomerados en dos etapas. El muestreo estratificado y el muestreo por conglomerados son similares, ya que en los dos se divide a la población en grupos de elementos. Sin embargo, las razones para elegir el muestreo por conglomerados son diferentes de las razones para elegir el muestreo estratificado. Con el muestreo por conglomerados se obtienen mejores resultados cuando los elementos dentro de los conglomerados son heterogéneos (no son parecidos). Lo ideal es que los conglomerados sean una versión a pequeña escala de la población. Cuando es así, al muestrear una pequeña cantidad de conglomerados se obtiene una buena información de las características de toda la población. Una de las principales aplicaciones del muestreo por conglomerados es el muestreo de áreas, en donde los conglomerados son condados, poblaciones, manzanas u otras secciones geográficamente bien definidas de la población. Como sólo se recolectan datos de una muestra o conglomerado de toda un área geográfica y como los elementos dentro de un conglomerado se suelen encontrar cerca, uno de otros, cuando un recolector de datos o entrevistador se envía a una unidad muestreada se obtiene un considerable ahorro de tiempo y costos. Por tanto, aun cuando se requiera que el tamaño total de la muestra sea grande, el muestreo por conglomerados puede resultar menos costoso que el muestreo aleatorio simple o el muestreo aleatorio simple estratificado. Además,
22Ander(915-950).qxd 2/29/08 10:58 AM Page 936
936
Capítulo 22
FIGURA 22.1
Encuestas muestrales
CONDADOS DEL ESTADO DE OHIO USADOS COMO CONGLOMERADOS DE VOTANTES REGISTRADOS
Ashtabula
Lake Lucas
Fulton
Williams
Ottawa
Geauga Cuyahoga
Henry
Defiance
Erie
Sandusky
Wood
Huron
Senca
Paulding Putnam
Trumbull
Lorain Medina
Summit
Portage Mahoning
Hancock Wyandot
Van Wert
Crawford
Allen
Richland
Ashland
Wayne
Carroll
Hardin Mercer
Columbiana
Stark
Holmes
Marion
Auglaize
Morrow Logan Shelby
Jefferson
Tuscarawas
Knox
Harrison
Coshocton
Delaware Union Champaign
Darke
Licking
Miami Clark Preble
Montgomery
Guernsey
Franklin
Noble Fairfield
Madison Greene Fayette
Perry
Warren
Clinton Ross
Hamilton
Washington Athens
Vinton
Highland Pike
Clermont Brown
Adams
Scioto
Monroe
Morgan
Pickaway Hocking
Butler
Belmont
Muskingum
Meigs
Jackson Gallia Lawrence
No es necesario hacer una lista de todos los elementos de la población. En el muestreo por conglomerados sólo se necesita una lista de los elementos en los conglomerados muestreados.
el muestreo por conglomerados minimiza el tiempo y el costo de la elaboración de un marco o lista de los elementos a ser muestreados, dado que en el muestreo por conglomerados no se necesita una lista de todos los elementos de la población. Sólo se necesita una lista de los elementos de los conglomerados muestreados. Con el fin de ilustrar el muestreo por conglomerados se verá una encuesta realizada por la CPA Society (Certified Public Account Society) de los 12 000 integrantes en servicio en un determinado estado. Como parte de la encuesta, la CPA Society recolectó información sobre el ingreso, el género y sobre factores relacionados con el estilo de vida de los contadores. Dado que para obtener toda la información deseada era necesario realizar entrevistas, para minimizar los gastos de desplazamiento y de las entrevistas, la CPA Society realizó un muestreo por conglomerados. El marco consistió en todas las empresas con contadores registradas en el estado. Suponga que el número de empresas registradas en el estado haya sido N = 1 000 y que se haya tomado una muestra aleatoria simple de n = 10 empresas. Para las fórmulas que se requieren en el muestreo por conglomerados para la obtención de intervalos de confianza de aproximadamente 95% para estimar la media, el total o la proporción poblacionales, se usará la notación siguiente.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 937
22.6
937
Muestreo por conglomerados
N número de conglomerados en la población n número de conglomerados tomados para la muestra Mi número de elementos en el conglomerado i M número de elementos en la población; M M1 M2 . . . MN M M/N número promedio de elementos en un conglomerado xi número total de observaciones en el conglomerado i ai número de observaciones con una determinada característica en el conglomerado i En el caso de la encuesta muestral de la CPA Society, la información que se tiene es la siguiente. N n M M
1 000 10 12 000 12 000/1 000 12
En la tabla 22.4 se dan los valores de Mi y xi correspondientes a cada uno de los conglomerados muestreados, así como el número de mujeres de la CPA Society en las empresas muestreadas.
Media poblacional El estimador puntual de la media poblacional en un muestreo por conglomerados está dado por la fórmula siguiente.
ESTIMADOR PUNTUAL DE LA MEDIA POBLACIONAL n
兺x
i
x̄ c
i 1 n
兺
(22.29)
Mi
i 1
TABLA 22.4
RESULTADOS DE LA ENCUESTA MUESTRAL SOBRE LOS CPA
Empresa (i)
CPA (Mi )
Salario total (miles de $) en la empresa i (xi )
Mujeres CPA (ai )
8 25 4 17 7 3 15 4 12 33
384 1350 148 857 296 131 761 176 577 1880
2 8 0 6 1 2 2 0 5 9
128
6560
35
1 2 3 4 5 6 7 8 9 10 Totales
22Ander(915-950).qxd 2/29/08 10:58 AM Page 938
938
Capítulo 22
Encuestas muestrales
Una estimación del error estándar de este estimador puntual es
sx̄ c
冑
n
兺(x x̄ M )
2
冢
N n NnM 2
冣
i
c
i
i 1
n 1
(22.30)
Por tanto, con la expresión siguiente se obtiene un intervalo de aproximadamente 95% como estimación de la media poblacional.
INTERVALO DE APROXIMADAMENTE 95% COMO ESTIMACIÓN DE LA MEDIA POBLACIONAL
x̄ c 2sx̄ c
(22.31)
Al emplear los datos de la tabla 22.4 se obtiene una estimación del salario medio de los contadores públicos certificados. x̄ c
6 560 51.250 128
Los datos de la tabla 22.4, dados en miles de dólares, indican que una estimación del salario medio de los contadores públicos certificados del estado es $51 250. En la tabla 22.5 se presenta parte de los cálculos que se necesitan para estimar el error estándar, observe que n
兺(x x̄ M )
2
i
c
i
51,281.378
i 1
Por tanto, sx̄ c
冑冤
1 000 10 51 281.378 1.979 (1 000)(10)(12)2 10 1
冥
Por tanto, el error estándar es $1 979. Con la expresión (22.31) se encuentra que un intervalo de confianza de aproximadamente 95% para la estimación del salario anual medio es 51 250 2(1 979) 51 250 3 958, es decir, $47 292 a $55 208.
Total poblacional El estimador puntual para el total poblacional se obtiene multiplicando M por x̄ c.
ESTIMADOR PUNTUAL PARA EL TOTAL POBLACIONAL
X̂ Mx̄ c
(22.32)
Una estimación del error estándar de este estimador es sX̂ Msx̄ c
(22.33)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 939
22.6
939
Muestreo por conglomerados
TABLA 22.5
CÁLCULOS PARCIALES PARA LA ESTIMACIÓN DEL ERROR ESTÁNDAR DE LA MEDIA EN LA ENCUESTA MUESTRAL DE CPA
Empresa (i)
Mi
xi
(xi ⴚ 51.250Mi )2
1 2 3 4 5 6 7 8 9 10
8 25 4 17 7 3 15 4 12 33
384 1350 148 857 296 131 761 176 577 1880
[384 51.250(8)]2 676.000 [1350 51.250(25)]2 4 726.563 [148 51.250(4)]2 3 249.000 [857 51.250(17)]2 203.063 [296 51.250(7)]2 3 937.563 [131 51.250(3)]2 517.563 [761 51.250(15)]2 60.063 [176 51.250(4)]2 841.000 [577 51.250(12)]2 1 444.000 [1880 51.250(33)]2 35 626.563
128
6560
51 281.378
Totales
n
兺(x x̄ M )
2
i
c
i
i 1
Por tanto, un intervalo de confianza de aproximadamente 95% para estimar el total poblacional está dado por la expresión siguiente.
INTERVALO DE CONFIANZA DE APROXIMADAMENTE 95% PARA EL TOTAL POBLACIONAL
Mx̄ c 2sX̂
(22.34)
En la encuesta muestral de la CPA. X̂ Mx̄c 12 000(51 250) $615 000 000 sX̂ Msx̄ c 12 000(1 979) $23 748 000 En consecuencia, con la expresión (22.34), se encuentra que un intervalo de confianza de aproximadamente 95% es $615 000 000 2($23 784 000) = $615 000 000 $47 496 000, es decir, $567 504 000 a $662 496 000.
Proporción poblacional A continuación se da el estimador puntual para la proporción poblacional cuando se hace un muestreo por conglomerados. ESTIMADOR PUNTUAL PARA LA PROPORCIÓN POBLACIONAL n
兺a
i
p̄c
i 1 n
兺M
(22.35)
i
i 1
donde ai número de elementos, con la característica de interés, en el conglomerado i.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 940
940
Capítulo 22
Encuestas muestrales
Una estimación de la desviación estándar de este estimador puntual es
sp̄c
冑
n
兺(a p̄ M )
2
冢
N n NnM 2
i
冣
c
i
i 1
(22.36)
n 1
Entonces un intervalo de confianza de aproximadamente 95% para estimar la proporción poblacional es el dado por la expresión siguiente.
INTERVALO DE CONFIANZA DE APROXIMADAMENTE 95% PARA ESTIMAR LA PROPORCIÓN POBLACIONAL
p̄c 2 sp̄c
(22.37)
En el caso de la encuesta muestral de los contadores certificados con la ecuación (22.35) y los datos de la tabla 22.4 se obtiene una estimación de la proporción de contadores certificados que son mujeres. p̄c
2 8 ... 9 35 0.2734 . . . 8 25 33 128
En la tabla 22.6 se presenta parte de los cálculos necesarios para estimar el error estándar; observe que n
兺(a p̄ M )
2
i
c
i
15.2098
i 1
Por tanto, sp̄c
冑冤
冥
1 000 10 15.2098 0.0341 (1 000)(10)(12) 2 10 1
De esta manera, con la expresión (22.37) se halla que un intervalo de confianza de aproximadamente 95% para la proporción de mujeres que son contadoras certificadas es 0.2734 2(0.0341) 0.2734 0.0682, es decir, 0.2052 a 0.3416.
Determinación del tamaño de la muestra Una vez formados los conglomerados, lo primero para determinar el tamaño de la muestra es elegir el número n de conglomerados. Este procedimiento en el caso del muestreo por conglomerados es parecido al procedimiento empleado con los otros métodos de muestreo. El nivel de precisión se especifica al elegir un valor para B, la cota del error muestral. Después se elabora la fórmula para obtener el valor de n que permitirá lograr la precisión deseada. Para decidir cuántos conglomerados incluir en la muestra, los factores decisivos son el tamaño promedio de los conglomerados y la varianza entre los conglomerados. Si los conglomerados son parecidos, la varianza entre ellos será pequeña y el número de conglomerados que se muestree puede ser pequeña. Las fórmulas para determinar exactamente el tamaño de la muestra se encuentran en libros más avanzados sobre muestreo.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 941
22.6
941
Muestreo por conglomerados
TABLA 22.6
PARTE DE LOS CÁLCULOS PARA LA ESTIMACIÓN DEL ERROR ESTÁNDAR DE p̄c EN EL ESTUDIO MUESTRAL DE LA CPA, DONDE p̄c 0.2734
Empresa (i)
Mi
ai
1 2 3 4 5 6 7 8 9 10
8 25 4 17 7 3 15 4 12 33
2 8 0 6 1 2 2 0 5 9
128
35
Totales
(ai ⴚ 0.2734Mi )2 [2 0.2734(8)]2 [8 0.2734(25)]2 [0 0.2734(4)]2 [6 0.2734(17)]2 [1 0.2734(7)]2 [2 0.2734(3)]2 [2 0.2734(15)]2 [0 0.2734(4)]2 [5 0.2734(12)]2 [9 0.2734(33)]2
0.0350 1.3572 1.1960 1.8284 0.8350 1.3919 4.4142 1.1960 2.9556 0.0005 15.2098
n
兺(a p̄ M )
2
i
c
i
i 1
Ejercicios
Métodos
Auto examen
14. De una población que tiene N 25 conglomerados y M 300 elementos se va a tomar una muestra de cuatro conglomerados. En la tabla siguiente se presentan los valores de Mi, xi y ai en cada conglomerado.
a. b. c. d. e.
Conglomerado (i) 1 2 3 4
Mi 7 18 15 10
xi 95 325 190 140
ai 1 6 6 2
Totales
50
750
15
Dé estimaciones puntuales de la media, del total y de la proporción poblacionales. Estime el error estándar de las estimaciones del inciso a. Obtenga un intervalo de confianza de aproximadamente 95% para la media poblacional. Proporcione un intervalo de confianza de aproximadamente 95% para el total poblacional. Obtenga un intervalo de confianza de aproximadamente 95% para la proporción poblacional.
15. De una población que tiene N 30 conglomerados y M 600 elementos se va a tomar una muestra de cuatro conglomerados. En la tabla siguiente se presentan los valores de Mi, xi y ai en cada conglomerado Conglomerado (i) 1 2 3 4 5 6
Mi 35 15 12 23 20 25
xi 3 500 965 960 2 070 1 100 1 805
ai 3 0 1 4 3 2
Totales
130
10 400
13
22Ander(915-950).qxd 2/29/08 10:58 AM Page 942
942
Capítulo 22
a. b. c. d.
Encuestas muestrales
Dé estimaciones puntuales de la media, del total y de la proporción poblacionales. Obtenga un intervalo de confianza de aproximadamente 95% para la media poblacional. Proporcione un intervalo de confianza de aproximadamente 95% para el total poblacional. Obtenga un intervalo de confianza de aproximadamente 95% para la proporción poblacional.
Aplicaciones 16. Una empresa de servicio público realiza una encuesta a los ingenieros mecánicos para conocer los factores que influyen en la elección del equipo de calefacción, ventilación y aire acondicionado (HVAC, por sus siglas en inglés) en los nuevos edificios comerciales. En el área de acción de esta empresa de servicio público hay 120 empresas relacionadas con el diseño de sistemas HVAC. La idea es hacer un muestreo por conglomerados en el que cada empresa represente un conglomerado. Todos los ingenieros mecánicos de cada empresa que se tome en la muestra serán entrevistados. Se cree que en las 120 empresas están empleados aproximadamente 500 ingenieros mecánicos. Se toma una muestra de 10 empresas. Entre otras cosas se anota la edad de cada entrevistado y si estudió en la universidad local.
Conglomerado (i) 1 2 3 4 5 6 7 8 9 10 Totales
a. b. c. d.
Mi 12 1 2 1 6 3 2 1 9 13
Total de las edades de los entrevistados 520 33 70 29 270 129 102 48 337 462
Número que estudió en la universidad local 8 0 1 1 3 2 0 1 7 12
50
2000
35
Estime la edad promedio de los ingenieros mecánicos que trabajan en esta actividad. Halle la proporción de ingenieros mecánicos en esta actividad que estudió en la universidad local. Dé un intervalo de confianza de aproximadamente 95% para la edad promedio de los ingenieros mecánicos que trabajan en esta actividad. Proporcione un intervalo de confianza de aproximadamente 95% para la proporción de ingenieros mecánicos en el área de acción de la empresa pública que estudiaron en la universidad local.
17. Una empresa inmobiliaria nacional acaba de adquirir una empresa más pequeña que cuenta con 150 oficinas y 6 000 agentes en Los Ángeles y en otros sitios del sur de California. La empresa nacional realizó una encuesta muestral para conocer las actitudes y otras características de sus nuevos empleados. En una muestra de ocho oficinas, todos los empleados llenaron los cuestionarios. A continuación se presentan los resultados de esta encuesta en las ocho oficinas.
Oficina 1 2 3 4 5 6 7 8
Agentes 17 35 26 66 43 12 48 57
Edad promedio 37 32 36 30 41 52 35 44
Título universitario 3 14 8 38 18 2 20 25
Agentes del sexo masculino 4 12 7 28 12 6 17 26
22Ander(915-950).qxd 2/29/08 10:58 AM Page 943
943
Resumen
a. b. c. d. e.
22.7
Estime la edad promedio de los agentes. Estime la proporción de agentes que tienen un título universitario y la proporción de agentes del sexo masculino. Dé un intervalo de confianza de aproximadamente 95% para la edad promedio de los agentes. Dé un intervalo de confianza de aproximadamente 95% para la proporción de agentes que tiene un título universitario. Dé un intervalo de confianza de aproximadamente 95% para la proporción de agentes del sexo masculino.
Muestreo sistemático El muestreo sistemático suele emplearse como alternativa al muestreo aleatorio simple. En algunas situaciones, en especial cuando las poblaciones son grandes se lleva mucho tiempo tomar una muestra aleatoria simple en la que primero hay que hallar un número aleatorio y después contar o buscar en el marco el elemento correspondiente. En tales casos el muestreo sistemático es una alternativa al muestreo aleatorio simple. Por ejemplo, si se quiere una muestra de tamaño 50 de una población que contiene 5 000 elementos, se toma en la muestra un elemento cada 5 000/50 = 100 elementos de la población. En este caso un muestreo sistemático consistirá en elegir en forma aleatoria uno de los primeros 100 elementos del marco. Los demás elementos para la muestra se encuentran contando a partir del primer elemento tomado en la muestra hasta encontrar el centésimo elemento que sigue en el marco. En efecto, la muestra de 50 elementos se obtiene avanzando sistemáticamente a través de la población y tomando el centésimo elemento después del último elemento tomado en la muestra. De esta manera suele ser mas fácil tomar la muestra de 50 elementos de lo que sería si se usara un muestreo aleatorio simple. El primer elemento se elige aleatoriamente, lo que permite suponer que una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta suposición suele ser correcta cuando el marco es un ordenamiento aleatorio de los elementos de la población.
Resumen Se le presentó una breve introducción al campo de muestreo de encuestas. El propósito del muestreo de encuestas es recolectar datos con el objeto de hacer estimaciones de parámetros poblacionales como la media, el total o la proporción poblacional. El muestreo de encuestas es comparable con la realización de experimentos para generar datos. Cuando se usa el muestreo de encuestas, el diseño del plan de muestreo tiene una importancia crítica en la determinación de qué datos ya existentes se recolectarán. Cuando se emplean experimentos, el diseño experimental tiene una importancia vital en la determinación de cuáles son los datos que serán generados o creados. En el muestreo de encuestas pueden presentarse dos tipos de errores: el error muestral y los errores no muestrales. El error muestral es el tipo de error que se presenta debido a que para estimar un parámetro poblacional se emplea una muestra y no toda la población. Los errores no muestrales se refieren a todos los otros tipos de errores que pueden presentarse, tales como errores de medición, del entrevistador, de falta de respuesta y errores de procesamiento. Los errores no muestrales se controlan a través del diseño del cuestionario, de la capacitación de los entrevistadores, de la verificación cuidadosa de los datos, etc. El error muestral se minimiza mediante la elección adecuada del diseño y del tamaño de la muestra. En este capítulo se habló de cuatro diseños muestrales muy empleados: muestreo aleatorio simple, muestreo aleatorio simple estratificado, muestreo por conglomerados y muestreo sistemático. El objetivo del diseño muestral es obtener la estimación más precisa al mínimo costo. Cuando la población es dividisible en estratos, de manera que los elementos dentro de cada estrato sean relativamente homogéneos, el muestreo aleatorio simple estratificado permitirá obtener mayor precisión (intervalos de confianza más estrechos) que el muestreo aleatorio simple. Cuando los elementos se
22Ander(915-950).qxd 2/29/08 10:58 AM Page 944
944
Capítulo 22
Encuestas muestrales
pueden agrupar en conglomerados de manera que todos los elementos de un conglomerado se encuentren cercanos unos de otros geográficamente, el muestreo por conglomerados suele reducir el costo del entrevistador; en estos casos, el muestreo por conglomerados proporcionará mayor precisión a menor costo. El muestreo aleatorio sistemático se presentó como alternativa al muestreo aleatorio simple.
Glosario Elemento Entidad de la que se recolectan los datos. Población El conjunto de todos los elementos de interés. Muestra Un subconjunto de la población. Población objetivo Población acerca de la cual se quieren hacer las inferencias. Población muestreada Población de la que se toma la muestra. Unidades muestrales Las unidades que se toman para la muestra. Marco Lista de las unidades muestrales para un estudio. La muestra es aleatoria para seleccionar unidades del marco. Muestreo probabilístico Todo método de muestreo en el que se puede calcular la probabilidad que tiene cada posible muestra. Muestreo no probabilístico Todo método de muestreo en el que no se puede calcular la probabilidad de seleccionar una determinada muestra. Muestreo de conveniencia Un método no probabilístico de muestreo en el que los elementos se toman con base en la conveniencia. Muestreo subjetivo Un método no probabilístico de muestreo en el que los elementos se seleccionan con base en el criterio de la persona que diseña el estudio. Error muestral El error que se presenta debido a que se emplea una muestra y no toda la población para estimar un parámetro poblacional. Error no muestral Todos los tipos de errores que no son un error muestral, como errores de medición, errores del entrevistador y errores de procesamiento. Muestra aleatoria simple Muestra que se toma de tal manera que toda muestra de tamaño n tiene la misma probabilidad de ser elegida. Cota del error muestral Número que se suma o que se resta de una estimación puntual para obtener un intervalo de confianza de aproximadamente 95%. La cota del error muestral es igual al doble del error estándar del estimador puntual. Muestreo aleatorio simple estratificado Método probabilístico para tomar una muestra en el que, primero, se divide la población en estratos y después de cada estrato se toma una muestra aleatoria simple. Muestreo por conglomerados Método probabilístico de muestreo en el que primero se divide la población en conglomerados y después se selecciona uno o más de los conglomerados para la muestra. En el muestreo por conglomerados en una sola etapa, se toman en la muestra todos los elementos de cada uno de los conglomerados elegidos; en el muestreo por conglomerados en dos etapas se toma una muestra de los elementos de cada uno de los conglomerados elegidos. Muestreo sistemático Método para tomar una muestra en el que el primer elemento se toma aleatoriamente y después se toma cada k-ésimo elemento.
Fórmulas clave
Muestreo aleatorio simple Estimación por intervalo de la media poblacional x̄ tα/2
s 兹n
(22.1)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 945
945
Fórmulas clave
Estimación del error estándar de la media
冑
sx̄
N n s N 兹n
冢 冣
(22.2)
Intervalo de estimación para la media poblacional x̄ tα/2 sx̄
(22.3)
Intervalo de confianza de aproximadamente 95% para estimar la media poblacional x̄ 2 sx̄
(22.4)
Estimación puntual del total poblacional X̂ Nx̄
(22.5)
sX̂ Nsx̄
(22.6)
^
Estimación del error estándar de X
Intervalo de confianza de aproximadamente 95% para estimar el total poblacional Nx̄ 2 sX̂
(22.8)
Estimación del error estándar de la proporción sp̄
冑冢
N n N
冣冢
p̄(1 p̄) n 1
冣
(22.9)
Intervalo de confianza de aproximadamente 95% para estimar la proporción poblacional p̄ 2 sp̄
(22.10)
Tamaño de la muestra en una estimación de la media poblacional n
Ns 2 B2 N s2 4
冢 冣
(22.12)
Tamaño de la muestra en una estimación del total poblacional n
Ns 2 B2 s2 4N
冢 冣
(22.13)
Tamaño de la muestra en una estimación de la proporción poblacional n
N p̄(1 p̄) B2 N p̄(1 p̄) 4
冢 冣
(22.14)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 946
946
Capítulo 22
Encuestas muestrales
Muestreo aleatorio simple estratificado Estimación puntual de la media poblacional H
兺 冢 N 冣x̄
x̄st
Nh
(22.15)
h
h 1
Estimación del error estándar de la media sx̄ st
冑
1 H s 2h N (N n ) h N 2 h 1 h h nh
兺
(22.16)
Intervalo de confianza de aproximadamente 95% para la media poblacional x̄st 2 sx̄ st
(22.17)
Estimación puntual del total poblacional X̂ Nx̄st
(22.18)
sX̂ Nsx̄st
(22.19)
^
Estimación del error estándar de X
Intervalo de confianza de aproximadamente 95% para estimar el total poblacional Nx̄st 2 sX̂
(22.20)
Estimación puntual de la proporción poblacional H
p̄st
兺 冢 N 冣p̄ Nh
(22.21)
h
h 1
Estimación del error estándar de p̄st sp̄st
冑
1 H p̄ (1 p̄h) N (N nh) h N 2 h 1 h h nh 1
冤
兺
冥
(22.22)
Intervalo de confianza de aproximadamente 95% para la proporción poblacional p̄st 2sp̄st
(22.23)
Asignación del total n de la muestra a los estratos: asignación de Neyman
冢兺 冣 Nh sh
nh n
H
(22.24)
Nh sh
h 1
Tamaño de la muestra cuando se estima la media poblacional
冢兺N s 冣 H
2
h h
h 1
n N
2
H B2 Nh s 2h 4 h 1
冢 冣 兺
(22.25)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 947
947
Fórmulas clave
Tamaño de la muestra cuando se estima el total poblacional
冢兺 冣 H
2
Nh sh
h 1
n
(22.26)
H B2 Nh s 2h 4 h 1
兺
Tamaño de la muestra para la estimación de la proporción poblacional
冢 兺 N 兹p̄ (1 p̄ )冣 H
2
h
h
h
h 1
n N
2
H B2 Nh p̄h(1 p̄h ) 4 h 1
冢 冣 兺
(22.27)
Asignación proporcional de la muestra n a los estratos nh n
冢N冣 Nh
(22.28)
Muestreo por conglomerados Estimación puntual de la media poblacional n
兺x
i
x̄ c
i 1 n
(22.29)
兺M
i
i 1
冑
Estimación del error estándar de la media
sx̄ c
n
兺(x x̄ M )
2
冢
N n NnM 2
冣
i
c
i
i 1
n 1
(22.30)
Intervalo de confianza de aproximadamente 95% para la media poblacional x̄ c 2sx̄ c
(22.31)
Estimación puntual del total poblacional X̂ Mx̄ c
(22.32)
sX̂ Msx̄ c
(22.33)
^
Estimación del error estándar de X
Intervalo de confianza de aproximadamente 95% para el total poblacional Mx̄ c 2sX̂
(22.34)
Estimación puntual de la proporción poblacional n
兺a
i
p̄c
i 1 n
兺
i 1
Mi
(22.35)
22Ander(915-950).qxd 2/29/08 10:58 AM Page 948
948
Capítulo 22
Encuestas muestrales
Estimación del error estándar de p–c
sp̄c
冑
n
兺(a p̄ M )
2
冢
N n NnM 2
冣
i
c
i 1
n 1
i
(22.36)
Intervalo de confianza de aproximadamente 95% para estimar la proporción poblacional p̄c 2 sp̄c
(22.37)
Ejercicios complementarios 18. Para evaluar la aceptación que tiene ante los consumidores una nueva publicidad de la cerveza Millar Lite Beer, Louis Harris realizó una encuesta nacional con 363 adultos que habían visto la nueva publicidad de Millar Lite (USA Today, 17 de noviembre de 1997). Algunas de las respuestas obtenidas en la encuesta fueron las que se presentan a continuación (Nota: Como en esta encuesta sólo se tomó en la muestra una pequeña fracción de todos los adultos, en todas las fórmulas en las que se use el error estándar suponga que ((N n)/N 1). a. Diecinueve por ciento de los entrevistados indicó que la nueva publicidad les gustaba mucho. Dé un intervalo de confianza de 95% para esta proporción poblacional. b. A 31% de los entrevistados no les gustó la nueva publicidad. Dé un intervalo de confianza de 95% para esta proporción poblacional. c. Diecisiete por ciento de los entrevistados indicó que la nueva publicidad les parecía muy efectiva. Dé un intervalo de confianza de 95% para la proporción de adultos que encuentra que la nueva publicidad es muy efectiva. d. Louis Harris informó que “el margen de error era de cinco puntos porcentuales”. ¿Qué significa esto y cómo cree usted que llegó a esta cifra? e. ¿Cómo pueden sesgar los errores no muestrales los resultados de un estudio de este tipo? 19. Mediante una encuesta entre los suscriptores de su edición interactiva, The Wall Street Journal realizó una investigación. Una de las preguntas que se hizo a los 504 encuestados era si usaban su laptop cuando viajaban; 55% respondió que sí. Otra de las preguntas era si cuando viajaban empleaban un servicio exprés o un servicio de paquetería; 31% respondió que sí (The Wall Street Journal Interactive Edition Subscriber Survey, 2000). a. Estime el error estándar para la proporción que usa la laptop. b. Estime el error estándar de la proporción que usa un servicio exprés o un servicio de paquetería. c. ¿Son iguales las estimaciones del error estándar dadas en el inciso a y en el inciso b? Si son diferentes explique por qué. d. Dé un intervalo de confianza de 95% para la proporción que usa la laptop. e. Dé un intervalo de confianza de 95% para la proporción que usa un servicio exprés o un servicio de paquetería. 20. Mediante una encuesta se realizó un estudio sobre la calidad de vida de los empleados de una fábrica. A 300 de los 3 000 empleados de la fábrica se les envió un cuestionario. La tasa de respuesta fue de 67%, lo que corresponde a 200 cuestionarios contestados. a. En la muestra el salario anual medio fue x̄ $23 200 con s $3 000. Dé un intervalo de confianza de aproximadamente 95% para el salario anual medio de la población. b. Use la información del inciso a para obtener un intervalo de confianza de aproximadamente 95% para el total de los salarios de los 3 000 empleados.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 949
949
Ejercicios complementarios
c.
d.
Setenta y tres por ciento de los entrevistados informó estar “en general satisfechos” con su trabajo. Proporcione un intervalo de confianza de aproximadamente 95% para esta proporción poblacional. Haga un comentario sobre si usted considera que el resultado del inciso c pueda estar sesgado. ¿Cambiaría su opinión si supiera que a los entrevistados se les garantizó el anonimato?
21. En un informe del Comité Judicial del Senado de Estados Unidos se presenta el número de homicidios en cada estado. En Indiana, Ohio y Kentucky, el número de homicidios fue, respectivamente, 380, 760 y 260. Suponga que se tomó una muestra aleatoria estratificada para conocer más acerca de las víctimas y de la causa de su muerte, los resultados se presentan a continuación
Estrato
Tamaño de la muestra
Disparo
Golpiza
Víctima urbana
30 45 25
10 19 7
9 12 11
21 34 15
Indiana Ohio Kentucky
a. b. c. d.
Dé un intervalo de confianza de aproximadamente 95% para la proporción de muertes por disparo con arma de fuego en Indiana. Estime el número total de muertes por disparo con arma de fuego en Ohio. Dé un intervalo de confianza de aproximadamente 95% para la proporción de muertes por disparo con arma de fuego en Ohio. Dé un intervalo de confianza de aproximadamente 95% para la proporción de muertes por disparo con arma de fuego en los tres estados.
22. Remítase a los datos del ejercicio 21. a. Estime la cantidad total de muertes (en los tres estados) por golpizas. b. Dé un intervalo de confianza de aproximadamente 95% para la proporción de muertes por golpizas en los tres estados. c. Dé un intervalo de confianza de aproximadamente 95% para la proporción de víctimas urbanas. d. Estime la cantidad total de víctimas urbanas. 23. Se va a tomar una muestra aleatoria simple estratificada de los clientes de un banco para tener información sobre actitudes y datos demográficos. La estratificación se basará en el estado de cuenta al 30 de junio de 2001. A continuación se presenta una distribución de frecuencias para cada estrato junto con las desviaciones estándar de los estados de cuenta por estrato.
a.
b.
Estrato ($)
Cuentas
Desviación estándar de los estados de cuenta
0.00–1 000.00 1 000.01–2 000.00 2 000.01–5 000.00 5 000.01–10 000.00 más de 10 000.00
3000 600 250 100 50
80 150 220 700 3000
Si el costo por unidad muestreada es aproximadamente el mismo en todos los estratos, determine el número total de personas que deberán incluirse en la muestra. Suponga que se desea una cota del error de estimación de la media poblacional de los estados de cuenta de B $20. Utilice el procedimiento de asignación de Neyman para determinar el número que debe ser muestreado de cada estrato.
22Ander(915-950).qxd 2/29/08 10:58 AM Page 950
950
Capítulo 22
Encuestas muestrales
24. Un organismo público está interesado en conocer más acerca de las personas que viven en casas de reposo en una determinada ciudad. En esa ciudad hay en total 100 casas de reposo que atienden a 4 800 personas y se ha tomado una muestra por conglomerados de seis casas de reposo.
Casa
Residentes
Edad promedio de los residentes
Residentes inválidos
1 2 3 4 5 6
14 7 96 23 71 29
61 74 78 69 73 84
12 2 30 8 10 22
a. b. c.
Estime la edad promedio de los residentes en las casas de reposo en esa ciudad. Dé un intervalo de confianza de aproximadamente 95% para la proporción de personas inválidas en las casas de reposo de esa ciudad. Estime el número total de personas inválidas en las casas de reposo de esa ciudad.
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 951
Apéndices APÉNDICE A Referencias y bibliografía APÉNDICE B Tablas APÉNDICE C Notación para la suma APÉNDICE D Soluciones para los autoexámenes y respuestas a los ejercicios con números pares APÉNDICE E Uso de las funciones de Excel APÉNDICE F Cálculo de los valores-p usando Minitab o Excel
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 952
Apéndice A: Referencias y bibliografía
General
Métodos no paramétricos
Bowerman, B. L. y O’Connell, R. T., Applied Statistics: Improving Business Processes, Irwin, 1996. Freedman, D., Pisani, R. y Purves, R., Statistics, 3a. ed., W. W. Norton, 1997. Hogg, R. V. y Craig, A. T., Introduction to Mathematical Statistics, 5a. ed., Prentice Hall, 1994. Hogg, R. V. y Tanis, E. A., Probability and Statistical Inference, 6a. ed., Prentice Hall, 2001. Joiner, B. L. y Ryan, B. F., Minitab Handbook, Brooks/Cole. 2000. Miller, I. y Miller, M. John E. Freund’s Mathematical Statistics, Prentice Hall, 1998. Moore, D. S. y McCabe, G. P., Introduction to the Practice of Statistics, 4a. ed., Freeman, 2003. Roberts, H., Data Analysis for Managers with Minitab, Scientific Press, 1991. Tanur, J. M. Statistics: A Guide to the Unknown, 4a. ed. Brooks/Cole, 2002. Tukey, J. W., Exploratory Data Analysis, Addison-Wesley, 1977.
Conover, W: J., Practical Nonparametric Statistics, 3a. ed., Wiley, 1998. Gibbons, J. D. y Chakraborti, S., Nonparametric Statistical Inference, 3a. ed., Marcel Dekker, 1992. Siegel, S. y Castellan, N. J., Nonparametric Statistics for the Behavioral Sciences, 2a. ed., McGraw-Hill, 1990. Sprent, P., Applied Non-Parametric Statistical Methods, CRC, 1993.
Diseño experimental
Deming, W. E. Quality, Productivity, and Competitive Position, MIT, 1982. Evans, J. R. y Lindsay, W. M., The Management and Control Quality, 5a. ed., South-Western, 2001. Gryna F. M. y Juran, I. M., Quality Planning and Analysis: From Product Development Through Use, 3a. ed., McGraw-Hill, 1993. Ishikawa, K., Introduction to Quality Control, Kluwer Academic, 1991. Montgomery, D. C., Introduction to Statistical Quality Control, 4a. ed., Wiley, 2000.
Cochran, W. G. y Cox, G. M., Experimental Designs, 2a. ed., Wiley, 1992. Hicks, C. R. y Turner, K. V. Fundamental Concepts in the Design of Experiments, 5a. ed., Oxford University Press, 1999. Montgomery, D. C., Design and Analysis of Experiments, 5a. ed., Wiley, 2000. Winer, B. J., Michels, K. M. y Brown, D. R., Statistical Principles in Experimental Design, 3a. ed., McGraw-Hill, 1991. Wu, C. F. y Hamada, M., Experiments: Planning Analysis and Parameter Optimization, Wiley, 2000.
Pronóstico Bowerman, B. L. y O’Connell, R. T., Forecasting and Time Series: An Applied Approach, 3a. ed., Brooks/Cole, 2000. Box, G. E. P., Reinsel, G. C. y Jenkins, G., Time Series Analysis: Forecasting and Control, 3a. ed., Prentice Hall, 1994. Makridakis, S., Wheelwright, S. C. y Hyndman, R. J., Forecasting: Methods and Applications, 3a. ed., Wiley, 1997.
Números índice U.S. Department of Commerce. Survey of Current Business. U.S. Department of Labor, Bureau of Labor Statistics. CPI Detailed Report. U.S. Department of Labor. Producer Price Indexes. 952
Probabilidad Hogg, R. V. y Tanis, E. A., Probability and Statistical Inference, 6a. ed., Prentice Hall, 2001. Ross, S. M., Introduction to Probability Models, 7a. ed., Academic Press, 2000. Wackerly, D. D., Mendelhall, W. y Scheaffer, R. L., Mathematical Statistics with Applications, 6a. ed., Duxbury Press, 2002.
Control de calidad
Análisis de regresión Belsley, D. A., Conditioning Diagnostics: Collinearity and Weak Data in Regression, Wiley, 1991. Chatterjee, S. y Price, B., Regression Analysis by Example, 3a. ed., Wiley, 1999. Draper, N. R. y Smith, H., Applied Regression Analysis, 3a. ed., Wiley, 1998. Graybill, F. A. y Iyer, H., Regression Analysis: Concepts and Applications, Duxbury Press, 1994. Hosmer, D. W. y Lemeshow, S., Applies Logistic Regression, 2a. ed., Wiley, 2000. Kleinbaum, D. G., Kupper, L. L. y Muller, K. E., Applied Regression Analysis and Other Multivariate Methods, 3a. ed., Duxbury Press, 1997.
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 953
Apéndice A
953
Referencias y bibliografía
Kutner, M. H., Nachtschiem, C. J., Wasserman, W. y Neter, J., Applied Linear Statistical Models, 4a. ed., Irwin, 1996. Mendenhall, M. y Sincich, T., A Second Course in Statistics: Regression Analysis, 5a. ed., Prentice Hall, 1996. Myers, R. H., Classical and Modern Regression with Applications, 2a. ed., PWS, 1990.
Análisis de decisión Chernoff, H. y Moses, L. E., Elementary Decision Theory, Dover, 1987. Clemen, R. T. y Reilly, T., Making Hard Decisions with Decision Tools, Duxbury Press, 2001. Goodwin, P. y Wright, G., Decision Analysis for Management Judgment, 2a. ed., Wiley, 1999.
Pratt, J. W., Raiffa, H. y Schlaifer, R., Introduction to Statistical Decision Theory, MIT Press, 1995. Raiffa, H., Decision Analysis, McGraw-Hill, 1997
Muestreo Cochran, W. G., Sampling Techniques, 3a. ed., Wiley, 1977. Deming, W. E., Some Theory of Sampling, Dover, 1984. Hansen, M. H., Hurwitz, W. N., Madow, W. G. y Hanson, M. N., Simple Survey Methods and Theory, Wiley, 1993. Kish, L., Survey Sampling, Wiley, 1995. Levy, P. S. y Lemeshow, S., Sampling of Populations: Methods and Applications, 3a. ed., Wiley, 1999. Scheaffer, R. L., Mendenhall, W. y Ott, L., Elementary Survey Sampling, 5a. ed., Duxbury Press, 1996.
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 954
Apéndice B: Tablas 954
Apéndices
TABLA 1
PROBABILIDADES ACUMULADAS EN LA DISTRIBUCIÓN NORMAL ESTÁNDAR
Las entradas que aparecen en la tabla dan el área bajo la curva y a la izquierda del valor de z. Por ejemplo, para z = – 0.85, la probabilidad acumulada es 0.1977.
Probabilidad acumulada
z
0
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
3.0
0.0013
0.0013
0.0013
0.0012
0.0012
0.0011
0.0011
0.0011
0.0010
0.0010
2.9 2.8 2.7 2.6 2.5
0.0019 0.0026 0.0035 0.0047 0.0062
0.0018 0.0025 0.0034 0.0045 0.0060
0.0018 0.0024 0.0033 0.0044 0.0059
0.0017 0.0023 0.0032 0.0043 0.0057
0.0016 0.0023 0.0031 0.0041 0.0055
0.0016 0.0022 0.0030 0.0040 0.0054
0.0015 0.0021 0.0029 0.0039 0.0052
0.0015 0.0021 0.0028 0.0038 0.0051
0.0014 0.0020 0.0027 0.0037 0.0049
0.0014 0.0019 0.0026 0.0036 0.0048
2.4 2.3 2.2 2.1 2.0
0.0082 0.0107 0.0139 0.0179 0.0228
0.0080 0.0104 0.0136 0.0174 0.0222
0.0078 0.0102 0.0132 0.0170 0.0217
0.0075 0.0099 0.0129 0.0166 0.0212
0.0073 0.0096 0.0125 0.0162 0.0207
0.0071 0.0094 0.0122 0.0158 0.0202
0.0069 0.0091 0.0119 0.0154 0.0197
0.0068 0.0089 0.0116 0.0150 0.0192
0.0066 0.0087 0.0113 0.0146 0.0188
0.0064 0.0084 0.0110 0.0143 0.0183
1.9 1.8 1.7 1.6 1.5
0.0287 0.0359 0.0446 0.0548 0.0668
0.0281 0.0351 0.0436 0.0537 0.0655
0.0274 0.0344 0.0427 0.0526 0.0643
0.0268 0.0336 0.0418 0.0516 0.0630
0.0262 0.0329 0.0409 0.0505 0.0618
0.0256 0.0322 0.0401 0.0495 0.0606
0.0250 0.0314 0.0392 0.0485 0.0594
0.0244 0.0307 0.0384 0.0475 0.0582
0.0239 0.0301 0.0375 0.0465 0.0571
0.0233 0.0294 0.0367 0.0455 0.0559
1.4 1.3 1.2 1.1 1.0
0.0808 0.0968 0.1151 0.1357 0.1587
0.0793 0.0951 0.1131 0.1335 0.1562
0.0778 0.0934 0.1112 0.1314 0.1539
0.0764 0.0918 0.1093 0.1292 0.1515
0.0749 0.0901 0.1075 0.1271 0.1492
0.0735 0.0885 0.1056 0.1251 0.1469
0.0721 0.0869 0.1038 0.1230 0.1446
0.0708 0.0853 0.1020 0.1210 0.1423
0.0694 0.0838 0.1003 0.1190 0.1401
0.0681 0.0823 0.0985 0.1170 0.1379
0.9 0.8 0.7 0.6 0.5
0.1841 0.2119 0.2420 0.2743 0.3085
0.1814 0.2090 0.2389 0.2709 0.3050
0.1788 0.2061 0.2358 0.2676 0.3015
0.1762 0.2033 0.2327 0.2643 0.2981
0.1736 0.2005 0.2296 0.2611 0.2946
0.1711 0.1977 0.2266 0.2578 0.2912
0.1685 0.1949 0.2236 0.2546 0.2877
0.1660 0.1922 0.2206 0.2514 0.2843
0.1635 0.1894 0.2177 0.2483 0.2810
0.1611 0.1867 0.2148 0.2451 0.2776
0.4 0.3 0.2 0.1 0.0
0.3446 0.3821 0.4207 0.4602 0.5000
0.3409 0.3783 0.4168 0.4562 0.4960
0.3372 0.3745 0.4129 0.4522 0.4920
0.3336 0.3707 0.4090 0.4483 0.4880
0.3300 0.3669 0.4052 0.4443 0.4840
0.3264 0.3632 0.4013 0.4404 0.4801
0.3228 0.3594 0.3974 0.4364 0.4761
0.3192 0.3557 0.3936 0.4325 0.4721
0.3156 0.3520 0.3897 0.4286 0.4681
0.3121 0.3483 0.3859 0.4247 0.4641
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 955
Apéndice B
955
Tablas
TABLA 1
PROBABILIDADES ACUMULADAS EN LA DISTRIBUCIÓN NORMAL ESTÁNDAR (continuación)
Probabilidad acumulada
0
Las entradas que aparecen en la tabla dan el área bajo la curva y a la izquierda del valor de z. Por ejemplo, para z = 1.25, la probabilidad acumulada es 0.8944.
z
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0 0.1 0.2 0.3 0.4
0.5000 0.5398 0.5793 0.6179 0.6554
0.5040 0.5438 0.5832 0.6217 0.6591
0.5080 0.5478 0.5871 0.6255 0.6628
0.5120 0.5517 0.5910 0.6293 0.6664
0.5160 0.5557 0.5948 0.6331 0.6700
0.5199 0.5596 0.5987 0.6368 0.6736
0.5239 0.5636 0.6026 0.6406 0.6772
0.5279 0.5675 0.6064 0.6443 0.6808
0.5319 0.5714 0.6103 0.6480 0.6844
0.5359 0.5753 0.6141 0.6517 0.6879
0.5 0.6 0.7 0.8 0.9
0.6915 0.7257 0.7580 0.7881 0.8159
0.6950 0.7291 0.7611 0.7910 0.8186
0.6985 0.7324 0.7642 0.7939 0.8212
0.7019 0.7357 0.7673 0.7967 0.8238
0.7054 0.7389 0.7704 0.7995 0.8264
0.7088 0.7422 0.7734 0.8023 0.8289
0.7123 0.7454 0.7764 0.8051 0.8315
0.7157 0.7486 0.7794 0.8078 0.8340
0.7190 0.7517 0.7823 0.8106 0.8365
0.7224 0.7549 0.7852 0.8133 0.8389
1.0 1.1 1.2 1.3 1.4
0.8413 0.8643 0.8849 0.9032 0.9192
0.8438 0.8665 0.8869 0.9049 0.9207
0.8461 0.8686 0.8888 0.9066 0.9222
0.8485 0.8708 0.8907 0.9082 0.9236
0.8508 0.8729 0.8925 0.9099 0.9251
0.8531 0.8749 0.8944 0.9115 0.9265
0.8554 0.8770 0.8962 0.9131 0.9279
0.8577 0.8790 0.8980 0.9147 0.9292
0.8599 0.8810 0.8997 0.9162 0.9306
0.8621 0.8830 0.9015 0.9177 0.9319
1.5 1.6 1.7 1.8 1.9
0.9332 0.9452 0.9554 0.9641 0.9713
0.9345 0.9463 0.9564 0.9649 0.9719
0.9357 0.9474 0.9573 0.9656 0.9726
0.9370 0.9484 0.9582 0.9664 0.9732
0.9382 0.9495 0.9591 0.9671 0.9738
0.9394 0.9505 0.9599 0.9678 0.9744
0.9406 0.9515 0.9608 0.9686 0.9750
0.9418 0.9525 0.9616 0.9693 0.9756
0.9429 0.9535 0.9625 0.9699 0.9761
0.9441 0.9545 0.9633 0.9706 0.9767
2.0 2.1 2.2 2.3 2.4
0.9772 0.9821 0.9861 0.9893 0.9918
0.9778 0.9826 0.9864 0.9896 0.9920
0.9783 0.9830 0.9868 0.9898 0.9922
0.9788 0.9834 0.9871 0.9901 0.9925
0.9793 0.9838 0.9875 0.9904 0.9927
0.9798 0.9842 0.9878 0.9906 0.9929
0.9803 0.9846 0.9881 0.9909 0.9931
0.9808 0.9850 0.9884 0.9911 0.9932
0.9812 0.9854 0.9887 0.9913 0.9934
0.9817 0.9857 0.9890 0.9913 0.9936
2.5 2.6 2.7 2.8 2.9
0.9938 0.9953 0.9965 0.9974 0.9981
0.9940 0.9955 0.9966 0.9975 0.9982
0.9941 0.9956 0.9967 0.9976 0.9982
0.9943 0.9957 0.9968 0.9977 0.9983
0.9945 0.9959 0.9969 0.9977 0.9984
0.9946 0.9960 0.9970 0.9978 0.9984
0.9948 0.9961 0.9971 0.9979 0.9985
0.9949 0.9962 0.9972 0.9979 0.9985
0.9951 0.9963 0.9973 0.9980 0.9986
0.9952 0.9964 0.9974 0.9981 0.9986
3.0
0.9986
0.9987
0.9987
0.9988
0.9988
0.9989
0.9989
0.9989
0.9990
0.9990
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 956
956
Apéndices
TABLA 2
DISTRIBUCIÓN t
Área o probabilidad
0
Grados de libertad
t
Las entradas que aparecen en la tabla dan los valores de t correspondientes a un área o probabilidad en la cola superior de la distribución t. Por ejemplo, para 10 grados de libertad y un área de 0.05 en la cola superior, t0.05 1.812.
Área en la cola superior 0.20
0.10
0.05
0.025
0.01
0.005
1 2 3 4
1.376 1.061 0.978 0.941
3.078 1.886 1.638 1.533
6.314 2.920 2.353 2.132
12.706 4.303 3.182 2.776
31.821 6.965 4.541 3.747
63.656 9.925 5.841 4.604
5 6 7 8 9
0.920 0.906 0.896 0.889 0.883
1.476 1.440 1.415 1.397 1.383
2.015 1.943 1.895 1.860 1.833
2.571 2.447 2.365 2.306 2.262
3.365 3.143 2.998 2.896 2.821
4.032 3.707 3.499 3.355 3.250
10 11 12 13 14
0.879 0.876 0.873 0.870 0.868
1.372 1.363 1.356 1.350 1.345
1.812 1.796 1.782 1.771 1.761
2.228 2.201 2.179 2.160 2.145
2.764 2.718 2.681 2.650 2.624
3.169 3.106 3.055 3.012 2.977
15 16 17 18 19
0.866 0.865 0.863 0.862 0.861
1.341 1.337 1.333 1.330 1.328
1.753 1.746 1.740 1.734 1.729
2.131 2.120 2.110 2.101 2.093
2.602 2.583 2.567 2.552 2.539
2.947 2.921 2.898 2.878 2.861
20 21 22 23 24
0.860 0.859 0.858 0.858 0.857
1.325 1.323 1.321 1.319 1.318
1.725 1.721 1.717 1.714 1.711
2.086 2.080 2.074 2.069 2.064
2.528 2.518 2.508 2.500 2.492
2.845 2.831 2.819 2.807 2.797
25 26 27 28 29
0.856 0.856 0.855 0.855 0.854
1.316 1.315 1.314 1.313 1.311
1.708 1.706 1.703 1.701 1.699
2.060 2.056 2.052 2.048 2.045
2.485 2.479 2.473 2.467 2.462
2.787 2.779 2.771 2.763 2.756
30 31 32 33 34
0.854 0.853 0.853 0.853 0.852
1.310 1.309 1.309 1.308 1.307
1.697 1.696 1.694 1.692 1.691
2.042 2.040 2.037 2.035 2.032
2.457 2.453 2.449 2.445 2.441
2.750 2.744 2.738 2.733 2.728
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 957
Apéndice B
TABLA 2
957
Tablas
DISTRIBUCIÓN t (continuación) Área en la cola superior
Grados de libertad
0.20
0.10
0.05
0.025
0.01
0.005
35 36 37 38 39
0.852 0.852 0.851 0.851 0.851
1.306 1.306 1.305 1.304 1.304
1.690 1.688 1.687 1.686 1.685
2.030 2.028 2.026 2.024 2.023
2.438 2.434 2.431 2.429 2.426
2.724 2.719 2.715 2.712 2.708
40 41 42 43 44
0.851 0.850 0.850 0.850 0.850
1.303 1.303 1.302 1.302 1.301
1.684 1.683 1.682 1.681 1.680
2.021 2.020 2.018 2.017 2.015
2.423 2.421 2.418 2.416 2.414
2.704 2.701 2.698 2.695 2.692
45 46 47 48 49
0.850 0.850 0.849 0.849 0.849
1.301 1.300 1.300 1.299 1.299
1.679 1.679 1.678 1.677 1.677
2.014 2.013 2.012 2.011 2.010
2.412 2.410 2.408 2.407 2.405
2.690 2.687 2.685 2.682 2.680
50 51 52 53 54
0.849 0.849 0.849 0.848 0.848
1.299 1.298 1.298 1.298 1.297
1.676 1.675 1.675 1.674 1.674
2.009 2.008 2.007 2.006 2.005
2.403 2.402 2.400 2.399 2.397
2.678 2.676 2.674 2.672 2.670
55 56 57 58 59
0.848 0.848 0.848 0.848 0.848
1.297 1.297 1.297 1.296 1.296
1.673 1.673 1.672 1.672 1.671
2.004 2.003 2.002 2.002 2.001
2.396 2.395 2.394 2.392 2.391
2.668 2.667 2.665 2.663 2.662
60 61 62 63 64
0.848 0.848 0.847 0.847 0.847
1.296 1.296 1.295 1.295 1.295
1.671 1.670 1.670 1.669 1.669
2.000 2.000 1.999 1.998 1.998
2.390 2.389 2.388 2.387 2.386
2.660 2.659 2.657 2.656 2.655
65 66 67 68 69
0.847 0.847 0.847 0.847 0.847
1.295 1.295 1.294 1.294 1.294
1.669 1.668 1.668 1.668 1.667
1.997 1.997 1.996 1.995 1.995
2.385 2.384 2.383 2.382 2.382
2.654 2.652 2.651 2.650 2.649
70 71 72 73 74
0.847 0.847 0.847 0.847 0.847
1.294 1.294 1.293 1.293 1.293
1.667 1.667 1.666 1.666 1.666
1.994 1.994 1.993 1.993 1.993
2.381 2.380 2.379 2.379 2.378
2.648 2.647 2.646 2.645 2.644
75 76 77 78 79
0.846 0.846 0.846 0.846 0.846
1.293 1.293 1.293 1.292 1.292
1.665 1.665 1.665 1.665 1.664
1.992 1.992 1.991 1.991 1.990
2.377 2.376 2.376 2.375 2.374
2.643 2.642 2.641 2.640 2.639
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 958
958
Apéndices
TABLA 2
Grados de libertad
DISTRIBUCIÓN t (continuación) Área en la cola superior 0.20
0.10
0.05
0.025
0.01
0.005
80 81 82 83 84
0.846 0.846 0.846 0.846 0.846
1.292 1.292 1.292 1.292 1.292
1.664 1.664 1.664 1.663 1.663
1.990 1.990 1.989 1.989 1.989
2.374 2.373 2.373 2.372 2.372
2.639 2.638 2.637 2.636 2.636
85 86 87 88 89
0.846 0.846 0.846 0.846 0.846
1.292 1.291 1.291 1.291 1.291
1.663 1.663 1.663 1.662 1.662
1.988 1.988 1.988 1.987 1.987
2.371 2.370 2.370 2.369 2.369
2.635 2.634 2.634 2.633 2.632
90 91 92 93 94
0.846 0.846 0.846 0.846 0.845
1.291 1.291 1.291 1.291 1.291
1.662 1.662 1.662 1.661 1.661
1.987 1.986 1.986 1.986 1.986
2.368 2.368 2.368 2.367 2.367
2.632 2.631 2.630 2.630 2.629
95 96 97 98 99 100
0.845 0.845 0.845 0.845 0.845 0.845 0.842
1.291 1.290 1.290 1.290 1.290 1.290 1.282
1.661 1.661 1.661 1.661 1.660 1.660 1.645
1.985 1.985 1.985 1.984 1.984 1.984 1.960
2.366 2.366 2.365 2.365 2.364 2.364 2.326
2.629 2.628 2.627 2.627 2.626 2.626 2.576
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 959
Apéndice B
TABLA 3
959
Tablas
DISTRIBUCIÓN CHI-CUADRADA
Área o probabilidad
χα2
Las entradas que aparecen en la tabla dan los valores de χ α2 , donde α es el área o probabilidad en la cola superior de la distribución chi-cuadrada. Por ejemplo, para 10 grados de libertad y un área de 0.01 en la cola superior, χ 0.012 23.209.
Grados de libertad
Áreas en la cola superior 0.995
0.99
0.975
0.95
0.90
0.10
0.05
0.025
0.01
0.005
1 2 3 4 5
0.000 0.010 0.072 0.207 0.412
0.000 0.020 0.115 0.297 0.554
0.001 0.051 0.216 0.484 0.831
0.004 0.103 0.352 0.711 1.145
0.016 0.211 0.584 1.064 1.610
2.706 4.605 6.251 7.779 9.236
3.841 5.991 7.815 9.488 11.070
5.024 7.378 9.348 11.143 12.832
6.635 9.210 11.345 13.277 15.086
7.879 10.597 12.838 14.860 16.750
6 7 8 9 10
0.676 0.989 1.344 1.735 2.156
0.872 1.239 1.647 2.088 2.558
1.237 1.690 2.180 2.700 3.247
1.635 2.167 2.733 3.325 3.940
2.204 2.833 3.490 4.168 4.865
10.645 12.017 13.362 14.684 15.987
12.592 14.067 15.507 16.919 18.307
14.449 16.013 17.535 19.023 20.483
16.812 18.475 20.090 21.666 23.209
18.548 20.278 21.955 23.589 25.188
11 12 13 14 15
2.603 3.074 3.565 4.075 4.601
3.053 3.571 4.107 4.660 5.229
3.816 4.404 5.009 5.629 6.262
4.575 5.226 5.892 6.571 7.261
5.578 6.304 7.041 7.790 8.547
17.275 18.549 19.812 21.064 22.307
19.675 21.026 22.362 23.685 24.996
21.920 23.337 24.736 26.119 27.488
24.725 26.217 27.688 29.141 30.578
26.757 28.300 29.819 31.319 32.801
16 17 18 19 20
5.142 5.697 6.265 6.844 7.434
5.812 6.408 7.015 7.633 8.260
6.908 7.564 8.231 8.907 9.591
7.962 8.672 9.390 10.117 10.851
9.312 10.085 10.865 11.651 12.443
23.542 24.769 25.989 27.204 28.412
26.296 27.587 28.869 30.144 31.410
28.845 30.191 31.526 32.852 34.170
32.000 33.409 34.805 36.191 37.566
34.267 35.718 37.156 38.582 39.997
21 22 23 24
8.034 8.643 9.260 9.886
8.897 9.542 10.196 10.856
10.283 10.982 11.689 12.401
11.591 12.338 13.091 13.848
13.240 14.041 14.848 15.659
29.615 30.813 32.007 33.196
32.671 33.924 35.172 36.415
35.479 36.781 38.076 39.364
38.932 40.289 41.638 42.980
41.401 42.796 44.181 45.558
25 26 27 28 29
10.520 11.160 11.808 12.461 13.121
11.524 12.198 12.878 13.565 14.256
13.120 13.844 14.573 15.308 16.047
14.611 15.379 16.151 16.928 17.708
16.473 17.292 18.114 18.939 19.768
34.382 35.563 36.741 37.916 39.087
37.652 38.885 40.113 41.337 42.557
40.646 41.923 43.195 44.461 45.722
44.314 45.642 46.963 48.278 49.588
46.928 48.290 49.645 50.994 52.335
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 960
960
Apéndices
TABLA 3
DISTRIBUCIÓN CHI-CUADRADA (continuación) Áreas en la cola superior
Grados de libertad
0.995
0.99
0.975
0.95
0.90
0.10
0.05
0.025
0.01
0.005
30 35 40 45 50
13.787 17.192 20.707 24.311 27.991
14.953 18.509 22.164 25.901 29.707
16.791 20.569 24.433 28.366 32.357
18.493 22.465 26.509 30.612 34.764
20.599 24.797 29.051 33.350 37.689
40.256 46.059 51.805 57.505 63.167
43.773 49.802 55.758 61.656 67.505
46.979 53.203 59.342 65.410 71.420
50.892 57.342 63.691 69.957 76.154
53.672 60.275 66.766 73.166 79.490
55 60 65 70 75
31.735 35.534 39.383 43.275 47.206
33.571 37.485 41.444 45.442 49.475
36.398 40.482 44.603 48.758 52.942
38.958 43.188 47.450 51.739 56.054
42.060 46.459 50.883 55.329 59.795
68.796 74.397 79.973 85.527 91.061
73.311 79.082 84.821 90.531 96.217
77.380 83.298 89.177 95.023 100.839
82.292 88.379 94.422 100.425 106.393
85.749 91.952 98.105 104.215 110.285
80 85 90 95 100
51.172 55.170 59.196 63.250 67.328
53.540 57.634 61.754 65.898 70.065
57.153 61.389 65.647 69.925 74.222
60.391 64.749 69.126 73.520 77.929
64.278 68.777 73.291 77.818 82.358
96.578 102.079 107.565 113.038 118.498
101.879 107.522 113.145 118.752 124.342
106.629 112.393 118.136 123.858 129.561
112.329 118.236 124.116 129.973 135.807
116.321 122.324 128.299 134.247 140.170
DISTRIBUCIÓN F
0
Fα
Área o probabilidad
Área en la cola superior
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
Grados de libertad en el denominador
1
2
3
4
5
4.06 6.61. 10.01 16.26
4.54 7.71 12.22 21.20
5.54 10.13 17.44 34.12
8.53 18.51 38.51 98.50
39.86 161.45 647.79 4052.18
1
3.78 5.79 8.43 13.27
4.32 6.94 10.65 18.00
5.46 9.55 16.04 30.82
9.00 19.00 39.00 99.00
49.50 199.50 799.48 4999.34
2
3.62 5.41 7.76 12.06
4.19 6.59 9.98 16.69
5.39 9.28 15.44 29.46
9.16 19.16 39.17 99.16
53.59 215.71 864.15 5403.53
3
3.52 5.19 7.39 11.39
4.11 6.39 9.60 15.98
5.34 9.12 15.10 28.71
9.24 19.25 39.25 99.25
55.83 224.58 899.60 5624.26
4
3.45 5.05 7.15 10.97
4.05 6.26 9.36 15.52
5.31 9.01 14.88 28.24
9.29 19.30 39.30 99.30
57.24 230.16 921.83 5763.96
5
3.40 4.95 6.98 10.67
4.01 6.16 9.20 15.21
5.28 8.94 14.73 27.91
9.33 19.33 39.33 99.33
58.20 233.99 937.11 5858.95
6
3.37 4.88 6.85 10.46
3.98 6.09 9.07 14.98
5.27 8.89 14.62 27.67
9.35 19.35 39.36 99.36
58.91 236.77 948.20 5928.33
7
3.34 4.82 6.76 10.29
3.95 6.04 8.98 14.80
5.25 8.85 14.54 27.49
9.37 19.37 39.37 99.38
59.44 238.88 956.64 5980.95
8
3.32 4.77 6.68 10.16
3.94 6.00 8.90 14.66
5.24 8.81 14.47 27.34
9.38 19.38 39.39 99.39
59.86 240.54 963.28 6022.40
9
3.30 4.74 6.62 10.05
3.92 5.96 8.84 14.55
5.23 8.79 14.42 27.23
9.39 19.40 39.40 99.40
60.19 241.88 968.63 6055.93
10
3.324 4.62 6.43 9.72
3.87 5.86 8.66 14.20
5.20 8.70 14.25 26.87
9.42 19.43 39.43 99.43
61.22 245.95 984.87 6156.97
15
Grados de libertad en el numerador
3.21 4.56 6.33 9.55
3.84 5.80 8.56 14.02
5.18 8.66 14.17 26.69
9.44 19.45 39.45 99.45
61.74 248.02 993.08 6208.66
20
3.19 4.52 6.27 9.45
3.83 5.77 8.50 13.91
5.17 8.63 14.12 26.58
9.45 19.46 39.46 99.46
62.05 249.26 998.09 6239.86
25
3.17 4.50 6.23 9.38
3.82 5.75 8.46 13.84
5.17 8.62 14.08 26.50
9.46 19.46 39.46 99.47
62.26 250.10 1001.40 6260.35
30
3.16 4.46 6.18 9.29
3.80 5.72 8.41 13.75
5.16 8.59 14.04 26.41
9.47 19.47 39.47 99.48
62.53 251.14 1005.60 6286.43
40
3.14 4.43 6.12 9.20
3.79 5.69 8.36 13.65
5.15 8.57 13.99 26.32
9.47 19.48 39.48 99.48
62.79 252.20 1009.79 6312.97
60
3.13 4.41 6.08 9.13
3.78 5.66 8.32 13.58
5.14 8.55 13.96 26.24
9.48 19.49 39.49 99.49
63.01 253.04 1013.16 6333.92
100
3.11 4.37 6.02 9.03
3.76 5.63 8.26 13.47
5.13 8.53 13.91 26.14
9.49 19.49 39.50 99.50
63.30 254.19 1017.76 6362.80
1000
Las entradas que aparecen en la tabla dan los valores de Fα, donde α es el área o probabilidad en la cola superior de la distribución F. Por ejemplo, para 4 grados de libertad en el numerador, 8 grados de libertad en el denominador y un área de 0.05 en la cola superior, F0.05 3.84.
TABLA 4
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 961
961
962
Área en la cola superior
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
6
7
8
9
10
11
12
13
14
15
3.07 4.54 6.20 8.68
3.10 4.60 6.30 8.86
3.14 4.67 6.41 9.07
3.18 4.75 6.55 9.33
3.23 4.84 6.72 9.65
3.29 4.96 6.94 10.04
3.36 5.12 7.21 10.56
3.46 5.32 7.57 11.26
3.59 5.59 8.07 12.25
3.78 5.99 8.81 13.75
1
2.70 3.68 4.77 6.36
2.73 3.74 4.86 6.51
2.76 3.81 4.97 6.70
2.81 3.89 5.10 6.93
2.86 3.98 5.26 7.21
2.92 4.10 5.46 7.56
3.01 4.26 5.71 8.02
3.11 4.46 6.06 8.65
3.26 4.74 6.54 9.55
3.46 5.14 7.26 10.92
2
2.49 3.29 4.15 5.42
2.52 3.34 4.24 5.56
2.56 3.41 4.35 5.74
2.61 3.49 4.47 5.95
2.66 3.59 4.63 6.22
2.73 3.71 4.83 6.55
2.81 3.86 5.08 6.99
2.92 4.07 5.42 7.59
3.07 4.35 5.89 8.45
3.29 4.76 6.60 9.78
3
DISTRIBUCIÓN F (continuación)
Grados de libertad en el denominador
TABLA 4
2.36 3.06 3.80 4.89
2.39 3.11 3.89 5.04
2.43 3.18 4.00 5.21
2.48 3.26 4.12 5.41
2.54 3.36 4.28 5.67
2.61 3.48 4.47 5.99
2.69 3.63 4.72 6.42
2.81 3.84 5.05 7.01
2.96 4.12 5.52 7.85
3.18 4.53 6.23 9.15
4
2.27 2.90 3.58 4.56
2.31 2.96 3.66 4.69
2.35 3.03 3.77 4.86
2.39 3.11 3.89 5.06
2.45 3.20 4.04 5.32
2.52 3.33 4.24 5.64
2.61 3.48 4.48 6.06
2.73 3.69 4.82 6.63
2.88 3.97 5.29 7.46
3.11 4.39 5.99 8.75
5
2.21 2.79 3.41 4.32
2.24 2.85 3.50 4.46
2.28 2.92 3.60 4.62
2.33 3.00 3.73 4.82
2.39 3.09 3.88 5.07
2.46 3.22 4.07 5.39
2.55 3.37 4.32 5.80
2.67 3.58 4.65 6.37
2.83 3.87 5.12 7.19
3.05 4.28 5.82 8.47
6
2.16 2.71 3.29 4.14
2.19 2.76 3.38 4.28
2.23 2.83 3.48 4.44
2.28 2.91 3.61 4.64
2.34 3.01 3.76 4.89
2.41 3.14 3.95 5.20
2.51 3.29 4.20 5.61
2.62 3.50 4.53 6.18
2.78 3.79 4.99 6.99
3.01 4.21 5.70 8.26
7
2.12 2.64 3.20 4.00
2.15 2.70 3.29 4.14
2.20 2.77 3.39 4.30
2.24 2.85 3.51 4.50
2.30 2.95 3.66 4.74
2.38 3.07 3.85 5.06
2.47 3.23 4.10 5.47
2.59 3.44 4.43 6.03
2.75 3.73 4.90 6.84
2.98 4.15 5.60 8.10
8
2.09 2.59 3.12 3.89
2.12 2.65 3.21 4.03
2.16 2.71 3.31 4.19
2.21 2.80 3.44 4.39
2.27 2.90 3.59 4.63
2.35 3.02 3.78 4.94
2.44 3.18 4.03 5.35
2.56 3.39 4.36 5.91
2.72 3.68 4.82 6.72
2.96 4.10 5.52 7.98
9
2.06 2.54 3.06 3.80
2.10 2.60 3.15 3.94
2.14 2.67 3.25 4.10
2.19 2.75 3.37 4.30
2.25 2.85 3.53 4.54
2.32 2.98 3.72 4.85
2.42 3.14 3.96 5.26
2.54 3.35 4.30 5.81
2.70 3.64 4.76 6.62
2.94 4.06 5.46 7.87
10
1.97 2.40 2.86 3.52
2.01 2.46 2.95 3.66
2.05 2.53 3.05 3.82
2.10 2.62 3.18 4.01
2.17 2.72 3.33 4.25
2.24 2.85 3.52 4.56
2.34 3.01 3.77 4.96
2.46 3.22 4.10 5.52
2.63 3.51 4.57 6.31
2.87 3.94 5.27 7.56
15
Grados de libertad en el numerador
1.92 2.33 2.76 3.37
1.96 2.39 2.84 3.51
2.01 2.46 2.95 3.66
2.06 2.54 3.07 3.86
2.12 2.65 3.23 4.10
2.20 2.77 3.42 4.41
2.30 2.94 3.67 4.81
2.42 3.15 4.00 5.36
2.59 3.44 4.47 6.16
2.84 3.87 5.17 7.40
20
1.89 2.28 2.69 3.28
1.93 2.34 2.78 3.41
1.98 2.41 2.88 3.57
2.03 2.50 3.01 3.76
2.10 2.60 3.16 4.01
2.17 2.73 3.35 4.31
2.27 2.89 3.60 4.71
2.40 3.11 3.94 5.26
2.57 3.40 4.40 6.06
2.81 3.83 5.11 7.30
25
1.87 2.25 2.64 3.21
1.99 2.31 2.73 3.35
1.96 2.38 2.84 3.51
2.01 2.47 2.96 3.70
2.08 2.57 3.12 3.94
2.16 2.70 3.31 4.25
2.25 2.86 3.56 4.65
2.38 3.08 3.89 5.20
2.56 3.38 4.36 5.99
2.80 3.81 5.07 7.23
30
1.85 2.20 2.59 3.13
1.89 2.27 2.67 3.27
1.93 2.34 2.78 3.43
1.99 2.43 2.91 3.62
2.05 2.53 3.06 3.86
2.13 2.66 3.26 4.17
2.23 2.83 3.51 4.57
2.36 3.04 3.84 5.12
2.54 3.34 4.31 5.91
2.78 3.77 5.01 7.14
40
1.82 2.16 2.52 3.05
1.86 2.22 2.61 3.18
1.90 2.30 2.72 3.34
1.96 2.38 2.85 3.54
2.03 2.49 3.00 3.78
2.11 2.62 3.20 4.08
2.21 2.79 3.45 4.48
2.34 3.01 3.78 5.03
2.51 3.30 4.25 5.82
2.76 3.74 4.96 7.06
60
1.79 2.12 2.47 2.98
1.83 2.19 2.56 3.11
1.88 2.26 2.67 3.27
1.94 2.35 2.80 3.47
2.01 2.46 2.96 3.71
2.09 2.59 3.15 4.01
2.19 2.76 3.40 4.41
2.32 2.97 3.74 4.96
2.50 3.27 4.21 5.75
2.75 3.71 4.92 6.99
100
1.76 2.07 2.40 2.88
1.80 2.14 2.50 3.02
1.85 2.21 2.60 3.18
1.91 2.30 2.73 3.37
1.98 2.41 2.89 3.61
2.06 2.54 3.09 3.92
2.16 2.71 3.34 4.32
2.30 2.93 3.68 4.87
2.47 3.23 4.15 5.66
2.72 3.67 4.86 6.89
1000
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 962
Área en la cola superior
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
Grados de libertad en el denominador
16
17
18
19
20
21
22
23
24
2.93 4.26 5.72 7.82
2.94 4.28 5.75 7.88
2.95 4.30 5.79 7.95
2.96 4.32 5.83 8.02
2.97 4.35 5.87 8.10
2.99 4.38 5.92 8.18
3.01 4.41 5.98 8.29
3.03 4.45 6.04 8.40
3.05 4.49 6.12 8.53
1
2.54 3.40 4.32 5.61
2.55 3.42 4.35 5.66
2.56 3.44 4.38 5.72
2.57 3.47 4.42 5.78
2.59 3.49 4.46 5.85
2.61 3.52 4.51 5.93
2.62 3.55 4.56 6.01
2.64 3.59 4.62 6.11
2.67 3.63 4.69 6.23
2
2.33 3.01 3.72 4.72
2.34 3.03 3.75 4.76
2.35 3.05 3.78 4.82
2.36 3.07 3.82 4.87
2.38 3.10 3.86 4.94
2.40 3.13 3.90 5.01
2.42 3.16 3.95 5.09
2.44 3.20 4.01 5.19
2.46 3.24 4.08 5.29
3
2.19 2.78 3.38 4.22
2.21 2.80 3.41 4.26
2.22 2.82 3.44 4.31
2.23 2.84 3.48 4.37
2.25 2.87 3.51 4.43
2.27 2.90 3.56 4.50
2.29 2.93 3.61 4.58
2.31 2.96 3.66 4.67
2.33 3.01 3.73 4.77
4
2.10 2.62 3.15 3.90
2.11 2.64 3.18 3.94
2.13 2.66 3.22 3.99
2.14 2.68 3.25 4.04
2.16 2.71 3.29 4.10
2.18 2.74 3.33 4.17
2.20 2.77 3.38 4.25
2.22 2.81 3.44 4.34
2.24 2.85 3.50 4.44
5
2.04 2.51 2.99 3.67
2.05 2.53 3.02 3.71
2.06 2.55 3.05 3.76
2.08 2.57 3.09 3.81
2.09 2.60 3.13 3.87
2.11 2.63 3.17 3.94
2.13 2.66 3.22 4.01
2.15 2.70 3.28 4.10
2.18 2.74 3.34 4.20
6
1.98 2.42 2.87 3.50
1.99 2.44 2.90 3.54
2.01 2.46 2.93 3.59
2.02 2.49 2.97 3.64
2.04 2.51 3.01 3.70
2.06 2.54 3.05 3.77
2.08 2.58 3.10 3.84
2.10 2.61 3.16 3.93
2.13 2.66 3.22 4.03
7
1.94 2.36 2.78 3.36
1.95 2.37 2.81 3.41
1.97 2.40 2.84 3.45
1.98 2.42 2.87 3.51
2.00 2.45 2.91 3.56
2.02 2.48 2.96 3.63
2.04 2.51 3.01 3.71
2.06 2.55 3.06 3.79
2.09 2.59 3.12 3.89
8
1.91 2.30 2.70 3.26
1.92 2.32 2.73 3.30
1.93 2.34 2.76 3.35
1.95 2.37 2.80 3.40
1.96 2.39 2.84 3.46
1.98 2.42 2.88 3.52
2.00 2.46 2.93 3.60
2.03 2.49 2.98 3.68
2.06 2.54 3.05 3.78
9
1.88 2.25 2.64 3.17
1.89 2.27 2.67 3.21
1.90 2.30 2.70 3.26
1.92 2.32 2.73 3.31
1.94 2.35 2.77 3.37
1.96 2.38 2.82 3.43
1.98 2.41 2.87 3.51
2.00 2.45 2.92 3.59
2.03 2.49 2.99 3.69
10
1.78 2.11 2.44 2.89
1.80 2.13 2.47 2.93
1.81 2.15 2.50 2.98
1.83 2.18 2.53 3.03
1.84 2.20 2.57 3.09
1.86 2.23 2.62 3.15
1.89 2.27 2.67 3.23
1.91 2.31 2.72 3.31
1.94 2.35 2.79 3.41
15
Grados de libertad en el numerador
1.73 2.03 2.33 2.74
1.74 2.05 2.36 2.78
1.76 2.07 2.39 2.83
1.78 2.10 2.42 2.88
1.79 2.12 2.46 2.94
1.81 2.16 2.51 3.00
1.84 2.19 2.56 3.08
1.86 2.23 2.62 3.16
1.89 2.28 2.68 3.26
20
1.70 1.97 2.26 2.64
1.71 2.00 2.29 2.69
1.73 2.02 2.32 2.73
1.74 2.05 2.36 2.79
1.76 2.07 2.40 2.84
1.78 2.11 2.44 2.91
1.80 2.14 2.49 2.98
1.83 2.18 2.55 3.07
1.86 2.23 2.61 3.16
25
1.67 1.94 2.21 2.58
1.69 1.96 2.24 2.62
1.70 1.98 2.27 2.67
1.72 2.01 2.31 2.72
1.74 2.04 2.35 2.78
1.76 2.07 2.39 2.84
1.78 2.11 2.44 2.92
1.81 2.15 2.50 3.00
1.84 2.19 2.57 3.10
30
1.64 1.89 2.15 2.49
1.66 1.91 2.18 2.54
1.67 1.94 2.21 2.58
1.69 1.96 2.25 2.64
1.71 1.99 2.29 2.69
1.73 2.03 2.33 2.76
1.75 2.06 2.38 2.84
1.78 2.10 2.44 2.92
1.81 2.15 2.51 3.02
40
1.61 1.84 2.08 2.40
1.62 1.86 2.11 2.45
1.64 1.89 2.14 2.50
1.66 1.92 2.18 2.55
1.68 1.95 2.22 2.61
1.70 1.98 2.27 2.67
1.72 2.02 2.32 2.75
1.75 2.06 2.38 2.83
1.78 2.11 2.45 2.93
60
1.58 1.80 2.02 2.33
1.59 1.82 2.06 2.37
1.61 1.85 2.09 2.42
1.63 1.88 2.13 2.48
1.65 1.91 2.17 2.54
1.67 1.94 2.22 2.60
1.70 1.98 2.27 2.68
1.73 2.02 2.33 2.76
1.76 2.07 2.40 2.86
100
1.54 1.74 1.94 2.22
1.55 1.76 1.98 2.27
1.57 1.79 2.01 2.32
1.59 1.82 2.05 2.37
1.61 1.85 2.09 2.43
1.64 1.88 2.14 2.50
1.66 1.92 2.20 2.58
1.69 1.97 2.26 2.66
1.72 2.02 2.32 2.76
1000
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 963
963
964
Área en la cola superior
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
0.10 0.05 0.025 0.01
25
26
27
28
29
30
40
60
100
1000
2.71 3.85 5.04 6.66
2.76 3.94 5.18 6.90
2.79 4.00 5.29 7.08
2.84 4.08 5.42 7.31
2.88 4.17 5.57 7.56
2.89 4.18 5.59 7.60
2.89 4.20 5.61 7.64
2.90 4.21 5.63 7.68
2.91 4.23 5.66 7.72
2.92 4.24 5.69 7.77
1
2.31 3.00 3.70 4.63
2.36 3.09 3.83 4.82
2.39 3.15 3.93 4.98
2.44 3.23 4.05 5.18
2.49 3.32 4.18 5.39
2.50 3.33 4.20 5.42
2.50 3.34 4.22 5.45
2.51 3.35 4.24 5.49
2.52 3.37 4.27 5.53
2.53 3.39 4.29 5.57
2
2.09 2.61 3.13 3.80
2.14 2.70 3.25 3.98
2.18 2.76 3.34 4.13
2.23 2.84 3.46 4.31
2.28 2.92 3.59 4.51
2.28 2.93 3.61 4.54
2.29 2.95 3.63 4.57
2.30 2.96 3.65 4.60
2.31 2.98 3.67 4.64
2.32 2.99 3.69 4.68
3
DISTRIBUCIÓN F (continuación)
Grados de libertad en el denominador
TABLA 4
1.95 2.38 2.80 3.34
2.00 2.46 2.92 3.51
2.04 2.53 3.01 3.65
2.09 2.61 3.13 3.83
2.14 2.69 3.25 4.02
2.15 2.70 3.27 4.04
2.16 2.71 3.29 4.07
2.17 2.73 3.31 4.11
2.17 2.74 3.33 4.14
2.18 2.76 3.35 4.18
4
1.85 2.22 2.58 3.04
1.91 2.31 2.70 3.21
1.95 2.37 2.79 3.34
2.00 2.45 2.90 3.51
2.05 2.53 3.03 3.70
2.06 2.55 3.04 3.73
2.06 2.56 3.06 3.75
2.07 2.57 3.08 3.78
2.08 2.59 3.10 3.82
2.09 2.60 3.13 3.85
5
1.78 2.11 2.42 2.82
1.83 2.19 2.54 2.99
1.87 2.25 2.63 3.12
1.93 2.34 2.74 3.29
1.98 2.42 2.87 3.47
1.99 2.43 2.88 3.50
2.00 2.45 2.90 3.53
2.00 2.46 2.92 3.56
2.01 2.47 2.94 3.59
2.02 2.49 2.97 3.63
6
1.72 2.02 2.30 2.66
1.78 2.10 2.42 2.82
1.82 2.17 2.51 2.95
1.87 2.25 2.62 3.12
1.93 2.33 2.75 3.30
1.93 2.35 2.76 3.33
1.94 2.36 2.78 3.36
1.95 2.37 2.80 3.39
1.96 2.39 2.82 3.42
1.97 2.40 2.85 3.46
7
1.68 1.95 2.20 2.53
1.73 2.03 2.32 2.69
1.77 2.10 2.41 2.82
1.83 2.18 2.53 2.99
1.88 2.27 2.65 3.17
1.89 2.28 2.67 3.20
1.90 2.29 2.69 3.23
1.91 2.31 2.71 3.26
1.92 2.32 2.73 3.29
1.93 2.34 2.75 3.32
8
1.64 1.89 2.13 2.43
1.69 1.97 2.24 2.59
1.74 2.04 2.33 2.72
1.79 2.12 2.45 2.89
1.85 2.21 2.57 3.07
1.86 2.22 2.59 3.09
1.87 2.24 2.61 3.12
1.87 2.25 2.63 3.15
1.88 2.27 2.65 3.18
1.89 2.28 2.68 3.22
9
1.61 1.84 2.06 2.34
1.66 1.93 2.18 2.50
1.71 1.99 2.27 2.63
1.76 2.08 2.39 2.80
1.82 2.16 2.51 2.98
1.83 2.18 2.53 3.00
1.84 2.19 2.55 3.03
1.85 2.20 2.57 3.06
1.86 2.22 2.59 3.09
1.87 2.24 2.61 3.13
10
1.49 1.68 1.85 2.06
1.56 1.77 1.97 2.22
1.60 1.84 2.06 2.35
1.66 1.92 2.18 2.52
1.72 2.01 2.31 2.70
1.73 2.03 2.32 2.73
1.74 2.04 2.34 2.75
1.75 2.06 2.36 2.78
1.76 2.07 2.39 2.81
1.77 2.09 2.41 2.85
15
Grados de libertad en el numerador
1.43 1.58 1.72 1.90
1.49 1.68 1.85 2.07
1.54 1.75 1.94 2.20
1.61 1.84 2.07 2.37
1.67 1.93 2.20 2.55
1.68 1.94 2.21 2.57
1.69 1.96 2.23 2.60
1.70 1.97 2.25 2.63
1.71 1.99 2.28 2.66
1.72 2.01 2.30 2.70
20
1.38 1.52 1.64 1.79
1.45 1.62 1.77 1.97
1.50 1.69 1.87 2.10
1.57 1.78 1.99 2.27
1.63 1.88 2.12 2.45
1.64 1.89 2.14 2.48
1.65 1.91 2.16 2.51
1.66 1.92 2.18 2.54
1.67 1.94 2.21 2.57
1.68 1.96 2.23 2.60
25
1.35 1.47 1.58 1.72
1.42 1.57 1.71 1.89
1.48 1.65 1.82 2.03
1.54 1.74 1.94 2.20
1.61 1.84 2.07 2.39
1.62 1.85 2.09 2.41
1.63 1.87 2.11 2.44
1.64 1.88 2.13 2.47
1.65 1.90 2.16 2.50
1.66 1.92 2.18 2.54
30
1.30 1.41 1.50 1.61
1.38 1.52 1.64 1.80
1.44 1.59 1.74 1.94
1.51 1.69 1.88 2.11
1.57 1.79 2.01 2.30
1.58 1.81 2.03 2.33
1.59 1.82 2.05 2.35
1.60 1.84 2.07 2.38
1.61 1.85 2.09 2.42
1.63 1.87 2.12 2.45
40
1.25 1.33 1.41 1.50
1.34 1.45 1.56 1.69
1.40 1.53 1.67 1.84
1.47 1.64 1.80 2.02
1.54 1.74 1.94 2.21
1.55 1.75 1.96 2.23
1.56 1.77 1.98 2.26
1.57 1.79 2.00 2.29
1.58 1.80 2.03 2.33
1.59 1.82 2.05 2.36
60
1.20 1.26 1.32 1.38
1.29 1.39 1.48 1.60
1.36 1.48 1.60 1.75
1.43 1.59 1.74 1.94
1.51 1.70 1.88 2.13
1.52 1.71 1.90 2.16
1.53 1.73 1.92 2.19
1.54 1.74 1.94 2.22
1.55 1.76 1.97 2.25
1.56 1.78 2.00 2.29
100
1.08 1.11 1.13 1.16
1.22 1.30 1.36 1.45
1.30 1.40 1.49 1.62
1.38 1.52 1.65 1.82
1.46 1.63 1.80 2.02
1.47 1.65 1.82 2.05
1.48 1.66 1.84 2.08
1.50 1.68 1.86 2.11
1.51 1.70 1.89 2.14
1.52 1.72 1.91 2.18
1000
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 964
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 965
Apéndice B
965
Tablas
TABLA 5 PROBABILIDADES BINOMIALES Las entradas que aparecen en la tabla dan la probabilidad de x éxitos en n ensayos en un experimento binomial, donde p es la probabilidad de un éxito en un ensayo. Por ejemplo, para seis ensayos y p 0.05, la probabilidad de dos éxitos es 0.0305. p n
x
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
2
0 1 2
0.9801 0.0198 0.0001
0.9604 0.0392 0.0004
0.9409 0.0582 0.0009
0.9216 0.0768 0.0016
0.9025 0.0950 0.0025
0.8836 0.1128 0.0036
0.8649 0.1302 0.0049
0.8464 0.1472 0.0064
0.8281 0.1638 0.0081
3
0 1 2 3
0.9703 0.0294 0.0003 0.0000
0.9412 0.0576 0.0012 0.0000
0.9127 0.0847 0.0026 0.0000
0.8847 0.1106 0.0046 0.0001
0.8574 0.1354 0.0071 0.0001
0.8306 0.1590 0.0102 0.0002
0.8044 0.1816 0.0137 0.0003
0.7787 0.2031 0.0177 0.0005
0.7536 0.2236 0.0221 0.0007
4
0 1 2 3 4
0.9606 0.0388 0.0006 0.0000 0.0000
0.9224 0.0753 0.0023 0.0000 0.0000
0.8853 0.1095 0.0051 0.0001 0.0000
0.8493 0.1416 0.0088 0.0002 0.0000
0.8145 0.1715 0.0135 0.0005 0.0000
0.7807 0.1993 0.0191 0.0008 0.0000
0.7481 0.2252 0.0254 0.0013 0.0000
0.7164 0.2492 0.0325 0.0019 0.0000
0.6857 0.2713 0.0402 0.0027 0.0001
5
0 1 2 3 4 5
0.9510 0.0480 0.0010 0.0000 0.0000 0.0000
0.9039 0.0922 0.0038 0.0001 0.0000 0.0000
0.8587 0.1328 0.0082 0.0003 0.0000 0.0000
0.8154 0.1699 0.0142 0.0006 0.0000 0.0000
0.7738 0.2036 0.0214 0.0011 0.0000 0.0000
0.7339 0.2342 0.0299 0.0019 0.0001 0.0000
0.6957 0.2618 0.0394 0.0030 0.0001 0.0000
0.6591 0.2866 0.0498 0.0043 0.0002 0.0000
0.6240 0.3086 0.0610 0.0060 0.0003 0.0000
6
0 1 2 3 4 5 6
0.9415 0.0571 0.0014 0.0000 0.0000 0.0000 0.0000
0.8858 0.1085 0.0055 0.0002 0.0000 0.0000 0.0000
0.8330 0.1546 0.0120 0.0005 0.0000 0.0000 0.0000
0.7828 0.1957 0.0204 0.0011 0.0000 0.0000 0.0000
0.7351 0.2321 0.0305 0.0021 0.0001 0.0000 0.0000
0.6899 0.2642 0.0422 0.0036 0.0002 0.0000 0.0000
0.6470 0.2922 0.0550 0.0055 0.0003 0.0000 0.0000
0.6064 0.3164 0.0688 0.0080 0.0005 0.0000 0.0000
0.5679 0.3370 0.0833 0.0110 0.0008 0.0000 0.0000
7
0 1 2 3 4 5 6 7
0.9321 0.0659 0.0020 0.0000 0.0000 0.0000 0.0000 0.0000
0.8681 0.1240 0.0076 0.0003 0.0000 0.0000 0.0000 0.0000
0.8080 0.1749 0.0162 0.0008 0.0000 0.0000 0.0000 0.0000
0.7514 0.2192 0.0274 0.0019 0.0001 0.0000 0.0000 0.0000
0.6983 0.2573 0.0406 0.0036 0.0002 0.0000 0.0000 0.0000
0.6485 0.2897 0.0555 0.0059 0.0004 0.0000 0.0000 0.0000
0.6017 0.3170 0.0716 0.0090 0.0007 0.0000 0.0000 0.0000
0.5578 0.3396 0.0886 0.0128 0.0011 0.0001 0.0000 0.0000
0.5168 0.3578 0.1061 0.0175 0.0017 0.0001 0.0000 0.0000
8
0 1 2 3 4 5 6 7 8
0.9227 0.0746 0.0026 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
0.8508 0.1389 0.0099 0.0004 0.0000 0.0000 0.0000 0.0000 0.0000
0.7837 0.1939 0.0210 0.0013 0.0001 0.0000 0.0000 0.0000 0.0000
0.7214 0.2405 0.0351 0.0029 0.0002 0.0000 0.0000 0.0000 0.0000
0.6634 0.2793 0.0515 0.0054 0.0004 0.0000 0.0000 0.0000 0.0000
0.6096 0.3113 0.0695 0.0089 0.0007 0.0000 0.0000 0.0000 0.0000
0.5596 0.3370 0.0888 0.0134 0.0013 0.0001 0.0000 0.0000 0.0000
0.5132 0.3570 0.1087 0.0189 0.0021 0.0001 0.0000 0.0000 0.0000
0.4703 0.3721 0.1288 0.0255 0.0031 0.0002 0.0000 0.0000 0.0000
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 966
966
Apéndices
TABLA 5
PROBABILIDADES BINOMIALES (continuación) p
n
x
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
9
0 1 2 3 4 5 6 7 8 9
0.9135 0.0830 0.0034 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.8337 0.1531 0.0125 0.0006 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.7602 0.2116 0.0262 0.0019 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
0.6925 0.2597 0.0433 0.0042 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000
0.6302 0.2985 0.0629 0.0077 0.0006 0.0000 0.0000 0.0000 0.0000 0.0000
0.5730 0.3292 0.0840 0.0125 0.0012 0.0001 0.0000 0.0000 0.0000 0.0000
0.5204 0.3525 0.1061 0.0186 0.0021 0.0002 0.0000 0.0000 0.0000 0.0000
0.4722 0.3695 0.1285 0.0261 0.0034 0.0003 0.0000 0.0000 0.0000 0.0000
0.4279 0.3809 0.1507 0.0348 0.0052 0.0005 0.0000 0.0000 0.0000 0.0000
10
0 1 2 3 4 5 6 7 8 9 10
0.9044 0.0914 0.0042 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.8171 0.1667 0.0153 0.0008 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.7374 0.2281 0.0317 0.0026 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.6648 0.2770 0.0519 0.0058 0.0004 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.5987 0.3151 0.0746 0.0105 0.0010 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
0.5386 0.3438 0.0988 0.0168 0.0019 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
0.4840 0.3643 0.1234 0.0248 0.0033 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000
0.4344 0.3777 0.1478 0.0343 0.0052 0.0005 0.0000 0.0000 0.0000 0.0000 0.0000
0.3894 0.3851 0.1714 0.0452 0.0078 0.0009 0.0001 0.0000 0.0000 0.0000 0.0000
12
0 1 2 3 4 5 6 7 8 9 10 11 12
0.8864 0.1074 0.0060 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.7847 0.1922 0.0216 0.0015 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.6938 0.2575 0.0438 0.0045 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.6127 0.3064 0.0702 0.0098 0.0009 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.5404 0.3413 0.0988 0.0173 0.0021 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.4759 0.3645 0.1280 0.0272 0.0039 0.0004 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.4186 0.3781 0.1565 0.0393 0.0067 0.0008 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.3677 0.3837 0.1835 0.0532 0.0104 0.0014 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.3225 0.3827 0.2082 0.0686 0.0153 0.0024 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
15
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0.8601 0.1303 0.0092 0.0004 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.7386 0.2261 0.0323 0.0029 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.6333 0.2938 0.0636 0.0085 0.0008 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.5421 0.3388 0.0988 0.0178 0.0022 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.4633 0.3658 0.1348 0.0307 0.0049 0.0006 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.3953 0.3785 0.1691 0.0468 0.0090 0.0013 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.3367 0.3801 0.2003 0.0653 0.0148 0.0024 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.2863 0.3734 0.2273 0.0857 0.0223 0.0043 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.2430 0.3605 0.2496 0.1070 0.0317 0.0069 0.0011 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 967
Apéndice B
TABLA 5
967
Tablas
PROBABILIDADES BINOMIALES (continuación) p
n
x
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
18
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0.8345 0.1517 0.0130 0.0007 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.6951 0.2554 0.0443 0.0048 0.0004 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.5780 0.3217 0.0846 0.0140 0.0016 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.4796 0.3597 0.1274 0.0283 0.0044 0.0005 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.3972 0.3763 0.1683 0.0473 0.0093 0.0014 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.3283 0.3772 0.2047 0.0697 0.0167 0.0030 0.0004 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.2708 0.3669 0.2348 0.0942 0.0266 0.0056 0.0009 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.2229 0.3489 0.2579 0.1196 0.0390 0.0095 0.0018 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.1831 0.3260 0.2741 0.1446 0.0536 0.0148 0.0032 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0.8179 0.1652 0.0159 0.0010 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.6676 0.2725 0.0528 0.0065 0.0006 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.5438 0.3364 0.0988 0.0183 0.0024 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.4420 0.3683 0.1458 0.0364 0.0065 0.0009 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.3585 0.3774 0.1887 0.0596 0.0133 0.0022 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.2901 0.3703 0.2246 0.0860 0.0233 0.0048 0.0008 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.2342 0.3526 0.2521 0.1139 0.0364 0.0088 0.0017 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.1887 0.3282 0.2711 0.1414 0.0523 0.0145 0.0032 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.1516 0.3000 0.2818 0.1672 0.0703 0.0222 0.0055 0.0011 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 968
968
Apéndices
TABLA 5
PROBABILIDADES BINOMIALES (continuación) p
n
x
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
2
0 1 2
0.8100 0.1800 0.0100
0.7225 0.2550 0.0225
0.6400 0.3200 0.0400
0.5625 0.3750 0.0625
0.4900 0.4200 0.0900
0.4225 0.4550 0.1225
0.3600 0.4800 0.1600
0.3025 0.4950 0.2025
0.2500 0.5000 0.2500
3
0 1 2 3
0.7290 0.2430 0.0270 0.0010
0.6141 0.3251 0.0574 0.0034
0.5120 0.3840 0.0960 0.0080
0.4219 0.4219 0.1406 0.0156
0.3430 0.4410 0.1890 0.0270
0.2746 0.4436 0.2389 0.0429
0.2160 0.4320 0.2880 0.0640
0.1664 0.4084 0.3341 0.0911
0.1250 0.3750 0.3750 0.1250
4
0 1 2 3 4
0.6561 0.2916 0.0486 0.0036 0.0001
0.5220 0.3685 0.0975 0.0115 0.0005
0.4096 0.4096 0.1536 0.0256 0.0016
0.3164 0.4219 0.2109 0.0469 0.0039
0.2401 0.4116 0.2646 0.0756 0.0081
0.1785 0.3845 0.3105 0.1115 0.0150
0.1296 0.3456 0.3456 0.1536 0.0256
0.0915 0.2995 0.3675 0.2005 0.0410
0.0625 0.2500 0.3750 0.2500 0.0625
5
0 1 2 3 4 5
0.5905 0.3280 0.0729 0.0081 0.0004 0.0000
0.4437 0.3915 0.1382 0.0244 0.0022 0.0001
0.3277 0.4096 0.2048 0.0512 0.0064 0.0003
0.2373 0.3955 0.2637 0.0879 0.0146 0.0010
0.1681 0.3602 0.3087 0.1323 0.0284 0.0024
0.1160 0.3124 0.3364 0.1811 0.0488 0.0053
0.0778 0.2592 0.3456 0.2304 0.0768 0.0102
0.0503 0.2059 0.3369 0.2757 0.1128 0.0185
0.0312 0.1562 0.3125 0.3125 0.1562 0.0312
6
0 1 2 3 4 5 6
0.5314 0.3543 0.0984 0.0146 0.0012 0.0001 0.0000
0.3771 0.3993 0.1762 0.0415 0.0055 0.0004 0.0000
0.2621 0.3932 0.2458 0.0819 0.0154 0.0015 0.0001
0.1780 0.3560 0.2966 0.1318 0.0330 0.0044 0.0002
0.1176 0.3025 0.3241 0.1852 0.0595 0.0102 0.0007
0.0754 0.2437 0.3280 0.2355 0.0951 0.0205 0.0018
0.0467 0.1866 0.3110 0.2765 0.1382 0.0369 0.0041
0.0277 0.1359 0.2780 0.3032 0.1861 0.0609 0.0083
0.0156 0.0938 0.2344 0.3125 0.2344 0.0938 0.0156
7
0 1 2 3 4 5 6 7
0.4783 0.3720 0.1240 0.0230 0.0026 0.0002 0.0000 0.0000
0.3206 0.3960 0.2097 0.0617 0.0109 0.0012 0.0001 0.0000
0.2097 0.3670 0.2753 0.1147 0.0287 0.0043 0.0004 0.0000
0.1335 0.3115 0.3115 0.1730 0.0577 0.0115 0.0013 0.0001
0.0824 0.2471 0.3177 0.2269 0.0972 0.0250 0.0036 0.0002
0.0490 0.1848 0.2985 0.2679 0.1442 0.0466 0.0084 0.0006
0.0280 0.1306 0.2613 0.2903 0.1935 0.0774 0.0172 0.0016
0.0152 0.0872 0.2140 0.2918 0.2388 0.1172 0.0320 0.0037
0.0078 0.0547 0.1641 0.2734 0.2734 0.1641 0.0547 0.0078
8
0 1 2 3 4 5 6 7 8
0.4305 0.3826 0.1488 0.0331 0.0046 0.0004 0.0000 0.0000 0.0000
0.2725 0.3847 0.2376 0.0839 0.0185 0.0026 0.0002 0.0000 0.0000
0.1678 0.3355 0.2936 0.1468 0.0459 0.0092 0.0011 0.0001 0.0000
0.1001 0.2670 0.3115 0.2076 0.0865 0.0231 0.0038 0.0004 0.0000
0.0576 0.1977 0.2965 0.2541 0.1361 0.0467 0.0100 0.0012 0.0001
0.0319 0.1373 0.2587 0.2786 0.1875 0.0808 0.0217 0.0033 0.0002
0.0168 0.0896 0.2090 0.2787 0.2322 0.1239 0.0413 0.0079 0.0007
0.0084 0.0548 0.1569 0.2568 0.2627 0.1719 0.0703 0.0164 0.0017
0.0039 0.0312 0.1094 0.2188 0.2734 0.2188 0.1094 0.0313 0.0039
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 969
Apéndice B
TABLA 5
969
Tablas
PROBABILIDADES BINOMIALES (continuación) p
n
x
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
9
0 1 2 3 4 5 6 7 8 9
0.3874 0.3874 0.1722 0.0446 0.0074 0.0008 0.0001 0.0000 0.0000 0.0000
0.2316 0.3679 0.2597 0.1069 0.0283 0.0050 0.0006 0.0000 0.0000 0.0000
0.1342 0.3020 0.3020 0.1762 0.0661 0.0165 0.0028 0.0003 0.0000 0.0000
0.0751 0.2253 0.3003 0.2336 0.1168 0.0389 0.0087 0.0012 0.0001 0.0000
0.0404 0.1556 0.2668 0.2668 0.1715 0.0735 0.0210 0.0039 0.0004 0.0000
0.0207 0.1004 0.2162 0.2716 0.2194 0.1181 0.0424 0.0098 0.0013 0.0001
0.0101 0.0605 0.1612 0.2508 0.2508 0.1672 0.0743 0.0212 0.0035 0.0003
0.0046 0.0339 0.1110 0.2119 0.2600 0.2128 0.1160 0.0407 0.0083 0.0008
0.0020 0.0176 0.0703 0.1641 0.2461 0.2461 0.1641 0.0703 0.0176 0.0020
10
0 1 2 3 4 5 6 7 8 9 10
0.3487 0.3874 0.1937 0.0574 0.0112 0.0015 0.0001 0.0000 0.0000 0.0000 0.0000
0.1969 0.3474 0.2759 0.1298 0.0401 0.0085 0.0012 0.0001 0.0000 0.0000 0.0000
0.1074 0.2684 0.3020 0.2013 0.0881 0.0264 0.0055 0.0008 0.0001 0.0000 0.0000
0.0563 0.1877 0.2816 0.2503 0.1460 0.0584 0.0162 0.0031 0.0004 0.0000 0.0000
0.0282 0.1211 0.2335 0.2668 0.2001 0.1029 0.0368 0.0090 0.0014 0.0001 0.0000
0.0135 0.0725 0.1757 0.2522 0.2377 0.1536 0.0689 0.0212 0.0043 0.0005 0.0000
0.0060 0.0403 0.1209 0.2150 0.2508 0.2007 0.1115 0.0425 0.0106 0.0016 0.0001
0.0025 0.0207 0.0763 0.1665 0.2384 0.2340 0.1596 0.0746 0.0229 0.0042 0.0003
0.0010 0.0098 0.0439 0.1172 0.2051 0.2461 0.2051 0.1172 0.0439 0.0098 0.0010
12
0 1 2 3 4 5 6 7 8 9 10 11 12
0.2824 0.3766 0.2301 0.0853 0.0213 0.0038 0.0005 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.1422 0.3012 0.2924 0.1720 0.0683 0.0193 0.0040 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000
0.0687 0.2062 0.2835 0.2362 0.1329 0.0532 0.0155 0.0033 0.0005 0.0001 0.0000 0.0000 0.0000
0.0317 0.1267 0.2323 0.2581 0.1936 0.1032 0.0401 0.0115 0.0024 0.0004 0.0000 0.0000 0.0000
0.0138 0.0712 0.1678 0.2397 0.2311 0.1585 0.0792 0.0291 0.0078 0.0015 0.0002 0.0000 0.0000
0.0057 0.0368 0.1088 0.1954 0.2367 0.2039 0.1281 0.0591 0.0199 0.0048 0.0008 0.0001 0.0000
0.0022 0.0174 0.0639 0.1419 0.2128 0.2270 0.1766 0.1009 0.0420 0.0125 0.0025 0.0003 0.0000
0.0008 0.0075 0.0339 0.0923 0.1700 0.2225 0.2124 0.1489 0.0762 0.0277 0.0068 0.0010 0.0001
0.0002 0.0029 0.0161 0.0537 0.1208 0.1934 0.2256 0.1934 0.1208 0.0537 0.0161 0.0029 0.0002
15
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0.2059 0.3432 0.2669 0.1285 0.0428 0.0105 0.0019 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0874 0.2312 0.2856 0.2184 0.1156 0.0449 0.0132 0.0030 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0352 0.1319 0.2309 0.2501 0.1876 0.1032 0.0430 0.0138 0.0035 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
0.0134 0.0668 0.1559 0.2252 0.2252 0.1651 0.0917 0.0393 0.0131 0.0034 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000
0.0047 0.0305 0.0916 0.1700 0.2186 0.2061 0.1472 0.0811 0.0348 0.0016 0.0030 0.0006 0.0001 0.0000 0.0000 0.0000
0.0016 0.0126 0.0476 0.1110 0.1792 0.2123 0.1906 0.1319 0.0710 0.0298 0.0096 0.0024 0.0004 0.0001 0.0000 0.0000
0.0005 0.0047 0.0219 0.0634 0.1268 0.1859 0.2066 0.1771 0.1181 0.0612 0.0245 0.0074 0.0016 0.0003 0.0000 0.0000
0.0001 0.0016 0.0090 0.0318 0.0780 0.1404 0.1914 0.2013 0.1647 0.1048 0.0515 0.0191 0.0052 0.0010 0.0001 0.0000
0.0000 0.0005 0.0032 0.0139 0.0417 0.0916 0.1527 0.1964 0.1964 0.1527 0.0916 0.0417 0.0139 0.0032 0.0005 0.0000
23AnderApA(0951-000).qxd 2/29/08 10:00 AM Page 970
970
Apéndices
TABLA 5
PROBABILIDADES BINOMIALES (continuación) p
n
x
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
18
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0.1501 0.3002 0.2835 0.1680 0.0700 0.0218 0.0052 0.0010 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0536 0.1704 0.2556 0.2406 0.1592 0.0787 0.0301 0.0091 0.0022 0.0004 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0180 0.0811 0.1723 0.2297 0.2153 0.1507 0.0816 0.0350 0.0120 0.0033 0.0008 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0056 0.0338 0.0958 0.1704 0.2130 0.1988 0.1436 0.0820 0.0376 0.0139 0.0042 0.0010 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0016 0.0126 0.0458 0.1046 0.1681 0.2017 0.1873 0.1376 0.0811 0.0386 0.0149 0.0046 0.0012 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000
0.0004 0.0042 0.0190 0.0547 0.1104 0.1664 0.1941 0.1792 0.1327 0.0794 0.0385 0.0151 0.0047 0.0012 0.0002 0.0000 0.0000 0.0000 0.0000
0.0001 0.0012 0.0069 0.0246 0.0614 0.1146 0.1655 0.1892 0.1734 0.1284 0.0771 0.0374 0.0145 0.0045 0.0011 0.0002 0.0000 0.0000 0.0000
0.0000 0.0003 0.0022 0.0095 0.0291 0.0666 0.1181 0.1657 0.1864 0.1694 0.1248 0.0742 0.0354 0.0134 0.0039 0.0009 0.0001 0.0000 0.0000
0.0000 0.0001 0.0006 0.0031 0.0117 0.0327 0.0708 0.1214 0.1669 0.1855 0.1669 0.1214 0.0708 0.0327 0.0117 0.0031 0.0006 0.0001 0.0000
20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0.1216 0.2702 0.2852 0.1901 0.0898 0.0319 0.0089 0.0020 0.0004 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0388 0.1368 0.2293 0.2428 0.1821 0.1028 0.0454 0.0160 0.0046 0.0011 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0115 0.0576 0.1369 0.2054 0.2182 0.1746 0.1091 0.0545 0.0222 0.0074 0.0020 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0032 0.0211 0.0669 0.1339 0.1897 0.2023 0.1686 0.1124 0.0609 0.0271 0.0099 0.0030 0.0008 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0008 0.0068 0.0278 0.0716 0.1304 0.1789 0.1916 0.1643 0.1144 0.0654 0.0308 0.0120 0.0039 0.0010 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0002 0.0020 0.0100 0.0323 0.0738 0.1272 0.1712 0.1844 0.1614 0.1158 0.0686 0.0336 0.0136 0.0045 0.0012 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000
0.0000 0.0005 0.0031 0.0123 0.0350 0.0746 0.1244 0.1659 0.1797 0.1597 0.1171 0.0710 0.0355 0.0146 0.0049 0.0013 0.0003 0.0000 0.0000 0.0000 0.0000
0.0000 0.0001 0.0008 0.0040 0.0139 0.0365 0.0746 0.1221 0.1623 0.1771 0.1593 0.1185 0.0727 0.0366 0.0150 0.0049 0.0013 0.0002 0.0000 0.0000 0.0000
0.0000 0.0000 0.0002 0.0011 0.0046 0.0148 0.0370 0.0739 0.1201 0.1602 0.1762 0.1602 0.1201 0.0739 0.0370 0.0148 0.0046 0.0011 0.0002 0.0000 0.0000