14 minute read
Glosario423 Fórmulas clave424 Ejercicios complementarios425 Caso problema: Par, Inc Apéndice 10.1 Inferencias acerca de dos poblaciones usando Minitab429 Apéndice 10.2 Inferencias acerca de dos poblaciones usando Excel431
from Estadistica
by Chris LC
Asegurados solteros Asegurados casados
n1 400
Advertisement
n2
900 Cantidad que hizo uso del seguro 76 Cantidad que hizo uso del seguro 90
a. Use α 0.05. Haga una prueba para determinar si la razón de reclamaciones es diferente entre asegurados solteros y casados. b. Dé un intervalo de 95% de confianza para la diferencia entre las proporciones de las dos poblaciones. 45. Se realizaron pruebas médicas para probar la resistencia a medicamentos contra la tuberculosis.
En Nueva Jersey, de 142 casos, 9 fueron resistentes a los medicamentos. En Texas, de 268 casos, 5 fueron resistentes a los medicamentos. ¿Estos datos indican que existe una diferencia estadísticamente significativa entre la proporción de casos resistentes a los medicamentos en estos dos estados? Use 0.02 como nivel de significancia. ¿Cuál es el valor-p y cuál es la conclusión a la que se llega? 46. En julio de 2001 Harris Ad Track Research Service realizó una encuesta para evaluar la efectividad de una importante campaña de publicidad para las cámaras fotográficas Kodak (USAToday, 27 de agosto de 2007). En una muestra, de los 430 encuestados, 163 dijeron que la publicidad había sido muy eficiente. En otra muestra, de los 285 entrevistados respecto a otra campaña, 66 opinaron que la publicidad había sido muy eficiente. a. Estime la proporción de entrevistados que consideraron muy eficiente la publicidad de las cámaras fotográficas Kodak y la proporción de encuestados que opinó que la otra campaña de publicidad había sido muy eficiente. b. Dé un intervalo de 95% de confianza para la diferencia entre estas proporciones. c. De acuerdo con los resultados del inciso b, ¿cree que la campaña de publicidad de Kodak haya sido más eficiente que la mayoría de las campañas de publicidad? 47. En junio de 2001, 38% de los administradores de fondos encuestados creían que la tasa de inflación subyacente sería más alta en un año. Un mes después, en un estudio similar, 22% de los administradores de fondos pensaban que la inflación subyacente sería más elevada en un año (Global Research Highlights, Merrill Lynch, 20 de julio de 2001). Suponga que tanto en junio como en julio el tamaño de la muestra fue 200 encuestados. a. Dé una estimación puntual para la diferencia entre proporciones, en junio y julio, de administradores de fondos que esperaban que la inflación subyacente fuera mayor en un año. b. Presente hipótesis de manera que el rechazo de la hipótesis nula permita concluir que las expectativas de inflación disminuyeron de junio a julio. c. Pruebe las hipótesis del inciso b con α 0.05. ¿Cuál es la conclusión?
Caso problema Par, Inc.
Par, Inc., es un importante fabricante de equipo de golf. El gerente de Par piensa que la participación de la empresa en el mercado aumentaría con la introducción de una pelota de golf resistente al corte y de alta duración. Para esto el grupo de investigación de Par ha estado probando un recubrimiento que dé a las pelotas resistencia al corte y alta durabilidad. Las pruebas realizadas con el recubrimiento han sido prometedoras.
Uno de los investigadores expresó su preocupación por el efecto del nuevo recubrimiento en la distancia de vuelo de la pelota. Par desea que la nueva pelota, resistente al corte, tenga una distancia de recorrido/distancia de vuelo comparable al de las pelotas de golf actuales. Para comparar la distancia de vuelo de los dos tipos de pelotas, se sometieron 40 pelotas de cada modelo a pruebas de distancia. Las pruebas se realizaron con una máquina lanzadora de pelotas con objeto de que la diferencia entre las distancias de vuelo entre los dos modelos de pelota pudiera atri-
buirse a sus diferencias. Los resultados de las pruebas, dados a la yarda más cercana, se presentan en la tabla. Estos datos se encuentran en el disco compacto que se distribuye con el libro.
archivo en CD
Golf
Modelo Modelo Modelo Modelo Actual Nuevo Actual Nuevo Actual Nuevo Actual Nuevo
264 277 270 272 263 274 281 283 261 269 287 259 264 266 274 250 267 263 289 264 284 262 273 253 272 266 280 280 263 271 263 260 258 262 272 274 260 260 275 270 283 251 275 281 283 281 267 263 258 262 265 276 255 250 279 261 266 289 260 269 272 263 274 255 259 286 278 268 266 278 276 263 270 264 275 262 268 264 262 279
Informe administrativo
1. Formule una prueba de hipótesis que le sirva a Par para comparar las distancias de vuelo de la pelota actual y de la nueva pelota. 2. Analice los datos para dar la conclusión de la prueba de hipótesis. ¿Cuál es el valor-p de la prueba? ¿Qué le recomendaría a Par, Inc.? 3. Proporcione un resumen de estadística descriptiva con los datos de cada modelo. 4. Dé un intervalo de 95% de confianza para la media poblacional de cada modelo, y otro similar para la diferencia entre las medias poblacionales de los dos modelos. 5. ¿Ve usted que haya necesidad de tomar muestras más grandes y de hacer más pruebas con las pelotas de golf? Discuta.
usando Minitab
archivo en CD
CheckAcct Aquí se describe el uso de Minitab para calcular estimaciones por intervalos y para realizar pruebas de hipótesis para la diferencia entre dos medias poblacionales y entre dos proporciones poblacionales. Con Minitab se pueden calcular estimaciones por intervalos y hacer pruebas de hipótesis dentro de un mismo módulo. Es decir, Minitab tiene un mismo procedimiento para los dos tipos de inferencias. En los ejemplos siguientes, se mostrará cómo realizar los cálculos para una estimación por intervalo y para una prueba de hipótesis con las dos mismas muestras. Minitab no cuenta con una rutina para inferencias acerca de la diferencia entre dos medias poblacionales cuando no se conocen las desviaciones estándar poblacionales σ1 y σ2.
Se emplearán los datos del ejemplo presentado en la sección 10.2, sobre los saldos en las cuentas de cheques. Los datos de los saldos en las cuentas de cheques en la sucursal Cherry Grove se encuentran en la columna 1 y los correspondientes a la sucursal Beechmont se encuentran en la columna C2. En este ejemplo se usará el procedimiento de Minitab 2-Sample t para obtener un intervalo de 95% de confianza para estimar la diferencia entre las medias poblacionales de los saldos en las cuentas de cheques de las dos sucursales. En el resultado de este procedimiento Mi-
archivo en CD
Matched
archivo en CD
nitab da también el valor-p para la prueba de hipótesis: H0: μ1 μ2 0 frente a Ha: μ1 μ2 0.
Los pasos necesarios para realizar este procedimiento se indican a continuación.
Paso 1. Seleccionar el menú Stat
Paso 2. Elegir Basic Statistics
Paso 3. Elegir 2-Sample t
Paso 4. Cuando aparezca el cuadro de diálogo 2-Sample t (Test and Confidence Interval) Seleccionar Samples in different columns Ingresar C1 en el cuadro First Ingresar C2 en el cuadro Second Seleccionar Options
Paso 5. Cuando aparezca el cuadro de diálogo 2-Sample t-Options: Ingresar 95 en el cuadro Confidence level Ingresar 0 en el cuadro Test difference Ingresar not equal en el cuadro Alternative Clic en OK
Paso 6. Clic en OK La estimación por intervalo de confianza de 95% es el intervalo que va de $37 a $193, como se vio en la sección 10.2. El valor-p 0.005 indica que la hipótesis nula de que las medias poblacionales son iguales puede rechazarse para el nivel de significancia 0.01. El paso 5 puede modificarse para otras aplicaciones con diferentes niveles de confianza, distintos valores hipotéticos y diversas formas de la prueba de hipótesis.
Para ilustrar el procedimiento de muestras pareadas se usarán los datos de la tabla 10.2, sobre los tiempos necesarios para realizar una tarea. Los tiempos con el método 1 se ingresan en la columna C1 y los tiempos con el método 2 se ingresan en la columna C2. Los pasos a seguir al usar Minitab para una prueba de muestras por pares son los siguientes:
Paso 1. Seleccionar el menú Stat
Paso 2. Elegir Basic Statistics
Paso 3. Elegir Paired t
Paso 4. Cuando aparezca el cuadro de diálogo Paired t (Test and Confidence Interval) Seleccionar Samples in columns Ingresar C1 en el cuadro First sample Ingresar C2 en el cuadro Second sample Seleccionar Options
Paso 5. Cuando aparezca el cuadro de diálogo Paired t-Options: Ingresar 95 en el cuadro Confidence level Ingresar 0 en el cuadro Test mean Ingresar not equal en el cuadro Alternative Clic en OK
Paso 6. Click en OK La estimación por intervalo de 95% de confianza es el intervalo que va de 0.05 a 0.65, como se vio en la sección 10.3. El valor-p 0.08 indica que la hipótesis nula de que no hay diferencia en los tiempos para realizar la tarea no puede rechazarse para el nivel de significancia α 0.05. El paso 5 puede modificarse para diferentes niveles de confianza, distintos valores hipotéticos y diversas formas de la prueba de hipótesis.
Diferencia entre dos proporciones poblacionales
Se emplearán los datos presentados en la sección 10.4 sobre los errores en las declaraciones de impuestos. Los resultados muestrales de 250 declaraciones de impuestos elaboradas en la ofici-
na 1 se encuentran en la columna C1 y los resultados muestrales de 300 declaraciones de impuestos elaboradas en la oficina 2 se encuentran en la columna C2. Sí indica que se encontró un error en la declaración de impuestos y No que no se encontró ningún error. Con el procedimiento que se describe a continuación, se obtiene una estimación por intervalo de 95% de confianza para la diferencia entre las dos proporciones poblacionales, también los resultados de la prueba de hipótesis y
Paso 1. Seleccionar el menú Stat
Paso 2. Elegir Basic Statistics
Paso 3. Elegir 2 Proportions
Paso 4. Cuando aparezca el cuadro de diálogo 2 Proportions (Test and Confidence Interval): Seleccionar Samples in different columns Ingresar C1 en el cuadro First Ingresar C2 en el cuadro Second Seleccionar Options
Paso 5. Cuando aparezca el cuadro de diálogo 2 Proportions-Options. Ingresar 90 en el cuadro Confidence level Ingresar 0 en el cuadro Test difference Ingresar not equal en el cuadro Alternative Clic en OK
Paso 6. Clic en OK
Ha: p1 p2 0.H0: p1
p2 0
El intervalo de 90% de confianza es el intervalo que va de 0.005 a 0.095, como se vio en la sección 10.4. El valor-p 0.065 indica que la hipótesis nula de que no hay diferencia entre la tasa de errores se puede rechazar para α 0.10. El paso 5 puede modificarse para diferentes nivelesde confianza, distintos valores hipotéticos y diversas formas de la prueba de hipótesis.
En el ejemplo de la elaboración de las declaraciones de impuestos, los datos son cualitativos. Sí y No sirven para indicar si hay o no un error. En el módulo para proporciones, Minitab calcula la proporción de la respuesta que tiene el segundo lugar en las respuestas en orden alfabético. Por tanto, en este ejemplo de la elaboración de las declaraciones de impuestos, Minitab calculará la proporción de respuestas Sí, que es la proporción que se busca.
Si Minitab con el orden alfabético no calcula la proporción de la respuesta de interés, es posible modificar esto. Para ello, seleccione una celda en la columna de los datos, vaya a la barra del menú de Minitab y seleccione Editor Column Value Order. Esta secuencia proporcionará la opción de ingresar un orden especificado por el usuario. En la caja define-an-order enumere las respuestas colocando en segundo lugar la respuesta de interés. La rutina de Minitab 2 Proportion facilitará el intervalo de confianza y los resultados de la prueba de hipótesis para la proporción poblacional de interés.
Por último, la rutina de Minitab 2 Proportion emplea un procedimiento de cálculo distinto al descrito en este libro. Por tanto, quizá los resultados suministrados por Minitab sean ligeramente diferentes, una estimación por intervalo y un valor-p ligeramente diferentes. Sin embargo, los resultados serán muy parecidos y se espera que conduzcan a la misma interpretación y a las mismas conclusiones.
usando Excel
Se describirá el uso de Excel para realizar pruebas de hipótesis acerca de la diferencia entre dos medias poblacionales.* Se empieza con las diferencias entre las medias de dos poblaciones cuando se conocen las desviaciones estándar poblacionales σ1 y σ2.
*Las herramientas para el análisis de datos de Excel facilitan procedimientos para pruebas de hipótesis acerca de la diferencia entre dos medias poblacionales. Excel no cuenta con una rutina para estimación por intervalos para la diferencia entre dos medias poblacionales ni para inferencias acerca de la diferencia entre dos proporciones poblacionales.
archivo en CD
ExamScores
archivo en CD
SoftwareTest
Se empleará el ejemplo de la sección 10.1 sobre las puntuaciones obtenidas en el examen para los dos centros de enseñanza. El rótulo Centro Ase encuentra en la celda A1 y el rótulo Centro B se encuentra en la celda B1. Las puntuaciones de los exámenes del centro Ase encuentran en las celdas A2:A31 y las puntuaciones de los exámenes del centro B se encuentran en las celdas B2:B41. Se supone que se conocen las desviaciones estándar poblacionales y que son σ1 10y σ2 10. La rutina de Excel solicitará que se ingresen las varianzas, que son 100y 100. Para realizar una prueba de hipótesis acerca de la diferencia entre dos medias poblacionales se siguen los pasos que se indican a continuación.
Paso 1. Seleccionar el menú Herramientas
Paso 2. Elegir Análisis de datos
Paso 3. Cuando aparezca el cuadro de diálogo Análisis de datos: Elegir Prueba z para medias de dos muestras Clic en Aceptar
Paso 4. Cuando aparezca el cuadro de diálogoPrueba z para medias de dos muestras: Ingresar A1:A31 en el cuadro Rango para la variable 1 Ingresar B1:B41 en el cuadro Rango para la variable 2 Ingresar 0 en el cuadro Diferencia hipotética de las medias Ingresar 100 en el cuadro Varianza para la variable 1 Ingresar 100 en el cuadro Varianza para la variable 2 Seleccionar Rótulos Ingresar 0.05 en el cuadro Alfa Seleccionar Rango de salida e ingresar C1 en el cuadro correspondiente Clic en Aceptar El valor-p para dos colas se denota P(Z z) dos colas y es 0.0978, valor que no permite rechazar la hipótesis nula con α 0.05.
σ2 1 σ2 2
Se usarán los datos que aparecen en la tabla 10.1 del estudio de la prueba del software. Los datos ya se han ingresado en la hoja de cálculo de Excel, en la que el rótulo Existente se ha ingresado en la celda A1 y el rótulo Nuevo se ha ingresado en la celda B1. Los tiempos requeridos con la tecnología existente se encuentran en las celdas A2:A13 y los tiempos requeridos con el nuevo software se encuentran en las celdas B2:B13. Para realizar una prueba de hipótesis acerca de la diferencia entre dos medias poblacionales cuando no se conocen σ1 y σ2 se emplean los siguientes:
Paso 1. Seleccionar el menú Herramientas
Paso 2. Elegir Análisis de datos
Paso 3. Cuando aparezca el cuadro de diálogo Análisis de datos: Elegir Prueba t para dos muestras suponiendo varianzas desiguales Clic en Aceptar
Paso 4. Cuando aparezca el cuadro de diálogoPrueba t para dos muestras suponiendovarianzas iguales Ingresar A1:A13 en el cuadro Rango para la variable 1 Ingresar B1:B13 en el cuadro Rango para la variable 2 Ingresar 0 en el cuadro Diferencia hipotética entre las medias Seleccionar Rótulos Ingresar 0.05 en el cuadro Alfa Seleccionar Rango de salida e ingresar C1 en el cuadro correspondiente. Clic en Aceptar El valor-p es el denotado P(T t)una cola, cuyo valor es 0.017, valor que permite rechazar la hipótesis nula para α 0.05.
archivo en CD
Matched
Para ilustrar este método se usan los pares de datos para la realización de una tarea, que aparecen en la tabla 10.2.
Estos datos se han ingresado en la hoja de cálculo colocando el rótulo Método 1 en la celda A1 y el rótulo Método 2 en la celda B1. Los tiempos requeridos para la realización de la tarea con el método 1 se encuentran en las celdas A2:A7 y los tiempos para la realización de la tareacon el método 2 se encuentran en las celdas B2:B7. En el procedimiento de Excel se emplean los pasos previamente descritos para la prueba-t excepto que en el paso 3, cuando aparece el cuadro de diálogo Análisis de datos, hay que elegir Prueba t para medias de dos muestras porpares.El rango para la variable 1 es A1:A7 y el rango para la variable 2 es B1:B7. El valor-p es el denotado por P(T t) dos colas, cuyo valor es 0.08, valor que no permite rechazar la hipótesis nula con α 0.05.
CAPÍTULO 11
Inferencias acerca de varianzas poblacionales
CONTENIDO
LAESTADÍSTICAEN LAPRÁCTICA: LAGENERALACCOUNTING OFFICE DE ESTADOS UNIDOS 11.1 INFERENCIAS ACERCA DE UNAVARIANZA POBLACIONAL Estimación por intervalos Pruebas de hipótesis 11.2 INFERENCIAS ACERCA DE DOS VARIANZAS POBLACIONALES