Estadística para negocios y economía

Page 1

5/9

Estadística para negocios y Iconomía 13a edición

Anderson • Sweeney • Williams Camm • Cochran Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

David R. Anderson University of Cincinnati

Dennis J. Sweeney University of Cincinnati

Thomas A. Williams Rochester Institute of Technology

Jeffrey D. Camm Wake Forest University

James J. Cochran University of Alabama Traducción Consuelo García Álvarez

Revisión técnica María de Guadalupe Arroyo Satisteban

José Cruz Ramos Báez

Academia de Matemáticas ECEE Universidad Panamericana

Academia de Matemáticas ECEE Universidad Panamericana

Ignacio García Juárez

Iren Castillo Saldaña

Academia de Matemáticas ECEE Universidad Panamericana

Academia de Matemáticas ECEE Universidad Panamericana

José Gerardo Reyes López Universidad Autónoma de Chihuahua

Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

EstadĂ­stica para negocios y economĂ­a Decimotercera ediciĂłn David R. Anderson, Dennis J. Sweeney, 7KRPDV $ :LOOLDPV -HÎ?UH\ ' &DPP James J. Cochran Director Higher Education LatinoamĂŠrica Renzo CasapĂ­a Valencia Gerente Editorial de Contenidos en EspaĂąol JesĂşs Mares ChacĂłn Editor Senior Javier Reyes MartĂ­nez Coordinador de Manufactura Rafael PĂŠrez GonzĂĄlez &RPSRVLFLÂľQ WLSRJUÂŁČ´FD Jose Alejandro HernĂĄndez HernĂĄndez FotografĂ­a de portada ÂĄStockphoto.com/alienforce

Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V., una Compaùía de Cengage Learning, Inc. &DUUHWHUD 0ÂŤ[LFR 7ROXFD QÂźP RČ´FLQD &RO (O <DTXL 'HO &XDMLPDOSD & 3 Ciudad de MĂŠxico. Cengage LearningÂŽ es una marca registrada usada bajo permiso. DERECHOS RESERVADOS. Ninguna parte de este trabajo amparado por la Ley Federal del Derecho de Autor, podrĂĄ ser reproducida, transmitida, almacenada o utilizada en cualquier forma o por cualquier medio, ya sea JUÂŁČ´FR HOHFWUÂľQLFR R PHFÂŁQLFR LQFOX\HQGR pero sin limitarse a lo siguiente: fotocopiado, reproducciĂłn, escaneo, digitalizaciĂłn, grabaciĂłn en audio, distribuciĂłn en Internet, distribuciĂłn en redes de informaciĂłn o almacenamiento y recopilaciĂłn en sistemas de informaciĂłn a excepciĂłn de lo permitido en el CapĂ­tulo III, ArtĂ­culo 27 de la Ley Federal del Derecho de Autor, sin el consentimiento por escrito de la Editorial. Traducido del libro: Statistics for Business and Economics Thirteen edition David R. Anderson, Dennis J. Sweeney, 7KRPDV $ :LOOLDPV -HÎ?UH\ ' &DPP James J. Cochran Publicado en inglĂŠs por Cengage Learning Š2018 Ζ6%1 'DWRV SDUD FDWDORJDFLÂľQ ELEOLRJUÂŁČ´FD Anderson, David R., Dennis J. Sweeney, 7KRPDV $ :LOOLDPV -HÎ?UH\ ' &DPP James J. Cochran EstadĂ­stica para negocios y economĂ­a Decimotercera ediciĂłn ISBN: 978-607-526-832-3 Visite nuestro sitio web en: http://latinoamerica.cengage.com

Impreso en MĂŠxico 1 2 3 4 5 6 7 22 21 20 19

Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Dedicado a Marcia, Cherri, Robbie, Karen y Teresa

Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Contenido breve

Prefacio xxv Acerca de los autores xxxi

Capítulo 1 Capítulo 2 Capítulo 3 Capítulo 4 Capítulo 5 Capítulo 6 Capítulo 7 Capítulo 8 Capítulo 9 Capítulo 10

Los datos y la estadística 1 Estadística descriptiva: presentaciones tabulares y gráficas 29 Estadística descriptiva: medidas numéricas 95 Introducción a la probabilidad 165 Distribuciones discretas de probabilidad 211 Distribuciones continuas de probabilidad 263 Muestreo y distribuciones de muestreo 296 Estimación por intervalo 340 Pruebas de hipótesis 378 Inferencia estadística acerca de medias y proporciones con dos poblaciones 435

Capítulo 11 Capítulo 12

Inferencias acerca de varianzas poblacionales 474

Capítulo 13 Capítulo 14 Capítulo 15 Capítulo 16 Capítulo 17 Capítulo 18 Capítulo 19 Capítulo 20 Apéndice A Apéndice B Apéndice C Apéndice D

Diseño de experimentos y análisis de varianza 537

Comparaciones de múltiples proporciones, pruebas de bondad de ajuste e independencia 499 Regresión lineal simple 590 Regresión múltiple 674 Análisis de regresión: construcción de modelos 745 Análisis de series de tiempo y elaboración de pronósticos 796 Métodos no paramétricos 862 Métodos estadísticos de control de la calidad 906 Números índice 939 Referencias y bibliografía 960 Tablas 962 Notación de suma 989 Soluciones de las autoevaluaciones y respuestas a los ejercicios con números pares 991

Apéndice E

Microsoft Excel 2016 y sus herramientas de análisis estadístico 1056

Apéndice F

Cálculo de los valores-p usando Minitab y Excel 1064

Índice analítico 1068

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Contenido

Prefacio xxv Acerca de los autores xxxi

Capítulo 1 Los datos y la estadística 1 Estadística en la práctica. Bloomberg Businessweek 2 1.1 Aplicaciones en negocios y economía 3 Contabilidad 3 Finanzas 3 Marketing 4 Producción 4 Economía 4 Sistemas de información 4 1.2 Datos 5 Elementos, variables y observaciones 5 Escalas de medición 5 Datos categóricos y cuantitativos 7 Datos de corte transversal y de series de tiempo 8 1.3 Fuentes de datos 10 Fuentes existentes 10 Estudios observacionales 11 Estudios experimentales 12 Tiempo y costo 12 Errores en la adquisición de datos 13 1.4 Estadística descriptiva 13 1.5 Inferencia estadística 15 1.6 Analítica 16 1.7 Big data y minería de datos 17 1.8 Computadoras y análisis estadístico 19 1.9 Lineamientos éticos para la práctica de la estadística 19 Resumen 20 Glosario 21 Ejercicios complementarios 22

Capítulo 2 Estadística descriptiva: presentaciones tabulares y gráficas

29

Estadística en la práctica. Colgate-Palmolive Company 30 2.1 Resumen de datos para una variable cualitativa o categórica 31 Distribución de frecuencia 31

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

x

Contenido

Distribuciones de frecuencia relativa y frecuencia porcentual 32 Gráficas de barras y circulares 32 2.2 Resumen de datos para una variable cuantitativa 38 Distribución de frecuencia 38 Distribuciones de frecuencia relativa y de frecuencia porcentual 39 Diagrama de puntos 39 Histograma 40 Distribuciones acumuladas 42 Diagrama de tallo y hoja 43 2.3 Cómo resumir datos para dos variables por medio de tablas 51 Tabulación cruzada 51 La paradoja de Simpson 53 2.4 Cómo resumir datos para dos variables por medio de representaciones gráficas 59 Diagrama de dispersión y línea de tendencia 59 Gráficas de barras apiladas y de barras agrupadas 61 2.5 Visualización de datos: mejores prácticas en la elaboración de representaciones gráficas efectivas 65 Cómo elaborar representaciones gráficas efectivas 65 Selección del tipo de representación gráfica 66 Data dashboards o tableros de datos 67 Visualización de datos en la práctica: el zoológico y jardín botánico de Cincinnati 69 Resumen 71 Glosario 71 Fórmulas clave 73 Ejercicios complementarios 73 Caso práctico 1 Pelican Stores 78 Caso práctico 2 Industria del cine 79 Caso práctico 3 Queen City 80 Apéndice 2.1 Cómo usar Minitab para presentaciones tabulares y gráficas 81 Apéndice 2.2 Cómo usar Excel para presentaciones tabulares y gráficas 83

Capítulo 3 Estadística descriptiva: medidas numéricas 95 Estadística en la práctica. Small Fry Design 96 3.1 Medidas de posición o localización 97 Media 97 Media ponderada 99 Mediana 100 Media geométrica 102 Moda 103 Percentiles 104 Cuartiles 105

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xi

Contenido

3.2

Medidas de variabilidad 111 Rango 111 Rango intercuartílico o intercuartil 112 Varianza 112 Desviación estándar 113 Coeficiente de variación 114 3.3 Medidas de la forma de la distribución, posición relativa y detección de observaciones atípicas 118 Forma de la distribución 118 Valor z 118 Teorema de Chebyshev 120 Regla empírica 121 Detección de observaciones atípicas 123 3.4 Resúmenes de cinco números y diagramas de caja 126 Resumen de cinco números 126 Diagrama de caja 127 Análisis comparativo con diagramas de caja 127 3.5 Medidas de asociación entre dos variables 131 Covarianza 131 Interpretación de la covarianza 133 Coeficiente de correlación 135 Interpretación del coeficiente de correlación 136 3.6 Data dashboards o tableros de datos: incorporación de medidas numéricas para mejorar su eficacia 140 Resumen 143 Glosario 144 Fórmulas clave 145 Ejercicios complementarios 146 Caso práctico 1 Pelican Stores 151 Caso práctico 2 Industria del cine 152 Caso práctico 3 Escuelas de negocios de Asia-Pacífico 153 Caso práctico 4 Transacciones del sitio web de Heavenly Chocolates 155 Caso práctico 5 Las poblaciones de elefantes africanos 156 Apéndice 3.1 Estadística descriptiva con Minitab 157 Apéndice 3.2 Estadística descriptiva con Excel 159

Capítulo 4 Introducción a la probabilidad 165 Estadística en la práctica. National Aeronautics and Space Administration 166 4.1 Experimentos aleatorios, reglas de conteo y asignación de probabilidades 167 Reglas de conteo, combinaciones y permutaciones 168 Asignación de probabilidades 172 Probabilidades para el proyecto de KP&L 174

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xii

Contenido

4.2 4.3

4.4

4.5

Eventos y sus probabilidades 177 Algunas relaciones básicas de probabilidad 181 Complemento de un evento 181 Ley de la adición 182 Probabilidad condicional 188 Eventos independientes 191 Ley de la multiplicación 191 Teorema de Bayes 196 Método tabular 199

Resumen 202 Glosario 202 Fórmulas clave 203 Ejercicios complementarios 204 Caso práctico Jueces del condado de Hamilton 208

Capítulo 5 Distribuciones discretas de probabilidad 211 Estadística en la práctica. Citibank 212 5.1 Variables aleatorias 213 Variables aleatorias discretas 213 Variables aleatorias continuas 214 5.2 Desarrollo de distribuciones discretas de probabilidad 216 5.3 Valor esperado y varianza 221 Valor esperado 221 Varianza 221 5.4 Distribuciones bivariantes, covarianza y portafolios financieros 226 Distribución discreta de probabilidad bivariante empírica 226 Aplicaciones financieras 229 Resumen 232 5.5 Distribución binomial de probabilidad 235 Un experimento binomial 236 El problema de Martin Clothing Store 237 Cómo usar tablas de probabilidades binomiales 241 Valor esperado y varianza de la distribución binomial 242 5.6 Distribución de Poisson 246 Un ejemplo con intervalos de tiempo 246 Un ejemplo con intervalos de longitud o distancia 248 5.7 Distribución hipergeométrica 249 Resumen 253 Glosario 254 Fórmulas clave 254 Ejercicios complementarios 256 Caso práctico Go Bananas! 259 Apéndice 5.1 Distribuciones discretas de probabilidad con Minitab 260 Apéndice 5.2 Distribuciones discretas de probabilidad con Excel 261

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xiii

Contenido

Capítulo 6 Distribuciones continuas de probabilidad 263 Estadística en la práctica. Procter & Gamble 264 6.1 Distribución uniforme 265 El área como medida de la probabilidad 266 6.2 Distribución normal 269 Curva normal 269 Distribución normal estándar 271 Cálculo de probabilidades para cualquier distribución normal 276 El problema de Grear Tire Company 277 6.3 Aproximación mediante la distribución normal de las probabilidades binomiales 281 6.4 Distribución exponencial 285 Cálculo de probabilidades para la distribución exponencial 285 Relación entre las distribuciones de Poisson y exponencial 286 Resumen 288 Glosario 289 Fórmulas clave 289 Ejercicios complementarios 289 Caso práctico Specialty Toys 292 Apéndice 6.1 Distribuciones continuas de probabilidad con Minitab 293 Apéndice 6.2 Distribuciones continuas de probabilidad con Excel 294

Capítulo 7 Muestreo y distribuciones muestrales o de muestreo 296 Estadística en la práctica. MeadWestvaco Corporation 297 7.1 El problema de muestreo de Electronics Associates 298 7.2 Cómo seleccionar una muestra 299 Muestreo de una población finita 299 Muestreo de una población infinita 301 7.3 Estimación puntual 304 Consejo práctico 306 7.4 Introducción a las distribuciones muestrales o de muestreo 308 _ 7.5 Distribución de muestreo de x 310 _ Valor esperado de x 310 _ Desviación estándar de x 311 _ Forma de la distribución de muestreo de x 312 _ Distribución de muestreo de x en el problema de EAI 314 _ Valor práctico de la distribución de muestreo de x 315 Relación entre el tamaño de la muestra y la distribución _ de muestreo de x 316 _ 7.6 Distribución de muestreo de p 320 _ Valor esperado de p 321 _ Desviación estándar de p 321

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xiv

Contenido

7.7

7.8

_ Forma de la distribución de muestreo de p 322 _ Valor práctico de la distribución de muestreo de p 322 Propiedades de los estimadores puntuales 326 Insesgadez 326 Eficiencia 327 Consistencia 328 Otros métodos de muestreo 329 Muestreo aleatorio estratificado 329 Muestreo por conglomerados (o clusters) 329 Muestreo sistemático 330 Muestreo de conveniencia 330 Muestreo subjetivo 331

Resumen 331 Glosario 332 Fórmulas clave 333 Ejercicios complementarios 333 Caso práctico Marion Dairies 335

_ Apéndice 7.1 Valor esperado y desviación estándar de x 336 Apéndice 7.2 Muestreo aleatorio con Minitab 338 Apéndice 7.3 Muestreo aleatorio con Excel 339

Capítulo 8 Estimación por intervalo 340 Estadística en la práctica. Food Lion 341 8.1 Media poblacional: ó conocida 342 Margen de error y estimación por intervalo 342 Consejo práctico 346 8.2 Media poblacional: ó desconocida 348 Margen de error y estimación por intervalo 349 Consejo práctico 352 Uso de una muestra pequeña 352 Resumen de los procedimientos de estimación por intervalo 354 8.3 Determinación del tamaño de la muestra 357 8.4 Proporción poblacional 360 Determinación del tamaño de la muestra 362 Resumen 365 Glosario 366 Fórmulas clave 367 Ejercicios complementarios 367 Caso práctico 1 Revista Young Professional 370 Caso práctico 2 Gulf Real Estate Properties 371 Caso práctico 3 Metropolitan Research, Inc. 372

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xv

Contenido

Apéndice 8.1 Estimación por intervalo con Minitab 373 Apéndice 8.2 Estimación por intervalo con Excel 375

Capítulo 9 Pruebas de hipótesis 378 Estadística en la práctica. John Morrell & Company 379 9.1 Formulación de las hipótesis nula y alternativa 380 La hipótesis alternativa como hipótesis de investigación 380 La hipótesis nula como supuesto para desafiarlo 381 Resumen de las formas para las hipótesis nula y alternativa 382 9.2 Errores tipo I y tipo II 383 9.3 Media poblacional: ó conocida 386 Prueba de una cola 386 Prueba de dos colas 392 Resumen y consejo práctico 394 Relación entre estimación por intervalo y prueba de hipótesis 396 9.4 Media poblacional: ó desconocida 401 Prueba de una cola 401 Prueba de dos colas 402 Resumen y consejo práctico 404 9.5 Proporción poblacional 407 Resumen 409 9.6 Pruebas de hipótesis y toma de decisiones 412 9.7 Cálculo de la probabilidad de los errores tipo II 413 9.8 Determinación del tamaño de la muestra en una prueba de hipótesis para la media poblacional 418 Resumen 421 Glosario 422 Fórmulas clave 423 Ejercicios complementarios 423 Caso práctico 1 Quality Associates, Inc. 426 Caso práctico 2 Conducta ética de los estudiantes de negocios en Bayview University 428 Apéndice 9.1 Pruebas de hipótesis con Minitab 429 Apéndice 9.2 Pruebas de hipótesis con Excel 431

Capítulo 10 Inferencia estadística acerca de medias y proporciones con dos poblaciones

435

Estadística en la práctica. U.S. Food and Drug Administration 436 10.1 Inferencias acerca de la diferencia entre dos medias poblacionales: ó1 y ó2 conocidas 437 Estimación por intervalo para μ1 – μ2 437

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xvi

Contenido

10.2

10.3 10.4

Pruebas de hipótesis acerca de μ1 – μ2 439 Consejo práctico 441 Inferencias acerca de la diferencia entre dos medias poblacionales: ó1 y ó2 desconocidas 444 Estimación por intervalo para μ1 – μ2 444 Pruebas de hipótesis acerca de μ1 – μ2 446 Consejo práctico 448 Inferencias acerca de la diferencia entre dos medias poblacionales: muestras pareadas 452 Inferencias acerca de la diferencia entre dos proporciones poblacionales 458 Estimación por intervalo de p1 – p2 458 Prueba de hipótesis acerca de p1 – p2 460

Resumen 464 Glosario 465 Fórmulas clave 465 Ejercicios complementarios 466 Caso práctico Par, Inc. 469 Apéndice 10.1 Inferencias acerca de dos poblaciones con Minitab 470 Apéndice 10.2 Inferencias acerca de dos poblaciones con Excel 472

Capítulo 11 Inferencias acerca de varianzas poblacionales 474 Estadística en la práctica. La U.S. Government Accountability Office 475 11.1 Inferencias acerca de una varianza poblacional 476 Estimación por intervalo 476 Pruebas de hipótesis 480 11.2 Inferencias acerca de dos varianzas poblacionales 486 Resumen 493 Fórmulas clave 493 Ejercicios complementarios 493 Caso práctico Programa de capacitación de la Fuerza Aérea 495 Apéndice 11.1 Varianzas poblacionales con Minitab 497 Apéndice 11.2 Varianzas poblacionales con Excel 497

Capítulo 12 Comparaciones de múltiples proporciones, pruebas de bondad de ajuste e independencia 499 Estadística en la práctica. United Way 500 12.1 Pruebas de igualdad de proporciones poblacionales para tres o más poblaciones 501 Procedimiento de comparación múltiple 506 12.2 Prueba de independencia 511

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xvii

Contenido

12.3

Prueba de bondad de ajuste 519 Distribución de probabilidad multinomial 519 Distribución de probabilidad normal 522

Resumen 528 Glosario 528 Fórmulas clave 529 Ejercicios complementarios 529 Caso práctico Una agenda bipartidista para el cambio 532 Apéndice 12.1 Pruebas de ji-cuadrada con Minitab 533 Apéndice 12.2 Pruebas de ji-cuadrada con Excel 534

Capítulo 13 Diseño de experimentos y análisis de varianza 537 Estadística en la práctica. Burke Marketing Services, Inc. 538 13.1 Introducción al diseño de experimentos y al análisis de varianza 539 Recolección de datos 540 Supuestos del análisis de varianza 541 Análisis de varianza: una perspectiva conceptual 541 13.2 Análisis de varianza y diseño completamente aleatorizado 544 Estimación de la varianza poblacional entre tratamientos 545 Estimación de la varianza poblacional dentro de los tratamientos 546 Comparación de las estimaciones de las varianzas: la prueba F 547 Tabla de ANOVA (análisis de varianza) 549 Resultados de computadora para el análisis de varianza 550 Prueba para la igualdad de k medias poblacionales: un estudio observacional 551 13.3 Procedimientos de comparación múltiple 555 LSD de Fisher 555 Tasas de error tipo I 558 13.4 Diseño de bloques aleatorizado 561 Prueba de estrés para controladores de tráfico aéreo 562 Procedimiento ANOVA 563 Cálculos y conclusiones 564 13.5 Experimento factorial 568 Procedimiento ANOVA 570 Cálculos y conclusiones 570 Resumen 575 Glosario 576 Fórmulas clave 576 Ejercicios complementarios 578 Caso práctico 1 Wentworth Medical Center 583 Caso práctico 2 Compensación para vendedores profesionales 583 Apéndice 13.1 Análisis de varianza con Minitab 584 Apéndice 13.2 Análisis de varianza con Excel 586

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xviii

Contenido

Capítulo 14 Regresión lineal simple 590 Estadística en la práctica. Alliance Data Systems 591 14.1 Modelo de regresión lineal simple 592 Modelo de regresión y ecuación de regresión 592 Ecuación de regresión estimada 593 14.2 Método de mínimos cuadrados 595 14.3 Coeficiente de determinación 606 Coeficiente de correlación 610 14.4 Supuestos del modelo 614 14.5 Prueba de significancia 615 Estimación de ó 2 615 Prueba t 616 Intervalo de confianza para â1 618 Prueba F 619 Algunas advertencias acerca de la interpretación de las pruebas de significancia 621 14.6 Uso de la ecuación de regresión estimada para estimación y predicción 624 Estimación por intervalo 625 Intervalo de confianza para el valor medio de y 626 Intervalo de predicción para un solo valor de y 627 14.7 Solución por computadora 632 14.8 Análisis de residuales: validación de los supuestos del modelo 636 Gráfica de residuales contra x 637 Gráfica de residuales contra ŷ 638 Residuales estandarizados 640 Gráfica de probabilidad normal 642 14.9 Análisis de residuales: observaciones atípicas y observaciones influyentes 645 Detección de observaciones atípicas 645 Detección de observaciones influyentes 648 Resumen 653 Glosario 653 Fórmulas clave 654 Ejercicios complementarios 656 Caso práctico 1 Medición del riesgo en el mercado de valores 663 Caso práctico 2 Departamento del Transporte de Estados Unidos 664 Caso práctico 3 Cómo seleccionar una cámara digital 665 Caso práctico 4 Cómo encontrar el automóvil de mayor valor 666 Caso práctico 5 Buckeye Creek Amusement Park 667 Apéndice 14.1 Obtención de la fórmula de mínimos cuadrados con base en el cálculo 668 Apéndice 14.2 Prueba de significancia usando correlación 669 Apéndice 14.3 Análisis de regresión con Minitab 670 Apéndice 14.4 Análisis de regresión con Excel 671

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xix

Contenido

Capítulo 15 Regresión múltiple 674 Estadística en la práctica. dunnhumby 675 15.1 Modelo de regresión múltiple 676 Modelo de regresión y ecuación de regresión 676 Ecuación de regresión múltiple estimada 676 15.2 Método de mínimos cuadrados 677 Ejemplo: Butler Trucking Company 678 Nota sobre la interpretación de los coeficientes 680 15.3 Coeficiente de determinación múltiple 686 15.4 Supuestos del modelo 690 15.5 Prueba de significancia 691 Prueba F 691 Prueba t 694 Multicolinealidad 695 15.6 Uso de la ecuación de regresión estimada para estimación y predicción 698 15.7 Variables independientes cualitativas 701 Ejemplo: Johnson Filtration, Inc. 701 Interpretación de los parámetros 703 Variables cualitativas más complejas 705 15.8 Análisis residual 709 Detección de observaciones atípicas 711 Residuales estudentizados eliminados y observaciones atípicas 711 Observaciones influyentes 712 Uso de la medida de la distancia de Cook para identificar observaciones influyentes 712 15.9 Regresión logística 716 Ecuación de regresión logística 717 Estimación de la ecuación de regresión logística 718 Prueba de significancia 721 Aplicación en la administración 721 Interpretación de la ecuación de regresión logística 722 Transformación logit 725 Resumen 729 Glosario 729 Fórmulas clave 730 Ejercicios complementarios 732 Caso práctico 1 Consumer Research, Inc. 739 Caso práctico 2 Predicción de victorias para los conductores de NASCAR 740 Caso práctico 3 Cómo encontrar el automóvil de mayor valor 741 Apéndice 15.1 Regresión múltiple con Minitab 742 Apéndice 15.2 Regresión múltiple con Excel 742 Apéndice 15.3 Regresión logística con Minitab 744

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xx

Contenido

Capítulo 16 Análisis de regresión: construcción de modelos 745 Estadística en la práctica. Monsanto Company 746 16.1 Modelo lineal general 747 Modelado de relaciones curvilíneas 747 Interacción 751 Transformaciones que involucran a la variable dependiente 753 Modelos no lineales que son intrínsecamente lineales 758 16.2 Determinación de cuándo agregar o eliminar variables 762 Caso general 764 Uso de los valores-p 765 16.3 Análisis de un problema mayor 768 16.4 Procedimientos de selección de variables 772 Regresión por pasos 773 Selección hacia adelante 773 Eliminación hacia atrás 775 Regresión de los mejores subconjuntos 775 La elección final 776 16.5 Método de regresión múltiple para el diseño de experimentos 779 16.6 Autocorrelación y la prueba de Durbin-Watson 784 Resumen 788 Glosario 788 Fórmulas clave 788 Ejercicios complementarios 789 Caso práctico 1 Análisis de las estadísticas del PGA Tour 792 Caso práctico 2 Clasificación de vinos de la región de Piamonte, Italia 793 Apéndice 16.1 Procedimientos de selección de variables con Minitab 794

Capítulo 17 Análisis de series de tiempo y elaboración de pronósticos

796

Estadística en la práctica. Nevada Occupational Health Clinic 797 17.1 Patrones de una serie de tiempo 798 Patrón horizontal 798 Patrón de tendencia 800 Patrón o componente estacional 800 Patrones estacional y de tendencia 801 Patrón cíclico 801 Selección de un método de elaboración de pronósticos 803 17.2 Exactitud del pronóstico 804 17.3 Promedios móviles y suavizamiento exponencial 809 Promedios móviles 809

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xxi

Contenido

17.4

17.5

17.6

Promedios móviles ponderados 812 Suavizamiento exponencial 812 Proyección de la tendencia 819 Regresión de tendencia lineal 819 Regresión de tendencia no lineal 824 Estacionalidad y tendencia 830 Estacionalidad sin tendencia 830 Estacionalidad y tendencia 832 Modelos basados en datos mensuales 835 Descomposición de series de tiempo 839 Cálculo de los índices estacionales 840 Desestacionalización de una serie de tiempo 843 Uso de una serie de tiempo desestacionalizada para identificar tendencias 845 Ajustes estacionales 846 Modelos basados en datos mensuales 846 Patrón o componente cíclico 846

Resumen 849 Glosario 850 Fórmulas clave 851 Ejercicios complementarios 851 Caso práctico 1 Pronóstico de ventas de alimentos y bebidas 855 Caso práctico 2 Elaboración del pronóstico de pérdida de ventas 856 Apéndice 17.1 Elaboración de pronósticos con Minitab 858 Apéndice 17.2 Elaboración de pronósticos con Excel 860

Capítulo 18 Métodos no paramétricos 862 Estadística en la práctica. West Shell Realtors 863 18.1 La prueba de signos 864 Prueba de hipótesis acerca de una mediana poblacional 864 Prueba de hipótesis con muestras pareadas 869 18.2 Prueba de rangos con signo de Wilcoxon 872 18.3 Prueba de Mann-Whitney-Wilcoxon 877 18.4 Prueba de Kruskal-Wallis 887 18.5 Correlación de rangos 892 Resumen 897 Glosario 897 Fórmulas clave 898 Ejercicios complementarios 899 Apéndice 18.1 Métodos no paramétricos con Minitab 902 Apéndice 18.2 Métodos no paramétricos con Excel 904

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xxii

Contenido

Capítulo 19 Métodos estadísticos de control de la calidad 906 Estadística en la práctica. Dow Chemical Company 907 19.1 Filosofías y marcos de referencia 908 El Malcolm Baldrige National Quality Award 909 ISO 9000 909 Six Sigma 909 Calidad en el sector servicios 912 19.2 Control estadístico de procesos 912 Gráficas de control 913 Gráfica x: media y desviación estándar conocidas del proceso 914 Gráfica x: media y desviación estándar desconocidas del proceso 916 Gráfica R 919 Gráfica p 921 Gráfica np 923 Interpretación de las gráficas de control 923 19.3 Muestreo de aceptación 926 KALI, Inc.: un ejemplo de muestreo de aceptación 927 Cálculo de la probabilidad de aceptación de un lote 928 Selección de un plan de muestreo de aceptación 931 Planes de muestreo múltiple 933 Resumen 934 Glosario 934 Fórmulas clave 935 Ejercicios complementarios 936 Apéndice 19.1 Gráficas de control con Minitab 938

Capítulo 20 Números índice 939 Estadística en la práctica. Oficina de Estadísticas Laborales, Departamento del Trabajo de Estados Unidos 940 20.1 Precios relativos 941 20.2 Índices de precios agregados 941 20.3 Cálculo del índice de precios agregados a partir de los precios relativos 945 20.4 Algunos índices importantes de precios 947 Índice de precios al consumidor 947 Índice de precios al productor 947 Promedios Dow Jones 948 20.5 Deflactación de una serie mediante índices de precios 949 20.6 Índices de precios: otras consideraciones 952 Selección de artículos 952 Selección de un periodo base 953 Variaciones en la calidad 953 20.7 Índices de cantidad 953

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xxiii

Contenido

Resumen 955 Glosario 955 Fórmulas clave 956 Ejercicios complementarios 956

Apéndice A Referencias y bibliografía 960 Apéndice B Tablas 962 Apéndice C Notación de suma 989 Apéndice D Soluciones de las autoevaluaciones y respuestas a los ejercicios con números pares

991

Apéndice E Microsoft Excel 2016 y sus herramientas de análisis estadístico

Apéndice F Índice analítico

1056

Cálculo de los valores-p usando Minitab y Excel

1068

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019

1064


5/9

Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Prefacio

Esta es la decimotercera edición revisada de Estadística para negocios y economía. El lector encontrará cambios en los apéndices de los capítulos, en los que ahora se describen los procedimientos para Excel 2016 y Minitab 17. Además, se actualizó el apéndice del libro sobre Microsoft Excel 2016 y sus herramientas de análisis estadístico. Muchas de las funciones estadísticas de Excel se actualizaron y mejoraron. El propósito de la obra es proporcionar a quienes se preparan en las áreas de negocios y economía, una introducción conceptual al campo de la estadística y sus múltiples aplicaciones. Su orientación se dirige a las aplicaciones y fue escrito tomando en cuenta las necesidades de personas que no cuentan con conocimientos sólidos de matemáticas. Las aplicaciones del análisis de datos y la metodología estadística son parte integral de la organización y presentación del material. El análisis y desarrollo de cada técnica se presentan en el escenario de una aplicación, cuyos resultados estadísticos permiten comprender las decisiones y soluciones de los problemas. Aunque el libro está orientado a las aplicaciones, se ha tenido cuidado de proporcionar un desarrollo metodológico sólido y de usar la notación convencional aceptada para el tema que se estudia. Por consiguiente, el lector encontrará que el texto proporciona una buena preparación para estudiar material más avanzado. El libro introduce al lector a Minitab 17 y Microsoft® Office Excel 2016, y recalca el papel del software en la aplicación del análisis estadístico. Minitab fue incluido por ser uno de los principales software tanto en la enseñanza como en la práctica profesional de la estadística. Excel no es un paquete para estadística, pero debido a su amplia disponibilidad y a su uso extendido, es importante para el lector comprender las funciones estadísticas con que cuenta. Los procedimientos de Minitab y Excel se estudian en los apéndices del libro, de manera que los docentes tienen la flexibilidad de hacer tanto énfasis en la computadora como lo deseen para sus cursos.

Cambios en esta edición Agradecemos la aceptación y respuesta positiva a las ediciones anteriores del libro. Así, al hacer modificaciones para ésta, hemos mantenido el estilo de presentación y la legibilidad de las versiones previas, y se han realizado muchos cambios para mejorar la efectividad educativa. Los cambios más significativos se resumen a continuación.

Actualizaciones del contenido •

Los datos y la estadística. Capítulo 1. Se amplía la sección sobre minería de datos para incluir un análisis sobre Big data. Se incorpora una nueva sección sobre analítica, con mayor énfasis en la distinción entre datos experimentales y de observación.

Estadística descriptiva: Presentaciones tabulares y gráficas. Capítulo 2. Al final del capítulo, en el Apéndice 2.2, se incluyen las instrucciones para usar las opciones de gráficas de Excel. Esta nueva funcionalidad produce una galería de gráficas sugeridas con base en datos seleccionados por el usuario, y puede ayudar al lector a identificar las gráficas más apropiadas para desplegar los datos.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xxvi

Prefacio

Estadística descriptiva: Medidas numéricas. Capítulo 3. Para calcular los percentiles se usa el método recomendado por el National Institute of Standards and Technology (NIST). Además de ser el estándar recomendado por el NIST, este método es el que emplean muchos de los paquetes de software, y se utilizará a lo largo del libro cuando se usen percentiles (por ejemplo, al crear un diagrama de caja o al calcular cuartiles o rangos intercuartílicos).

Introducción a la probabilidad. Capítulo 4. Se actualizó el análisis sobre experimentos para clarificar las diferencias entre experimentos aleatorios y diseñados. Esta distinción facilita la comprensión de las diferencias en el análisis de experimentos en los capítulos sobre probabilidad (capítulos 4, 5 y 6) y el capítulo sobre diseño experimental (capítulo 13).

Software. Se revisaron paso a paso todas las instrucciones en los apéndices de software, así como todas las ilustraciones que ejemplifican los resultados que se obtienen con Excel 2016 y Minitab 17. Esto permite que el lector conozca y experimente con las versiones actuales de los dos programas de uso más recurrente para análisis estadístico en los negocios. En esta edición ya no se describe el uso de StatTools.

Casos prácticos. Se incorporan dos nuevos casos prácticos para un total de 33. Se agregó un caso sobre modelos de probabilidad en el capítulo 5 y uno sobre regresión lineal simple en el capítulo 14. Los 33 casos prácticos brindan la oportunidad al lector de trabajar en problemas más complejos, analizar bancos de datos más grandes y elaborar informes gerenciales con base en los resultados de sus análisis.

Ejemplos y ejercicios basados en datos reales. Continuamos con un esfuerzo importante para actualizar los ejercicios y ejemplos con datos reales más actuales y fuentes de referencia de información estadística. En esta edición se incorporan más de 180 nuevos ejemplos y ejercicios basados en datos reales, con sus referencias. Con información obtenida de fuentes empleadas por The Wall Street Journal, USA Today y Barron’s, entre otras, se toman estudios y aplicaciones para desarrollar explicaciones y crear ejercicios que demuestran los múltiples usos de la estadística en negocios y economía. Consideramos que el uso de datos reales de problemas interesantes y relevantes ayuda a atraer más el interés del estudiante en el material y le permite aprender tanto de la metodología estadística como de su aplicación. Esta edición contiene más de 350 ejemplos y ejercicios de este tipo.

Características y pedagogía Ejercicios de métodos y aplicaciones Los ejercicios al final de cada sección se dividen en dos partes: métodos y aplicaciones. Los de métodos requieren que el estudiante use las fórmulas y realice los cálculos necesarios, y los de aplicaciones demandan que use el material del capítulo en situaciones reales. Por lo tanto, el estudiante primero se concentra en lo “esencial” de los cálculos y luego pasa a las sutilezas de la aplicación estadística y su interpretación.

Ejercicios de autoevaluación Ciertos ejercicios se identifican como “Autoevaluación”. Las soluciones completamente desarrolladas de estos ejercicios se incluyen en el apéndice D del libro. El estudiante puede intentar resolverlos y comprobar inmediatamente después la solución para evaluar su comprensión de los conceptos que se presentan en el capítulo.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xxvii

Prefacio

Anotaciones al margen, notas y comentarios Las anotaciones al margen que resaltan los puntos clave y proporcionan información adicional para el lector son una característica fundamental del libro. Fueron diseñadas para resaltar y mejorar la comprensión de los términos y conceptos que se presentan. Al final de cada sección se incluye un recuadro de Notas y comentarios, diseñado para proporcionar al lector información adicional que le permita comprender la metodología estadística y sus aplicaciones. Estas Notas y comentarios contienen advertencias o acotaciones de la metodología, recomendaciones para su aplicación, una breve descripción de consideraciones técnicas e información complementaria.

Archivos de datos Más de 200 archivos de datos están disponibles para el libro. En esta edición, para hacerlos más eficientes, se incluyen archivos en un solo formato, CSV (valores separados por comas), que es compatible con Minitab y Excel. En los apéndices del capítulo 2 se proporcionan las instrucciones para abrir estos archivos en Excel y Minitab. En el texto se usa el logo DATAfile para identificar los bancos de datos. Se incluyen los bancos de datos de todos los casos prácticos y los ejercicios más grandes. Para acceder a estos archivos y otros recursos de apoyo, contacte a su representante local de Cengage.

Agradecimientos Queremos reconocer el trabajo de nuestros revisores, quienes nos han proporcionado comentarios y sugerencias sobre diferentes formas de mejorar el libro. Agradecemos a

AbouEl-Makarim Aboueissa, University of Southern Maine Kathleen Arano Fort Hays State University Musa Ayar Uw-baraboo/Sauk County Kathleen Burke SUNY Cortland YC Chang University of Notre Dame David Chen Rosemont College and Saint Joseph’s University Margaret E. Cochran Northwestern State University of Louisiana Thomas A. Dahlstrom Eastern University

Anne Drougas Dominican University

Tony Hunnicutt Ouachita Technical College

Fesseha Gebremikael Strayer University/ Calhoun Community College

Stacey M. Jones Albers School of Business and Economics, Seattle University

Malcolm C. Gold University of Wisconsin— Marshfield/Wood County

Dukpa Kim University of Virginia

Joel Goldstein Western Connecticut State University

Rajaram Krishnan Earlham College Robert J. Lemke Lake Forest College

Jim Grant Lewis & Clark College

Philip J. Mizzi Arizona State University

Reidar Hagtvedt University of Alberta School of Business

Mehdi Mohaghegh Norwich University

Clifford B. Hawley West Virginia University Vance A. Hughey Western Nevada College

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019

Mihail Motzev Walla Walla University Somnath Mukhopadhyay The University of Texas at El Paso


5/9

xxviii

Contenido

Kenneth E. Murphy Chapman University Ogbonnaya John Nwoha Grambling State University Claudiney Pereira Tulane University J. G. Pitt University of Toronto

Sunil Sapra California State University, Los Angeles Kyle Vann Scott Snead State Community College Rodney E. Stanley Tennessee State University

Scott A. Redenius Brandeis University

Jennifer Strehler Oakton Community College

Sandra Robertson Thomas Nelson Community College

Ronald Stunda Valdosta State University

Cindy van Es Cornell University Jennifer VanGilder Ursinus College Jacqueline Wroughton Northern Kentucky University Dmitry Yarushkin Grand View University David Zimmer Western Kentucky University

Continuamos en deuda con muchos de nuestros colegas y amigos por sus valiosos comentarios y sugerencias para el desarrollo de esta y las anteriores ediciones, entre los que se encuentran: Mohammad Ahmadi University of Tennessee at Chattanooga Lari Arjomand Clayton College and State University Robert Balough Clarion University Philip Boudreaux University of Louisiana Mike Bourke Houston Baptist University James Brannon University of Wisconsin— Oshkosh John Bryant University of Pittsburgh Peter Bryant University of Colorado Terri L. Byczkowski University of Cincinnati Robert Carver Stonehill College Richard Claycombe McDaniel Colleg

Robert Cochran University of Wyoming

Alan Humphrey University of Rhode Island

Robert Collins Marquette University

Ann Hussein Philadelphia College of Textiles and Science

David W. Cravens Texas Christian University Tom Dahlstrom Eastern College Gopal Dorai William Patterson University

C. Thomas Innis University of Cincinnati Ben Isselhardt Rochester Institute of Technology Jeffery Jarrett University of Rhode Island

Nicholas Farnum California State University—Fullerton

Ronald Klimberg St. Joseph’s University

Donald Gren Salt Lake Community College

David A. Kravitz George Mason University

Paul Guy California State University—Chico

David Krueger St. Cloud State University

Clifford Hawley West Virginia University Jim Hightower California State University, Fullerton

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019

John Leschke University of Virginia Martin S. Levy University of Cincinnati John S. Loucks St. Edward’s University


5/9

xxix

Prefacio

David Lucking-Reiley Vanderbilt University Bala Maniam Sam Houston State University

Tom Pray Rochester Institute of Technology

Victor Ukpolo Austin Peay State University

Harold Rahmlow St. Joseph’s University

Ebenge Usip Youngstown State University

Don Marx University of Alaska, Anchorage

H. V. Ramakrishna Penn State University at Great Valley

Tom McCullough University of California— Berkeley

Tom Ryan Case Western Reserve University

Jack Vaughn University of Texas-El Paso

Ronald W. Michener University of Virginia

Bill Seaver University of Tennessee

Andrew Welki John Carroll University

Glenn Milligan Ohio State University

Alan Smith Robert Morris College

Ari Wijetunga Morehead State University

Mitchell Muesham Sam Houston State University

Willbann Terpening Gonzaga University

J. E. Willis Louisiana State University

Roger Myerson Northwestern University

Ted Tsukahara St. Mary’s College of California

Richard O’Connell Miami University of Ohio Alan Olinsky Bryant College Ceyhun Ozgur Valparaiso University

Hroki Tsurumi Rutgers University David Tufte University of New Orleans

Cindy Van Es Cornell University

Mustafa Yilmaz Northeastern University Gary Yoshimoto St. Cloud State University Yan Yu University of Cincinnati Charles Zimmerman Robert Morris College

También agradecemos a nuestros socios de empresas y de la industria que proporcionaron los casos de la sección “Estadística en la práctica”. Los reconocemos de manera individual en los créditos de cada uno de los artículos. Por último, también estamos en deuda con nuestro gerente de producto, Aaron Arnsparge, por sus consejos y apoyo durante la preparación de este libro; nuestra editora de desarollo, Anne Merrill; nuestra gerente de proyecto de contenido, Colleen Farmer; nuestro gerente de proyecto en MPS Limited, Manoj Kumar; nuestro editor de contenidos digitales, Brandon Folts, y otras personas que laboran en Cengage Learning. David R. Anderson Dennis J. Sweeney Thomas A. Williams Jeffrey D. Camm James J. Cochran

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

Acerca de los autores

David R. Anderson. Es profesor emérito de análisis cuantitativo en el Colegio de Administración de Empresas de la University of Cincinnati. Nació en Grand Forks, Dakota del Norte, y obtuvo su licenciatura, maestría y doctorado en Purdue University. Ha colaborado como director del Departamento de Análisis Cuantitativo y Administración de Operaciones y como decano principal del Colegio de Administración de Empresas de la Universidad de Cincinnati. Además, fue coordinador del primer programa para ejecutivos de dicho colegio. En la Universidad de Cincinnati ha impartido la materia de introducción a la estadística a estudiantes de administración de empresas, así como cursos de posgrado sobre análisis de regresión, análisis multivariado y ciencias de la administración. También ha impartido cursos de estadística en el Departamento del Trabajo de Washington, D.C. Ha sido distinguido con nominaciones y premios a la excelencia en la enseñanza al servicio de organizaciones estudiantiles. Es coautor de diez libros en las áreas de estadística, ciencias de la administración, programación lineal y administración de la producción y las operaciones. Es consultor activo en las áreas de muestreo y métodos estadísticos. Dennis J. Sweeney. Es profesor emérito de análisis cuantitativo y fundador del Centro de Mejoramiento de la Productividad en la University of Cincinnati. Nació en Des Moines, Iowa, y obtuvo su licenciatura en Drake University, y la maestría y doctorado en Indiana University, donde le otorgaron una beca de investigación NDEA. Ha colaborado con el grupo de gestión científica de Procter & Gamble y fue profesor visitante durante un año en Duke University. También ocupó los puestos de director del Departamento de Análisis Cuantitativo y decano adjunto del Colegio de Administración de Empresas de la Universidad de Cincinnati. Ha publicado más de 30 artículos y monografías en el área de ciencias de la administración y estadística. La National Science Foundation, IBM, Procter & Gamble, Federated Department Stores, Kroger y Cincinnati Gas & Electric han financiado sus trabajos de investigación, mismos que han sido publicados en Management Science, Operations Research, Mathematical Programming, Decision Sciences, entre otras. El profesor Sweeney es coautor de diez libros en las áreas de estadística, ciencias de la administración, programación lineal y administración de la producción y las operaciones. Thomas A. Williams. Es profesor emérito de ciencias de la administración en el College of Business del Rochester Institute of Technology (RIT). Es originario de Elmira, Nueva York, y obtuvo su licenciatura en Clarkson University. Realizó sus estudios de posgrado en el Rensselaer Polytechnic Institute, donde obtuvo su maestría y doctorado. Antes de integrarse al College of Business del RIT, el profesor Williams fue miembro del personal docente del Colegio de Administración de Empresas de la Universidad de Cincinnati durante siete años, donde desarrolló el programa de licenciatura en sistemas de información que más tarde coordinó. En el Rensselaer Polytechnic Institute fue el primer director del Departamento de Ciencias de las Decisiones. Imparte cursos sobre ciencias de la administración y estadística, así como de posgrado sobre análisis de regresión y de decisiones. Es coautor de 11 libros en las áreas de ciencias de la administración, estadística, administración de la producción y las operaciones, y matemáticas. Ha sido consultor de numerosas empresas Fortune 500 y ha colaborado en proyectos que varían del uso de análisis de datos al desarrollo de modelos de regresión a gran escala.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

xxxii

Acerca de los autores

Jeffrey D. Camm. Es decano asociado de analítica y presidente de Inmar en la School of Business de la Wake Forest University. Nació en Cincinnati, Ohio, y obtuvo su licenciatura en Xavier University y su doctorado en la Clemson University. Antes de unirse a la facultad de Wake Forest, trabajó en la facultad de la University of Cincinnati. Ha sido profesor visitante en Stanford University y en Tuck School of Business en Dartmouth College. Ha publicado más de 30 artículos en el área de optimización aplicada a problemas de administración de operaciones. Los resultados de sus investigaciones han sido publicados en Management Science, Operations Research, Interfaces y otras revistas profesionales. Fue reconocido como Dornoff Fellow of Teaching Excellence en la University of Cincinnati y recibió en 2006 el Premio INFORMS por su práctica en la enseñanza de la investigación de operaciones. Ha participado como consultor en investigación de operaciones para un gran número de empresas y dependencias de gobierno, como firme creyente de practicar lo que se predica. De 2005 a 2010 se desempeñó como editor en jefe de la revista Interfaces y actualmente colabora en el grupo editorial de INFORMS Transactions on Education. James J. Cochran. Es profesor de estadística aplicada y miembro de la Rogers-Spivey Faculty en la University of Alabama. Originario de Dayton, Ohio, obtuvo sus grados de licenciatura, maestría en ciencias y maestría en negocios en Wright State University, y su grado de doctor en la University of Cincinnati. Forma parte de la University of Alabama desde 2014 y ha sido profesor visitante en Stanford University, Universidad de Talca y la University of South Africa y la Pole Universitaire Leonard de Vinci.. Ha publicado más de tres docenas de artículos sobre desarrollo y aplicaciones de investigación de operaciones y métodos estadísticos, así como investigaciones en Management Science, The American Statistician, Communications in Statistics—Theory and Methods, Annals of Operations Research, European Journal of Operational Research, Journal of Combinatorial Optimization, Interfaces, Statistics and Probability Letters y otras revistas profesionales. En 2008 recibió el Premio INFORMS, por su práctica en la enseñanza de la investigación de operaciones y en 2010 fue galardonado con el Premio Mu Sigma Rho Statistical Education Award. Fue electo en el International Statistics Institute en 2005 y nombrado miembro de la American Statistical Association en 2011. También recibió el Founders Award en 2014 y el Karl E. Peace Award en 2015 por parte de la American Statistical Association. Como ferviente defensor de la investigación de operaciones efectiva y la educación estadística como medios para mejorar la calidad de las aplicaciones en los problemas reales, ha organizado y dirigido talleres de efectividad en Montevideo, Uruguay; Cape Town, Sudáfrica; Cartagena, Colombia; Jaipur, India; Buenos Aires, Argentina; Nairobi, Kenia; Buea, Camerún; Kathmandú, Nepal; Osijek, Croacia; La Habana, Cuba, y Ulaanbaatar, Mongolia. Ha colaborado como consultor en diversas empresas y organizaciones no lucrativas. Se desempeño como editor en jefe de la revista INFORMS Transactions on Education de 2006 a 2012 y pertenece al grupo editorial de International Transactions in Operational Research, y Significance.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

1.1

Applications in Business and Economics

CAPÍTULO Los datos y la estadística CONTENIDO

1.3

FUENTES DE DATOS Fuentes existentes Estudios observacionales Estudios experimentales Tiempo y costo Errores en la adquisición de datos

1.4

ESTADÍSTICA DESCRIPTIVA

1.5

INFERENCIA ESTADÍSTICA

1.6

ANALÍTICA

1.7

BIG DATA Y MINERÍA DE DATOS

1.8

COMPUTADORAS Y ANÁLISIS ESTADÍSTICO

1.9

LINEAMIENTOS ÉTICOS PARA LA PRÁCTICA DE LA ESTADÍSTICA

ESTADÍSTICA EN LA PRÁCTICA: BLOOMBERG BUSINESSWEEK 1.1

1.2

APLICACIONES EN NEGOCIOS Y ECONOMÍA Contabilidad Finanzas Marketing Producción Economía Sistemas de información DATOS Elementos, variables y observaciones Escalas de medición Datos categóricos y cuantitativos Datos de corte transversal y de series de tiempo

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019

1

1


5/9

2

Capítulo 1

ESTADÍSTICA

Los datos y la estadística

en LA PRÁCTICA

BLOOMBERG BUSINESSWEEK* NUEVA YORK

Con una circulación global de más de un millón de ejemplares, Bloomberg Businessweek es la revista de negocios más leída en el mundo. Más de 1 700 reporteros en 145 oficinas de todo el mundo producen una variedad de artículos de interés para la comunidad global de los negocios y la economía. Además de reportajes especiales sobre temas de actualidad, la revista contiene secciones regulares sobre administración internacional, análisis económico, procesamiento de información y ciencia y tecnología. La información contenida en los reportajes especiales y las secciones regulares ayuda a los lectores a mantenerse al día en los desarrollos actuales y evalúa su impacto en los negocios y la economía bajo las condiciones actuales. La mayoría de los números de Bloomberg Businessweek, anteriormente conocida sólo como BusinessWeek, contiene un artículo de fondo sobre un tema de interés actual. Dichos artículos a menudo contienen hechos y resúmenes estadísticos que ayudan al lector a comprender la información de negocios y economía. Algunos ejemplos y reportes incluyen el impacto de las empresas que suben partes importantes de su trabajo a la nube, la crisis del Servicio Postal Estadounidense y las razones por las que la crisis de deuda es peor de lo que imaginamos. Además, Bloomberg Businessweek proporciona estadísticas sobre el estado de la economía, que incluyen índices de producción, precios de las acciones, fondos de inversión y tasas de interés. Bloomberg Businessweek también utiliza información estadística en la administración de su propia empresa. Por ejemplo, una encuesta anual aplicada a los suscriptores permite a la empresa obtener sus datos demográficos, hábitos de lectura, compras probables, su estilo de vida, etc. Los directivos de Bloomberg Businessweek utilizan resúmenes estadísticos de la consulta para brindar un mejor servicio a

* Los autores agradecen a Charlene Trentham, gerente de investigación de BusinessWeek, por proporcionar este artículo para la sección Estadística en la práctica.

Bloomberg Businessweek utiliza hechos estadísticos y resúmenes en muchos de sus artículos. © Imaginechina/Corbis

sus suscriptores y anunciantes. Una encuesta reciente entre los estadounidenses reveló que 90% de los suscriptores de Bloomberg Businessweek utiliza una computadora personal en su hogar, y que 64% realizó compras por computadora en el trabajo. Estas estadísticas alertaron a los directivos de la revista sobre el interés de los suscriptores en los nuevos avances en computación. Los resultados de la encuesta también se pusieron a disposición de los posibles anunciantes. El alto porcentaje de suscriptores que usan computadoras personales en el hogar y de los que realizan compras por internet en su trabajo son un incentivo para que un fabricante de estos equipos considere anunciarse en Bloomberg Businessweek. En este capítulo se estudian los tipos de datos de que se dispone para el análisis estadístico y se describe cómo se obtienen éstos. La estadística descriptiva y la inferencia estadística se presentan como medios para convertir los datos en información fácil de interpretar.

Es frecuente ver en los periódicos y las revistas las frases siguientes:

• En el último año el euro ha perdido casi 30% de su valor frente al dólar estadounidense, • • • •

mientras que el dólar australiano ha perdido casi 20% (The Economist, 25 de abril-1 de mayo, 2015). Una encuesta de Pew Research Center reveló que 68% de los usuarios de internet considera que las leyes actuales no son lo suficientemente buenas para proteger la privacidad en línea de las personas (The Wall Street Journal, 24 de marzo de 2014). Las ventas del grupo VW en Estados Unidos continúan cayendo, con una reducción total de 13% desde el pasado mes de enero, a 36 930 vehículos (Panorama, marzo de 2014). Una encuesta con 1 320 reclutadores corporativos reveló que 68% clasifica las habilidades de comunicación como una de las cinco más importantes en los empleados recién contratados (Bloomberg Businessweek, 13-19 de abril, 2015). El sistema de retiro para profesores del estado de California administra 154 300 millones de dólares (Bloomberg Businesweek, 21-27 de enero, 2013). Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

1.1

3

Aplicaciones en negocios y economía

• La pintura de Pablo Picasso Mujer sentada delante de una ventana fue vendida en 45 mi•

llones de dólares en una subasta de arte en Sotheby el 5 de febrero de 2013 (The Wall Street Journal, 15 de febrero de 2013). En los últimos tres meses el incentivo promedio de ventas por vehículo de GM, Chrysler, Ford, Toyota y Honda fue de 2 336 dólares (The Wall Street Journal, 14 de febrero de 2013).

Los datos numéricos en las frases anteriores (30%, 20%, 68%, 13%, 36 930, 1 320, 68%, $154 300, $45 millones, $2 336) se llaman estadísticas. En este sentido, el término estadística se refiere a datos numéricos como promedios, medias, porcentajes e índices que nos ayudan a entender diversas situaciones de los negocios y la economía. Sin embargo, como verá más adelante, el campo, o materia, de la estadística abarca mucho más que los datos numéricos. En un sentido más amplio, la estadística se define como el arte y la ciencia de recolectar, analizar, presentar e interpretar datos. En particular en los negocios y la economía, la información que se obtiene a partir de la recolección, el análisis, la presentación y la interpretación de los datos permite a los administradores o gerentes y a quienes toman decisiones comprender mejor los entornos económico y de negocios, y por lo tanto tomar decisiones mejores y más informadas. En este libro se enfatiza el uso de la estadística para la toma de decisiones en ambos ámbitos. El capítulo 1 comienza con algunos ejemplos de aplicaciones de la estadística en los negocios y la economía. En la sección 1.2 se define el término dato y se introduce el concepto de banco de datos. Esta sección también presenta términos clave como variables y observaciones; estudia la diferencia entre datos cuantitativos y categóricos, e ilustra los usos de los datos de corte transversal y de series de tiempo. En la sección 1.3 se analiza cómo se obtienen los datos de fuentes existentes o por medio de estudios experimentales diseñados para obtener datos nuevos. También se destaca el papel importante que juega hoy internet en la obtención de datos. Los usos de los datos en el desarrollo de la estadística descriptiva y la elaboración de inferencias estadísticas se describen en las secciones 1.4 y 1.5. Las últimas cuatro secciones presentan una introducción al análisis de negocios y el papel de la estadística, una introducción a big data y minería de datos, la función de la computadora en el análisis estadístico, así como un análisis de los lineamientos éticos en la práctica profesional de la estadística.

1.1

Aplicaciones en negocios y economía En el actual entorno global de los negocios y la economía, cualquier persona tiene acceso a una vasta cantidad de información estadística. Los gerentes y líderes de decisiones más exitosos entienden la información y saben cómo usarla de manera eficiente. En esta sección se proporcionan ejemplos que ilustran algunas aplicaciones de la estadística en los negocios y la economía.

Contabilidad Las firmas de contabilidad públicas utilizan procedimientos de muestreo estadístico cuando realizan auditorías para sus clientes. Por ejemplo, suponga que una firma contable quiere determinar si el estado de cuenta de un cliente representa de manera precisa el monto real de las cuentas por cobrar. La gran cantidad de cuentas por cobrar hace que la revisión y la validación de cada cuenta consuman demasiado tiempo y dinero. Como práctica común en este tipo de situaciones, el personal de auditoría selecciona un subconjunto de las cuentas llamado muestra. Después de revisar la precisión de la selección que tomó como muestra, los auditores llegan a una conclusión con respecto a si el monto de las cuentas por cobrar que aparece en el estado de cuenta del cliente es aceptable.

Finanzas Los analistas financieros utilizan una variedad de información estadística como guía para sus recomendaciones de inversión. En el caso de las acciones, revisan diversos datos financieros que incluyen las razones precio/utilidad y el rendimiento por concepto de dividendos. Al comparar la información para una acción con datos sobre los promedios del mercado de valores, un analista financiero puede formular una conclusión acerca de si una acción es una buena inversión. Por ejemplo, el número del 6 de junio de 2015 de The Wall Street Journal reportó que el rendimiento promedio por concepto de dividendos de las 500 grandes empresas S&P 500 fue Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

4

Capítulo 1

Los datos y la estadística

de 2%. Microsoft, en específico, obtuvo un rendimiento por concepto de dividendos de 1.95%. En este caso, la información estadística sobre el rendimiento por concepto de dividendos indica una cifra inferior de los dividendos de Microsoft sobre el promedio de dividendos de las empresas S&P 500. Esta información sobre Microsoft, junto con otra, ayuda a los analistas a realizar recomendaciones para conservar, vender o comprar acciones de Microsoft.

Marketing Los escáneres electrónicos en las cajas de cobro de las tiendas minoristas recolectan datos para diversas aplicaciones de investigación de mercados. Por ejemplo, proveedores de datos como ACNielsen e Information Resources, Inc., compran datos de los escáneres en puntos de venta como las tiendas de abarrotes, los procesan y luego venden resúmenes estadísticos a los fabricantes. Estos últimos gastan cientos de miles de dólares por categoría de producto para obtener este tipo de datos. Los fabricantes también compran datos y resúmenes estadísticos sobre actividades promocionales, como la asignación de precios especiales y el uso de exhibidores dentro de las tiendas. Los gerentes de marca pueden revisar las estadísticas de los escáneres y de la actividad promocional para comprender mejor la relación entre las actividades de promoción y las ventas. Estos análisis a menudo son útiles para establecer futuras estrategias de marketing para diversos productos.

Producción El énfasis actual en la calidad hace que su control sea una aplicación importante de la estadística en la producción. Diversas gráficas estadísticas de control de calidad se usan para monitorear el resultado de un proceso de producción. En particular, una gráfica x barra sirve para monitorear el resultado promedio. Suponga, por ejemplo, que una máquina llena envases con 12 onzas de una bebida refrescante. En forma periódica, un empleado de producción selecciona una muestra de envases y calcula el número promedio de onzas en la muestra. Este promedio, o valor x barra, se traza en una gráfica x barra. Un valor trazado sobre el límite superior de control de la gráfica indica que hay un exceso en el llenado, y un valor trazado por debajo del límite inferior de control indica que el llenado es deficiente. El proceso se considera “bajo control” y permite continuar siempre que los valores x barra trazados se encuentren dentro de los límites de control superior e inferior de la gráfica. Si se interpreta de manera adecuada, una gráfica x barra ayuda a determinar cuándo es necesario realizar ajustes para corregir un proceso de producción.

Economía Los economistas a menudo proporcionan pronósticos sobre la economía o algún otro tema relacionado. Utilizan diferente información estadística para elaborarlos. Por ejemplo, para pronosticar las tasas de inflación recurren a información estadística sobre indicadores como el índice de precios al consumidor, la tasa de desempleo y el uso de la capacidad de manufactura. Estos indicadores se introducen con frecuencia en modelos computarizados de pronósticos que predicen las tasas de inflación.

Sistemas de información Los administradores de sistemas de información son responsables de la operación cotidiana de las redes de cómputo de una organización. Una gran variedad de información estadística les ayuda a evaluar el desempeño de dichas redes, como las redes de área local (LAN), redes de área amplia (WAN), segmentos de redes, intranets y otros sistemas de comunicación de datos. Las estadísticas, como el número medio de usuarios del sistema, la cantidad de tiempo que un componente del sistema no funciona y la proporción de ancho de banda que se utiliza en varios momentos del día, son ejemplos de información estadística que ayuda a los administradores de los sistemas a comprender y manejar mejor las redes de cómputo. Las aplicaciones de la estadística, como las descritas en esta sección, son parte integral de este libro. Estos ejemplos proporcionan una descripción general de gran número de aplicaciones. Para complementar estos ejemplos, profesionales en el campo de los negocios y la economía aportaron artículos para la sección denominada Estadística en la práctica, que se ubica al inicio de cada capítulo, donde se presenta el material que cubre su contenido. Dichas aplicaciones muestran la importancia de la estadística en una amplia variedad de situaciones de negocios y economía. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

1.2

1.2

5

Datos

Datos Los datos son los hechos y las cifras recabados, analizados y resumidos para su presentación e interpretación. Todos los datos recabados en un estudio en particular se conocen como banco o conjunto de datos del estudio. La tabla 1.1 presenta un banco de datos que contiene información sobre 60 países que participan en la Organización Mundial de Comercio. Esta organización fomenta el libre flujo del comercio internacional y proporciona un foro para resolver disputas comerciales.

Elementos, variables y observaciones Los elementos son las entidades a partir de las cuales se recaban los datos. Cada uno de los países listados en la tabla 1.1 es un elemento con el nombre del país o del elemento en la primera columna. Puesto que se presentan 60 países, el banco de datos contiene 60 elementos. Una variable es una característica de interés para los elementos. El banco de datos de la tabla 1.1 incluye las cinco variables siguientes:

• Estatus en la OMC (WTO Status): El estatus de membresía que tiene el país ante la Organización Mundial de Comercio; puede ser como miembro o como observador.

• PIB per cápita [Per Capita GDP ($)]: El valor total de mercado ($) de todos los bienes y • • •

servicios producidos en un país dividido entre su número de habitantes. Por lo general, esta variable se emplea para comparar la productividad económica de los países. Déficit comercial en miles de dólares (Trade Deficit $1000s): La diferencia en dólares entre el valor de las importaciones y las exportaciones totales del país. Fitch Rating: La calificación de crédito soberano del país provista por el grupo Fitch.1 El rango de calificaciones para los créditos va desde AAA en su punto más alto hasta F en su punto más bajo, y pueden ser modificadas con atributos 1 o 2. Fitch Outlook: Es un indicador de que la dirección de la calificación del crédito tiene posibilidades de modificarse durante los próximos dos años. El panorama puede ser negativo, estable o positivo.

En un estudio, las mediciones recabadas para cada elemento en cada variable proporcionan los datos. El conjunto de mediciones obtenido para un elemento en particular se llama observación. Al analizar de nuevo la tabla 1.1, se observa que el conjunto de mediciones para la primera observación (Armenia) es Miembro, 5 400, 2 673 359, BB2 y Estable. El conjunto de mediciones para la segunda observación (Austria) es Miembro, 40 800, 233 304 157, AAA y Estable. Un banco de datos de 60 elementos contiene 60 observaciones

Escalas de medición La recolección de datos requiere una de las escalas de medición siguientes: nominal, ordinal, de intervalo o de razón. La escala de medición determina la cantidad de información contenida en los datos e indica la manera más apropiada de resumirlos y analizarlos estadísticamente. Cuando los datos de una variable se componen de etiquetas o nombres utilizados para identificar un atributo del elemento, la escala de medición se considera una escala nominal. Por ejemplo, al observar los datos de la tabla 1.1 se observa que la escala de medición para la variable estatus en la OMC es nominal, porque “miembro (member)” y “observador (observer)” son etiquetas que se usan para identificar la categoría del estatus del país. En tales casos se puede utilizar un código numérico o etiquetas no numéricas. Por ejemplo, para facilitar la recolección y preparación de los datos con la finalidad de introducirlos en una base de datos computarizada, podría utilizarse un código numérico para la variable estatus en la OMC (WTO Status) que establezca que 1 denota un país miembro de la Organización Mundial de Comercio y 2 un país observador. La escala de medición es nominal a pesar de que los datos aparecen como valores numéricos.

1

El Fitch Group es una de tres organizaciones de estadísticas, reconocidas a nivel nacional, designadas por la U.S. Securities and Exchange Commission. Las otras dos son Standard and Poor’s y Moody’s.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

6

Capítulo 1

TABLA 1.1

Banco de datos de 60 países que participan en la Organización Mundial del Comercio

Nation

DATA

file Nations

Los bancos de datos, como el de Nations, están disponibles en inglés en el sitio web de este libro.

Los datos y la estadística

Armenia Australia Austria Azerbaijan Bahrain Belgium Brazil Bulgaria Canada Cape Verde Chile China Colombia Costa Rica Croatia Cyprus Czech Republic Denmark Ecuador Egypt El Salvador Estonia France Georgia Germany Hungary Iceland Ireland Israel Italy Japan Kazakhstan Kenya Latvia Lebanon Lithuania Malaysia Mexico Peru Philippines Poland Portugal South Korea Romania Russia Rwanda Serbia Seychelles Singapore Slovakia Slovenia South Africa Sweden

WTO Status

Per Capita GDP ($)

Trade Deficit ($1000s)

Fitch Rating

Fitch Outlook

Member Member Member Observer Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Member Observer Member Member Observer Member Member Member Member Member Member Member Member Member Observer Member Observer Observer Member Member Member Member Member

5,400 40,800 41,700 5,400 27,300 37,600 11,600 13,500 40,300 4,000 16,100 8,400 10,100 11,500 18,300 29,100 25,900 40,200 8,300 6,500 7,600 20,200 35,000 5,400 37,900 19,600 38,000 39,500 31,000 30,100 34,300 13,000 1,700 15,400 15,600 18,700 15,600 15,100 10,000 4,100 20,100 23,200 31,700 12,300 16,700 1,300 10,700 24,700 59,900 23,400 29,100 11,000 40,600

2,673,359 233,304,157 12,796,558 216,747,320 3,102,665 214,930,833 229,796,166 4,049,237 21,611,380 874,459 214,558,218 2156,705,311 21,561,199 5,807,509 8,108,103 6,623,337 210,749,467 215,057,343 1,993,819 28,486,933 5,019,363 802,234 118,841,542 4,398,153 2213,367,685 29,421,301 2504,939 259,093,323 6,722,291 33,568,668 31,675,424 233,220,437 9,174,198 2,448,053 13,715,550 3,359,641 239,420,064 1,288,112 27,888,993 15,667,209 19,552,976 21,060,508 237,509,141 13,323,709 2151,400,000 939,222 8,275,693 666,026 227,110,421 22,110,626 2,310,617 3,321,801 210,903,251

BB2 AAA AAA BBB2 BBB AA1 BBB BBB2 AAA B1 A1 A1 BBB2 BB1 BBB2 BBB A1 AAA B2 BB BB A1 AAA B1 AAA BBB2 BB1 BBB1 A A1 AA BBB B1 BBB2 B BBB A2 BBB BBB BB1 A2 BBB2 A1 BBB2 BBB B BB2 B AAA A1 AA2 BBB1 AAA

Stable Stable Stable Positive Stable Negative Stable Positive Stable Stable Stable Stable Stable Stable Negative Negative Positive Stable Stable Negative Stable Stable Stable Positive Stable Negative Stable Negative Stable Negative Negative Positive Stable Positive Stable Positive Stable Stable Stable Stable Stable Negative Stable Stable Positive Stable Stable Stable Stable Stable Negative Stable Stable

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

1.2

Switzerland Thailand Turkey UK Uruguay USA Zambia

7

Datos

Member Member Member Member Member Member Member

43,400 9,700 14,600 35,900 15,400 48,100 1,600

227,197,873 2,049,669 71,612,947 162,316,831 2,662,628 784,438,559 21,805,198

AAA BBB BB1 AAA BB AAA B1

Stable Stable Positive Negative Positive Stable Stable

La escala de medición de una variable se llama escala ordinal si los datos exhiben las propiedades de los datos nominales y su orden o clasificación es significativo. Por ejemplo, en relación con la tabla 1.1, la escala de medición para Fitch Rating es ordinal, porque las etiquetas de rating o calificación que van desde AAA hasta F pueden ordenarse desde la mejor calificación crediticia AAA hasta la peor, que es F. Las letras que indican la calificación proporcionan etiquetas similares a los datos nominales, pero además pueden clasificarse u ordenarse con base en la calificación crediticia, lo que hace que la escala sea ordinal. Los datos ordinales también pueden proporcionarse por medio de un código numérico, por ejemplo, su número de lista en clase. En una escala de intervalo para una variable, los datos presentan todas las propiedades de los datos ordinales, y el intervalo entre los valores se expresa en términos de una unidad de medida fija. Los datos de intervalo son siempre numéricos. Las calificaciones de la prueba de aptitudes Scholastic Aptitude Test (SAT) son un ejemplo de datos escala de intervalo. Por ejemplo, tres estudiantes que obtuvieron las calificaciones 620, 550 y 470 en una prueba o examen de matemáticas llamada SAT pueden clasificarse u ordenarse en función del mejor al peor desempeño. Además, las diferencias entre las puntuaciones son significativas. Por ejemplo, el estudiante 1 obtuvo 620 2 550 5 70 puntos más que el estudiante 2, mientras que éste obtuvo 550 2 470 5 80 puntos más que el estudiante 3. En una escala de razón para una variable los datos tienen todas las propiedades de los datos de intervalo, y la razón de los dos valores es significativa. Para la medición de variables como la distancia, la estatura, el peso y el tiempo se usa la escala de razón. Ésta requiere que se incluya un valor cero para indicar que en este punto no existe un valor para la variable. Por ejemplo, considere el costo de un automóvil. Un valor cero para el costo indicaría que el vehículo no tiene costo, es gratis. Además, si se compara el costo de un automóvil de $30 000 con el costo de un segundo automóvil de $15 000, la propiedad de la razón muestra que el primero cuesta $30 000/$15 000 5 2 veces, o el doble, que el segundo.

Datos categóricos y cuantitativos

El método estadístico apropiado para resumir los datos depende de que los datos sean categóricos o cuantitativos.

Los datos se clasifican como categóricos o cuantitativos. Los que se agrupan por categorías específicas se conocen como datos categóricos. Este tipo de datos utiliza una escala de medición que puede ser nominal u ordinal. Los que utilizan valores numéricos para indicar cuánto o cuántos se conocen como datos cuantitativos; éstos se obtienen usando la escala de medición ya sea de intervalo o de razón. Una variable categórica incluye datos categóricos y una variable cuantitativa comprende datos cuantitativos. El análisis estadístico apropiado para una variable en particular depende de que ésta sea categórica o cuantitativa. Si la variable es categórica, el análisis estadístico es muy limitado. Los datos categóricos se resumen mediante el conteo del número de observaciones en cada categoría o por medio del cálculo de la proporción de las observaciones en cada categoría. Sin embargo, aun cuando estos datos se identifican por medio de un código aritmético, operaciones como la suma, la resta, la multiplicación y la división no producen resultados que tengan sentido. En la sección 2.1 se estudian algunas maneras de resumir los datos categóricos. Las operaciones aritméticas sí proporcionan resultados con sentido para las variables cuantitativas. Por ejemplo, los datos cuantitativos pueden sumarse y luego dividirse entre el número de observaciones para calcular el valor promedio, el cual tiene significado y se interpreta con facilidad. En general, se tienen más alternativas para el análisis estadístico cuando los datos son cuantitativos. La sección 2.2 y el capítulo 3 proporcionan maneras de resumir este tipo de datos.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

8

Capítulo 1

Los datos y la estadística

Datos de corte transversal y de series de tiempo Para efectos del análisis estadístico es importante distinguir entre datos de corte transversal y datos de series de tiempo. Los datos de corte transversal son recabados en el mismo momento, o aproximadamente al mismo tiempo. Los de la tabla 1.1 son de corte transversal, debido a que describen las cinco variables para los 60 países de la Organización Mundial de Comercio en el mismo punto de tiempo. Los datos de series de tiempo o series temporales son recabados a lo largo de varios periodos. Por ejemplo, la serie de tiempo de la figura 1.1 muestra el precio promedio por galón de gasolina regular convencional en Estados Unidos entre 2009 y 2014. De enero de 2009 a mayo de 2011 el precio promedio por galón continuó su incremento de forma estable. Desde entonces se ha presentado más fluctuación de precios y alcanzó un precio promedio por galón de 3.12 dólares en octubre de 2014. Las gráficas de los datos de series de tiempo a menudo se encuentran en publicaciones de negocios y economía; ayudan a los analistas a comprender lo que ocurrió en el pasado, identificar cualquier tendencia en el tiempo y proyectar niveles futuros para las series de tiempo. Las gráficas de este tipo pueden adoptar una variedad de formas, como lo muestra la figura 1.2. Con un poco de estudio, suelen ser fáciles de comprender e interpretar. Por ejemplo, la gráfica (A) de la figura 1.2 muestra el índice promedio industrial Dow Jones de 2004 a 2014. En noviembre de 2004, el índice del mercado de valores se encontraba cercano a 10 000 puntos. El índice aumentó y llegó a ubicarse por encima de los 14 000 puntos en octubre de 2007. Sin embargo, observe que existe un declive en las series de tiempo después de su punto más alto en 2007. Para febrero de 2009 las condiciones económicas deficientes provocaron que el promedio industrial Dow Jones regresara a niveles alrededor de los 7 000 puntos. Este fue un periodo de temor y desaliento para los inversionistas. Sin embargo, para finales de 2009, el índice mostró una recuperación al alcanzar los 10 000 puntos. Este índice ha aumentado de forma constante y se ubicó por encima de los 17 500 puntos en noviembre de 2014. La gráfica (B) muestra la utilidad neta de McDonald’s Inc. desde 2005 hasta 2013. Las condiciones económicas en declive de 2008 y 2009 fueron realmente benéficas para la empresa, ya que dicha utilidad alcanzó un máximo histórico. Este crecimiento en la utilidad neta demostró que la empresa estaba prosperando durante la crisis económica, cuando la gente empezó a restringir sus gastos y prefería las alternativas más económicas ofrecidas por McDonald’s en lugar de los restaurantes tradicionales más caros. La utilidad neta de McDonald’s continuó aumentando hasta alcanzar un nuevo máximo histórico en 2010 y 2011, disminuyó ligeramente en 2012 e incrementó nuevamente en 2013. FIGURA 1.1

Precio promedio por galón de la gasolina regular en Estados Unidos

Precio promedio por galón

$4.50 $4.00 $3.50 $3.00 $2.50 $2.00 $1.50 $1.00 $0.50 $0.00

Ene-09

Ago-09

May-10

Oct-10

May-11

Dic-11

Jul-12

Feb-13

Fecha Fuente: Energy Information Administration, U.S. Department of Energy, marzo de 2014.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019

Sep-13

Ago-14


5/9

1.2

14

13

N ov

12

N ov

11

N ov

10

N ov

09

N ov

08

N ov

07

N ov

06

N ov

N ov

N ov

N ov

05

20 000 18 000 16 000 14 000 12 000 10 000 8 000 6 000 4 000 2 000 0

04

Promedio Industrial Dow Jones

Varias gráficas de series de tiempo

Año (A) Promedio Industrial Dow Jones

Utilidad neta (miles de millones $)

6

5

4

3

2

1

0

2005

2006

2007

2008

2009

2010

2011

Año (B) Utilidad neta de McDonald’s Inc. 100

80

60

40

20

Mes (C) Tasa de ocupación de los hoteles del sur de Florida

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019

ic D

ov N

O

ct

p Se

l

go

Ju

A

n Ju

ay M

br A

ar M

Fe b

0

En e

Porcentaje de ocupación

FIGURA 1.2

9

Datos


5/9

10

Capítulo 1

Los datos y la estadística

La gráfica (C) muestra la serie de tiempo para la tasa de ocupación de los hoteles en el sur de Florida durante un periodo de un año. Las tasas más altas, 95 y 98%, ocurren durante los meses de febrero y marzo, cuando el clima de la región es atractivo para los turistas. De hecho, la temporada de ocupación más alta para los hoteles del sur de Florida es de enero a abril de cada año. Por otra parte, observe las menores tasas de ocupación durante los meses de agosto a octubre, periodo en cual se encuentra el indicador más bajo de 50% durante septiembre. Las altas temperaturas y la temporada de huracanes son las razones principales de la caída en la ocupación de los hoteles durante este periodo.

NOTAS Y COMENTARIOS 1. Una observación es el conjunto de mediciones obtenido para cada elemento de un banco de datos. Por consiguiente, el número de observaciones es siempre igual al número de elementos. El número de mediciones obtenidas para cada elemento es igual al número de variables. Por ende, el número total de elementos de datos se determina multiplicando el número de observaciones por el número de variables.

1.3

2. Los datos cuantitativos pueden ser discretos o continuos. Los datos cuantitativos que miden cuántos (por ejemplo, el número de llamadas recibidas en 5 minutos) son discretos. Los datos cuantitativos que miden cuánto (por ejemplo, el peso o el tiempo) son continuos debido a que no hay una separación entre los valores de datos posibles.

Fuentes de datos Los datos se obtienen de fuentes existentes o de encuestas y estudios experimentales diseñados para recabar datos nuevos.

Fuentes existentes En algunos casos, los datos necesarios para una aplicación en particular ya existen. Las empresas mantienen diversas bases de datos de sus empleados, clientes y operaciones de negocios. Los datos sobre los sueldos, la edad y los años de experiencia de los empleados se obtienen por lo general de los registros internos del personal. Otros registros internos contienen datos sobre ventas, gastos de publicidad, costos de distribución, niveles de inventario y cantidades de producción. La mayoría de las empresas mantiene también datos detallados sobre sus clientes. La tabla 1.2 muestra algunos de los datos de que se dispone por lo general a partir de los registros internos de una empresa. Las organizaciones que se especializan en la recolección y el mantenimiento de datos proveen cantidades significativas de información económica y de negocios. Las empresas tienen TABLA 1.2

Ejemplos de datos disponibles de los registros o expedientes internos de una empresa

Fuente

Algunos datos comúnmente disponibles

Registros de empleados

Nombre, domicilio, número de Seguro Social, sueldo, número de días de vacaciones, número de días de incapacidad y bonos

Registros de producción

Número de parte o de producto, cantidad producida, costo de la mano de obra directa y costo de los materiales

Registros de inventarios

Número de parte o de producto, cantidad disponible de unidades, punto de reorden, lote económico o cantidad económica del pedido y programa de descuentos

Registros de ventas

Número de producto, volumen de ventas, volumen de ventas por región y volumen de ventas por tipo de cliente

Registros de crédito

Nombre del cliente, domicilio, número telefónico, límite de crédito y saldo de las cuentas por cobrar

Perfiles de clientes

Edad, género, nivel de ingresos, número de miembros en la familia, domicilio y preferencias

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

1.3

11

Fuentes de datos

acceso a estas fuentes de datos externos por medio de acuerdos o al comprarlos. Dun & Bradstreet, Bloomberg y Dow Jones & Company son tres empresas que ofrecen extensos servicios de bases de datos a sus clientes. ACNielsen e Information Resources, Inc. ha logrado el éxito en su negocio de recolección y procesamiento de datos que vende a anunciantes y fabricantes de productos. También se obtienen datos de diversas asociaciones de la industria y de organizaciones de interés especial. Travel Industry Association of America mantiene información relacionada con viajes, como el número de turistas y los gastos de viaje por estado. Estos datos son de interés para las empresas y personas de la industria del ramo. El Graduate Management Admission Council cuenta con datos sobre calificaciones de exámenes, características de los estudiantes y programas sobre administración de educación universitaria. La mayoría de los datos provenientes de estos tipos de fuentes se proveen a usuarios calificados por un costo moderado. Internet es una fuente importante de datos e información estadística. Casi todas las empresas tienen una página web que proporciona información general acerca de la organización, así como datos sobre ventas, número de empleados y de productos, el precio de los productos y sus especificaciones. Además, varias empresas se especializan en proveer información a través de Internet, gracias a lo cual se puede tener acceso a cotizaciones de acciones, precios de los platillos en los restaurantes, datos sobre sueldos y una variedad casi infinita de información. Las agencias gubernamentales son otra fuente importante de datos existentes. Por ejemplo, el Departamento del Trabajo de Estados Unidos maneja una gran cantidad de datos sobre las tasas de empleo, las tasas salariales, el porcentaje de la población activa y la afiliación a sindicatos. La tabla 1.3 lista algunas agencias gubernamentales seleccionadas y algunos de los datos que proporcionan. La mayoría de las dependencias que recaba y procesa datos también los pone a disposición de los usuarios por medio de un sitio web. La figura 1.3 muestra la página principal del sitio web de la Oficina de Estadísticas Laborales de Estados Unidos.

Estudios observacionales Los estudios sobre los fumadores y los no fumadores son observacionales, debido a que los investigadores no determinan o controlan quién fuma y quién no.

TABLA 1.3

En un estudio observacional simplemente se observa lo que ocurre en una situación particular, se registran los datos sobre una o más variables de interés y se lleva a cabo un análisis estadístico de los datos resultantes. Por ejemplo, los investigadores pueden observar a un grupo aleatorio de clientes que entran a una tienda Walmart para recabar datos sobre variables como el tiempo que emplean en comprar, su género, la cantidad de dinero que gastan, etc. El análisis estadístico de los datos puede ayudar a los gerentes a determinar la forma en que algunos factores, como el tiempo de compra y el género, influyen en la cantidad de dinero gastada. Como otro ejemplo de un estudio observacional, suponga que los investigadores están interesados en la relación entre el género del CEO de una empresa de Fortune 500 y el desempeño de la misma medida con el rendimiento sobre el capital (return on equity, ROE). Para obtener los datos, los investigadores seleccionan una muestra de empresas y registran el género del CEO y el ROE de cada una de ellas. El análisis estadístico de los datos puede ayudar a determinar la relación entre el desempeño de la empresa y el género del CEO. Este ejemplo es un estudio observacional porque los investigadores no tienen control sobre el género del CEO o el ROE de las empresas de la muestra.

Ejemplos de datos disponibles de algunas agencias gubernamentales

Agencia gubernamental

Algunos datos disponibles

Oficina del Censo

Datos poblacionales, número de familias e ingresos por familia

Consejo de la Reserva Federal

Datos sobre la masa monetaria, crédito a plazo, tipos de cambio y tasas de descuento

Oficina de Administración y Presupuesto

Datos sobre ingresos, gastos y deudas del gobierno federal

Departamento de Comercio

Datos sobre la actividad comercial, valor de las remesas por industria, nivel de utilidades por industria e industrias en crecimiento y en declive

Oficina de Estadísticas Laborales

Gasto de los consumidores, ingresos por hora, tasa de desempleo, registros de seguridad y estadísticas internacionales

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

12

Capítulo 1

FIGURA 1.3

Los datos y la estadística

Página principal de la Oficina de Estadísticas Laborales de Estados Unidos

Las encuestas y estudios de opinión son otros dos ejemplos de estudios observacionales comunes. Los datos que brindan este tipo de estudios sólo nos permiten observar las opiniones de los participantes. Por ejemplo, el estado de Nueva York llevó a cabo una encuesta telefónica en la que se preguntó a los residentes si estaban a favor o en contra de un incremento en el impuesto a la gasolina para obtener fondos para reparar caminos y puentes. El análisis estadístico de la encuesta ayudará a los legisladores a determinar si deben ingresar una iniciativa para incrementar los impuestos a la gasolina.

Estudios experimentales Se cree que el estudio estadístico experimental más grande jamás realizado es el experimento para la vacuna Salk contra la polio del Servicio de Salud Pública efectuado en 1954. Se seleccionaron casi dos millones de niños de 1o, 2o y 3er grados de enseñanza elemental de todo Estados Unidos.

La principal diferencia entre un estudio observacional y uno experimental es que los experimentos se llevan a cabo en condiciones controladas. Como resultado, los datos obtenidos a partir de un experimento bien diseñado suelen brindar más información en comparación con los datos de fuentes existentes o de estudios observacionales. Por ejemplo, suponga que una compañía farmacéutica desea conocer la forma en que un nuevo medicamento que ha desarrollado influye en la presión sanguínea. Para obtener los datos, los investigadores seleccionan una muestra de personas. Diferentes grupos de ellas reciben dosis distintas de la medicina y se recaba la información de la presión sanguínea previa y posterior para cada grupo. El análisis estadístico de los datos puede ayudar a determinar la forma en que el medicamento afecta la presión sanguínea. Con frecuencia, el tipo de experimento que se maneja en estadística comienza con identificar una variable de interés. Posteriormente se identifican y controlan una o más variables para obtener los datos sobre la forma en que otras variables influyen en la principal. En el capítulo 13 se analizan los modelos estadísticos apropiados para analizar los datos de los experimentos.

Tiempo y costo Cualquier persona que desee usar el análisis estadístico de datos para apoyar la toma de decisiones debe considerar el tiempo y los costos de obtenerlos. El uso de fuentes existentes de datos es preferible si se pueden obtener en un corto tiempo. Si no se cuenta con datos importantes disponibles de una fuente existente, se deben considerar el tiempo y el costo adicional para obtenerlos. En todos los casos, quien toma la decisión debe tomar en cuenta la contribución del análisis estadístico al proceso de toma de decisiones. El costo de la adquisición de datos y el análisis estadístico subsecuente no deben exceder el ahorro generado por el uso de la información para mejorar una decisión. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

1.4

13

Estadística descriptiva

Errores en la adquisición de datos Los gerentes deben ser siempre conscientes de la posibilidad de errores en los estudios estadísticos. El uso de datos erróneos es peor que no usar datos. Una equivocación en la adquisición de los datos ocurre siempre que el valor de los datos obtenidos no es igual al valor verdadero o real que se obtendría con un procedimiento correcto. Estos errores pueden ocurrir de varias maneras. Por ejemplo, un entrevistador podría cometer una falla de registro, como una transposición de los números cuando registra la edad de una persona, es decir, que anote 42 en vez de 24 años, o la persona que responde una pregunta durante una entrevista podría malinterpretarla y dar una respuesta incorrecta. Los analistas con experiencia tienen gran cuidado en recabar y registrar los datos para asegurarse de no cometer errores. Para verificar su consistencia interna se usan procedimientos especiales. Por ejemplo, estos procedimientos indicarían que el analista debe revisar la precisión de los datos para una persona entrevistada que indica que tiene 22 años de edad pero reporta 20 años de experiencia laboral. Los analistas también revisan los datos con valores inusualmente grandes o pequeños llamados atípicos, los cuales son candidatos a posibles errores. En el capítulo 3 se presentan algunos métodos que los expertos en estadística utilizan para identificar datos atípicos. Los errores ocurren con frecuencia durante la adquisición de datos. El uso a ciegas de cualquier dato con que se cuenta o el uso de los que se adquirieron con poco cuidado puede conducir a información y a decisiones erróneas. Por lo tanto, emprender acciones para adquirir datos precisos ayuda a garantizar que la información sea confiable y valiosa para la toma de decisiones.

1.4

Estadística descriptiva La mayor parte de la información estadística en periódicos, revistas, informes de empresas y otras publicaciones consiste en datos que se resumen y presentan en una forma fácil de comprender para el lector. Estos resúmenes de datos, que pueden ser tablas, gráficas o números, se conocen como estadística descriptiva. Consulte el banco de datos de la tabla 1.1, el cual contiene información referente a 60 países miembros de la Organización Mundial de Comercio. Los métodos de la estadística descriptiva se pueden usar para resumir esta información. Por ejemplo, considere la variable Fitch Outlook que indica la dirección en la cual es posible que se mueva la calificación crediticia de un país en los próximos dos años. Esta variable se registra como negativa, estable o positiva. La tabla 1.4 presenta un resumen tabular y muestra la cantidad de países clasificados en cada una de las categorías de Fitch Outlook. Un resumen gráfico de los mismos datos, llamado gráfica de barras, se presenta en la figura 1.4. Estos tipos de resúmenes gráficos y tabulares facilitan la interpretación de los datos. Al remitirnos a la tabla 1.4 y a la figura 1.4 se observa que la mayoría de las calificaciones de Fitch Outlook para los créditos es estable, con 65% de los países clasificados de esta manera. Las calificaciones positivas y negativas para los créditos son similares, siendo la calificación negativa (18.3%) ligeramente superior a la positiva (16.7%). En la figura 1.5 se presenta un resumen gráfico para la variable cuantitativa PIB per cápita de la tabla 1.1, llamado histograma. El histograma facilita ver que el PIB per cápita de los 60 países varía de 0 a 60 000 dólares, con una mayor concentración entre $10 000 y $20 000. Sólo un país muestra un PIB per cápita superior a los $50 000.

TABLA 1.4

Frecuencias y frecuencias porcentuales de la calificación crediticia de Fitch Outlook para 60 países

Fitch Outlook

Frecuencia

Positiva Estable Negativa

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

10 39 11

09.05.2019

Frecuencia porcentual (%) 16.7 65.0 18.3


5/9

Capítulo 1

FIGURA 1.4

Los datos y la estadística

Gráfica de barras de la calificación crediticia de Fitch Outlook para 60 países

70

Frecuencia porcentual

60 50 40 30 20 10 0

Negativa

Estable

Positiva

Fitch Outlook

Además de las tablas y las gráficas, para resumir los datos se usa la estadística descriptiva numérica. La medida estadística descriptiva numérica más común es el promedio, o media. Con ayuda de los datos sobre el PIB per cápita de 60 países que se presentan en la tabla 1.1, podemos calcular el promedio sumando el PIB per cápita de los 60 países y dividiendo el total entre 60. Al hacerlo, se obtiene un PIB per cápita promedio de 21 387 dólares, el cual demuestra una medida de tendencia central o posición central de los datos para esa variable. El interés en métodos eficaces para el desarrollo y la presentación de la estadística descriptiva es cada vez mayor. Los capítulos 2 y 3 se centran en los métodos tabular, gráfico y numérico de la estadística descriptiva. FIGURA 1.5

Histograma del PIB per cápita de 60 países

20 18 16 14

Frecuencia

14

12 10 8 6 4 2 0

0–9 999

10 000– 19 999

20 000– 29 999

30 000– 39 999

PIB per cápita

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019

40 000– 49 999

50 000– 59 999


5/9

1.5

1.5

15

Inferencia estadística

Inferencia estadística Numerosas situaciones requieren información sobre un grupo grande de elementos (personas, empresas, votantes, familias, productos, clientes, etc.), pero por razones de tiempo, costo y otras consideraciones sólo se pueden recabar datos de una pequeña porción del conjunto. El grupo más grande de elementos en un estudio en particular se llama población, y el grupo más pequeño se denomina muestra. En términos formales se utilizan las definiciones siguientes:

POBLACIÓN Una población es el conjunto de todos los elementos de interés en un estudio específico.

MUESTRA Una muestra es un subconjunto de la población.

El gobierno estadounidense efectúa un censo cada 10 años. Las firmas de investigación de mercados realizan todos los días encuestas por muestreo.

El proceso de aplicar una encuesta para recabar datos de toda una población se llama censo. El proceso de aplicar una encuesta para recabar datos de una muestra se llama encuesta por muestreo. Como una de sus contribuciones importantes, la estadística usa datos de una muestra para realizar estimaciones y probar hipótesis sobre las características de una población mediante un proceso conocido como inferencia estadística. Como ejemplo de inferencia estadística, considere el estudio realizado por Norris Electronics, la cual fabrica focos de alta luminosidad que se usan en diversos productos eléctricos. En un intento por incrementar la vida útil de los focos, el grupo de diseño desarrolló un filamento nuevo. En este caso, la población se define como todos los focos que pueden fabricarse con el filamento nuevo. Para evaluar sus ventajas, se fabricaron y probaron 200 focos con dicho aditamento. Los datos recabados de esta muestra señalan el número de horas de funcionamiento de cada foco antes de que el filamento se fundiera. Consulte la tabla 1.5.

TABLA 1.5

DATA

file Norris

107 54 66 62 74 92 75 65 81 83 78 90 96 66 68 85 83 74 73 73

Número de horas hasta que se funde el filamento para una muestra de 200 focos en el ejemplo de Norris Electronics 73 65 62 116 85 78 90 81 62 70 66 78 75 86 72 67 68 91 77 63

68 71 79 65 73 88 62 75 79 70 66 71 64 96 77 87 72 76 79 63

97 70 86 88 80 77 89 62 83 81 94 101 76 89 60 80 67 83 94 89

76 84 68 64 68 103 71 94 93 77 77 78 72 81 87 84 92 66 63 82

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

79 88 74 79 78 88 71 71 61 72 63 43 77 71 84 93 89 68 59 64

09.05.2019

94 62 61 78 89 63 74 85 65 84 66 59 74 85 75 69 82 61 62 85

59 61 82 79 72 68 70 84 62 67 75 67 65 99 77 76 96 73 71 92

98 79 65 77 58 88 74 83 92 59 68 61 82 59 51 89 77 72 81 64

57 98 98 86 69 81 70 63 65 58 76 71 86 92 45 75 102 76 65 73


5/9

16

Capítulo 1

Los datos y la estadística

Suponga que Norris quiere usar los datos muestrales para hacer una inferencia sobre las horas promedio de vida útil para la población de todos los focos que podrían producirse con el filamento nuevo. La adición de los 200 valores en la tabla 1.5 y la división del total entre 200 proporciona la vida útil promedio de la muestra para los focos: 76 horas. Podemos usar este resultado para estimar que la vida útil promedio para los focos en la población es de 76 horas. La figura 1.6 proporciona un resumen gráfico del proceso de inferencia estadística para Norris Electronics. Siempre que los expertos en estadística usan una muestra para estimar una característica de interés de la población, proporcionan un enunciado de la calidad, o precisión, asociada con la estimación. Para el ejemplo de Norris, el experto en estadística podría afirmar que la estimación puntual de la vida útil promedio para la población de focos nuevos es de 76 horas con un margen de error de 64 horas. Por lo tanto, una estimación del intervalo de la vida útil promedio para todos los focos producidos con el filamento nuevo es de 72 a 80 horas. El experto también puede mencionar cuánta confianza tiene en que este intervalo contenga la población promedio.

1.6

Adoptamos la definición de analítica desarrollada por el Institute for Operations Research and the Management Sciences (INFORMS).

Analítica La toma de decisiones basada en datos ha aumentado drásticamente debido al incremento de datos disponibles, el almacenamiento más eficiente en costos, el procesamiento más rápido de cómputo y el reconocimiento de los gerentes del valor de los datos para comprender a los clientes y las operaciones de negocios. El amplio rango de técnicas que se pueden emplear para apoyar las decisiones basadas en datos conforma lo que se conoce como analítica. La analítica es el procesamiento científico que transforma los datos en conocimiento para tomar mejores decisiones. Se emplea para tomar decisiones basadas en datos o en hechos, lo que se considera más objetivo que otros enfoques de decisiones. Las herramientas de la analítica pueden ayudar en este proceso al crear conocimiento a partir de los datos, mejorar nuestra capacidad para hacer predicciones más precisas para la planeación, cuantificar los riesgos y brindar mejores alternativas a partir del análisis. La analítica comprende una variedad de técnicas que van desde reportes simples hasta el uso de técnicas avanzadas de optimización (como algoritmos para encontrar el mejor curso de acción). Por lo general se considera que aborda tres amplias categorías de técnicas, que son la analítica descriptiva, la analítica predictiva y la analítica prescriptiva. La analítica descriptiva abarca el conjunto de técnicas analíticas que emplean modelos construidos a partir de datos históricos para predecir el futuro o evaluar el efecto de una variable sobre otra. Por ejemplo, se pueden usar los datos históricos sobre las ventas de un producto para construir un modelo matemático que prediga las ventas futuras. Este tipo de modelos puede

FIGURA 1.6

Proceso de inferencia estadística para el ejemplo de Norris Electronics

1. La población consiste en todos los focos fabricados con el filamento nuevo. No se conoce el dato de la vida útil promedio.

2. Una muestra de 200 focos se fabrica con el filamento nuevo.

4. El promedio muestral se usa para estimar la población promedio.

3. Los datos muestrales proporcionan una vida útil promedio de la muestra de 76 horas por foco.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

1.7

17

Big Data y minería de datos

considerar factores como la trayectoria de crecimiento y la estacionalidad de las ventas con base en sus patrones previos. Los datos de los escáneres en los puntos de venta que se usan en las tiendas pueden ayudar a que el fabricante de alimentos empacados estime el incremento de ventas en unidades asociado con los cupones o eventos promocionales. Los datos de las encuestas y el comportamiento de compra pueden emplearse para predecir la participación de mercado de un nuevo producto. Todos estos son ejemplos de analítica predictiva. Las técnicas de regresión lineal, el análisis de series de tiempo y los modelos de pronósticos también forman parte de esta categoría y se analizan más adelante en el libro. La simulación, que se refiere al uso de modelos estadísticos y probabilísticos computacionales para comprender el riesgo, también son analíticas predictivas. La analítica prescriptiva difiere mucho de la analítica predictiva o descriptiva. Lo que distingue a la analítica prescriptiva es que sus modelos identifican el mejor curso de acción que debe tomarse. Es decir, el resultado de un modelo prescriptivo es la mejor decisión posible. Por lo tanto, la analítica prescriptiva es el conjunto de técnicas analíticas que dan como resultado el mejor curso de acción. Los modelos de optimización, que generan soluciones para maximizar o minimizar un tema objetivo con un grupo de restricciones, forman parte de los modelos prescriptivos. Un ejemplo es el uso de la administración de ingresos de la industria aérea en la que se emplean los datos históricos de compra como insumos de un modelo que sugiere la estrategia de precios en todos los vuelos para maximizar los ingresos de la aerolínea. ¿Cómo se relaciona la estadística con la analítica? La mayoría de las técnicas de la analítica predictiva y la prescriptiva provienen de la estadística y la probabilidad, como estadística descriptiva, visualización de datos, probabilidades y distribuciones probabilísticas, muestreo y modelos predictivos, como análisis de regresión y pronósticos de series de tiempo. Todas estas técnicas se analizan en el libro. Cada vez es más importante que los gerentes entiendan el análisis de datos y la estadística debido al incremento del número de decisiones basadas en datos. Las empresas buscan gerentes conocedores que sepan cómo usar los modelos descriptivos y predictivos para tomar este tipo de decisiones. Al inicio de esta sección se mencionó que uno de los impulsores de la analítica es la amplia disponibilidad de datos. En la siguiente sección se analiza el incremento de datos disponibles y la forma en que se relaciona con el estudio de la estadística.

1.7

Big data y minería de datos Con la ayuda de lectores de tarjetas magnéticas, escáneres de código de barras y terminales punto de venta, la mayoría de las organizaciones obtiene cada día grandes cantidades de datos. Incluso para un restaurante local pequeño que usa monitores de pantalla táctil para introducir pedidos y manejar la facturación, la cantidad de datos recabados puede ser significativa. En el caso de los grandes minoristas, el gran volumen de datos recolectados es difícil de concebir, y averiguar cómo usarlos de manera eficiente para mejorar la rentabilidad constituye un reto. Por ejemplo, los minoristas masivos como Walmart capturan datos de 20 a 30 millones de transacciones diarias; las empresas de telecomunicaciones, como France Telecom y AT&T, generan más de 300 millones de registros de llamadas por día, y Visa procesa 6 800 transacciones de pago por segundo o aproximadamente 600 millones de operaciones diarias. Además del volumen total y la velocidad con que las empresas recaban datos en la actualidad, existen tipos más complejos de datos que son valiosos para los negocios. Los datos de texto se recaban por medio del monitoreo de lo que se dice sobre un producto o servicio de la empresa en redes sociales como Twitter. Los datos de audio se obtienen de llamadas de servicio (en ellas, es frecuente que se escuche “esta llamada podrá ser grabada con fines de calidad en el servicio”). Los datos en video provienen de cámaras de tiendas y se usan para analizar el comportamiento de compra. El análisis de la información de estas fuentes no tradicionales es más difícil debido que requiere un proceso complejo para transformar la información en datos analizables. Cuando nos referimos a conjuntos más grandes y complejos de datos, hablamos de Big data. Aunque no existe una definición universalmente aceptada, Big data puede considerarse como un banco de datos que por lo general no puede administrarse, procesarse o analizarse con el software disponible en un lapso razonable de tiempo. Muchos analistas lo definen con las tres V de los datos: volumen, velocidad y variedad. El volumen es la cantidad disponible de datos (la unidad de medida típica es un terabyte, que es igual a 1012 bytes); la velocidad es la rapidez con que se recaban y procesan los datos y la variedad se refiere a los diferentes tipos de datos. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

18

Los métodos estadísticos desempeñan un papel importante en la minería de datos, tanto en términos del descubrimiento de relaciones en los datos como de la predicción de resultados futuros. Sin embargo, una cobertura rigurosa de la minería de datos y del uso de la estadística en la misma están fuera del alcance de este libro.

Capítulo 1

Los datos y la estadística

El término almacenamiento de datos se utiliza para referirse al proceso de su captura, almacenamiento y mantenimiento. La capacidad de cómputo y las herramientas de recolección de datos han llegado al punto en que ahora es posible almacenar y recuperar en segundos cantidades sumamente grandes. El análisis de los datos del almacén puede resultar en decisiones que conducirán a estrategias nuevas y mayores beneficios para la organización. Por ejemplo, General Electric (GE) recaba una gran cantidad de datos de los sensores en los motores de aviones cada vez que despegan o aterrizan. Esto le permite ofrecer un importante servicio a sus clientes porque supervisa el desempeño del motor y puede advertirles cuando es probable que surja algún problema o requiere servicio. El tema de la minería de datos trata acerca de métodos relacionados con el desarrollo de información para la toma de decisiones útil de bases de datos grandes. Usando una combinación de procedimientos de estadística, matemáticas y ciencias de la computación, los analistas “extraen los datos” del almacén para convertirlos en información útil; de ahí el nombre minería de datos. El Dr. Kurt Thearling, un profesional líder en este campo, define la minería de datos como “la extracción automatizada de información predictiva de bases de datos (grandes)”. Las dos palabras clave en la definición del Dr. Thearling son “automatizada” y “predictiva”. Los sistemas de minería de datos representan el uso más eficiente de los procedimientos automatizados para extraer información de los datos usando sólo las consultas más generales o incluso vagas realizadas por el usuario. Y el software de minería de datos automatiza el proceso de descubrir información predictiva oculta que en el pasado requería análisis manual. Las principales aplicaciones de la minería de datos las han realizado empresas con un fuerte enfoque en el consumidor, como las empresas minoristas, las organizaciones financieras y las empresas de comunicaciones. La minería de datos se ha aplicado de manera exitosa para ayudar a minoristas como Amazon y Barnes & Noble a determinar uno o más productos relacionados que también es probable que compren los clientes que ya han adquirido un artículo específico. Por lo tanto, cuando un cliente ingresa en el sitio web de una empresa y solicita un producto, el sitio web utiliza pop-ups para alertarlo acerca de los productos adicionales que es probable que compre. En otra aplicación, la minería de datos puede usarse para identificar a los consumidores que es probable que gasten más de $20 en un viaje específico de compras particular. Estos clientes pueden entonces identificarse como aquellos que reciben un mensaje de correo electrónico especial u ofertas con descuento por correo postal para animarlos a realizar su siguiente visita de compras antes de la fecha de terminación del descuento. La minería de datos es una tecnología que se basa en gran medida en metodología estadística como la regresión múltiple, la regresión logística y la correlación, pero se requiere una integración creativa de todos estos métodos y tecnologías de las ciencias de la computación que involucran la inteligencia artificial y el aprendizaje de máquinas para hacerla eficiente. Se requiere una inversión significativa en tiempo y dinero para implementar software comercial de minería de datos desarrollado por empresas como Oracle, Teradata y SAS. Los conceptos estadísticos introducidos en este libro serán útiles en la comprensión de la metodología estadística empleada por el software de minería de datos y le permitirán entender mejor la información estadística desarrollada. Dado que los modelos estadísticos desempeñan un papel importante en el desarrollo de modelos predictivos en la minería de datos, muchas de las preocupaciones que inquietan a los expertos en el desarrollo de modelos estadísticos también son aplicables. Por ejemplo, una inquietud en cualquier estudio estadístico se relaciona con el problema de la confiabilidad del modelo. Encontrar uno que funcione bien para una muestra de datos en particular no necesariamente significa que pueda aplicarse de manera confiable a otros datos. Uno de los enfoques estadísticos comunes para la evaluación de la confiabilidad del modelo es dividir el banco de datos muestral en dos partes: un banco de datos de entrenamiento y un banco de datos de prueba. Si el modelo desarrollado usando los datos de entrenamiento puede predecir de manera precisa valores en los datos de prueba, se dice que es confiable. Una ventaja que la minería de datos tiene sobre la estadística clásica reside en que la enorme cantidad disponible de datos permite al software de minería de datos la partición del banco de datos, de modo que un modelo desarrollado para el banco de datos de entrenamiento pueda probarse para la confiabilidad de otros datos. En este sentido, la partición del banco de datos permite que la minería de datos desarrolle modelos y relaciones, y luego observe de manera rápida si son repetibles y válidos con datos nuevos y diferentes. Por otra parte, una advertencia para las aplicaciones de minería de datos es que, con tantos datos disponibles, existe el peligro de sobreajuste (overfitting) del modelo Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

1.9

Lineamientos éticos para la práctica de la estadística

19

al punto de que las asociaciones erróneas y las conclusiones de causa y efecto parecen existir. La interpretación cuidadosa de la minería de datos se produce, y pruebas adicionales ayudarán a evitar esta dificultad.

1.8

Para estudiantes no familiarizados con Microsoft Excel, el Apéndice E proporciona una introducción a Excel 2016 y las herramientas disponibles para análisis estadístico.

1.9

Computadoras y análisis estadístico Los expertos en estadística usan con frecuencia software de computadora para realizar los cálculos estadísticos que se requieren para grandes cantidades de datos. Por ejemplo, el cálculo de la vida útil promedio de los 200 focos del ejemplo de Norris Electronics (tabla 1.5) sería muy tedioso sin una computadora. Para facilitar el uso de una computadora, muchos bancos de datos en este libro están disponibles en el sitio web que lo acompaña. Los apéndices al final de los capítulos describen los procedimientos que deben seguirse paso a paso en Microsoft Excel o el software estadístico Minitab para implementar las técnicas estadísticas del capítulo. Para el análisis y el manejo de datos para Big data, descrito en la sección anterior, se requieren herramientas especiales, como software de código abierto para procesar grandes cantidades de datos, como Hadoop, lenguajes de programación como R y paquetes comerciales como SAS y SPSS. Un análisis del uso de estas herramientas de Big data va más allá del alcance de este libro.

Lineamientos éticos para la práctica de la estadística El comportamiento ético es algo por lo que debemos luchar en todo lo que realizamos. Los problemas éticos surgen en la estadística debido a la importancia que tiene ésta en la recolección, el análisis, la presentación y la interpretación de los datos. En un estudio estadístico, el comportamiento no ético puede adoptar una variedad de formas que incluyen el muestreo inadecuado, el análisis inapropiado de los datos, la elaboración errónea de gráficas, el uso de resúmenes estadísticos inadecuados o una interpretación tendenciosa de los resultados estadísticos. A medida que comience a adentrarse en su trabajo estadístico, le recomendamos que sea justo, meticuloso, objetivo y neutral cuando recabe los datos, realice análisis y presentaciones orales y presente informes escritos que contengan información desarrollada. Como consumidor de la estadística, usted también debe ser consciente de la posibilidad de que otros tengan un comportamiento no ético hablando en tales términos. Cuando usted ve las estadísticas en los periódicos, la televisión, internet, etc., es buena idea que muestre cierto escepticismo respecto a la información y sea siempre consciente de la fuente de donde provienen, así como de su propósito y objetividad. La American Statistical Association, la organización estadounidense profesional y líder en la rama de la estadística y para los expertos en la materia, elaboró el informe “Ethical Guidelines for Statistical Practice”2 para ayudar a los profesionales a tomar y comunicar decisiones éticas y ayudar a los estudiantes a aprender cómo realizar con responsabilidad el trabajo estadístico. El informe contiene 67 lineamientos organizados en ocho áreas temáticas: Profesionalismo; Responsabilidades de los fundadores, clientes y empleadores; Responsabilidades en las publicaciones y el testimonio; Responsabilidades de los sujetos de investigación; Responsabilidades de los pares del equipo de investigación; Responsabilidades con otros expertos o profesionales de la estadística; Responsabilidades respecto de acusaciones de falta de ética profesional, y Responsabilidades de los empleadores, incluidas las organizaciones, las personas, los abogados u otros clientes que emplean a profesionales de la estadística. Uno de los lineamientos éticos en el área del profesionalismo aborda el problema de realizar múltiples pruebas hasta obtener el resultado deseado. Considere este ejemplo. En la sección 1.5 se comentó un estudio estadístico realizado por Norris Electronics que involucra una muestra de 200 focos de alta intensidad fabricados con un filamento nuevo. La vida útil promedio de la muestra, 76 horas, proporcionó una estimación de la vida útil promedio de todos los focos fabricados con el nuevo filamento. Sin embargo, considere lo siguiente: debido a que Norris seleccionó una muestra de focos, es razonable suponer que cualquier otra habría proporcionado una vida útil promedio diferente. 2

American Statistical Association, “Ethical Guidelines for Statistical Practice”, 1999.

Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

20

Capítulo 1

Los datos y la estadística

Suponga que la gerencia de Norris esperaba que los resultados le permitieran afirmar que la vida útil promedio de los focos nuevos era de 80 horas o más. Suponga además que la gerencia decidió continuar el estudio al fabricar y probar muestras repetidas de 200 focos con el filamento nuevo hasta obtener una muestra media de 80 horas o más. Si el estudio se repitiera suficientes veces, finalmente se podría conseguir una muestra, sólo por casualidad, que proporcionara el resultado deseado y permitiera a Norris hacer una afirmación como ésta. En este caso los consumidores cometerían un error al pensar que el producto nuevo es mejor de lo que en realidad es. Desde luego, este tipo de comportamiento no es ético y representa un uso incorrecto grave de la estadística en la práctica. Diversos lineamientos éticos en las responsabilidades y publicaciones y en el área de testimonios se relacionan con problemas que involucran el manejo de datos. Por ejemplo, un experto en estadística debe representar todos los datos considerados en un estudio y explicar la(s) muestra(s) empleada(s) en realidad. En el estudio de Norris Electronics, la vida útil promedio de los 200 focos de la muestra original es de 76 horas; este tiempo es considerablemente menor que las 80 o más horas que la gerencia esperaba obtener. Suponga ahora que después de revisar los resultados que arrojan una vida útil promedio de 76 horas, la empresa descarta todas las observaciones con 70 horas o menos hasta que el filamento se funde, supuestamente debido a que estos focos contienen imperfecciones provocadas por problemas iniciales en el proceso de manufactura. Después de descartar estos focos, la vida útil promedio de los que restan en la muestra resulta ser de 82 horas. ¿Sospecharía de la afirmación de Norris de que la vida útil promedio de sus focos es de 82 horas? Si los focos que funcionan 70 o menos horas hasta que se funden fueron descartados para sencillamente proporcionar una vida útil promedio de 82 horas, no hay duda de que descartar los focos con 70 horas o menos hasta que se funden no es ético. Pero incluso si estos últimos contienen imperfecciones debido a los problemas iniciales en el proceso de manufactura y, como resultado, no deberían haberse incluido en el análisis, el experto que realizó el estudio debe justificar todos los datos que se consideraron y explicar cómo se obtuvo la muestra empleada en realidad. Hacer lo contrario es potencialmente erróneo y constituiría una conducta no ética tanto de la empresa como del experto. Una pauta en los valores compartidos del informe de la American Statistical Association establece que los profesionales de la estadística deben evitar cualquier tendencia a sesgar su trabajo hacia resultados predeterminados. Este tipo de práctica no ética se observa con frecuencia cuando se usan muestras poco representativas para hacer reclamos. Por ejemplo, en diversas áreas del país no está permitido fumar en restaurantes. Suponga que un miembro de un grupo de presión para la industria del tabaco entrevista a personas en restaurantes donde está permitido fumar con la finalidad de estimar el porcentaje de comensales que está a favor de consumir cigarrillos en este tipo de negocios. El resultado de la muestra revela que 90% de las personas entrevistadas está a favor de que se permita fumar en los restaurantes. Con base en este resultado, el miembro del grupo de presión proclama que 90% de las personas que come en restaurantes está a favor de que se permita fumar en estos establecimientos. En este caso se puede argumentar que una muestra que incluye sólo a personas que comen en restaurantes donde se permite fumar sesga los resultados. Si sólo se reportan los resultados finales del estudio, se puede engañar a los lectores no familiarizados con los detalles del estudio (como que la muestra fue recolectada sólo en restaurantes que permiten fumar). El alcance del informe de la American Statistical Association es amplio e incluye lineamientos éticos que son apropiados no sólo para un experto en estadística, sino también para los consumidores de información de este tipo. Le sugerimos que lea el informe para obtener una mejor perspectiva de los problemas éticos a medida que continúe su estudio de la estadística, y adquirir experiencia para determinar cómo asegurar que los estándares de ética se cumplen cuando usted comienza a aplicarla.

Resumen La estadística es el arte y la ciencia de recabar, analizar, presentar e interpretar los datos. Casi todos los estudiantes que cursan licenciaturas de negocios o economía requieren tomar por lo menos un curso de estadística. El capítulo comienza con la descripción de las aplicaciones estadísticas comunes para los negocios y la economía. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


5/9

El propósito de este libro es proporcionar una introducción conceptual al área de la estadística y sus aplicaciones a quienes se preparan en los campos académico y profesional de los negocios y la economía. Esta edición ofrece ahora una introducción a Minitab 17 y Microsoft® Office Excel 2016, y enfatiza el papel del software en la aplicación del análisis estadístico. Minitab fue elegido por ser uno de los principales software tanto en la enseñanza como en la práctica profesional de la estadística. Por otra parte, si bien Excel no es un software estadístico, debido a su amplia disponibilidad y uso extendido, es importante para el lector comprender sus funciones relevantes para dicha área. Entre los cambios en esta edición, destacan los siguientes: • Actualizaciones del contenido. En el capítulo 1 se incluye un análisis sobre Big data, así como una nueva sección sobre analítica. Asimismo, en un apéndice del capítulo 2 se incluyen instrucciones para usar las opciones de gráficas de Excel. Por otra parte, para calcular los percentiles, en el capítulo 3 se utiliza el método recomendado por el National Institute of Standards and Technology (NIST). Por último, en el capítulo 4 se actualiza el análisis sobre experimentos. • Uso de software. Se revisan paso a paso todas las instrucciones sobre software, así como las ilustraciones que ejemplifican los resultados que se obtienen con Excel y Minitab. Esto le permitirá al lector conocer y experimentar con las versiones actuales de estos dos programas, que son los de uso más recurrente para análisis estadístico aplicado a los negocios. • Casos prácticos. Se incorporan nuevos casos, los cuales brindan la oportunidad de trabajar con problemas más complejos, analizar bancos de datos más grandes y elaborar informes gerenciales con base en los resultados del análisis. • Ejemplos y ejercicios basados en datos reales. En esta edición se incorporan más de 180 nuevos ejemplos y ejercicios basados en datos reales obtenidos de fuentes empleadas por The Wall Street Journal, USA Today y Barron’s, entre otras, los cuales muestran los múltiples usos de la estadística en los negocios y la economía.

ISBN-13: 978-607-526-832-3 ISBN-10: 607-526-832-4

Visite nuestro sitio en http://latinoamerica.cengage.com Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.

09.05.2019


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.