Estadística I Wa l t e r
C é s p e s d e s
R a m í r e z
FONDO EDITORIAL
Estadística I
W a lt e r C é s p e d e s R a m i r e z
FICHA TÉCNICA Título: Autor: Código: Edición: Formato: Impresión: Soporte: Interiores: Publicado:
Estadística I Walter Céspedes Ramírez CU/334-2014 Fondo Editorial de la UIGV 170 mm X 245 mm. 341 pp Offsett y encuadernación en rústica Cubierta: folcote calibre 14 Bond alisado de 75 g Lima, Perú. Abril de 2014
Universidad Inca Garcilaso de la Vega Rector: Luis Cervantes Liñán Jefe del Fondo Editorial: Fernando Hurtado Ganoza
©
Universidad Inca Garcilaso de la Vega Av. Arequipa 1841 - Lince Teléf.: 471-1919 Página web: www.uigv.edu.pe
Fondo Editorial Correo electrónico: fhurtadog@uigv.edu.pe Jr. Luis N. Sáenz 557 - Jesús María Teléf.: 461-2745 Anexo: 3712
Corrección y diagramación: Nérida Curazzi Gutiérrez
Estos textos de educación a distancia están en proceso de revisión y adecuación a los estándares internacionales de notación y referencia. Hecho el Depósito Legal en la Biblioteca Nacional del Perú Nº 2014-04906
ÍNDICE Presentación................................................................................................ 11 Introducción................................................................................................ 13 Orientaciones metodológicas.......................................................................... 15
PRIMERA UNIDAD
INTRODUCCIÓN a la ESTADÍSTICA DESCRIPTIVA.............................................. 17 Lección 1 1.1. Conceptos básicos............................................................................. 19 1.1.1. Glosario estadístico.................................................................. 19 1.1.1.1. Marco referencial...................................................... 19 1.1.1.2. Población................................................................. 19 1.1.1.3. Muestra................................................................... 20 1.1.1.4. Recopilación de datos................................................ 20 1.1.1.5. Estadígrafo.............................................................. 20 1.1.1.6. Tratamiento............................................................. 20 1.1.2. Estadística .............................................................................. 20 1.1.2.1. Estadística Descriptiva............................................... 21 1.1.2.2. Estadística Inferencial o Analítica................................ 22 Lección 2 1.2. Variables .............................................................................. 23 1.2.1. Variables Cualitativas............................................................... 24 1.2.1.1. Variables Nominales.................................................. 24 1.2.1.2. Variables Ordinales................................................... 24 1.2.2. Variables Cuantitativas............................................................. 24 1.2.2.1. Variables Discretas.................................................... 24 1.2.2.2. Variables Continuas................................................... 25
z5 z
E S TA D Í S T I C A I
Lección 3 1.3. Fuentes de Recolección...................................................................... 29 1.3.1. Clasificación de la fuente.......................................................... 29 1.3.1.1. Fuente primaria........................................................ 30 1.3.1.2. Fuente secundaria.................................................... 30 1.3.2. Métodos de recopilación........................................................... 30 1.3.2.1. Observación............................................................. 30 1.3.2.2. Encuesta................................................................. 31 1.3.3. Proceso para la recopilación de datos......................................... 31 Lección 4 1.4. Aplicaciones matemáticas................................................................... 39 1.4.1. Notación científica................................................................... 39 1.4.2. Redondeo de datos.................................................................. 42 1.4.3. Sumatoria ............................................................................. 43 1.4.3.1. Sumatoria de una variable......................................... 44 1.4.3.2. Sumatoria de una constante....................................... 45 1.4.3.3. Sumatoria de un índice.............................................. 46 1.4.3.4. Propiedades de sumatorias........................................ 48 Autoevaluación Nº 1 .............................................................................. 53 Glosario .............................................................................. 55 Exploración On Line .............................................................................. 55
SEGUNDA UNIDAD
USO DE LOS DATOS ESTADÍSTICOS................................................................ 57 Lección 1 2.1. Estadísticas para información.............................................................. 59 2.1.1. Textos .............................................................................. 60 2.1.2. Tabulados o cuadros................................................................ 60 2.1.2.1. Tabulados unidimensionales....................................... 61 2.1.2.2. Tabulados bidimensionales......................................... 62 2.1.2.3. Tabulados tridimensionales......................................... 64 2.1.3. Gráficos .............................................................................. 66 2.1.3.1. Gráficos lineales....................................................... 66 2.1.3.2. Gráficos por barras................................................... 67 2.1.3.3. Gráficos circulares.................................................... 69 2.1.3.4. Pictogramas............................................................. 70 Lección 2 2.2. Estadísticas para investigación............................................................ 71 2.2.1. Tablas de Distribución de Frecuencias......................................... 71 2.2.1.1. Distribución de Frecuencias de Variables Cualitativas..... 73 2.2.1.2. Distribución de Frecuencias de Variables Discretas........ 77 2.2.1.3. Distribución de Frecuencias de Variables Continuas....... 84 2.2.2. Gráficos .............................................................................. 89 2.2.2.1. Polígono de Frecuencias............................................. 89
z6 z
WA LT E R C É S P E D E S R A M Í R E Z
2.2.2.2. Histogramas............................................................. 91 2.2.2.3. Ojiva Menos de......................................................... 92 2.2.2.4. Ojiva Más de............................................................ 93 Autoevaluación Nº 2 .............................................................................. 94 Glosario .............................................................................. 96 Exploración On Line .............................................................................. 96
TERCERA UNIDAD
MEDIDAS DE POSICIÓN O DE LOCALIZACIÓN.................................................. 97 Lección 1 3.1. Promedios .............................................................................. 99 3.1.1. Media Aritmética .................................................................... 100 3.1.1.1. Media Aritmética Simple............................................ 100 3.1.1.2. Media Aritmética Ponderada....................................... 102 3.1.1.3. Media Aritmética para Datos Agrupados....................... 105 3.1.2. Media Geométrica ................................................................... 108 3.1.2.1. Media Geométrica Simple........................................... 108 3.1.2.2. Media Geométrica para Datos Agrupados..................... 111 3.1.3. Media Armónica ...................................................................... 115 3.1.3.1. Media Armónica Simple............................................. 116 3.1.3.2. Media Armónica para Datos Agrupados........................ 118 Lección 2 3.2. OTRAS MEDIDAS 3.2.1. Mediana 3.2.1.1. 3.2.1.2. 3.2.2. Moda 3.2.2.1. 3.2.2.2.
DE POSICIÓN CENTRAL............................................. 121 .............................................................................. 121 Mediana para Datos no Agrupados.............................. 122 Mediana para Datos Agrupados................................... 124 .............................................................................. 128 Moda para Datos no Agrupados.................................. 128 Moda para Datos Agrupados....................................... 130
Lección 3 3.3. Cuartiles .............................................................................. 137 3.3.1. Cuartiles .............................................................................. 137 3.3.1.1. Cuartiles para Datos no Agrupados.............................. 137 3.3.1.2. Cuartiles para Datos Agrupados.................................. 140 3.3.2. Deciles .............................................................................. 143 3.3.2.1. Deciles para Datos no Agrupados................................ 143 3.3.2.2. Deciles para Datos Agrupados.................................... 145 3.3.3. Percentiles ............................................................................. 149 3.3.3.1. Percentiles para Datos no Agrupados........................... 149 3.3.3.2. Percentiles para Datos Agrupados............................... 152 Lección 4 3.4. Propiedades de las medidas de posición............................................... 157 3.4.1. Cambio de origen.................................................................... 157 3.4.2. Cambio de escala.................................................................... 158 z7 z
E S TA D Í S T I C A I
Autoevaluación Nº 3 Glosario Exploración On Line
.............................................................................. 159 .............................................................................. 162 .............................................................................. 162
CUARTA UNIDAD
MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD............................................... 163 Lección 1 4.1. Dispersión con relación a una medida de posición central........................ 165 4.1.1. Desviación Media ................................................................... 165 4.1.1.1. Desviación Media para Datos no Agrupados.................. 166 4.1.1.2. Desviación Media para Datos Agrupados...................... 168 4.1.2. Desviación Mediana ................................................................. 172 4.1.2.1. Desviación Mediana para Datos no Agrupados.............. 172 4.1.2.2. Desviación Mediana para Datos Agrupados................... 175 4.1.3. Varianza .............................................................................. 179 4.1.3.1. Varianza para Datos no Agrupados.............................. 179 4.1.3.2. Varianza para Datos Agrupados.................................. 182 4.1.4. Desviación Estándar ................................................................ 185 4.1.4.1. Desviación Estándar para Datos no Agrupados.............. 186 4.1.4.2. Desviación Estándar para Datos Agrupados.................. 189 Lección 2 4.2. Dispersión entre medidas o entre datos de posición no central................. 193 4.2.1. Rango Simple ......................................................................... 193 4.2.1.1. Rango Simple de Variable Discreta................................. 194 4.2.1.2. Rango Simple de Variable Continua................................ 195 4.2.2. Variación Cuartílica .................................................................. 197 4.2.2.1. Variación Cuartílica para Datos no Agrupados................. 198 4.2.2.2. Variación Cuartílica para Datos Agrupados..................... 200 4.2.3. Variación Percentílica ............................................................... 203 4.2.3.1. Variación Percentílica para Datos no Agrupados............... 203 4.2.3.2. Variación Percentílica para Datos Agrupados.................... 205 Lección 3 4.3. Otras medidas de dispersion relativas.................................................. 209 4.3.1. Coeficiente de Variación .......................................................... 209 4.3.2. Variable Estándar ................................................................... 214 4.3.3. Coeficiente de Desviación Mediana ............................................ 215 4.3.4. Coeficiente de apertura ........................................................... 219 4.3.5. Recorrido Relativo .................................................................. 221 4.3.6. Recorrido Inter-Cuartílico Relativo ............................................. 222 4.3.7. Recorrido Semi-Inter-Cuartílico Relativo .................................... 223
Lección 4 4.4. Propiedades de las medidas de dispersión............................................ 225
z8 z
WA LT E R C É S P E D E S R A M Í R E Z
4.4.1. Cambio de origen.................................................................... 225 4.4.2. Cambio de escala.................................................................... 226 Autoevaluación Nº 4 .............................................................................. 228 Glosario .............................................................................. 231 Exploración On Line .............................................................................. 231
QUINTA UNIDAD
MEDIAS DE CONCENTRACIÓN........................................................................ 232 Lección 1 5.1. Momentos .............................................................................. 235 5.1.1. Momentos con relación al origen ............................................... 235 5.1.1.1. Momentos para datos no agrupados............................ 236 5.1.1.2. Momentos para distribuciones de frecuencias................ 238 5.1.2. Momentos con relación a la media aritmética ............................. 242 5.1.2.1. Momentos para datos no agrupados............................ 242 5.1.2.2. Momentos para distribuciones de frecuencias................ 245 Lección 2 5.2. Asimetría .............................................................................. 251 5.2.1. Tipos de Asimetría................................................................... 252 5.2.1.1. Asimetría negativa.................................................... 252 5.2.1.2. Simetría.................................................................. 252 5.2.1.3. Asimetría Positiva..................................................... 253 5.2.2. Definición de Asimetría............................................................. 253 5.2.2.1. Asimetría según Pearson............................................ 254 5.2.2.2. Asimetría según Fisher.............................................. 257 5.2.2.3. Asimetría según Bowley............................................. 262 5.2.2.4. Asimetría según Yule................................................. 265 5.2.2.5. Asimetría según Kelly................................................ 270 Lección 3 5.3. CURTOSIS .............................................................................. 271 5.3.1. Tipos de Curtosis..................................................................... 273 5.3.1.1. Platicúrtica............................................................... 273 5.3.1.2. Mesocúrtica............................................................. 273 5.3.1.3. Leptocúrtica............................................................. 274 5.3.2. Utilidad del Coeficiente de Curtosis............................................. 274 5.3.3. Definición de Curtosis............................................................... 275 5.3.3.1. Curtosis según Fisher................................................ 275 5.3.3.2. Curtosis según Cuantiles............................................ 279 5.3.3.3. Curtosis según Moors................................................ 282 Lección 4 5.4. DESIGUALDAD .............................................................................. 285 5.4.1. Formas de Concentración de Datos............................................. 285
z9 z
E S TA D Í S T I C A I
5.4.1.1. 5.4.1.2. 5.4.2. Definición 5.4.2.1. 5.4.2.2. Autoevaluación Nº 5 Glosario Exploración On Line
Concentración mínima............................................... 286 Concentración máxima.............................................. 286 de la Desigualdad...................................................... 287 Índice de Gini........................................................... 287 Curva de Lorenz....................................................... 292 .............................................................................. 295 .............................................................................. 297 .............................................................................. 297
SEXTA UNIDAD TEORÍA de las PROBABILIDADES.................................................................... 299 Lección 1 6.1. Teoría de Conjuntos........................................................................... 301 6.1.1. Operación de Unión ................................................................ 301 6.1.2. Operación de Intercepción ....................................................... 302 6.1.3. Operación de Complemento .................................................... 302 Lección 2 6.2. Teoría combinatoria........................................................................... 305 6.2.1. Factorial .............................................................................. 306 6.2.2. Permutaciones ........................................................................ 308 6.2.2.1. Permutaciones sin elementos repetidos y sin reemplazo. 308 6.2.2.2. Permutaciones sin elementos repetidos y con reemplazo. 308 6.2.2.3. Permutaciones sin elementos repetidos, sin reemplazo, tomando todos a la vez para ser ubicados en línea........ 309 6.2.2.4. Permutaciones sin elementos repetidos, sin reemplazo, tomando todos a la vez para ubicarlos en círculo........... 310 6.2.2.5. Permutaciones con elementos repetidos sin reemplazo tomando todos a la vez............................................. 310 6.2.2.6. Permutaciones con restricciones................................. 311 6.2.3. Combinaciones ...................................................................... 313 Lección 3 6.3. Probabilidades 6.3.1. Definición 6.3.2. Definición 6.3.2.1. 6.3.2.2. 6.3.2.3. 6.3.2.4. 6.3.2.5. 6.3.2.6. Autoevaluación Nº 6 Glosario Exploración On Line
.............................................................................. 317 numérica................................................................. 317 por Teoremas........................................................... 319 Teorema del conjunto vacío........................................ 319 Teorema del complemento......................................... 320 Teorema de la adición................................................ 321 Teorema de la multiplicación...................................... 324 Teorema de la probabilidad total o de las particiones .... 327 Teorema de la Bayes ................................................ 331 .............................................................................. 336 .............................................................................. 338 .............................................................................. 339
z1 0 z
P R E S E N TA C I Ó N
El Fondo Editorial de la Universidad Inca Garcilaso de la Vega participa como editor y productor de los textos universitarios para los alumnos de pregrado de la modalidad de educación a distancia. Esta labor exige del personal directivo, académico, profesional y técnico una visión de conjunto de las estrategias metodológicas propias de esta modalidad. El trabajo del Fondo Editorial se desarrolla en el diseño, diagramación y corrección de estilo lingüístico de los textos universitarios. Los contenidos están ubicados en los tres grandes campos del conocimiento: científico, humanístico o artístico. El esfuerzo compartido con las Facultades, a través de sus docentes-tutores, autores de los referidos libros, conduce, sin duda alguna, a la elaboración de textos de buena calidad, los cuales podrán utilizarse a través de la página web o mediante la presentación física clásica. En los últimos quince años la modalidad de educación a distancia ha evolucionado, pasando por el e-learning, que privilegia la formación profesional digital; b-learning, que combina lo tradicional y lo nuevo en el proceso de la formación profesional; hasta la aproximación actual al móvil learning, que aparece como la síntesis de todo lo anterior y una proyección al futuro. Con todo ello, el Fondo Editorial reitera su compromiso de participar en la tarea universitaria de formación académica y profesional, acorde con los tiempos actuales.
Fondo Editorial z1 1 z
INTRODUCCIÓN
El objetivo principal de este libro, es el de brindar a todos los estudiantes los conocimientos necesarios para comprender el uso de la Estadística Descriptiva o Estadística I, de tal manera que pueda resolver casos con rapidez y precisión mediante el uso de estadígrafos. El texto empieza dando una serie de conceptos utilizados en Estadística, para que el alumno pueda entender nuevos términos o nuevos significados que son propios de esta asignatura, focaliza las fuentes de información y diferencia las dos principales variables de información, tanto la variable no numérica o cualitativa de la numérica o cuantitativa; adicionalmente, en este inicio se incluyen algunas operaciones aritméticas como las notaciones científicas y el redondeo de datos que son de gran utilidad en la reducción de cifras, además de las sumatorias empleadas en la mayoría de las fórmulas estadísticas. En la estadística descriptiva existen dos modalidades de trabajo, que los textos no precisan, que bien podrían verse por separado para no confundir al lector; resulta que después de recopilar la información necesaria, esta puede tener dos destinos que son: estadísticas para informar o publicar, que tienen una forma de presentación para que las comprenda cualquier lector, y estadística para investigar, que se presenta ordenada especialmente para recibir un tratamiento con medidas estadísticas, de tal manera que la investigación continúa. Al mencionar un tratamiento con medidas estadísticas, en este texto se analizarán: las medidas de posición o de localización, las medidas de dispersión o de variabilidad y las medias de concentraz1 3 z
E S TA D Í S T I C A I
ción. Cada uno de estos tipos de mediadas tienen la particularidad de dar a conocer las características de los datos u observaciones con relación a la ubicación del dato principal o central, la variabilidad entre ellos con relación a un valor central, la forma cómo se distribuyen y la manera en que se concentran. Finalmente, después de hacer todo el trabajo descriptivo con las mediadas mencionadas, se ingresa al mundo de las probabilidades que para el investigador estadístico tienen gran importancia, porque con ellas se abren las puertas para ingresar a la estadística inferencial, que es motivo de la asignatura Estadística II. Al término del estudio de este manual autoinstructivo, el alumno debe entender que los conocimientos que ha adquirido no es la culminación de todos los elementos estadísticos y que ya está en condiciones de tomar decisiones de índole empresarial en cualquier nivel de la misma, sino que ha empezado a entender la actividad empresarial en términos cuantitativos.
El autor
z1 4 z
orientaciones METODOLÓGICAS
El manual autoinstructivo está compuesto por 6 unidades temáticas.
Estructura del Manual Se está incluyendo en el MAI de Estadística Descriptiva todas las unidades temáticas del sílabo que esta facultad ha considerado necesarias en todas las modalidades de estudio, incluyendo la modalidad a distancia; tales unidades temáticas son: Primera Unidad :
Introducción a la estadística descriptiva
Segunda Unidad :
Uso de los datos estadísticos
Tercera Unidad :
Medidas de posición o de localización
Cuarta Unidad :
Medidas de dispersión o de variabilidad
Quinta Unidad :
Medias de concentración
Sexta Unidad
Teoría de las probabilidades
:
Instrucciones para el alumno 1° Para facilitar el entendimiento de esta asignatura, se recomienda tener claro lo aprendido en las asignaturas de Matemáticas. 2° Debe tener siempre a la mano: cuaderno, lápiz o lapicero, borrador y una calculadora que tenga más funciones de aquellas que solo manejan las 4 operaciones aritméticas. z1 5 z
E S TA D Í S T I C A I
3° Leer con detenimiento cada ítem de una unidad temática y una vez entendido lo que se dice allí, resolver los ejercicios propuestos, por cada ítems. 4° Culminada la unidad resolver la prueba autoevaluativa que está al final, luego comparar las respuestas obtenidas con las claves de respuestas que se dan. 5° Si ha respondido correctamente al menos 9 de los 15 ejercicios, usted esta en condiciones de seguir con la siguiente unidad, en caso contrario, se recomienda hacer un repaso.
Nota importante Si por alguna razón no logra entender con facilidad cualquier tema de los mencionados, se recomienda solicitar asesoría que le sirva de orientación en el aprendizaje del curso.
Mucha suerte y felicitaciones por cada unidad aprendida
z1 6 z
p r i m e r a
UNIDAD Introducción a la Estadística Descriptiva
Conceptos básicos: Glosario estadístico, Estadística Variables: Cualitativas, Cuantitativas Fuentes de recolección: Clasificación de la fuente, Métodos de recopilación, Prosceso para la recolección de datos Aplicaciones matemáticas: Notación científica, Redondeo de datos, Sumatorias
OBJETIVO (S) GENERAL Aprender que la estadística descriptiva es parte de todo un proceso de investigación que le permite al estudiante conocer la composición de los datos que se estudian. Por ello, se propone en esta unidad, los términos y significados más importantes utilizados por los investigadores, para que entienda sus técnicas y herramientas de mayor utilidad. También, es necesario conocer las variables que engloban datos, porque se le dará el tratamiento respectivo dependiendo del tipo de esta. Otra necesidad del investigador es la de conocer la procedencia o fuente de información, ya que la credibilidad de los resultados, va a depender de ella; finalmente, como la Estadística utiliza en muchas ocasiones datos numéricos, aquí se recuerda al estudiante las aplicaciones matemáticas que utiliza. ESPECÍFICOS • Conocer los términos que se utilizan en la Estadística, así como la división o campo de acción de esta ciencia. • Saber porqué tienen tratamientos diferentes tanto las variables cualitativas como las cuantitativas. • Determinar la responsabilidad de las fuentes de información, que son las que proporcionan las observaciones para conocer sus métodos y procesos. • Recordar que algunas aplicaciones matemáticas son de mucha utilidad en el tratamiento de los datos, que permiten simplificar las cifras numéricas, facilitando su uso.
L e c c i ó n
1
1.1 CONCEPTOS BÁSICOS Se recopilan en esta lección todos aquellos conceptos que el lector debe conocer para entender esta asignatura. En términos generales se reúnen aquí conceptos relacionados con la estadística y su división, con los datos u observaciones, además de sus características y limitaciones.
1.1.1. Glosario estadístico Son los términos propios de la Estadística, por lo que es necesario que todo estudiante de esta disciplina los conozca, para que pueda utilizarlos apropiadamente, además de entender con claridad la estadística descriptiva.
1.1.1.1. Marco referencial Es el alcance de la variable o variables que constituyen problemas que se investigan. Para un investigador es importante saber hasta dónde debe llegar, por ello todo marco referencial es el límite de la investigación. Así por ejemplo, si se investigan problemas relacionados con las universidades, el marco referencial nos dirá si se investiga: una universidad en particular, todas las universidades de Lima, todas las universidades del Perú, etc.
1.1.1.2. Población Es el universo de los datos o unidades de información que se investiga; en cuanto a su alcance, es toda la información que existe respecto a una variable limitada por el marco referencial. En cuanto a su contenido; las poblaciones pueden ser limitadas, cuando se pueden contar todos los datos u observaciones, por ejemplo las matriculas z1 9 z
E S TA D Í S T I C A I
del actual semestre académico; también pueden ser ilimitadas, cuando no se pueden contar todos los datos u observaciones, por ejemplo la producción agrícola de maíz en el Perú o la cantidad de vino que produce Europa para el mundo, debido a que se siguen produciendo.
1.1.1.3. Muestra Es parte de una población, mayormente los investigadores prefieren trabajar con muestras, porque utilizan pocos datos ahorrando tiempo y costos principalmente. La muestra es la porción de la población que se selecciona para su análisis, se caracteriza por tener un tamaño conocido, es decir que tiene límites y permite estudiar poblaciones incluyendo las ilimitadas.
1.1.1.4. Recopilación de datos Cuando se recogen las observaciones o datos, estos pueden hacerse en forma total o en forma parcial. El proceso de recolección total se llama censo, a través del cual se obtiene la población. El proceso de recolección parcial se llama muestreo, a través del cual se obtiene una muestra que es representativa de la población. El censo solo es posible con poblaciones limitadas; es decir, con poblaciones que pueden contarse todos sus elementos; en cambio, no es posible hacer un censo en poblaciones de naturaleza ilimitada. El hecho de que no se pueda realizar un censo en poblaciones ilimitadas, no es razón suficiente para dejar de hacer un estudio las observaciones que aún se encuentran en proceso de producción, ya que existe el muestreo.
1.1.1.5. Estadígrafo Es un indicador que se obtiene al procesar cualquier medida estadística de resumen, tanto de posición o localización, como de dispersión o variabilidad. Cuando este indicador se obtiene de una muestra toma el nombre de estimador, y cuando su procedencia es de una población toma el nombre de parámetro.
1.1.1.6. Tratamiento Se refiere al procesamiento de los datos (unidad de información), con el objeto de obtener una medida descriptiva que generalmente es un estimador, para luego hacer una inferencia, que es otro tratamiento pero esta vez del estimador para convertirlo en parámetro.
1.1.2. Estadística Etimológicamente el término estadística viene del alemán statistik, que fue primeramente introducido por Gottfried Achenwall (1749), quién designaba originalmente el análisis de datos del Estado, como la “ciencia del Estado” (también llamada aritmética política de su traducción directa del inglés). No fue hasta el siglo XIX cuando el término
z2 0 z
WA LT E R C É S P E D E S R A M Í R E Z
“estadística” adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el inglés John Sinclair. En su origen, por tanto, la Estadística estuvo asociada a los Estados, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos acerca de estados y localidades continúa ampliamente a través de los servicios de estadísticas nacionales e internacionales. En particular, los censos suministran información regular acerca de la población. Hacia el año 3 000 a. C. los babilonios usaban ya pequeños envases moldeados de arcilla para recopilar datos sobre la producción agrícola y de los géneros vendidos o cambiados. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XI a. C. Los libros bíblicos de Números y Crónicas incluyen en algunas partes trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a. C. Los antiguos griegos realizaban censos cuya información se utilizaba hacia el 594 a. C. para cobrar impuestos. Cada vez que alguien habla de cifras, inmediatamente se asocia tales cifras con las estadísticas; de tal forma que por ejemplo al referirse al número de accidentes de tránsito, la pregunta es ¿cuáles son las estadísticas de accidentes de tránsito? Resulta que Estadística es eso y mucho más, porque es una ciencia que además de proporcionarnos datos, nos da una serie de procedimientos, metodologías y otras herramientas de mucha utilidad para presentar ordenadamente la información recibida en cuadros y gráficos, también partiendo de una muestra, nos permite obtener conclusiones valederas del comportamiento de la información, a nivel población. Además con el análisis e interpretación de datos puede ayudar en la resolución de la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado. Por lo general la Estadística se divide en dos partes: una denominada estadística descriptiva, basadas en observaciones o en datos, y la otra denominada Estadística Inferencial, basada en el razonamiento sobre las observaciones.
1.1.2.1. Estadística Descriptiva Es la parte de la Estadística que está basada en las observaciones o datos, por lo tanto se ocupa de la recolección y análisis del correspondiente de una muestra o de una población, para obtener conclusiones de los mismos. Esta parte solo se preocupa de: ordenar, tabular, graficar y calcular estadígrafos de los datos que se investigan; por ello se denomina estadística descriptiva, porque su acción solo se limita a describirlos. Estadística descriptiva, puede definirse como aquellos métodos que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto.
z2 1 z
E S TA D Í S T I C A I
1.2.2.2. Estadística Inferencial o Analítica Es la parte de la Estadística que está basada en el razonamiento sobre las observaciones y se ocupa del estudio de la población a partir de una muestra. Estadística inferencial, puede definirse como aquellos métodos que hacen posible la estimación de una característica de una población o la toma de una decisión referente a una población basándose solo en los resultados de una muestra. Uno de los problemas fundamentales de la Estadística, es el estudio de la relación existente entre una población y sus muestras. Según la dirección que tome tal relación, la Estadística puede ser: Deductiva, cuando a partir del conocimiento de la población se trata de caracterizar cada muestra posible. Inductiva, cuando a partir del conocimiento derivado de una muestra se pretende caracterizar la población.
z2 2 z
L e c c i ó n
2
1.2. Variables Se denomina variable a una característica o cualidad básica de la información que se investiga, que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores numéricos o modalidades cualitativas; es decir, es toda característica que varía de un elemento a otro en una población. La variable es un símbolo, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante. Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos números o medidas que toman los caracteres son los valores de la variable. Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es decir que no se pueden expresar mediante un número, son aquellas características que pueden presentarse en individuos que constituyen un conjunto. La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de modalidades. A pesar de que existen diferentes maneras de clasificar una variable, en este texto solo se tratará de la clasificación según su intensidad, por ser la más importante para la Estadística, que son: el valor que toma y la modalidad que la variable adquiere.
z2 3 z
E S TA D Í S T I C A I
1.2.1. Variables Cualitativas Son aquellas variables denominadas también de atributo, porque no adquieren valores numéricos. Estas variables se caracterizan por que adquieren distintas modalidades, ya que pueden ser nombradas o descritas, también pueden ser el resultado de una comparación. Estas variables no pueden ser medidas numéricamente, pero si pueden ser medidas según su categoría, las cuales se subdividen en:
1.2.1.1. Variables Nominales Son aquellas variables no numéricas que se caracterizan por nombrar, describir o comparar una modalidad. Ejemplo: la relación de estudiantes de un aula, la relación de países pobres de América, etc. En el primer ejemplo se hace referencia a nombres y el segundo se hace referencia a una descripción.
1.2.1.2. Variables Ordinales Son aquellas variables no numéricas que se caracterizan por ser el resultado de una comparación. Ejemplo: la selección de estudiantes de un aula para un evento internacional, la relación de países más pobres de América, etc. Ambos ejemplos son por el resultado de comparar los atributos de la variable, porque usted no puede seleccionar sin comparar, tampoco puede saber sin son más o menos pobres sin comparación.
1.2.2. Variables Cuantitativas Son aquellas variables denominadas también cuantificadas, porque tienen valores numéricos. Estas variables se caracterizan porque adquieren distintos valores dentro de su recorrido, dentro de los cuales puede haber solamente números enteros o también números combinados entre enteros y decimales. Estas variables que pueden ser medidas numéricamente se subdividen en:
1.2.2.1. Variables Discretas Son aquellas variables numéricas que dentro de su recorrido, solo puede aceptar valores enteros, estas variables por su naturaleza no pueden aceptar fraccionamiento de un valor numérico, porque se obtienen únicamente por conteo; es decir, que una forma de cuantificar una variable es contando las veces que aparece al relacionarla con otra de sus características. Por ejemplo se tiene la variable ASISTENCIA (característica básica) que va a ser asociada a los DÍAS (característica complementaria), resulta la asistencia del lunes, la asistencia del martes, etc., cada una de estas asistencias representan solamente un valor numérico entero.
z2 4 z
WA LT E R C É S P E D E S R A M Í R E Z
1.2.2.2. Variables Continuas Son aquellas variables numéricas que dentro de su recorrido, puede aceptar valores reales (enteros y/o decimales), estas variables por su naturaleza si pueden aceptar fraccionamiento de un valor numérico, porque se obtienen como resultado de una medición; es decir, que la forma de cuantificar una variable es midiendo el valor que adquiere al relacionarla con otra de sus características. Por ejemplo, se tiene la variable EDAD (característica básica) que va a ser asociada con PERSONAS (característica complementaria), resulta la edad de Enrique, la edad de María Paula, etc., cada una de estas edades representan un valor numérico entero y/o decimal.
En los siguientes ejercicios que se dan a continuación respecto a la subdivisión de una variable según su intensidad, es posible que haya más de una respuesta en cada ejemplo. En los casos de que usted encuentre una respuesta cualitativa y otra cuantitativa, la respuesta cualitativa prevalece sobre la cuantitativa ya que todas las variables pueden ser cuantificadas.
Ejercicios sobre variables Considerando la subdivisión de una variable según intensidad, determine a qué subdivisión se refieren los siguientes ejemplos: 1) Las evaluaciones de un grupo de estudiantes.
Respuesta: (
)
2) La cantidad de monedas emitidas por el BCR del Perú.
Respuesta: (
)
3) La obras escritas por César Vallejo
Respuesta: (
)
4) Las clases magistrales de un profesor.
Respuesta: (
)
5) Las mejores clases magistrales de profesor.
Respuesta: (
)
6) Las clases de un profesor de una universidad.
Respuesta: (
)
7) Las remuneraciones de los empleados de la categoría “A”.
Respuesta: (
)
8) Las auditorías realizadas por la Contraloría.
Respuesta: (
)
9) Los convenios firmados entre naciones con el Perú.
Respuesta: (
)
10) La relación de asistentes a una conferencia.
Respuesta: (
)
11) La calidad del espejo de una vitrina.
Respuesta: (
)
12) El carácter de una persona.
Respuesta: (
)
13) Las monedas de mayor circulación en el Perú.
Respuesta: (
)
z2 5 z
E S TA D Í S T I C A I
14) El hijo mayor de una familia.
Respuesta: (
)
15) La lista de personas heridas en un atentado.
Respuesta: (
)
16) El número de inscritos en una competencia deportiva.
Respuesta: (
)
17) La edad de Pedro.
Respuesta: (
)
18) La selección de fútbol de Perú.
Respuesta: (
)
19) Los sueldos de los magistrados.
Respuesta: (
)
20) La capacidad de un estanque.
Respuesta: (
)
21) La capacidad de un auditorio.
Respuesta: (
)
Respuestas al ejercicio: 1)
Variable continua, porque evaluación se refiere a una unidad de medida.
2)
Variable discreta, porque se refiere al número de monedas emitidas.
3)
Variable discreta, porque se refiere al número de obras.
4)
Variable nominal, porque el término magistral se refiere a una descripción de las clases del profesor.
5)
Variable ordinal, porque es una comparación entre las clases magistrales del profesor, en este caso el término magistral (nominal) deja de tener importancia como clasificación de la variables y menos aún cuantas son (discreta).
6)
Variable discreta, porque se refiere al número de clase del profesor universitario, la descripción del profesor deja de tener importancia.
7)
Variable continua, porque se refiere al salario del trabajador de categoría “A”, la descripción de la categoría de empleado deja de tener importancia, porque la referencia es a las remuneraciones que se encuentran dentro de una escala según el puesto.
8)
Variable discreta, porque se refiere al número de auditorías.
9)
Variable discreta, porque se refiere al número de convenios firmados.
10) Variable nominal, porque una relación es una lista de nombres. 11) Variable nominal, porque es una descripción sobre el espejo 12) Variable nominal, porque es una característica de una persona 13) Variable ordinal, porque el término mayor circulación solo resulta de una comparación. 14) Variable ordinal, porque el término mayor solo resulta de una comparación. 15) Variable nominal, porque es una lista de nombres. 16) Variable discreta, porque se refiere a la cantidad de inscritos en una competencia. 17) Variable continua, porque se refiere a la edad que solo se mide con relación al tiempo. z2 6 z
WA LT E R C É S P E D E S R A M Í R E Z
18) Variable ordinal, porque una selección solo resulta de una comparación. 19) Variable continua, porque se refiere a los sueldos que se encuentran dentro de una escala según el puesto de magistrado. 20) Variable continua, porque capacidad se refiere a una unidad de medida de igual nombre. 21) Variable discreta, porque se refiere al aforo (cantidad de personas) de un auditorio.
z2 7 z
L e c c i ó n
3
1.3. FUENTES DE RECOLECCIÓN Son llamadas también fuentes de información, porque permiten al investigador obtener datos u observaciones para utilizarlos con fines estadísticos. Para muchos, una fuente de información es una organización o institución pública o privada que provee de datos a quien lo solicite. Para otros, una fuente de información es una revista, un periódico, un libro o cualquier tipo de publicación que provee de datos a quién la requiera. También se considera como fuente de información a archivos, registros y documentos; impresos o virtuales que provee de datos a quienes tengan acceso a ellos. Como usted puede ver, una fuente de datos no es solo una institución, es también una publicación o simplemente un registro que se encuentra disponible de manera restringida. Por otro lado, algunas veces se recurre a información ya elaborada, porque cubre las necesidades del investigador, otras veces es necesario preparar una serie de preguntas que sirvan para cubrir nuestras necesidades de información. Por lo expuesto, de deduce que existen dos tipos de fuentes de información, aquella que nos provee datos existentes y aquellas que nos provee datos por la necesidad de recolección de información propia.
1.3.1. Clasificación de la fuente El concepto de fuentes de información ha evolucionado, ahora se identifican por la manera cómo se recolectan los datos, que son de manera directa con información propia actual o fuente primaria, y de manera indirecta con información pasada elaborada no necesariamente con fines estadísticos o fuente secundaria. z2 9 z
E S TA D Í S T I C A I
1.3.1.1. Fuente primaria Algunos piensan que las fuentes primarias son más confiables, porque son efectuadas por oficinas especializadas encargadas de ese fin. Lo que ocurre es que este tipo de fuente por conseguir información directa de informantes previamente seleccionados, utiliza preguntas ordenadas en una encuesta, para facilitar al investigador de toda la información que necesite; pero la confiabilidad de la información está en la responsabilidad en que se realice el trabajo. Toda fuente primaria, conformada generalmente por una encuesta, es fuente directa de información, porque genera información exclusiva acorde con las necesidades del investigador, con la encuesta se puede contar con información propia, elaborada con el único fin de conseguir datos actuales de gran utilidad para alcanzar las metas propuestas.
1.3.1.2. Fuente secundaria La información pasada ya existente y disponible en una institución, una publicación o en un archivo; constituyen una fuente secundaria de información. La confiabilidad de este tipo de fuente, va a depender solo de la seriedad con que fue elaborada y no del tipo de fuente. Los archivos que sirven para proveer datos al investigador, la estadística les llama registro administrativo, ya que no fueron hechos con fines estadísticos, pero pueden servir para tal fin, por ello a esta fuente se le denomina fuente indirecta. Además de los archivos, existen otras fuentes secundarias de información, como los informes de organizaciones, publicaciones, documentos de carácter privados, encuestas pasadas, etc.
1.3.2. Métodos de recopilación Conocida la fuente de información, existen dos maneras prácticas de obtener los datos que el investigador necesita para desarrollar su actividad, estos métodos son: la observación y la encuesta.
1.3.2.1. Observación Consiste en poner los sentidos sobre lo que se quiere conocer, de tal manera que un escrito o figura se observa con la vista, un sonido se observa con el oído, un aroma se observa con el olfato, un objeto puede ser observado con el tacto y finalmente el sabor es observado con el sentido del gusto. En otras palabras, observar es poner los sentidos sobre lo que se investiga, para tomar nota de lo que se considera importante. La observación es la forma de investigar una fuente secundaria que es de naturaleza personal, que se encuentra al servicio de una organización. z3 0 z
WA LT E R C É S P E D E S R A M Í R E Z
1.3.2.2. Encuesta Con el objeto de obtener datos actualizados directamente de personas sobre la o las variables en estudio, se utiliza la encuesta, que es un conjunto de preguntas elaboradas especialmente para la investigación. Como se sabe, la encuesta es un instrumento para conseguir datos actuales de lo que se investiga, pero para ejecutarla y conseguir la información, existen dos métodos que son: el cuestionario y la entrevista. El cuestionario, es un método de conseguir información con encuestas, en el que participa una persona (informante), quien se encargará de resolver todas las interrogantes, para hacerlas llegar al solicitante de la información a través de algún medio. El informante contesta las preguntas y la consigna en el formato encuesta, por consiguiente todo cuestionario va de persona a documento. La entrevista, es otro método de conseguir información con encuestas, en el que participan dos personas: el informante quién se encargará de resolver todas las interrogantes, y el entrevistador quien formula e interpreta si es preciso las preguntas, para anotar las respuestas en la propia encuesta. El informante contesta las preguntas y el entrevistador las recibe para luego consignarlas en el formato encuesta, por consiguiente toda encuesta va de persona a persona.
1.3.3. Proceso para la recopilación de datos Recopilar datos de una fuente secundaria, solo requiere determinar qué información rescatar y de dónde obtenerla; mientras que sacar información de una fuente primaria, requiere de una serie de pasos, que a continuación se describen: 1º Definir el problema. Cuando una organización desea cambiar, mejorar o alcanzar algo de interés, para ella se convierte en una necesidad que se define como un problema de decisión gerencial, en donde se determinará qué deberá hacerse para resolverlo. Cuando el problema involucra la opinión de usuarios o consumidores, entonces la gerencia determina que se trata de un problema de investigación de mercado, y para resolverlo, debe contratar los servicios de una empresa especializada en investigación de mercados, si no cuenta con ese servicio. 2º Determinar el objetivo general. La empresa investigadora, luego de conversar con el gerente y demás involucrados en el caso, determina ¿cuál? es el objetivo general de la investigación. 3º Definir los objetivos específicos. definido el objetivo general, este se subdivide en varias partes, que representan los objetivos específicos, los cuales son más precisos.
z3 1 z
E S TA D Í S T I C A I
4º Elaborar el plan de investigación. Establecidos los objetivos específicos, a cada uno de ellos, se le asigna una pregunta de investigación, que como resultado de ella aparecen las variables a investigar. Posteriormente conocidas las variables, se fija la fuente de investigación y se formula la hipótesis correspondiente; es decir, ¿qué? se espera encontrar al concluir la investigación. 5º Elaborar las preguntas de la encuesta. Identificadas cuáles son las variables a investigar, se procede a elaborar cada una de las preguntas que se relacionan con ellas, incluyendo solo las variables de fuente primaria, porque las variables de fuente secundaria, se van a conseguir con otro proceso. Las preguntas en la encuesta deben ser ordenadas de acuerdo con una secuencia lógica y no necesariamente deben tener el orden de presentación de los objetivos específicos. En la formulación de las preguntas, se deben utilizar palabras comunes fáciles de entender y todas deben hacerse cerradas en lo posible. Una encuesta generalmente utiliza diferentes tipos de preguntas, dependiendo de los objetivos que se propone alcanzar, entre las más usadas están: - Nominal dicotómicas cerradas: Son aquellas que solo responden a: “sí” o “no”. - Nominal cerradas: Son la mayoría de las preguntas en toda encuesta, en donde se tiene que escoger una respuesta entre varias. - Nominal de respuesta múltiple: Son las preguntas que tienen varias respuestas a la vez, pero están ordenadas de acuerdo con la opinión del encuestado. - Escalar unipolar: Se utilizan generalmente en edades y en ingresos, porque estos asuntos son considerados por los encuestados como personales, a los que no desean precisar con exactitud. En estos casos las respuestas se encuentran dentro de un rango. - Escalar con intensión de asistencia: Son preguntas que orientan al encuestado, se utilizan cuando se desea conocer la frecuencia o la intensidad del uso o consumo. - Diferencial semántico: Son preguntas de opinión utilizadas principalmente para evaluación, en donde de precisan los extremos y dentro de ellos se pone una escala de números correlativos a partir de 1, para que el encuestado califique que tan cerca o que tan lejos está su opinión dentro de dichos extremos. - Tipo Likert: Son preguntas que se formulan en forma positiva o en forma negativa, para conocer la opinión del encuestado, para que responda a una de las 5 opciones siguientes: concuerda fuertemente (CF), concuerda (C), no opina (NO), discrepa (D) y finalmente discrepa fuertemente (DF). - Tipo Thurstone: También son preguntas de opinión, que se utilizan para comparar: entidades, productos o servicios; entre los nuestros con productos o servicios de los competidores, el encuestado debe elegir entre las dos opciones, cuál prefiere. z3 2 z
WA LT E R C É S P E D E S R A M Í R E Z
6º Puesta en prueba la encuesta. Después de saludar a la persona que se desea encuestar y se mencione el objeto de la encuesta, cabe la pregunta ¿podría usted participar? Si la respuesta es afirmativa, se procede a probar las preguntas de la encuesta, para saber si están claras todas ellas, esta prueba se realiza con muy pocas personas. 7º Ejecutar la encuesta. En esta parte se repite lo mencionado en el paso anterior, con la diferencia de que la participación es masiva con la cantidad de personas que fue establecida en el estudio del caso, concluida la encuesta se agradece la participación del encuestado. 8º Tabular los resultados. Se hace un resumen numérico de las respuestas obtenidas en cada variable, con el objeto de conocer la apreciación de los participantes a las interrogantes que servirán de base para confirmar o no las hipótesis planteadas. 9º Obtener las conclusiones. Son resúmenes de los resultados de la encuesta, los que generalmente se presentan acompañados de gráficos, de cuadros de datos más representativos y de algunas medidas estadísticas de importancia. 10º Realizar las recomendaciones necesarias. Son las observaciones encontradas en la investigación, para que la empresa tome las medidas correctivas necesarias, de tal manera que se resuelva el problema planteado.
Ejercicio sobre la elaboración de una encuesta: Para elaborar una encuesta, primero se debe contar con un proyecto sobre el cual se precise esta necesidad. En la elaboración de toda encuesta se deben dar los 5 primeros pasos del proceso de recopilación de datos. A continuación se verá el siguiente caso: Proyecto para alcanzar la excelencia en la calidad del servicio de la Agencia 7 del BanMachu Picchu del distrito de San Sebastián del Cusco, frente a sus competidores.
co
1. Definir el problema: El Banco Machu Picchu es un banco joven que desea tener mayor cobertura en el Perú, pero un estudio a nivel nacional, está por el momento fuera de su presupuesto, generándose un problema de decisión gerencial; por ello, decide realizar un plan de investigación pequeño en una de sus agencias del Cusco. El gerente tiene la seguridad de que con los resultados de la investigación, le dará una idea sobre la estrategia a utilizar a nivel nacional. La empresa de investigación contratada quiere conocer, cuáles son las fortalezas y cuáles son las debilidades de la Agencia 7 de San Sebastián del Cusco, frente a sus competidores, tomando en cuenta los factores que determinan la calidad de un servicio para obtener la calificación de excelente, generándose un problema de investigación de mercado que hay que resolver mediante una encuesta dirigida solamente a las personas que salen de la Agencia 7, después de haber sido atendidas.
z3 3 z
E S TA D Í S T I C A I
2. Objetivo general: Identificar las fortalezas y las debilidades de la Agencia 7 de San Sebastián del Cusco, frente a sus competidores. 3. Objetivos específicos: Con relación al objetivo general, se desprenden los siguientes objetivos específicos: a) Conocer el criterio que utilizan los clientes para elegir un buen banco. b) Conocer como evalúan los clientes del Banco Machu Picchu de la Agencia 7 y a los competidores, respecto al criterio de selección de un buen banco. c) Analizar los servicios de mayor preferencia por los clientes, en qué banco o bancos. d) Conocer la participación en el mercado de Banco Machu Picchu con relación a los servicios que ofrece la Agencia 7. e) Conocer el perfil demográfico y psicográfico de los clientes de la Agencia 7 del Banco Machu Picchu y establecer diferencias con la de los competidores. f) Conocer la frecuencia de las visitas, el tiempo de demora en la atención al público y los niveles de satisfacción. 4. Plan de investigación: Todo plan de trabajo, debe relacionar cada objetivo específico con: preguntas de investigación, las variables, las hipótesis y las fuentes:
Objetivos específicos Cómo elegir un buen banco.
Preguntas de investigación
Variables
¿Qué característica Limpieza, atención, busca usted en un buen banco? rapidez, apariencia
Cómo evalúa ¿Cómo evalúa al perclientes a la sonal, seguridad y amAgencia 7 biente de la agencia?
Hipótesis
Tiene la Agencia 7 una Primaria excelente calidad en el servicio
Actitud, seguridad, Los servicios de la Agen- Primaria ambiente, presencia cia 7 son mejores que la de sus competidores.
Analizar los ¿Qué operaciones Tipo de servicios servicios de realizas en la agencia mayor pref. 7?
En la Agencia 7 el servicio de mayor preferencia es la cuenta corriente
Participación
Primaria
Secund.
Perfil demog. ¿Cuáles son las Ubicación, edad, de clientes de c a r a c t e r í s t i c a s sexo,niveles de inla Agenc. demográficas de los greso clientes? F r e c u e n c i a s ¿Con qué frecuencia de visitas. asiste? ¿Qué tiempo espera?
Fuentes
No hay diferencia en el perfil demográfico entre clientes de la agencia y competidores.
Primaria
Frecuencia de uso Existe satisfacción endemora. tre los cliente de la Agencia
Primaria
z3 4 z
WA LT E R C É S P E D E S R A M Í R E Z
El cuarto objetivo específico, por utilizar fuente secundaria, solo se menciona en el plan, porque tiene otro proceso de investigación. 5.Elaboración de la encuesta: Tomando como base el plan de investigación, se procede a elaborar una pregunta por cada variable, de la siguiente manera: Buenos días (buenas tardes), estamos realizando una encuesta para conocer cómo el cliente percibe la calidad del servicio de esta agencia, ¿podría participar?
ENCUESTA 1) ¿Es usted cliente o usuario de esta agencia bancaria? 1 – Cliente 2 – Usuario 2) ¿Qué características busca usted en un buen banco? 1 2 3 1 – Limpieza 2 – Orden 3 – Buena infraestructura 4 – Atención amable 5 – Servicio rápido 3) ¿Con qué frecuencia asiste a esta agencia bancaria? 1 – Diariamente 3 – Mensualmente 2 – Semanalmente 4 – Cuando lo necesito 4) En esta agencia usted fue atendido: 1 – Por un ejecutivo 2 – En ventanilla 3 – En plataforma 5) ¿Qué operación u operaciones realizó usted en la agencia? 1 2 3 1 – Cuenta corriente 2 – Ahorros 3 – Préstamos 4 – Servicios varios 6) ¿Entre qué intervalos de tiempo estuvo en cola de espera? 1 – Menos de 10 minutos 3 – Entre 20 y 30 minutos 2 – Entre 10 y 20 minutos 4 – Más de 30 minutos 7) ¿Cómo evaluaría usted a la persona que le atendió? 1 2 3 4 5 1 – Atención amable 2 – Buena apariencia 3 – Atención al saludo 4 – Despedida atenta 5 – Servicio rápido z3 5 z
No amable Sin apariencia No saluda Sin Despedida Sin rapidez
-
E S TA D Í S T I C A I
8) ¿Cómo evaluaría usted a esta agencia? 1 2 1 – Bastante ordenada 2 – Percibe limpieza 3 – Ambiente moderno 4 – Comodidad al esperar 5 – Folletos disponibles
3
4
5
Desordenada No hay limpieza Ambiente antiguo Incomodidad No hay folletos
9) ¿Cómo percibe la seguridad en esta agencia bancaria? 1 – Óptima 3 – Regular 2 – Buena 4 – Deficiente 10) ¿Recuerda dónde se ubicaba el vigilante de la agencia bancaria? 1 – En la puerta de ingreso 3 – En el exterior 2 – En recepción al público 4 – En el interior 11) ¿Recuerda dónde se ubicaba el policía (PNP) en la agencia? 1 – En la puerta de ingreso 3 – En el exterior 2 – En recepción al público 4 – En el interior 12) ¿Cómo evaluaría usted a las siguientes personas de la agencia? CF C NO D 1 – ¿Los vigilantes son muy amables?
DF
2 – ¿Los policías son poco amables? 13) ¿El personal de la agencia usa fotocheck? 1 – Sí 2 – No 14) Si tuviera que escoger necesariamente un banco entre cada opción ¿cuál escogería? 1 – Crédito Machu Picchu 2 – Machu Picchu Interbank 3 – Scotia Bank Machu Picchu 4 – Machu Picchu Continental 5 – Continental Crédito 6 – Interbank Scotia Bank 15) ¿Es cliente a de alguno de los bancos mencionados en la pregunta anterior? 1 – Sí 2 – No
16) ¿En cuál o cuáles de ellos según prioridad? 1 2 1 – Machu Picchu 2 – Crédito 3 – Continental 4 – Scotia Bank 5 – Interbank 17) ¿Reside usted en el distrito de San Sebastián? 1 – Sí 2 – No z3 6 z
3
WA LT E R C É S P E D E S R A M Í R E Z
18) ¿Dentro de qué intervalos ubica su edad? 1 – menores de 18 años 4 – Entre 35 y 45 años 2 – Entre 18 y 25 años 5 – Entre 45 y 55 años 3 – Entre 25 y 35 años 6 – Más de 55 años 19) ¿Dentro de qué intervalos ubica su ingreso? 1 – menores de 600 soles 4 – Entre 2000 y 3000 soles 2 – Entre 600 y 1000 soles 5 – Entre 3000 y 4000 soles 3 – Entre 1000 y 2000 soles 6 – Más de 4000 soles 20) ¿Sexo? 1 – Masculino
2 – Femenino
Muchas gracias.
Entrevistador (a)
Fecha
z3 7 z
Hora
L e c c i ó n
4
1.4. APLICACIONES MATEMÁTICAS La información estadística de carácter numérico, utiliza las matemáticas cuando le desea dar a las observaciones un tratamiento en conjunto tanto muestral como poblacional, la gran mayoría de medidas estadísticas son obtenidas a través de las matemáticas. Algunas veces las cifras numéricas son muy grandes, de tal manera que para simplificarlas se utiliza la notación científica, quedando las mismas en miles o millones. Otra necesidad matemática es el redondeo de datos que se da generalmente a la parte decimal de toda cifra numérica, también la estadística utiliza las sumatorias en la mayoría de las medidas de resumen.
1.4.1. Notación científica Matemáticamente la notación científica es la representación de un número en un potencial que puede utilizar cualquier número como base, pero para la estadística se utiliza el potencial con base diez. Ejercicios resueltos: 1) Expresar científicamente con 2 cifras enteras, la siguiente cantidad: 23 475 684 543,129
Solución:
Se corre la cifra decimal de la posición actual a la nueva posición dejando 2 cifras enteras
23,475684543129 x109
z3 9 z
E S TA D Í S T I C A I
El potencial positivo es la cantidad de cifras que ha recorrido la coma hacia la izquierda. 2) Expresar científicamente 0,000000012952
con
2
cifras
enteras,
la
siguiente
cantidad:
Solución:
Se corre la cifra decimal de la posición actual a la nueva posición dejando 2 cifras enteras
12,952 x10 – 9 El potencial negativo es la cantidad de cifras que ha recorrido la coma hacia la derecha.
3) Expresar científicamente con 1 cifra entera, la siguiente cantidad: 2 928 452,1857
Solución:
Se corre la cifra decimal de la posición actual a la nueva posición dejando 1 cifra entera 2,9284521857x106 El potencial positivo es la cantidad de cifras que ha recorrido la coma hacia la izquierda.
4) Expresar científicamente 0,0000004571652
con
1
cifra
entera,
la
siguiente
cantidad:
Solución: Se corre la cifra decimal de la posición actual a la nueva posición dejando 1 cifra entera 4,571652 x10 – 7
El potencial negativo es la cantidad de cifras que ha recorrido la coma hacia la derecha.
5) Expresar científicamente con 3 cifras enteras, la siguiente cantidad: 221,457878 Solución:
221,457878 x100 El potencial es cero porque la coma ha permanecido en el mismo lugar. z4 0 z
WA LT E R C É S P E D E S R A M Í R E Z
6) ¿A qué número real le corresponde: 12,4589235 x 104? Solución: 124589,235
Cuando el exponente es positivo, la coma regresa a la derecha 4 posiciones. 7) ¿A qué número real le corresponde: 12,4589235 x 10
Solución:
0,00124589235
?
–4
Cuando el exponente es negativo, la coma regresa a la izquierda 4 posiciones. 8) ¿A qué número real le corresponde: 4 457 258,45 x 10
?
–5
Solución:
44,5725845
Cuando el exponente es negativo, la coma regresa a la izquierda 5 posiciones.
Resolver los siguientes ejercicios propuestos sobre notación científica: 1)
Representar científicamente con una sola cifra entera las siguientes cantidades:
a) 125,568912
Resp:
1,25568912 x 10 2
b) 0,002385789
Resp:
2,385789 x 10 – 3
c) 145 256 357 235,9
Resp:
1,452563572359 x 10 11
d) 0,125569
Resp:
1,25569 x 10 – 1
e) 0,00000000369
Resp:
3,69 x 10 – 9
f) 4,59823
Resp:
4,59823 x 10 0
2) Resolver las siguientes expresiones científicas:
a) 125568,912 x 10 – 4
Resp:
b) 25,289435 x 10 – 6
Resp: z4 1 z
12,5568912 0,000025289435
E S TA D Í S T I C A I
c) 8,912 x 10 5
Resp:
891 200
d) 68,14452 x 10 – 7
Resp:
0,000006814452
e) 2 912 x 10 6
Resp:
2 912 000 000
f) 0,94132 x 10 – 4
Resp:
0,000094132
1.4.2. Redondeo de datos Consiste en suprimir cifras que generalmente son decimales, algunas veces se suprimen todos los decimales quedando solo enteros, otras veces se dejan una o dos cifras decimales sin suprimir, de acuerdo con el criterio o por necesidad de quien realiza el redondeo. Al redondeo también se le conoce como aproximación de cifras decimales, para lo cual existen tres reglas que son: 1º Cuando la cifra posterior a la cifra a aproximar es mayor de 5, la cifra de aproximación aumenta en 1. 2º Cuando la cifra posterior a la cifra a aproximar es menor de 5, la cifra de aproximación queda igual. 3º Cuando la cifra posterior a la cifra a aproximar es igual a 5, la cifra de aproximación aumenta en 1 siempre y cuando sea cifra impar, en caso contrario no aumenta. Ejercicios resueltos: 1) Redondear a décimas las siguientes cantidades: 34,5723; 1,334529; 356,15; 26,05 y 26,0500001 Solución: a) 34,6 b) 1,3 c) 356,2 d) 26,0 e) 26,1
z4 2 z
WA LT E R C É S P E D E S R A M Í R E Z
En el caso “e”, a pesar de que la cifra de aproximación es par (0) y la posterior es 5, el 0 se ha convertido en 1, porque el otro uno que está al final de todo el número, hace que las centésimas sean mayor de 5. 2) Las ventas de 5 años del 2006 al 2010 de una empresa fueron las siguientes; 2006
56 458 279,20
2007
58 125 458,60
2008
65 945 258,50
2009
72 815 856,30
2010
81 125 456,90
Convertir científicamente las ventas en millones y redondearlas a enteros:
Solución: Años
Venta
Años
Venta en millones
2006
56,45827920 x 106
2006
56
2007
58,12545860 x 106
2007
58
2008
65,94525850 x 106
2008
66
2009
72,81585630 x 106
2009
73
2010
81,12545690 x 106
2010
81
Total
334,47030950 x 106
Total
334
Puede observar que las ventas en millones expresan lo mismo que la información original, con la diferencia de que las cifras redondeadas y en millones, facilitan el tratamiento estadístico porque son cifras más pequeñas.
1.4.3. Sumatoria (Σ) Es la representación ordenada de un conjunto finito de datos, que habrán de ser sumados, toda sumatoria se representa por la letra griega mayúscula, sigma. En estadística se estila que los límites de una sumatoria, sean a partir de 1 hasta el dato “n” inclusive, y pueden suprimirse del símbolo de sumatoria, cuando tales límites son conocidos. z4 3 z
E S TA D Ă? S T I C A I
Como cualquier valor numĂŠrico puede ser sumado, existen valores: variables, constantes y correlativos o Ăndices de la sumatoria; por consiguiente, se puede decir que existe un tipo de sumatoria para cada caso.
1.4.3.1. Sumatoria de una variable Se trata de valores que tienen diferentes cambios de magnitud, inclusive pueden hasta cambiar de signos. La sumatoria de una variable se define de la siguiente manera: đ??§đ??§
đ??˘đ??˘  !đ?&#x;?đ?&#x;?
Â
Donde:
đ??—đ??— đ??˘đ??˘  =  đ??—đ??— đ?&#x;?đ?&#x;? +  đ??—đ??— đ?&#x;?đ?&#x;? +  đ??—đ??— đ?&#x;‘đ?&#x;‘ +  .   .   . +  đ??—đ??— đ??§đ??§
Xi= Variable. i=
Ă?ndice.
Ejercicios resueltos: 1) Dado:
Xi
2
–3
4
1
–2
6
Yi
1
5
2
–4
–3
1
Hallar las siguientes sumatorias: a) ÎŁ Xi
b) ÎŁ Yi
c) ÎŁ (Xi + Yi)
d) Σ (2Xi – 3Yi)
e) ÎŁ Xi2
f) ÎŁ (Xi + Yi)2
g) ÎŁ 9 Xi
Solución: a) Σ Xi = 2 – 3 + 4 + 1 – 2 + 6 = 8 b) Σ Yi = 1 + 5 + 2 – 4 – 3 + 1 = 2 c) Σ (Xi + Yi) = (2 + 1) + (–3 + 5) + (4 + 2) + (1 – 4) + (– 2 – 3) + (6 + 1) = = 3 + 2 + 6 – 3 – 5 + 7 = 10 d) Σ (2Xi – 3Yi) = [2(2) – 3(1)] + [2(–3) – 3(5)] + [2(4) – 3(2)] + [2(1) – 3(–4)] + [2(– 2) – 3(–3)] + [2(6) – 3(1)] = 1 – 21 + 2 + 14 + 5 + 9 = 10 e) Σ Xi2 = 22 – 32 + 42 + 12 – 22 + 62 = 4 + 9 + 16 + 1 + 4 + 36 = 70 f) Σ (Xi + Yi) 2 = (2 + 1) 2 + (–3 + 5) 2 + (4 + 2) 2 + (1 – 4) 2 + (– 2 – 3) 2 + (6 + 1) 2 = = 32 + 22 + 62 – 32 – 52 + 72 = 9 + 4 + 36 + 9 + 25 + 49 = 132 g) Σ 9 Xi = 9(2) + 9(– 3) + 9(4) + 9(1) + 9(– 2) + 9(6) = 18 – 27 + 36 + 9 – 18 + 54 = 72 z4 4 z
WA LT E R C É S P E D E S R A M � R E Z
En este grupo de ejercicios no se han puesto los lĂmites, porque se entiende que Xi e Yi, adquieren los 6 valores, tal como se observa en la tabla que contiene a ambas variables. Resolver los siguientes ejercicios propuestos, utilizando sumatorias de una variable: 1) Dado,
Xi:
a) ÎŁ Xi b) ÎŁ Xi
2
c) ÎŁ 4 Xi
4, –3, 7, –8, 6, 3, 8, 1, –5 y 2.
Hallar:
Resp:
15
Resp:
277
Resp:
60
d) Σ (Xi – 1)
Resp:
5
e) Σ (Xi – 2)
Resp:
257
2
f) ÎŁ 6 Xi
Resp:
1 662
Resp:
1 310
Resp:
508
i) Σ (4 – Xi)
Resp:
25
j) ÎŁ (1 + Xi)
Resp:
25
2
g) Σ (5Xi2 – 5Xi) h) Σ 4(Xi2 – 10Xi)
1.4.3.2. Sumatoria de una constante Se trata de valores que tienen la misma magnitud, no presentan cambios. La sumatoria de una constante se define de la siguiente manera:
đ??§đ??§
Â
Donde: K=
đ??˘đ??˘  !đ?&#x;?đ?&#x;?
đ??Šđ??Š  =   đ??Šđ??Š + đ??Šđ??Š + đ??Šđ??Š+  .   .   .   = đ??§đ??§  đ??Šđ??Š
Constante
Ejercicios resueltos 1) Con los lĂmites del 1 al 8, resolver las siguientes sumatorias: a) ÎŁ 2
b) ÎŁ 9
c) Σ – 6
d) ÎŁ 17
z4 5 z
e) ÎŁ 22
E S TA D Ă? S T I C A I
SoluciĂłn:
a) ÎŁ 2 = 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 = 16 b) ÎŁ 9 = 9 + 9 + 9 + 9 + 9 + 9 + 9 + 9 = 72 c) ÎŁ – 6 = – 6 – 6 – 6 – 6 – 6 – 6 – 6 – 6 = – 48 d) ÎŁ 17 = 17 + 17 + 17 + 17 + 17 + 17 +17 + 17 = 136 e) ÎŁ 22 = 22 + 22 + 22 + 22 + 22 + 22 + 22 + 22 = 176 2) Con los lĂmites del 15 al 21, resolver la sumatoria de la constante 28.
SoluciĂłn: ÎŁ 28 = 28 + 28 + 28 + 28 + 28 + 28 + 28 = 196
Resolver los siguientes ejercicios propuestos, utilizando sumatorias de una constante: 1) 2) 3) 4) 5)
Con Con Con Con Con
los los los los los
lĂmites lĂmites lĂmites lĂmites lĂmites
del del del del del
1 al 6, resolver la sumatoria de la constante 25. Resp: 1 al 9, resolver la sumatoria de la constante 19. Resp: 1 al 5, resolver la sumatoria de la constante 13. Resp: 10 al 19, resolver la sumatoria de la constante 23. Resp: 6 al 17, resolver la sumatoria de la constante 32. Resp:
150 171 65 230 384
1.4.3.3. Sumatoria de un Ăndice Se trata de valores que tienen cambios de magnitud de manera correlativa, obedeciendo a un mismo patrĂłn. La sumatoria de un Ăndice se define de la siguiente manera:
đ??§đ??§
Â
đ??˘đ??˘  !đ?&#x;?đ?&#x;?
đ??˘đ??˘  = đ?&#x;?đ?&#x;? + đ?&#x;?đ?&#x;? + đ?&#x;‘đ?&#x;‘+  .   .   . +   đ??§đ??§ Â
Donde:
i=
Ă?ndice
z4 6 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos
Resolver los siguientes ejercicios propuestos, utilizando sumatorias de un índice: 1) Si los límites van del 1 al 15, resolver: a) Σ i b) Σ 2i c) Σ (2i – 1)
z4 7 z
Resp: Resp: Resp:
120 240 225
E S TA D Í S T I C A I
1.4.3.4. Propiedades de sumatorias Dependiendo del tipo de sumatoria, las propiedades de estas son las siguientes: 1º La sumatoria de una constante es igual n veces la constante. ! ! !!
K = n K
2º La sumatoria de la suma y o diferencia entre constantes y/o variables, es igual a la suma y/o diferencia de las sumatorias de cada una de ellas. ! ! !!
(X ! − K + Y! ) =
! ! !!
X ! −
! ! !!
K +
! ! !!
Y!
3º La sumatoria del producto de una constante por una variable, es igual a la constante por la sumatoria de la variable. !
4º
! !!
K X ! = K
! ! !!
X !
La sumatoria los primeros números naturales consecutivos, es igual a la mitad de (n) por (n + 1). !
! !!
i =
n (n + 1) 2
5º La sumatoria los primeros números naturales pares consecutivos, es igual a (n) por (n + 1). !
6º
! !!
La sumatoria los primeros números naturales impares consecutivos, es igual a n2. !
7º
2 i = n (n + 1)
! !!
(2 i − 1) = n!
La sumatoria de los cuadrados de los primeros números naturales consecutivos, es igual a [n (n + 1) (2n + 1)] / 6. !
! !!
i! =
n n + 1 (2n + 1) 6
8º La sumatoria de los cubos de los primeros números naturales consecutivos, es igual a [n (n + 1)] 2 / 22. ! ! !!
i! =
n n + 1 2
!
z4 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos
1) Dado: Xi
2
–3
4
1
8
–2
6
7
9
5
Yi
1
5
2
–4
7
–3
–1
3
4
6
Hallar las siguientes sumatorias: a) (Xi + Yi)
b) Σ (2Xi – 3Yi)
c) Σ (Xi – Yi)2
Solución: a) Σ Xi = 2 – 3 + 4 + 1 + 8 – 2 + 6 + 7 + 9 + 5 = 37 b) c)
Σ Yi = 1 + 5 + 2 – 4 + 7 – 3 – 1 + 3 + 4 + 6 = 20 Σ (Xi + Yi) = Σ Xi + Σ Yi = 37 + 20 = 57 Σ (2Xi – 3Yi) = 2 Σ Xi – 3 Σ Yi = 2(37) – 3(20) = 14 Σ Xi2 = 22 – 32 + 42 + 12 + 82 – 22 + 62 + 72 + 92 + 52 = 289 Σ Yi2 = 12 + 52 + 22 – 42 + 72 – 32 – 12 + 32 + 42 + 62 = 166 Σ Xi Yi = (2 x 1) + (–3 x 5) + (4 x 2) + (1 x –4) + (8 x 7) + (–2 x –3) + (6 x –1) + (7 x 3) + (9 x 4) + (5 x 6) = 2 – 15 + 8 – 4 + 56 + 6 – 6 + 21 + 36 + 30 = 134
Σ (Xi – Yi) 2 = Σ Xi2 – 2 Σ Xi Yi + Σ Yi2 = 289 – 2(134) + 166 = 187 42
2) Resolver:
∑i i=1
Solución: Fórmula: n (n +1) / 2 n = 42 Σ i = 42 (43) / 2 = 903 70
3) Resolver:
∑ 2i i=1
Solución: Fórmula: n (n +1) n = 70 Σ 2i = 70 (71) – 9 (10) = 4880
–n = 9
z4 9 z
E S TA D Í S T I C A I
Recuerde que se están sumando 70 (n) términos o números pares consecutivos del 1 al 70, pero como la sumatoria no incluye del 1 al 9, es necesario restar los términos que no se incluyen. 130
4) Resolver:
∑ (2i −1)
i=105
Solución: Fórmula: n2 n = 130 – n = 104 Σ (2i – 1) = 1302 – 1042 = 6 084 5) Hallar la sumatoria de los siguientes números:
1 + 2 + 3 +……. + 156
Solución: Fórmula: n (n +1) / 2 n = 156 Σ i = 156 (157) / 2 = 12 246 6) Hallar la sumatoria de los siguientes números:
76 + 78 + 80 +……. + 280
Solución: Fórmula: n (n +1) n = 280 / 2 = 140 Σ 2i = 140 (141) – 37 (38) = 18 334 7) Hallar la sumatoria de los siguientes números:
– n = 74 / 2 = 37
7 + 9 + 11 +……. + 29
Solución: Fórmula: n2 n = (29 + 1) / 2 = 15 Σ (2i – 1) = 152 – 32 = 216
–n = (5 + 1) / 2 = 3
En los ejercicios 6 y 7, el valor de n se halla de manera inversa a la sumatoria de cada caso. 8) Hallar la sumatoria de los siguientes números:
520 + 540 + 560 +……. + 2080
Solución: Para darle solución a este ejercicio, primero se debe convertir a uno de los casos dados. (52 + 54 + 56 +……+ 208) x 10 Fórmula:
n (n +1)
n = 208 / 2 = 104
Σ 2i = 104 (105) – 25 (26) =
(10 270) x 10
z5 0 z
– n = 50 / 2 = 25 = 102 700
WA LT E R C É S P E D E S R A M � R E Z
9) Hallar la sumatoria de los siguientes números: 0,051 + 0,053 + 0,055 +‌+ 0,157 Solución: Para darle solución a este ejercicio, primero se debe convertir a uno de los casos dados. (51 + 53 + 55 +‌‌+ 157) x 10–3 Fórmula:
n2
n = (157 + 1) / 2 = 79
Σ (2i – 1) = 792 – 252 = (5 616) x 10–3
–n = (49 + 1) / 2 = 25
= 5,616
10) Si la suma de los primeros nĂşmeros naturales consecutivos, es 144 453, ÂżcuĂĄl es el valor de n? SoluciĂłn: FĂłrmula:
n (n +1) / 2
n =
n (n +1) / 2 = 144 453;
ÎŁ i = 144 453
?
n2 + n = 288 906;
n2 + n – 288 906 = 0
La fĂłrmula de una ecuaciĂłn de segundo grado es:
−  đ?‘?đ?‘?  ¹  đ?‘?đ?‘? ! −  4  đ?‘Žđ?‘Ž  đ?‘?đ?‘? −  1  ¹  1! −  4(1)(−288  906) , al  reemplazar  los  valores, se  tiene:   2  đ?‘Žđ?‘Ž 2(1) đ??§đ??§  =  Â
−  1  ¹  1! + 1  155  624 −  1  ¹  1  155  625 −  1 + 1  075 =  =  =   đ?&#x;“đ?&#x;“đ?&#x;“đ?&#x;“đ?&#x;“đ?&#x;“ 2 2 2
Un mĂŠtodo prĂĄctico para resolver este tipo de ecuaciones es sacando raĂz cuadrada del valor conocido, tomando solo la parte entera, sin redondeo.
n = 288 906 = 537, 4997674 = 537 Resolver los siguientes ejercicios propuestos, utilizando las propiedades de sumatorias: 1) Hallar las siguientes sumatorias, utilizando los datos de la tabla adjunta: Yi
5
4
2
3
8
6
9
Zi
6
1
2
5
–1
7
4
a) (Yi + Zi)
Resp:
61 52
b) Σ (4Yi – 4Zi)
Resp:
c) Σ (Yi – Zi)2
Resp: z5 1 z
121
E S TA D Í S T I C A I
125
∑i
2) Resolver: I=15 Resp: 7 770 51
3) Resolver:
∑ 2i I=33
Resp: 1 596 56
4) Resolver:
∑ (2i −1) I=15
Resp:
2 940
5) Hallar la sumatoria de los siguientes números: 19 + 20 + 21 + 22 +……. + 135 Resp.
9 009
6) Hallar la sumatoria de los siguientes números: 706 + 708 + 710 +……. + 720 Resp:
5 704
7) Hallar la sumatoria de los siguientes números: 37 + 39 + 41 + 43 +……. + 63 Resp: 8) Hallar la sumatoria de los siguientes números:
700
3,21 + 3,23 + 3,25 +……. + 4,11
Resp: 168,36 9) Hallar la sumatoria de los siguientes números:
0,001 + 0,002 + 0,003 +…….+ 0,17
Resp: 14,535 10) Si la suma de los primeros números naturales consecutivos, es 7 875, ¿cuál es el valor de n? Resp:
125
11) Si la suma de los primeros números naturales impares consecutivos, es 70 756, ¿cuál es el valor de n? Resp: 12) Si: Σ Xi = 32
Σ Xi2 = 321
Hallar Σ [Xi (Xi – 4)]
13) Si: Σ Zi = 16
y
y
266
Resp:
193
Resp:
201
Σ Zi2 = 201
Hallar Σ (Zi – 4)2; con los límites del 1 al 8 z5 2 z
WA LT E R C É S P E D E S R A M Í R E Z
AUTOEVALUACIÓN Nº 1 1) ¿Cuál de los siguientes conceptos se refiere al marco referencial? A) Procedimientos y metas del investigador C) Obtener datos más importantes E) Obtener una muestra de una población
B) Límites de la investigación D) Dar solución a un problema muestral
2) Una población es el . . . . . . . . . . . de los datos, de la cual se ………….. una muestra. A) Marco / Investiga D) Censo / muestrea
B) Estadígrafo/ procesa E) Estadígrafo / obtiene
C) Universo / obtiene
3) Los investigadores prefieren trabajar con muestras, para: A) Una investigación con variables C) Procesar datos E) Hacer un muestreo
B) Ahorrar tiempo y costo D) Calcular medidas
4) Un estadígrafo se obtiene al: A) Procesar una medida estadística de resumen C) Determinar los límites de una investigación E) Todas las respuestas anteriores son correctas
B) Desarrollar un proceso de investigación D) Clasificar los tipos de datos
5) Determine a cuál de los tipos de variables pertenece: “Las monedas de menor circulación”. A) Ordinal
B) Nominal
C) Discreta
D) Continua
E) Cuantitativa
6) Determine a cuál de los tipos de variables pertenece: “La lista de postulantes a una beca”. A) Ordinal
B) Nominal
C) Discreta
D) Continua
E) Cuantitativa
7) Determine a cuál de los tipos de variables pertenece: “La capacidad de la biblioteca de la Facultad”. A) Ordinal
B) Nominal
C) Discreta
D) Continua
E) Cualitativa
8) El tipo de pregunta utilizado en una encuesta que define los extremos y deja al encuestado determinar la intensidad de su respuesta, dentro de una escala, se llama: A) Likert
B) Thurstone
C) Dicotómica cerrada D) Escalar unipolar E) Diferencial semántico
z5 3 z
E S TA D Í S T I C A I
9) Si tuviera que escribir científicamente con tres cifras enteras el siguiente número: 1,25966. ¿Cuál sería el exponente de base 10? A) 3 B) – 3
C) 2
D) 1
E) –2
10) ¿Qué número es el que se ha escrito científicamente como 2,3958 x 10– 4? A) 0,0023958
B) 0,23958
C) 2395,8
D) 0,00023958
E) 0,000023958
11) Redondee a décimas, las siguientes cantidades: 34,71234; 0,45; 22,85000002 A) 34,7; 0,5; 22,8
B) 34,7; 0,4; 22,8 C) 34,7; 0,5; 22,9 D) 34,7; 0,4; 22,9 E) 34,8; 0,5; 22,8
12) Con: Σ Yi2 = 261,
Σ Yi Zi = 45,
Σ Zi2 = 246.
Hallar: Σ (5Yi – 5Zi)2 A) 507
B) 15
C) 4 785
D) 375
E) 10 425
41
13) Resolver: A) 358
∑ (2i −1)
i=37
B) 1 299
C) 1 681
D) 385
E) 2 977
14) Hallar la sumatoria de los siguientes números: 1 852, 1 854, 1 856,……., 2010 A) 308 960
B) 154 480
C) 1 011 030
D) 614 058
E) 617 760
15) Hallar la sumatoria de los siguientes números: 0,091 + 0,092 + 0,093 +…+ 0,21 A) 18,06
B) 18 060
C) 1,806
D) 180,6
E) 1 806
Respuestas de control 1. B, 2. C, 3. B, 4. A, 5. A, 6. B, 7. C, 8. E, 9. E, 10. D, 11. D, 12. E, 13. D, 14. B, 15. A
z5 4 z
WA LT E R C É S P E D E S R A M Í R E Z
GLOSARIO Caracterizar la muestra.
Es cuando una muestra adquiere las mismas características de una población (Deducción).
Caracterizar la población.
Es cuando se asume que una población tiene las mismas características de una muestra (Inducción).
Competidor.
Es una empresa u organización que actúa en el mismo mercado que otras empresas, generando competencia entre ellas.
Conjunto finito.
Es un grupo limitado de datos u observaciones; es decir, que un conjunto finito permite contar todos sus elementos.
Experimentación.
Significa probar diferentes acciones, con el propósito de comparar los resultados obtenidos para elegir el más apropiado.
Medidas de resumen.
Son todas aquellas medidas estadísticas tanto de posición o centralización como las de variación o dispersión que resumen de alguna manera las características de una muestra o población. Ejemplo: Media Aritmética, Mediana, Varianza, Coeficiente de Variación, etc.
Pregunta cerrada.
Es un tipo de pregunta utilizada en las encuestas, que se caracteriza por no dejar libertad al informante a contestar de manera abierta, solo debe contestar las posibles respuestas contempladas dentro de ella.
EXPLORACIÓN ON LINE http://es.wikipedia.org/wiki/Variable_estad%C3%ADstica http://recursostic.educacion.es/descartes/web/materiales_didacticos/iniciacion_estadististica_fjgarcia/01VariablesEstadisticas.htm http://www.unavarra.es/estadistica/I.T.A./Curso%202005-06/APUNTES/temas%201%20y% 202.pdf http://sitios.ingenieria-usac.edu.gt/estadistica/estadistica2/estadisticadescriptiva.html http://ag-exactas.wikidot.com/sumatorias z5 5 z
s e g u n d a
UNIDAD Uso de los Datos Estadísticos
Estadísticas para información: textos, tabulados, gráficos Estadísticas para investigación: Tablas de distribuciones de frecuencias, gráficos
OBJETIVO (S) GENERAL Aprender que los datos estadísticos tienen dos usos totalmente diferentes, ya que se pueden utilizar como estadística para información y como estadística para investigación. Las estadísticas para información es de uso público, que son preparadas para todos incluyendo a los que no conocen de Estadística; estas informaciones, obtenidas de alguna fuente, son publicadas ordenadamente en cuadros y gráficos. En cambio, para comprender las Estadísticas para Investigación, las personas deben de conocer sobre esta asignatura, porque utiliza procedimientos y medidas estadísticas propias.
ESPECÍFICOS • Conocer que una vez recogida la información de alguna fuente, existe un área estadística que se encarga de publicar los datos recopilados, con el cuidado especial de que cualquier persona pueda entenderlos. • Saber que una vez recogida la información de alguna fuente, existe otra área estadística que se encarga de prepararlos para el análisis, ordenando la información en tablas de distribución de frecuencias además de construir algunos gráficos de uso estadístico.
L e c c i ó n
1
2.1. ESTADÍSTICAS PARA INFORMACIÓN
Existen instituciones públicas y/o privadas que encargan de recolectar información, con el objeto de ordenarlas para publicarlas manteniendo informado a un determinado público. Por esta razón, existen revistas periódicas de diferentes especialidades, que se encargan de publicar: el movimiento bursátil de una ciudad, el movimiento migratorio del campo a la ciudad o de la ciudad al exterior, la producción minera o industrial, el PBI, etc. Este tipo de publicación se dice que posee información estadística por el volumen de cifras numéricas que incluye, además es conocida como información estadística de uso público, por que el lector no necesita conocer de Estadística, para comprender sobre lo que se está informando, es decir, que la información se prepara de tal manera que cualquiera pueda entenderla con facilidad.
En esta lección no se incluyen ejercicios para el alumno, porque el propósito de esta lección es hacer estadística solamente para informar, no está hecha para la investigación, asunto que si se verá en la siguiente lección. Además por la gran cantidad de información numérica que albergan los tabulados o cuadros, hacen que el trabajo sea muy laborioso y tengan una dedicación especial, esto fácilmente se puede lograr con programas informáticos o algún otro software como el SPSS (Statistical Package for the Social Sciences), que es un programa estadístico informático muy usado en las ciencias sociales y por las empresas de investigación de mercado. z5 9 z
E S TA D Í S T I C A I
La Estadística de uso público tiene diferentes presentaciones, que se incluyen en una misma publicación, con el propósito de que sea más comprensible y tenga vistosidad combinando colores con figuras elaboradas con esmero. Entre las principales formas de presentación de la estadística para informar al público, se tiene:
2.1.1. Textos Una de las formas de presentación de información es mediante textos, que consisten en informes o artículos sobre datos numéricos, resaltando o comentando todo aquello que se considere relevante; otra de la formas de utilizar los textos es para explicar las variaciones de las cifras en el tiempo, o para explicar el comportamiento de una determinada variable; también se utiliza para resumir toda la información e incluye comparaciones con otras cifras ya sea del mismo sector u otras cifras de periodos precedentes.
Ejemplos sobre texto Ejemplo 1 El Producto Bruto Interno (PBI) de la región Cusco fue de 2 983 millones de nuevos soles, ligeramente mayor que el del año anterior. Representa el 2,45% del PBI nacional, cifra que debe ser comparada con la del porcentaje de la población que alberga en la región que es del 4,52%. Ejemplo 2: Los empresarios encuestados a la pregunta ¿Cree Usted que el Tratado de Libre Comercio con China tendrá un efecto positivo en las ofertas de los productos de las pymes de Gamarra? De los 193 que participaron de la encuesta, solo 10 (5,19%), manifestaron algún tipo de concordancia, mientras que 178 (92,22%), dijeron que discrepaban del efecto positivo en el volumen de productos ofertados y 5 empresarios (2,59%) estaban indecisos. La discrepancia elevada del 92,22% sobre el efecto positivo del TLC con China, demuestra claramente que las ofertas de productos de las pymes tendrán un efecto más bien negativo. La gran mayoría está segura que los productos ofertados en Gamarra, se verán afectados fuertemente de manera negativa, por esta razón el hecho de no haberlos convocado a conversar sobre la implicancia del tratado tal como ellos lo perciben, para darle algún tipo de solución a este problema, demuestra claramente que el gobierno actual no respeta la posición de estos empresarios.
2.1.2. Tabulados o cuadros Otra de las formas de presentación de información es mediante tabulados o cuadros, que pueden albergar gran cantidad de información numérica.
z6 0 z
WA LT E R C É S P E D E S R A M Í R E Z
Con relación a como se elabora un cuadro, no existe una norma universal aunque han existido intentos de universalizar la forma de cómo se debe elaborar un tabulado de cifras, encontrándose las siguientes consideraciones: 1º Se debe usar el sentido común. 2º Considerar el punto de vista del usuario, comprenda que no es estadístico por ello debe ser de fácil entendimiento del tema que se publica. Por lo general, los tabulados deben tener las siguientes partes: a) Número: Es un valor correlativo que se emplea en toda publicación que cuenta con más de un tabulado, este número va a facilitar su ubicación en la publicación. b) Título: Debe indicar las características del tabulado, la forma como se presenta la información (por…… según……), el lugar donde se observó el fenómeno o dato y la fecha o periodo de referencia. c) Encabezamiento: Expresa todo aquello señalado en el título como “por” y muestra la información indicada en las columnas. d) Columna Matriz: Expresa todo aquello señalado en el título como “según” y muestra la información indicada en las filas. e) Cuerpo: Está compuesto por celdas imaginarias por el cruce de filas con columnas, donde van las cifras que se publican, cuidando que ninguna celda quede vacía. Algunas apreciaciones en el cuerpo del tabulado: - No hay información (- - -) - Información no disponible (n. d.) o también (. . .) - Información muy pequeña (0) ó (0,0) ó (0,00) según hayan decimales. - Información Preliminar o Provisional (P) es información sujeta a ser cambiada - Información Revisada (R) es información definitiva. f) Pié: Es la parte final del tabulado donde se señala la fuente, las llamadas (a/, */, etc.) y alguna nota explicadora en caso de ser necesario. Dependiendo del contenido del tabulado, puede presentarse una o más variables.
2.1.2.1. Tabulados unidimensionales Son tabulados o cuadros que contienen una sola variable, por lo consiguiente no tienen encabezamiento y en el título solo lleva el término “según” que expresa lo señalado en la matriz por filas.
z6 1 z
E S TA D Í S T I C A I
Ejemplos sobre tabulados unidimensionales: Ejemplo 1: Volumen de importaciones de trigo según países de origen En toneladas métricas – Perú 2011 Países de Origen
Total Canadá Estados Unidos Argentina México
T. M.
1 625 736 784 625 118 98
145 095 353 143
%
100,00 48,23 38,45 7,28 6,04
Fuente: Ministerio de Agricultura Ejemplo 2: Volumen de Exportaciones de Cobre según países de destino En millones de US dólares – Perú 2011
Países de Destino
Dólares
%
Total
1 486,8
100,00
1 109,5 104,3 92,5 59,4 30,7 90,4
74,62 7,02 6,22 4,00 2,06 6,08
Estados Unidos Italia Reino Unido Brasil Taiwán Otros
Fuente: Ministerio de Agricultura.
Fuente: Ministerio de Agricultura 2.1.2.2. Tabulados bidimensionales Son tabulados o cuadros de dos variables, una variable queda representada en el encabezamiento y la otra variable se expresa en la matriz. Las cifras representadas en las celdillas representan las dos variables a la vez, excepto los totales por cada variable.
z6 2 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejemplos sobre tabulados bidimensionales: Ejemplo 1: Ahorro en el Sistema Financiero por Modalidad de Depósito según Años Perú, 2000 - 2010, en millones de nuevos soles
Años 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Modalidad de Depósito Total 48 443 51 750 57 365 64 330 70 411 86 336 104 410 133 242 135 094 162 966 179 223
Ahorros 2 766 2 985 3 090 3 615 4 201 5 767 6 658 8 543 11 667 13 824 15 207
A Plazos
A. F. P.
M. Extranjera
Otros
2 103 2 482 3 016 3 116 4 575 6 630 7 318 10 972 15 506 17 666 27 559
9 599 12 350 15 754 21 844 25 651 32 223 45 547 60 406 49 380 68 595 79 128
32 900 32 555 34 273 34 751 34 784 39 809 42 485 48 590 54 930 57 108 55 315
1 075 1 378 1 232 1 004 1 200 1 907 2 402 4 731 3 611 5 773 2 014
Fuente: Banco Central de Reserva del Perú
Ejemplo 2:
z6 3 z
E S TA D Í S T I C A I
2.1.2.3. Tabulados tridimensionales Son tabulados o cuadros que contienen tres variables a la vez, dos variables pueden representarse en el encabezamiento y la otra variable en la columna matriz o viceversa. Las cifras en cada celdilla representan a las tres variables a la vez, excepto las de los totales. Dentro de estos tabulados hay totales que expresen dos variables, también hay totales que expresan solo una, dependiendo a qué nivel lleve el cruce de columna (por) con la fila (según). En lo posible hacer que los tabulados no muestren más de tres variables a la vez, porque en la práctica lejos de ser útil, tienden a crear confusión en el lector.
Ejemplos sobre tabulados tridimensionales: Ejemplo 1: Población Económicamente Activa (PEA) por Años y Sexo según Países América Latina, 2010 – 2020, en miles de personas (P)
Nota: Incluye a la población de 15 años a más. Fuente: Comisión Económica para América Latina z6 4 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejemplo 2
z6 5 z
E S TA D Í S T I C A I
2.1.3. Gráficos Son esquemas que generalmente se grafican sobre el primer cuadrante de los ejes cartesianos, con excepción de las gráficas circulares o gráficas de pastel, que representan las proporciones con ángulos. Los gráficos se deben hacer con especial cuidado y tener una representación con estética y de fácil interpretación, porque toda publicación además de ser clara debe agradar al lector, precisamente un gráfico con colores alegres, es una de las formas de atraer la atención para hacer que la publicación sea interesante. Un gráfico puede representar una o más variables, además de los diagramas circulares, estos puede ser: lineales, por barras o pictogramas.
2.1.3.1. Gráficos Lineales Son puntos o pares ordenados que se obtienen al cruzar valores definidos de la abscisa con la ordenada, tales puntos son unidos con un segmento en forma consecutiva, del primero al último. En el gráfico cada grupo de segmentos unidos, representa una variable. Ejemplos sobre Gráficos Lineales Ejemplo 1
z6 6 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejemplo 2
2.1.3.2. Gráficos por Barras Son barras graficadas tomando como base el eje de la abscisa a la altura de la ordenada según el dato a graficar. Este tipo de gráfico puede representar una o más variables, las cuales para ser diferenciadas, utilizan diferentes colores. Ejemplos sobre Gráficos por Barras: Ejemplo 1
z6 7 z
E S TA D Ă? S T I C A I
Ejemplo 2
Ejemplo 3
z6 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejemplo 4
2.1.3.3. Gráficos Circulares Son gráficos que representan las proporciones de una variable con ángulos. Se conocen como gráficos de pastel porque tienen una forma similar al pastel. Ejemplo sobre Gráfico Circular:
z6 9 z
E S TA D Ă? S T I C A I
2.1.3.4. Pictogramas Son grĂĄficos que representan figuras relacionadas con los datos. Ejemplos sobre Pictogramas: Ejemplo1
Ejemplo 2
z7 0 z
L e c c i ó n
2
2.2. ESTADÍSTICAS PARA INVESTIGACIÓN En esta lección se van a considerar solamente las estadísticas unidimensionales, porque los datos que se compilan además de ser ordenados para ver su composición, son preparados para continuar con su tratamiento de investigación. Como su nombre lo indica, el objetivo de esta lección, es la de dejar toda la información preparada, de tal manera que se pueda realizar un análisis de los datos que se investigan para tomar decisiones. Para analizar la información recogida de las fuentes, en primera instancia la Estadística utiliza dos herramientas de bastante utilidad; una es representar los datos en cuadros con características especiales, que se denominan Tablas de Distribución de Frecuencias; la otra herramienta es representar los datos en gráficos que permiten visualizar la forma y la composición de las observaciones. Para entender la presentación de esta forma de ordenamiento de los datos, es necesario tener los conocimientos básicos de Estadística, porque no fueron preparados para ser publicados o tengan uso público, sino más bien para uso o tratamiento estadístico.
2.2.1. Tablas de Distribución de Frecuencias Las tablas estadísticas representan el número de observaciones según el recorrido de la variable estadística; estas tablas, son utilizadas para analizar el comportamiento de la variable, además de la simple inspección que representa el presentarla de manera ordenada.
z7 1 z
E S TA D Í S T I C A I
El contenido de todas las tablas de distribución de frecuencias es el mismo, independientemente del tipo de variable y cómo está organizada. Las tablas pueden ser confeccionadas u organizadas: por lista o por intervalos de clases. Todas las tablas de distribución de frecuencias, se estructuran de la siguiente manera: 1º Columna principal o matriz: Contiene la variable estructurada por lista o por clase, dependiendo de la variable. 2º Tabulación: Está constituida por: tarjas, Check, palitos, etc. por cada vez que se repite o presente el dato, las repeticiones o presentaciones son conocidas en las tablas como frecuencias. Cada tarja o palito representa un dato y a esta columna se trasladan todos los datos, uno por uno hasta el último. 3º Frecuencia Absoluta (fi): Es la expresión numérica de la tabulación, la frecuencia absoluta es la expresión del número de repeticiones o simplemente frecuencias, que tiene un dato o una clase. Es también el número de veces que aparece el dato señalado en la columna matriz, que corresponde a una muestra o población. 4º Frecuencia Relativa Absoluta (hi): Es la proporción de observaciones que corresponden a un dato o a una clase, es la probabilidad de que el valor o magnitud de referencia ocurra. La frecuencia relativa absoluta, se obtiene al dividir la frecuencia absoluta entre la suma de todas las frecuencias o número total de datos (hi = fi / N). Los valores absolutos representan las frecuencias y las proporciones de un solo dato o una sola clase. 5º Frecuencia Acumulada (Fi): Es la acumulación directa de las frecuencias absolutas hacia abajo, conforme se cambie de dato o de clase. 6º Frecuencia Relativa Acumulada (Hi): Es la proporción de observaciones absolutas que se van agregando dato por dato o clase por clase. La frecuencia relativa acumulada hacia abajo también se puede obtener al dividir la frecuencia acumulada entre la suma de todas las frecuencias o número total de datos. (Hi = Fi / N). Si la variable de los valores acumulados hacia abajo es numérica, la frecuencia acumulada absoluta y relativa son denominadas valores “menos” o “menores de”. En cambio si es variable cualitativa o no numérica, la frecuencia acumulada absoluta y relativa son denominadas valores “antes de”. 7º Frecuencia Acumulada Inversa (Fi ↑ ): Es la acumulación de las frecuencias absolutas de abajo hacia arriba, conforme se cambie de dato o de clase. 8º Frecuencia Relativa Acumulada Inversa (Hi ↑ ) : Es la proporción de observaciones absolutas que se van agregando dato por dato o clase por clase de abajo hacia arriba. La frecuencia relativa acumulada inversa también se puede obtener al dividir la frecuencia acumulada inversa entre la suma de todas las frecuencias o número total de datos. (Hi ↑ = Fi ↑ / N). z7 2 z
WA LT E R C É S P E D E S R A M Í R E Z
Si la variable es numérica los valores acumulados hacia arriba son denominados valores: “más” o “mayores de” y si la variable es cualitativa son denominados “después de”. 9º Marca de Clase (Xi): Se calcula solo en las tablas organizadas por clases, porque en las tablas organizadas por lista la marca de clase se encuentra en la columna matriz o principal. La marca de clase es el valor que representa a toda la clase y se obtiene al dividir entre 2 la suma de sus límites (Xi = [Li + Ls] / 2).
Todas las frecuencias relativas se expresan en la tabla en tanto por uno, pero si usted desea, puede multiplicar este valor por cien y lo tiene en tanto por ciento, de esta manera podrá entender mejor los valores relativos.
2.2.1.1. Distribución de Frecuencias de Variables Cualitativas En las tablas de distribución de frecuencias, este tipo de variable solo se organiza por lista, en los casos de que la lista sea muy amplia, se agrupan estas variables según: categorías, tipos, géneros, etc. de tal manera que la lista se hace más pequeña. No es recomendable trabajar con una lista muy pequeña ni mucho menos con una amplia, en lo posible la distribución de frecuencias debe hacerse entre 5 y 12 nombres o categorías. Ejercicios resueltos 1) Una encuesta dirigida a 50 alumnos, para conocer cuál es su deporte de preferencia, los resultados fueron los siguientes: Futbol, vóley, gimnasia, futbol, natación, vóley, básquet, box, futbol, futbol, vóley, básquet, futbol, vóley, futbol, natación, básquet, futbol, vóley, futbol, básquet, natación, vóley, futbol, vóley, gimnasia, futbol, futbol, vóley, básquet, futbol, vóley, futbol, básquet, futbol, básquet, box, futbol, básquet, futbol, tenis, futbol, natación, básquet, futbol, vóley, gimnasia, vóley, básquet, vóley. Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos alumnos prefieren gimnasia? c) ¿Qué porcentaje de alumnos prefieren vóley? d) Según el ordenamiento ¿cuántos alumnos prefieren los deportes que se encuentran antes de la natación? e) Según el ordenamiento ¿qué porcentaje de alumnos prefieren los deportes que se encuentran antes del futbol?
z7 3 z
E S TA D Í S T I C A I
f) Según el ordenamiento ¿cuántos alumnos prefieren los deportes que se encuentran después del box? g) Según el ordenamiento ¿qué porcentaje de alumnos prefieren los deportes que se encuentran después del básquet? Solución: La variable es cualitativa, por lo tanto la tabla será construida por lista, en orden alfabético que es lo usual.
b) ¿Cuántos alumnos prefieren gimnasia?
3 alumnos
c) ¿Qué porcentaje de alumnos prefieren vóley?
24%
d) Según el ordenamiento ¿cuántos alumnos prefieren los deportes que se encuentran antes de la natación? 33 alumnos e) Según el ordenamiento ¿qué porcentaje de alumnos prefieren los deportes que se encuentran antes del futbol? 24% f) Según el ordenamiento ¿cuántos alumnos prefieren los deportes que se encuentran después del box? 38 alumnos g) Según el ordenamiento ¿qué porcentaje de alumnos prefieren los deportes que se encuentran después del básquet? 80%. 2) Una encuesta dirigida a 140 clientes de una organización, se les consultó que escogieran entre las siguientes opciones, ¿cuál de ellas en el servicio al cliente consideraban como más importante? 1. 2. 3. 4. 5. 6.
Ambiente limpio Atención agradable Atención ordenada Comodidad en la espera Equipos modernos Servicio rápido z7 4 z
WA LT E R C É S P E D E S R A M Í R E Z
Las respuestas fueron las siguientes:
Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos clientes prefieren equipos modernos? c) ¿Qué porcentaje de clientes prefieren ambiente limpio? d) Según el ordenamiento ¿cuántos clientes prefieren los tres primeros? e) Según el ordenamiento ¿qué porcentaje de clientes prefieren los cuatro primeros? f) Según el ordenamiento ¿cuántos clientes prefieren los tres últimos? g) Según el ordenamiento ¿qué porcentaje de clientes prefieren los dos últimos? h) ¿Qué opción tiene la mayor preferencia? i) ¿Qué opción tiene la menor preferencia? Solución: En la construcción de la tabla de variable cualitativa, la lista tendrá el orden tal como fueron codificadas las opciones.
b) ¿Cuántos clientes prefieren equipos modernos?
18 clientes.
c) ¿Qué porcentaje de clientes prefieren ambiente limpio?
15,71%
d) Según el ordenamiento ¿cuántos clientes prefieren los tres primeros? 90 clientes e) Según el ordenamiento ¿qué porcentaje de clientes prefieren los cuatro primeros? 78,57%
z7 5 z
E S TA D Í S T I C A I
f) Según el ordenamiento ¿cuántos clientes prefieren los tres últimos? 50 clientes g) Según el ordenamiento ¿qué porcentaje de clientes prefieren los dos últimos? 21,43%. h) ¿Qué opción tiene la mayor preferencia?
i) ¿Qué opción tiene la menor preferencia?
Atención ordenada. Servicio rápido.
Resolver los siguientes ejercicios propuestos, utilizando Distribución de Frecuencias de Variable Cualitativa: 1) En una encuesta a 80 vecinos de una localidad, se les consultó que en la próxima elección vecinal, ¿qué exigiría usted como prioritario a los candidatos? Las respuestas fueron: 1. Sin corrupción, 2. Más educación, 3. Seguridad ciudadana, 4. Manejo presupuestal, 5. Más empleo, 6. Más obras, 7. Servicios asistenciales, 8. Más hospitales. Con las siguientes respuestas, construya una tabla de distribución de frecuencia y determine el porcentaje de la opción de mayor prioridad: 2526425381 2574621563
Resp:
4523671475 8452874523
8652314125 6584123514
4158532541 7852145665
Más empleo (5) = 22,50%
2) En una encuesta a 50 consumidores de una localidad, se les consultó, ¿qué era lo que más le gustaba de un producto alimenticio? Las respuestas fueron: 1. Sea económico, 2. Color, 3. Sabor, 4. Presentación, 5. Tamaño, 6. Calidad. Con las siguientes respuestas, construya una tabla de distribución de frecuencias y determine cuál es la característica que menos gusta de un producto alimenticio: 1563241563 6535142635 5636513624 1445126351
Resp:
1245114511
Color (2) = 10%.
3) En una encuesta a 60 vecinos de una manzana, se les consultó, ¿cuál era el medio más efectivo para evitar robos en los hogares? Las respuestas fueron: 1. Rejas, 2. Policías, 3. Vigilantes, 4. Serenazgo, 5. Rondas vecinales.
z7 6 z
WA LT E R C É S P E D E S R A M Í R E Z
Con las siguientes respuestas, construya una tabla de distribución de frecuencia y determine cuál es el medio más efectivo para evitar robos en los hogares: 1245331252 3152412352
Resp:
1212541232 1514215323
3251412512 1412513514
El medio más efectivo está entre: Rejas (28,33%) y Policías (26,67%)
4) En una encuesta a 120 escolares, se les consultó, ¿qué esperaban de sus profesores? Las respuestas fueron: 1. Mayor explicación a los temas, 2. Menos tareas, 3. Trato amble, 4. Señalar los temas de evaluación, 5. Puntualidad, 6. Trabajos grupales. Con las siguientes respuestas, construya una tabla de distribución de frecuencia y determine la frecuencia de la opción de lo que menos esperan de los profesores: 2625463365 2152241515 3225214636
Resp:
2123654236 3625412365 5143625135
5123212564 2661256144 1142632513
3652145236 2365214526 2561235124
Señalar los temas de evaluación = 13
5) Ante la consulta a 200 alumnos ¿qué taller le gustaría aprender?, si tuviera que escoger entre los siguientes tipos de taller artístico que ofrece el colegio: 1. Pintura, 2. Baile, 3. Teatro, 4. Música, 5. Manualidades, 6. Dibujo, 7. Letras. Con las siguientes respuestas, construya una tabla de distribución de frecuencia y determine las proporciones de alumnos de los dos talleres más solicitados: 2 3 7 3 1
5 2 4 6 4
1 6 5 5 2
2 5 6 2 5
Resp:
4 1 2 3 6
7 4 3 6 2
2 2 6 2 3
5 5 2 1 2
6 7 1 4 5
3 4 2 2 7
2 1 5 5 2
3 2 2 7 5
6 5 1 4 6
5 3 4 1 2
7 6 5 2 3
4 5 3 5 6
1 4 2 6 2
2 7 6 3 3
5 1 5 2 2
3 2 4 6 5
6 5 7 2 4
2 2 1 1 7
5 3 2 4 1
1 6 4 5 2
4 5 5 6 1
5 2 7 2 2
3 4 5 6 6
2 1 6 2 2
6 2 3 5 3
7 5 2 4 5
1 4 5 7 2
2 1 4 1 6
4 2 1 7 2
5 3 3 5 1
2 6 2 2 4
3 2 5 6 4
2 1 4 2 2
2 4 7 3 5
5 5 2 5 1
2 2 1 2 2
Baile (2) = 28% y Manualidades (5) = 18,5%
2.2.1.2. Distribución de Frecuencias de Variables Discretas Las variables discretas tienen la particularidad de organizarse en tablas de distribución de frecuencias, tanto por lista como por intervalos de clases; cuando la lista es muy amplia, se agrupan los datos en intervalos para hacerla más pequeña la tabla, porque como ya se ha manifestado, no es recomendable trabajar con una lista muy pequeña ni mucho menos con una amplia, en lo posible la distribución de frecuencias debe hacerse con una tabla que contenga como mínimo 5 líneas y como máximo 12.
z7 7 z
E S TA D Í S T I C A I
Cuando se confecciona una tabla por lista, la columna principal lleva los valores de la lista de datos de la variable discreta, luego se continúa con el tabulado y lo demás. En cambio cuando se organiza una tabla con variable discreta por clase, para construir la columna principal, se deben dar los siguientes pasos: 1º Recorrido de la Variable (L): Se debe conocer que amplitud de datos de van a dividir en partes o clases, con la siguiente fórmula: L = Dato máximo – Dato mínimo + 1 2º Número de Intervalos de clase (k): Representa la cantidad de clases, en que se va a distribuir la tabla. Generalmente el número de clases se determina según la regla de Sturges redondeada al número entero más próximo. El número de clase se define de la siguiente manera: k = 1 + 3,322 log N 3º Tamaño de clase (e): Es la misma amplitud que van a tener cada una de las clases, la que se define de la siguiente manera: e = L/k 4º Rango de trabajo (L1): Es el recorrido de la variable que va a tener la tabla de distribución de frecuencias, que se obtiene de la siguiente manera: L1 = e (k) 5 º Exceso: L1 debe ser igual o mayor que L, en caso de ser menor se agrega 1 a la amplitud de clase (e), con ello L1 es mayor que L. Exceso =
L1 – L
En la elaboración de la columna principal de la tabla, si el exceso es 0, L1 es igual a L, por lo tanto se respetan los datos mínimo y máximo, trabajando la tabla a partir de ellos. En caso de haber exceso, si este es par, se calcula el nuevo dato mínimo restándole la mitad del exceso y el nuevo dato máximo sumándole la mitad del exceso. Si el exceso es impar, se resta uno para volverlo par con el objeto de repetir el proceso de repartir el exceso por parte iguales, y el uno restado al impar se le suma al nuevo dato máximo. Ejercicios Resueltos: 1) En una encuesta dirigida 80 obreros de Construcción Civil, se encontró que el número de hermanos vivos que conocían era el siguiente: 5623108452 6969542958
1039563257 7741251036
4512036952 5258963587 z7 8 z
1002314586 4125163897
WA LT E R C É S P E D E S R A M Í R E Z
Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos obreros tienen 5 hermanos vivos? c) ¿Qué porcentaje de obreros tienen 8 hermanos vivos? d) ¿Qué porcentaje de obreros tiene más de 3 hermanos vivos? e) ¿Qué porcentaje de obreros tiene menos de 5 hermanos vivos? Solución: Como las variaciones de datos a distribuir son pequeñas, la tabla va a quedar organizada por la lista o por la relación de valores número de hermanos vivos. a) Tabla de distribución de frecuencias de variable discreta
b) ¿Cuántos obreros tienen 5 hermanos vivos? 14 obreros. c) ¿Qué porcentaje de obreros tienen 8 hermanos vivos? 7,5% d) ¿Qué porcentaje de obreros tiene más de 3 hermanos vivos? 58,75% e) ¿Qué porcentaje de obreros tiene menos de 5 hermanos vivos? 48,75% 2) Durante 60 días se observó el número de visitas diarias de la página Web de una pequeña empresa, que fueron las siguientes:
95 54 46 75 96 43 42 44 95 75 92 54 45 58 65
62 52 43 81 70 45 67 59 50 60 48 57 95 50 60
53 71 90 82 81 82 45 75 90 98 40 82 67 58 58
43 61 75 81 62 87 75 48 86 59 42 54 48 58 67
Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántas visitas fueron en número de 60 en promedio? c) ¿Qué porcentaje de visitas fueron en número de 69 en promedio? d) ¿Qué porcentaje de visitas fueron mayores de 55? e) ¿Qué porcentaje de visitas fueron menores de 83?
z7 9 z
E S TA D Í S T I C A I
Solución: Como las variaciones de las visitas a la página web es amplia, se hace necesario construir la tabla por intervalos, para ello hay que realizar los siguientes pasos. 1º Recorrido de la Variable (L): L
L = Dato máximo – Dato mínimo + 1 = 98 – 40 + 1 = 59
2º Número de Intervalos de clase (k):
k = 1 + 3,322 log N
k = 1 + 3,322 log 60 = 1 + 3,322(1,77815125) = 6,607 = 7 clases 3º Tamaño de clase (e):
e = L/k
e = 59 / 7 = 8,42857 = 9 (Si se redondea a 8, L1 es menor que L). 4º Rango de trabajo (L1):
L1 = e (k) L1 = 9 (7) = 63.
5 º Exceso = L1 – L = 63 – 59 = 4
por que
L1 > L
Nuevo Dato mínimo = 40 – (4 / 2) = 38 Nuevo Dato máximo = 98 + (4 / 2) = 100 En la construcción de la tabla, el límite inferior de cada clase se obtiene a partir del nuevo dato mínimo (38), y los siguientes resultarán de agregar sucesivamente la amplitud o tamaño de clase. El límite superior se obtiene de manera inversa, colocando en la última clase el nuevo dato máximo (100), luego se va restando sucesivamente el tamaño de clase, para ir obteniendo los otros límites superiores, estos límites se escriben al final de la clase a que corresponde. Número de visitas 38
.
47
.
56
.
65
73
74
82
.
91
.
100
Una vez concluida la columna principal, se continúa con el desarrollo de la tabla como cualquier tabla de distribución de frecuencias. Recuerde que en la tabulación se pasan los datos uno por uno, hasta el último.
z8 0 z
WA LT E R C É S P E D E S R A M Í R E Z
a) Tabla de distribución de frecuencias de variable discreta
b) ¿Cuántas visitas fueron en número de 60 en promedio? c) ¿Qué porcentaje de visitas fueron en número de 69 en promedio? d) ¿Qué porcentaje de visitas fueron mayores de 55? e) ¿Qué porcentaje de visitas fueron menores de 83?
12 visitas 10,00% 65,00% 83,33%
Observe que en la tabla hay una nueva columna Xi (Marca de clase), esta columna solo existe en las tablas con distribuciones de frecuencias por intervalos, que representa el promedio de la clase. 3) Una gran empresa con 5 plantas de producción, encontró el siguiente número de tardanzas durante 125 días de trabajo:
29 13 19 11 27
25 18 27 25 23
34 21 17 13 41
39 26 18 30 34
53 34 22 43 29
59 28 54 34 15
61 53 49 31 21
24 61 24 20 25
36 24 46 34 31
31 21 33 12 39
50 54 43 42 41 10 16 52 27 37 25 60 53 41 18 17 40 31 49 26 34 19 34 38 29
51 60 25 19 22 21 26 32 35 26 17 19 61 54 35 39 42 35 38 40 45 48 40 39 48
28 45 63 52 34 18 24 19 32 47 21 18 24 45 52 27 38 31 32 41 33 14 42 46 38
Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántas tardanzas fueron en número de 33 en promedio? c) ¿Qué porcentaje de tardanzas fueron en número de 47 en promedio? d) ¿Qué porcentaje de tardanzas fueron mayores de 29? e) ¿Qué porcentaje de tardanzas fueron menores de 23? Solución: Se debe construir la tabla por intervalos con los siguientes pasos: 1º Recorrido de la Variable (L): L = 63 – 10 + 1 = 54.
L = Dato máximo – Dato mínimo + 1
2º Número de Intervalos de clase (k): k = 1 + 3,322 log N. k = 1 + 3,322 log 125 = 1 + 3,322(2,09691) = 7,965935 = 8 clases. z8 1 z
E S TA D Í S T I C A I
3º Tamaño de clase (e): e = L/k e = 54 / 8 = 6,75 = 7 4º Rango de trabajo (L1): L1 = 7 (8) = 56.
L1 = e (k)
5 º Exceso = L1 – L = 56 – 54 = 2 por que Nuevo Dato mínimo = 10 – (2 / 2) = 9 Nuevo Dato máximo = 63 + (2 / 2) = 64
L1 > L
En la construcción de la tabla, el límite inferior de cada clase se obtiene a partir del nuevo dato mínimo (9), y los siguientes resultarán de agregar sucesivamente la amplitud o tamaño de clase. El límite superior se obtiene de manera inversa, colocando en la última clase el nuevo dato máximo (64), luego se va restando sucesivamente el tamaño de clase. Número de Tardanzas 9
.
16
.
23
.
.
.
.
50
.
57
.
64
Una vez concluida la columna principal, se continúa con el desarrollo de la tabla como cualquier tabla de distribución de frecuencias. Nuevamente recuerde que en la tabulación se pasan los datos uno por uno, hasta el último. a) Tabla de distribución de frecuencias de variable discreta.
b) ¿Cuántas tardanzas fueron en número de 33 en promedio? 23 tardanzas c) ¿Qué porcentaje de tardanzas fueron en número de 47 en promedio? 8,8% d) ¿Qué porcentaje de tardanzas fueron mayores de 29? 57,6% e) ¿Qué porcentaje de tardanzas fueron menores de 23? 23,2% z8 2 z
WA LT E R C É S P E D E S R A M Í R E Z
Resolver los siguientes ejercicios propuestos, utilizando Distribución de Frecuencias de Variable Discreta: 1) A 80 promotores de la educación se le consultó sobre el número apropiado de alumnos por aula, para una enseñanza eficiente. Con los datos construya la tabla con 6 clases y determine la proporción de promotores que prefieren menos de 27 alumnos. 25 32 40 45 48
30 20 40 50 20
22 28 34 38 40
45 47 21 48 36
24 26 25 15 22
18 16 21 23 18 22 28 34 38 40 24 26 25 15 22.
16 45 48 36 45 18 20 36 34 20
18 20 36 34 20 24 26 25 15 22
24 22 34 18 22 26 45 40 18 30
30 36 20 16 25 25 28 33 25 28
Resp: 55% 2) Construir una tabla de distribución de frecuencias con el siguiente número de hijos encontrado en 120 hogares y determine ¿cuál es el número de hijos (Xi) se presenta con menor frecuencia? 2532404548 2426251522 2228343840
3020405020 2528332528 1820363420
2228343840 1816212318 2426251522
4547214836 1645483645 2645401830
Resp: 7 hijos 3) Durante 90 días se controló la asistencia de niños al museo de Lima, con los datos construir una tabla de distribución de frecuencias y determine ¿cuál fue el número promedio de asistencias de niños (Xi) resultó con la frecuencia más alta? 25 17 65 26
36 46 48 58
95 82 57 94
25 68 75 84
45 91 78 77
65 55 92 73
36 58 15 80
96 34 10 24
85 37 16 28
25 26 14 67
14 15 80 28
14 57 25 75
75 78 27 81
76 97 23 78
58 45 36 29 98 23 65 58 75 47 73 18 22 30 45 57 21 54 25 20 28 40 85 78 84 87 28 61 48 75 92 94 76 16
Resp: 80 niños 4) Con el número de accidente de tránsito en la ciudad de Lima, construir la tabla de distribución de frecuencias y determine ¿Cuál fue el número promedio de accidentes (Xi) que más veces se presentó? 15 25 45 25 12 05 12 34 15 11 16 08 11 04 27
13 31 44 41 32 08 19 24 28 39 19 24 31 08 10
26 02 25 18 17 12 16 37 29 14 37 17 25 22 20
16 40 30 20 10 15 11 06 07 14 41 38 29 16 11
15 16 12 17 05 21 06 18 27 19 16 27 22 40 37
Resp: 17 accidentes
z8 3 z
E S TA D Í S T I C A I
5) Con el número de clientes que compran diariamente en un minimarket, construir una tabla de distribución de frecuencias y determine, ¿qué número promedio de compras (Xi) resultó con la frecuencia más baja? 56 61 45 47
68 48 85 65
48 52 65 85
45 47 67 68
47 58 70 59
84 41 51 53
95 49 48 65
86 57 44 47
65 63 43 42
82 68 57 80
93 75 78 87
41 52 81 54
47 48 96 42
44 67 96 68
68 79 92 81
59 69 58 55
41 78 54 63
43 81 47 68
57 73 46 81
85 88 69 75
88 57 68 59
65 70 52 52
75 73 48 48
73 57 47 67
50 55 54 72
Resp: 93 compras
2.2.1.3. Distribución de Frecuencias de Variables Continuas Las variables continuas solo pueden organizarse en tablas de distribución de frecuencias por intervalos de clases, que debe contener 5 clases como mínimo y 12 como máximo. En la confección de la tabla de variable continua, se dan los mismos pasos, que en la confección de la tabla de variable discreta por clase, con la única diferencia que al recorrido de la variable (L) no se le suma 1: 1º Recorrido de la Variable (L):
L = Dato máximo – Dato mínimo.
2º Número de Intervalos de clase (k):
k = 1 + 3,322 log N.
3º Tamaño de clase (e):
e = L/k
4º Rango de trabajo (L1):
L1 = e (k)
5 º Exceso: (Si L1 < L, se agrega 1 “e”)
Exceso =
L1 – L
En la elaboración de la columna principal de la tabla, si el exceso es 0, L1 es igual a L, por lo tanto se respetan los datos mínimo y máximo, trabajando la tabla a partir de ellos. En caso de haber exceso, si este es par, se calcula el nuevo dato mínimo restándole la mitad del exceso y el nuevo dato máximo sumándole la mitad del exceso. Si el exceso es impar, se resta uno para volverlo par con el objeto de repetir el proceso de repartir el exceso por parte iguales, y el uno restado al impar se le suma al nuevo dato máximo. Construida la columna principal de la variable continua, a diferencia de la variable discreta, el límite superior (Ls) de una clase es el límite inferior (Li) de la clase siguiente, por ser datos continuos; al repetirse este valor en dos clases consecutivas, se crea un problema porque el dato con el mismo valor repetido no puede registrarse en ambas clases, teniéndose que elegir una de ellas. Si se registra dónde está el límite superior, se estará utilizando el criterio “hasta”, o “cerrado a la derecha”; en caso contrario, se estará utilizando el criterio “a partir de” o “cerrado a la izquierda”. En este texto se utilizará solo el criterio “a partir de”, [… >, porque al escogerse un criterio, todas las distribuciones de frecuencias, deben tener el mismo criterio; no se recomienda usar ambos criterios, para evitar crear confusión.
z8 4 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos 1) Una empresa con 100 trabajadores, paga las siguientes remuneraciones en soles:
805 2061 2358 1548 987 857 1879 1245 2000 845 2061 986 1250 2489 3015 894 1259 1638 1846 1682 986 1056 3507 2067
1522 3015 2985 2015
3965 945 1045 1806 2708 2215 1200 2894 1245 956 1068 1249 2018 1039 1678 1534 1025 987 1156 2145 1368 2715 1044 1245 1369 2049 2684 1894
960 1648 3505 1023
1874 965 1258 3015 2745 1457 1896 2956 2024 978 997 1570 1840 1548 1362 1029 2715 1836 2495 1723 2044 1788 1156 2780 1587 2674 1578 1745 1692 1023 3054 3485 2691 3478 3410 1578 2069 3415 3484 1055
Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos ganan 1 792,50 soles en promedio? c) ¿Qué porcentaje ganan en promedio 3 372,50 soles? d) ¿Qué porcentaje ganan más de 2 780 soles? e) ¿Qué porcentaje ganan menos de 1 595 soles? f) ¿Qué porcentaje ganan entre 1 990 y 2 385 soles? Solución: Hay que realizar los siguientes pasos. 1º Recorrido de la Variable (L): L = 3 965 – 805 = 3 160.
L = Dato máximo – Dato mínimo
2º Número de Intervalos de clase (k): k = 1 + 3,322 log N. k = 1 + 3,322 log 100 = 1 + 3,322(2) = 7,644 = 8 clases. 3º Tamaño de clase (e): e = 3 160 / 8 = 395
e = L/k
4º Rango de trabajo (L1): L1 = 395 (8) = 3 160.
L1 = e (k)
5º Exceso = L1 – L = 3 160 – 3 160 = 0 Como no hay exceso (0), el dato mínimo y el dato máximo, permanecen iguales, no hay necesidad de corregirlos. En la construcción de la tabla, los límites inferiores de cada clase se obtienen a partir del dato mínimo (805), resultando los otros de agregar sucesivamente el tamaño de clase. Los límites superiores se obtienen de manera inversa, colocando al final de la última clase el nuevo dato máximo (3 965), resultando los otros de ir restando sucesivamente el mismo tamaño de clase. Los límites inferiores se escriben al principio y los superiores al final. z8 5 z
E S TA D Í S T I C A I
Remuneraciones 805
.
1 200
.
1 595
.
1 990
2 385
2 385
2 780
.
3 175
.
3 570
.
3 965
Una vez concluida la columna matriz o principal, se continúa con el desarrollo de la tabla como cualquier tabla de distribución de frecuencias. Recuerde que en la tabulación se pasan los datos uno por uno, hasta el último. a) Tabla de distribución de frecuencias de variable continua Remuneraciones
Tabulación
fi
hi
Fi
Hi
Fi
Hi
Xi
[ 805
1 200> lllll lllll lllll lllll lllll l
26
0,26
26
026,
100
1,00
1 002,5
[1 200
1 595> lllll lllll lllll lllll
20
0,20
46
0,46
74
0,74
1 397,5
[1 595
1 990> lllll lllll lllll l
16
0,16
62
0,62
54
0,54
1 792,5
[1 990
2 385>
13
0,13
75
0,75
38
0,38
2 187,5
[2 385
2 780> lllll llll
9
0,09
84
0,84
25
0,25
2 582,5
[2 780
3 175>
8
0,08
92
0,92
16
0,16
2 977,5
[3 175
3 570> lllll
5
0,05
98
0,98
8
0,08
3 372,5
[3 570
3 965>
3
0,03
100
1,00
3
0,03
3 767,5
100
1,00
Menos de
N
lllll lllll lll
lllll lll
lll
Más de
En la tabla como ya se ha indicado, los datos se registran “a partir de” o también [ … >, por ejemplo el dato 1 200 fue registrado en la segunda clase porque en ella van todos los datos a partir de 1 200 hasta 1 594,99……. b) ¿Cuántos ganan 1 792,50 soles en promedio? c) ¿Qué porcentaje ganan en promedio 3 372,50 soles? d) ¿Qué porcentaje ganan más de 2 780 soles? e) ¿Qué porcentaje ganan menos de 1 595 soles? f) ¿Qué porcentaje ganan entre 1 990 y 2 385 soles?
16 trabajadores 5,00% 16,00% 46,00% 13,00%
2) El registro de ingreso en horas y minutos de 120 trabajadores de una compañía es la siguiente: Por ejemplo: 7,35 significa 7horas y 35 minutos. z8 6 z
WA LT E R C É S P E D E S R A M Í R E Z
Con los datos: a) Construir una tabla de distribución de frecuencias. b) ¿Cuántos llegaron a las 7h 57’ 30” en promedio? c) ¿Qué porcentaje llegaron a las 7h 47’ 30” en promedio? d) Si la tardanza se controla a partir de las 8 horas, ¿Qué porcentaje llegaron tarde? e) ¿Qué porcentaje llegaron antes de las 7h 50’? Solución: 1º Recorrido de la Variable (L): L = Dato máximo – Dato mínimo Como las horas y minutos no se pueden operar juntos, los datos máximos y mínimos serán transformados en minutos para determinar el rango en minutos. Dato máximo = 8h 14’ = 8(60) + 14 = 494 minutos Dato mínimo = 7h 35’ = 7(60) + 35 = 455 minutos L = 494 – 455 = 39 minutos. 2º Número de Intervalos de clase (k): k = 1 + 3,322 log N. k = 1 + 3,322 log 120 = 1 + 3,322(2,07918) = 7,907 = 8 clases. 3º Tamaño de clase (e): e = L/k e = 39 / 8 = 4,875 = 5 minutos
4º Rango de trabajo (L1): L1 = 5 (8) = 40.
L1 = e (k)
5º Exceso = L1 – L = 40 – 39 = 1 Como el exceso es 1 solo, se corrige el dato máximo al que se le suma el exceso 1, el dato mínimo permanece igual. Se generan los límites a partir de las 7h.35’ y se van agregando de 5 en 5 minutos, que es el tamaño de cada clase, luego se pasan los 120 datos, uno por uno hasta completar la tabla. La suma de hi siempre es 1, en los casos que aún con el redondeo sea menor o mayor de 1, usted debe corregir el redondeo para que de la suma exactamente 1.
z8 7 z
E S TA D Í S T I C A I
a) Tabla de distribución de frecuencias de variable continua
b) ¿Cuántos llegaron a las 7h 57’ 30” en promedio? c) ¿Qué porcentaje llegó a las 7h 47’ 30” en promedio? d) Si la tardanza se controla a partir de las 8 horas, ¿Qué porcentaje llegó tarde? e) ¿Qué porcentaje llegó antes de las 7h 50’?
20 trabajadores 13,33% 30,00% 32,49%
Resolver los siguientes ejercicios propuestos, utilizando Distribución de Frecuencias de Variable Continua: 1) Construya la tabla de distribución de frecuencias y determine la edad promedio con mayor frecuencia, entre los siguientes trabajadores de una empresa: 28 26 37 22
19 28 22 38
Resp:
42 38 48 44
51 40 36 50
29 44 29 23
27 37 20 28
31 26 27 67
20 25 33 48
33 38 35 41
93 31 21 57
24 26 29 26
30 24 34 31
41 19 26 44
57 18 34 46
26 27 40 28
30 24 46 25
35 55 51 26
38 42 27 34
25 26 28 56
21 34 52 44
26 años
2) Construya la tabla de distribución de frecuencias con los pesos en kilogramos de 100 alumnos y determine el peso promedio con menor frecuencia:
58 62 55 44 46
53 68 39 47 71
64 53 58 41 46
57 53 60 47 40
39 60 45 48 52
64 43 50 62 48
44 48 56 47 51
55 45 47 68 52
71 66 52 44 58
56 46 44 68 56
48 57 44 42 61
52 64 54 47 39
54 62 50 48 40
57 41 43 52 64
45 47 48 50 55
47 42 48 43 58
55 45 42 61 70
45 52 57 44 40
47 39 56 60 48
51 45 48 60 57
Resp:
65 kilos
3) Construya la tabla de distribución de frecuencias con las tallas en centímetros de 120 escolares y determine ¿cuántos mide más de 161centímetros? z8 8 z
WA LT E R C É S P E D E S R A M Í R E Z
140 156 147 128 156 175 160 138
154 180 162 142 142 162 180 174
145 173 175 158 158 175 173 168
168 169 164 167 161 164 169 173
143 152 157 132 176 157 132 160
126 157 136 158 158 136 157 138
162 146 140 153 140 140 146 133
155 143 138 169 138 138 143 127
143 150 130 157 148 130 141 157
173 176 128 140 167 128 176 180
143 168 145 152 145 145 168 172
155 160 158 138 156 158 160 176
149 152 162 134 168 162 152 132
156 172 170 141 173 170 172 140
164 154 132 157 174 182 145 138
Resp: 42 escolares
4) Construya la tabla de distribución de frecuencias con los jornales (diarios) de 150 obreros y determine ¿Qué proporción de obreros ganan 53,50 soles en promedio?
36 28 45 47 24 38 85 38
48 47 28 36 35 55 45 45
Resp:
87 58 37 28 47 29 72 26
28 68 36 47 45 38 25 89
35 29 45 57 50 45 34 42
94 34 72 72 83 47 50 25
58 42 80 81 75 85 37 87
88 47 55 83 92 75 26 24
24 46 47 90 84 48 45 26
45 22 73 52 68 37 88 73
67 28 76 27 26 26 75
72 34 26 35 83 23 47
26 26 30 46 57 27 70
45 37 40 37 67 64 44
48 47 47 45 66 42 28
38 58 30 24 84 57 26
39 68 35 31 90 38 33
75 72 26 40 57 30 58
50 88 31 55 72 26 77
65 54 51 62 71 34 34
8,67%
2.2.2. Gráficos Los gráficos son útiles porque ponen en relieve y aclaran las tendencias que no se captan fácilmente en las tablas, ayudan a estimar valores con una simple ojeada y brinda una verificación gráfica de la veracidad de las soluciones. Los investigadores encuentran en los gráficos, una manera de captar con rapidez como están compuestos los datos en su conjunto, visualizando su estructura, conociendo su forma. Los tipos de gráficos utilizados por los investigadores son: el polígono de frecuencias y el histograma, porque le muestran la densidad de la información graficada. También utilizan las ojivas “más de” y “menos de”, para observar el comportamiento de las clases en grupos.
2.2.2.1. Polígono de Frecuencias Es un tipo de gráfico por el cual se unen los puntos formados por los pares ordenados (Xi, fi) de las marcas de clase con la frecuencia absoluta en forma consecutiva a partir z8 9 z
E S TA D Í S T I C A I
del punto (X0, 0) hasta el punto (Xn+1, 0), de tal manera que la línea continua o polígono encierra el 100% de la información, generando una función de densidad. También se puede obtener el polígono de frecuencias uniendo cada punto medio (marca de clase) de los rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del áreas. El polígono de frecuencias por ser de investigación, además de ser graficado en el primer cuadrante de los ejes cartesianos, utiliza doble ordenada: a la izquierda van los valores de la ordenada principal fi, y a la derecha se grafica la otra ordenada con los valores complementarios hi; de tal manera que se puedan comparar en el gráfico los valores absolutos, en forma nominal (fi) y en forma proporcional (hi%).
Gráfico del Polígono de frecuencias Con la siguiente tabla de variable continua, graficar el polígono de frecuencia. Ingreso
fi
hi 0,0833
Xi
7h,35’
7h,40’
10
7h,40’
7h,45’
13
0,1083
7h,42’,30”
7h,45’
7h,50’
16
0,1333
7h,47’,30”
7h,50’
7h,55’
25
0,2084
7h,52’,30”
7h,55’
8h,00’
20
0,1667
7h,57’,30”
8h,00’
8h,05’
15
0,1250
8h,02’,30”
8h,05’
8h,10’
12
0,1000
8h,07’,30”
8h,10’
8h,15’
9
0,0750
8h,12’,30”
z9 0 z
7h,37’,30”
WA LT E R C É S P E D E S R A M Í R E Z
2.2.2.2. Histogramas Es un tipo de gráfico formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamaño en términos generales, o de diferente tamaño en términos particulares. La utilización de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos, de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sean mayores que la de los demás, logrando así que las observaciones se hallen mejor repartidas dentro del intervalo. En el histograma se representan los mismos valores absolutos que se representa el polígono de frecuencias, utiliza igualmente dos ordenadas y en la abscisa se grafican los límites de cada clase que al ser unidos por una línea horizontal a la altura de su respectiva frecuencia, en cada clase se encierra la cantidad de datos que contienen.
Gráfico del Histograma Con la siguiente tabla de variable continua, graficar el histograma. Ingreso
fi
Hi 0,0833
Xi
7h,35’
7h,40’
10
7h,40’
7h,45’
13
0,1083
7h,42’,30”
7h,45’
7h,50’
16
0,1333
7h,47’,30”
7h,50’
7h,55’
25
0,2084
7h,52’,30”
7h,55’
8h,00’
20
0,1667
7h,57’,30”
8h,00’
8h,05’
15
0,1250
8h,02’,30”
8h,05’
8h,10’
12
0,1000
8h,07’,30”
8h,10’
8h,15’
9
0,0750
8h,12’,30”
z9 1 z
7h,37’,30”
E S TA D Í S T I C A I
2.2.2.3. Ojiva Menos de Es un tipo de gráfico por el cual se unen los puntos formados por los pares ordenados a partir de (0, 0) hasta el último. Los pares ordenados representan el cruce del límite superior de cada clase (Ls) con la frecuencia acumulada (Fi) respectiva, que sirven para observar el comportamiento de los datos a medida que se van agregando clase por clase, a partir de la primera hasta la última. Este tipo de gráfico, se puede realizar también con dos ordenadas: la principal con Fi y la ordenada auxiliar con Hi%.
Gráfico de la Ojiva Menos de: Con la siguiente tabla de variable continua, graficar la ojiva menos de. Ingreso
Fi
Hi
7h,35’
7h,40’
10
0,0833
7h,40’
7h,45’
23
0,1916
7h,45’
7h,50’
39
0,3249
7h,50’
7h,55’
64
0,5333
7h,55’
8h,00’
84
0,7000
8h,00’
8h,05’
99
0,8250
8h,05’
8h,10’
111
0,9250
8h,10’
8h,15’
120
1,0000
z9 2 z
WA LT E R C É S P E D E S R A M Í R E Z
2.2.2.4. Ojiva Más de Es el gráfico inverso al de la ojiva menos de.
Gráfico de la Ojiva Más de: Con la siguiente tabla de variable continua, graficar la ojiva más de. Ingreso
Fi
Hi
7h,35’
7h,40’
120
1,0000
7h,40’
7h,45’
110
0,9167
7h,45’
7h,50’
97
0,8084
7h,50’
7h,55’
81
0,6751
7h,55’
8h,00’
56
0,4667
8h,00’
8h,05’
36
0,3000
8h,05’
8h,10’
21
0,1750
8h,10’
8h,15’
9
0,0750
7
z9 3 z
E S TA D Í S T I C A I
AUTOEVALUACIÓN Nº 2
1) ¿En un tabulado, qué representa el encabezamiento? A) Lo que se desea expresar en el cuadro B) La información contenida en las columnas C) Todo aquello que en el título se indique como según D) B y C son correctas E) Todas son correctas 2) ¿En qué tipo de gráfico se representan figuras con relación a los datos? A) Pictogramas
B) Lineal C) Circular
D) Por barras
E) En todos
3) ¿Cuál es la diferencia entre los gráficos por barras superpuestas nominales de los porcentuales? A) Los nominales siempre tienen diferentes tamaños y los porcentuales no B) Los nominales se expresan en el valor de origen y los porcentuales en tanto por ciento C) En los nominales importa la unidad de información y en los porcentuales no D) B y C son correctas E) Todas son correctas 4) Tres puntos en un tabulado ¿qué representa? A) No hay información B) La información que existe es mínima o muy pequeña C) La información es cero D) B y C son correctas E) Existe información pero no está disponible 5) En el tabulado, el cruce de filas con columnas donde van las cifras que se publican ¿cómo se llama? A) Encabezado
B) Matriz
C) Título
D) Cuerpo
E) pié
6) ¿Qué información se consigna en la tabulación de la tabla de distribución de frecuencias? A) Números E) Todas menos A
B) Frecuencias
C) Tarjas
D) Palitos
7) En la tabla de distribución de frecuencias, ¿qué es la marca de clase? A) Representa a todos los datos de su clase B) La semisuma de sus límites C) El valor central de una clase D) A, B, y C son correctas E) Solo A y C son correctas
z9 4 z
WA LT E R C É S P E D E S R A M Í R E Z
8) La tabla de distribución de frecuencias de variables Discretas, pueden ser organizadas por: A) Solo por lista
B) Solo por clase
C) Por lista o por clases
D) Por, según
E) Ninguna
9) En el eje de la abscisa del gráfico de un histograma, van: A) Las frecuencias absolutas C) Las marcas de clase E) Las frecuencias relativas
B) Las frecuencias acumuladas D) Los límites de clases
10) En la Estadística para investigar una gráfica lineal toma el nombre de: A) Polígono de frecuencias D) Gráfica lineal
B) Ojiva menos de E) Todas menos D
C) Ojiva más de
11) Si los datos: mínimo y máximo de una variable discreta son 65 y 188 alumnos. ¿Cuál será el tamaño de cada clase para 250 datos? A) 16
B) 10
C) 14
D) 12
E) 9
12) Si los datos: mínimo y máximo de una variable discreta son 65 y 188 alumnos. ¿Cuáles serán los límites de la primera clase para 250 datos? A) 64 y 78
B) 65 y 79
C) 65 y 77
D)
64 y 77
E) Ninguno
13) Determine los límites de la última clase de una tabla de distribución de frecuencias con 150 datos en donde el dato mínimo y el dato máximo son remuneraciones de 625 y 2705 soles respectivamente. A) 2445 y 2705
B) 2450 y 2700
C) 2425 y 2705
D) 2450 y 2705
E) Ninguno
14) Hallar la frecuencia relativa acumulada hasta la 5ta clase con la siguiente información: Clases fi
25 45 22
A) 0,8960
45 55 56
55 65
65 75
458
156
B) 0,9141
C) 0,9216
75 85 85
85 95
95 105
63
D) 0,9415
10 E) 0,8956
15) Hallar la frecuencia relativa acumulada después de la 3ra clase con la siguiente tabla: Clases fi
25 45 22
A) 0,9082
45 55 56 B) 0,8865
55 65
65 75
458
156
C) 0,3694 z9 5 z
75 85 85 D) 0,3753
85 95
95 105
63 E) 0,6306
10
E S TA D Í S T I C A I
Respuestas de control 1. B, 2. A, 3. D, 4. E, 5. D, 6. E, 7. D, 8. C, 9. D, 10. E, 11. C, 12. D, 13. A, 14. B, 15. E
GLOSARIO Ejes cartesianos.
Están representados por el cruce de dos líneas de las cuales una es horizontal o abscisa y otra vertical u ordenada. Cada ángulo recto de los ejes cartesianos se denomina cuadrante.
Fenómeno.
En estadística este término se utiliza como sinónimo de variable.
Llamadas.
Es: una letra, un número o un carácter, que se utilizan en los tabulados, para explicar el contenido de una: casilla, una columna, una fila o todo el cuadro, según sea necesario.
Pares ordenados.
Son valores de la abscisa que junto a los valores de la ordenada, permiten en los gráficos determinar la posición de los puntos que representan el cruce de cada valor de ambos ejes.
Relevante.
Es un valor que sobresale o que se distingue de los demás.
Tratamiento.
Consiste en trabajar con un grupo de datos, para utilizarlos como información o para utilizarlos como investigación.
Software.
Es un paquete o conjuntos de programas informáticos, que son desarrollados con diferentes fines incluyendo el estadístico.
EXPLORACIÓN ON LINE http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt12.html#seccion1 http://www.aulafacil.com/CursoEstadistica/Lecc-3-est.htm z9 6 z
t e r c e r a
UNIDAD Medidas de Posición o de Localización
Promedios: Media Aritmética, Media Geométrica, Media Armónica Otras medidas de posición central: Mediana, Moda Cuantiles: Cuartiles, Deciles, Percentiles
OBJETIVO (S) GENERAL Aprender que las medidas de Posición son medidas de resumen, que se caracterizan por tener una ubicación importante dentro de un conjunto de datos; algunas de ellas tienden hacia el centro y otros no tienen esa tendencia. Además para calcular estas medidas estadísticas se debe conocer cómo se encuentran los datos, ya que pueden estar agrupados en distribuciones de frecuencias, o también pueden no estar agrupados. Las medidas de Posición central, tienen uso significativo dentro de la investigación, porque todos los datos quedan representados por dicho valor central. También porque se interpreta fácilmente. Además del centro, otras veces uno se interesa por el valor que se localiza en determinada posición dentro de los datos ya ordenados; ello es posible con los cuantiles. Si los datos no se encuentran agrupados, con un simple ordenamiento se puede visualizar: el cuartil, decil o cualquier otro cuantil, sin embargo cuando los datos se encuentran agrupados, para visualizarlos, se requiere de un proceso interpolatorio. ESPECÍFICOS • Conocer mediante los promedios cuáles son sus aplicaciones dentro de las medidas de posición, además de saber utilizarlos de manera aritmética o de manera geométrica. • Saber cuál es el dato que se posiciona físicamente en el centro o es aquel que aparece con mayor frecuencia. • Determinar cómo se distribuyen los datos al repartirlos en: cuartos, décimas o en centésimas. Esto permite conocer donde se ubican aquellos valores de interés en la investigación. z9 8 z
L e c c i ó n
1
3.1. PROMEDIOS Se denominan promedios a los estadígrafos de posición que tienen una tendencia central, por que establecen el valor medio o simplemente la media del valor total de los datos o de una muestra. El Estadístico Yule ha definido algunas propiedades deseables para una medida estadística de resumen de esta naturaleza: 1º Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo resultado numérico. 2º Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna observación la medida considerada debe reflejar esta variación. 3º Tener un significado concreto: la interpretación debe ser inmediata y sencilla. 4º Ser sencilla de calcular. 5º Prestarse fácilmente al cálculo algebraico: Lo que permitirá demostraciones más elegantes. 6º Ser poco sensible a las fluctuaciones muestréales. Esta condición es imprescindible en la Estadística Matemática y en la Teoría de Sondeos. Existen diferentes tipos de promedios, a continuación se definirán los promedios mayormente utilizados en la Estadística Descriptivas:
z9 9 z
E S TA D Í S T I C A I
3.1.1. Media Aritmética ( X ) La media es la medida de posición central más importante, porque se constituye como el valor central por excelencia. El promedio es la suma de todos los valores que toma una variable sobre el total de la muestra o de la población que presentan variación aritmética, es el incremento o disminución del valor de los datos u observaciones en forma pequeña, porque no obedece a ningún factor, sino a un valor agregado o a un valor que se sustrae. Lo más positivo de la media, es que se utilizan para su cálculo todos los valores, por lo que no se pierde una sola información. Sin embargo presenta el problema de que su valor se puede ver influido por valores extremos, que se aparten en exceso del resto de los valores. Estos valores extremos podrían condicionar el valor de la media, perdiendo representatividad de la muestra o de la población. En Estadística se acostumbra para diferenciar una media aritmética de una muestra, con la media aritmética de una población, simbolizando a la muestra como X , y a la población como μ. La media aritmética tiene dos propiedades importantes que son: 1º Si se multiplican o se dividen todas las observaciones por un mismo número, la media queda multiplicada o dividida por dicho número. 2º Si se le suman o se le restan a todas las observaciones un mismo número, la media aumentará o disminuida en dicha cantidad. Dependiendo de la disponibilidad de los datos, la media aritmética se define de tres maneras diferentes, que son:
3.1.1.1. Media Aritmética Simple Cuando se calcula el promedio tomando todos los datos como están; es decir sin ordenamiento y sin ser agrupados, se denomina media aritmética simple. Este tipo de media aritmética, también es conocida como media aritmética para datos no agrupados o simplemente media aritmética de datos desordenados. La media aritmética simple, se define de la siguiente manera:
Donde: Xi N
= =
Variable Número total de datos o número de observaciones
z1 0 0 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos: 1) Hallar la media aritmética utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución:
2) Hallar la media aritmética utilizando los siguientes remuneraciones en soles: 1 412, 1 258, 1 528, 1 375, 1 248, 1 264, 1 347, 1 432. Solución:
3) Hallar el promedio de hijos de las siguientes familias: 4, 8, 1, 3, 5, 4, 4, 6, 0, 2 Solución:
A pesar de ser el número de hijos una variable discreta, se puede decir que las familias en promedio tienen 3,7 hijos, porque la media aritmética es una medida. Resolver los siguientes ejercicios propuestos, utilizando Media Aritmética Simple: 1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar el precio promedio por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10. Resp:
13,00
2) Hallar el promedio de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55. Resp:
67,00
3) Si un trabajador durante 5 años obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el promedio de remuneraciones? Resp:
29 014
4) Hallar la media aritmética de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322. Resp:
320 z1 0 1 z
E S TA D Í S T I C A I
5) Hallar el promedio de asistencia de: 118, 107, 115, 110 y 120. Resp:
114
6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la media aritmética. Resp: 1 656 7) Hallar la media aritmética de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 160, 187 y 162. Resp: 169,25 8) Hallar la media aritmética de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302. Resp: 306
3.1.1.2. Media Aritmética Ponderada Cuando a cada uno de los datos se le asigna un factor (W) llamado también peso o ponderación, dependiendo de la mayor o menor importancia que se desee otorgar; para obtener el promedio ponderado, primero se multiplica cada dato por su respectivo peso, luego se suman los productos para después dividirlos entre la suma de los factores o pesos. Este tipo de media aritmética, tiene mayor uso cuando se promedian evaluaciones, porque es muy común que algunos de los calificativos obtenidos tengan mayor valor que otros, dependiendo de los tipos de pruebas en las evaluaciones. La media aritmética ponderada, se define de la siguiente manera:
Donde: Xi = n = Wi =
Variable Número de observaciones o datos Ponderación o peso
z1 0 2 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos 1) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones Wi
195
84
81
88
128
164
2
5
2
3
3
5
Solución Calificaciones (Xi) Wi Xi Wi
195
84
81
88
128
164
Total
2
5
2
3
3
5
20
390
420
162
264
384
820
2440
2) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones Wi
15
8
9
12
18
16
1
2
3
3
4
2
Solución Calificaciones (Xi) Wi Xi Wi
15
8
9
12
18
16
Total
1
2
3
3
4
2
15
15
16
27
36
72
32
198
X = 198 / 15 = 13,2 puntos
3) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones Wi
125
181
124
118
124
150
8
8
8
8
8
8
Solución: Calificaciones (Xi) Wi Xi Wi
125
181
124
118
124
150
Total
8
8
8
8
8
8
48
1 000
1 448
992
944
992
1 200
6 576
X = 6 576 / 48 = 137 puntos
z1 0 3 z
E S TA D Í S T I C A I
Cuando las ponderaciones de todos los datos son iguales, no tiene sentido calcular la media aritmética en forma ponderada, porque este tipo de promedio solo se utiliza cuando hay diferencia entre los datos; con una media aritmética simple, el resultado es el mismo.
Resolver los siguientes ejercicios propuestos, utilizando media aritmética ponderada: 1) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones
125
181
124
118
124
150
Wi 4 8 5 9 2 7 Resp: 140,80 2) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones
12
18
5
17
14
15
Wi 1 2 3 4 5 6 Resp: 13,95 3) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones
134
156
182
145
147
165
Wi 4 3 4 4 3 4 Resp: 155,14 4) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones
1 322
1 184
1 244
1 186
1 434
1 350
Wi 2 2 3 3 4 4 Resp: 1 302,11 5) Hallar la media aritmética ponderada utilizando las siguientes calificaciones: Calificaciones
12,8
11,5
14,6
11,8
14,7
16,0
Wi 5 10 5 10 8 12 Resp: 13,59
z1 0 4 z
WA LT E R C É S P E D E S R A M Í R E Z
3.1.1.3. Media Aritmética para Datos Agrupados Cuando los datos han sido agrupados en tablas de distribución de frecuencias, para calcular la media aritmética es necesario identificar dentro de cada grupo de datos o clases, que valor representa a cada clase que es la marca de clase (Xi). Una vez obtenido el valor representativo, se multiplica cada marca de clase por su respectiva frecuencia absoluta (fi), luego se suman los productos para después dividirlos entre la suma de las frecuencia (N). Algunos autores consideran que por multiplicar la marca de clase (Xi) por la frecuencia respectiva (fi), este tipo de media aritmética es ponderada, porque ven a la frecuencia absoluta como un factor que genera un valor distinto en cada marca de clase; sin embargo en este texto, se diferenciará claramente al factor como ponderación o importancia, del factor como frecuencia absoluta que representa las veces que se repite el valor. La media aritmética para datos agrupados, se define de la siguiente manera:
Donde: fi Xi n N
= = = =
Frecuencia absoluta Variable o marca de clase Número de marcas de clase o veces que cambia el valor de la variable Suma de las frecuencias absolutas o total de datos u observaciones.
Ejercicios resueltos 1) Hallar la media aritmética utilizando los siguientes datos agrupados: Nº de Asistentes
fi
26
34
3
35
43
15
44
52
26
53
61
38
62
70
40
71
79
30
80
88
12
89
97
6
z1 0 5 z
E S TA D Í S T I C A I
Solución: Nº de Asistentes
fi
Xi
26
34
3
30
fi Xi 90
35
43
15
39
585
44
52
26
48
1 248
53
61
38
57
2 166
62
70
40
66
2 640
71
79
30
75
2 250
80
88
12
84
1 008
89
97
6
93
558
170
Σ
10 545
2) Hallar la media aritmética utilizando las siguientes calificaciones: Calificaciones
fi
260
280
3
280
300
15
300
320
30
320
340
25
340
360
12
360
380
8
380
400
7
Solución: Calificaciones
fi
Xi
fi Xi
260
280
3
270
810
280
300
15
290
4 350
300
320
30
310
9 300
320
340
25
330
8 250
340
360
12
350
4 200
360
380
8
370
2 960
380
400
7
390
Σ
100
z1 0 6 z
2 730 32 600
WA LT E R C É S P E D E S R A M Í R E Z
Resolver los siguientes ejercicios propuestos, utilizando media aritmética para datos agrupados: 1) Hallar la media aritmética utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 15 18 26 36 20 10 Resp: 154,64
2) Hallar la media aritmética utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
11
25
40
65
37
14
8
fi
Resp: 88,30 3) Hallar la media aritmética utilizando los siguientes datos agrupados: Sueldos fi
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
14
30
48
54
34
20
Resp: 1 424,00 4) Hallar la media aritmética utilizando los siguientes datos agrupados: Pedidos fi
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
4
16
25
18
12
5
Resp: 3 912,50 5) Hallar la media aritmética utilizando los siguientes datos agrupados: Pesos (Kg) fi
40 50
50 60
60 70
70 80
80 90
90 100
100 110
5
25
55
45
38
22
10
Resp: 74,60
z1 0 7 z
E S TA D Í S T I C A I
6) Hallar la media aritmética utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 14 26 35 28 17 5 Resp: 4 184,00
3.1.2. Media Geométrica La media geométrica es la medida de posición central de utilidad cuando los datos presentan variación geométrica; es decir, cuando la variación es producto de un factor. Este tipo de promedio es tan útil como la media aritmética aplicada a datos con variación aritmética. En Estadística existe poca información con datos que presentan variación geométrica, por esta razón a pesar de ser un promedio, no es utilizado con la misma intensidad que la media aritmética. La media geométrica conserva de la media aritmética, la propiedad de que si se multiplican o se dividen todas las observaciones por un mismo número, la media geométrica queda multiplicada o dividida por dicho número. Dependiendo de la disponibilidad de los datos u observaciones, esta medida de resumen se define de dos maneras diferentes, que son:
3.1.2.1. Media Geométrica Simple Este tipo de promedio conocido como media geométrica para datos no agrupados, se obtiene mediante la raíz enésima del producto de enésimos términos; también puede ser obtenido mediante el uso de logaritmos. La media geométrica para datos no agrupados o media geométrica simple, se define de la siguiente manera:
Donde: Xi = N =
Variable Número total de datos u observaciones.
Utilizando logaritmos, la media geométrica se define de la siguiente manera:
z1 0 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Donde: Log Xi =
N =
Logaritmo de la variable Número total de datos.
Con esta segunda fórmula de la media geométrica, los resultados se obtienen en logaritmos, por ello es necesario que al resultado que se obtenga de ella, se calcule el anti logaritmo para volver la información en su unidad de medida. El lector puede escoger cualquiera de las dos fórmulas para hallar la media geométrica, sin embargo cuando se trata de datos no agrupados, es más fácil utilizar la primera fórmula sin logaritmos, porque cualquier calculadora maneja estas cifras con facilidad. Ejercicios resueltos 1) Hallar la media geométrica utilizando los siguientes datos no agrupados: 28, 1 245, 56, 157 y 783. Solución:
Otra solución utilizando logaritmos: Log Xg = (log. 28 + log. 1245 + log. 56 + log. 157 + log. 783) / 5 Log Xg = (1,447158 + 3,095169 + 1,748188 + 2,1959 + 2,893762) / 5 Log Xg = 11,380177 / 5 = 2,2760354 Antilogaritmo de 2,2760354 = 188,81 Xg = 188,81
2) Hallar la media geométrica utilizando los siguientes datos no agrupados: 1 218, 245, 556, 1 507 63 y 87. Solución:
3) Hallar la media geométrica con los siguientes datos no agrupados: 4, 20, 100, 500 y 2 500. Solución:
Observe que si el dato siguiente es multiplicado exactamente por el mismo factor (5), y esto se repite continuamente, tendremos una progresión geométrica donde el promedio es exactamente el valor del centro. Esto mismo ocurre con la media aritmética, con la diferencia de que la variación no es un factor sino un mismo sumando.
z1 0 9 z
E S TA D Í S T I C A I
4) Hallar la media geométrica utilizando los siguientes datos no agrupados: 1, 7, 49, 343, 2 401, 16 807 y 117 649. Solución:
Cuando se trata de una misma progresión geométrica, el promedio geométrico es el valor del centro, sin importar que los datos estén ordenados o no.
Resolver los siguientes ejercicios propuestos, utilizando Media Geométrica Simple: 1) Hallar el promedio geométrico de una cuenta de ahorro a interés compuesto que durante 6 meses tuvo la siguiente variación: 1 224,20; 1 297,44; 1 382,80; 1 419,00; 1 527,90 y 1 673,50. Resp: 1 413,30 2) Hallar la media geométrica de: 1 245, 789, 521, 365, 1 045, 89, 76 y 1 758. Resp: 468,51 3) Hallar el promedio geométrico anual de crecimiento de una población rural durante 10 años que tuvo la siguiente variación: 673, 682, 701, 725, 748, 771, 792, 808, 818 y 836. Resp: 753,34 4) Hallar la media geométrica de: 2 245, 1 789, 1 521, 1 365, 2 045, 1 089, 1 076 y 1 758. Resp: 1 560,29 5) Hallar el promedio geométrico de una cuenta de ahorro a interés compuesto que durante 10 meses tuvo la siguiente variación: 528,56; 531,28; 540,19; 549,87; 556,25; 359,25; 367,15; 372,87; 380,02 y 388,15. Resp: 449,48 6) Hallar la media geométrica de: 45, 78, 52, 36, 81, 40, 89, 76 y 158. Resp: 65,68
z1 1 0 z
WA LT E R C É S P E D E S R A M Í R E Z
7) Hallar el promedio geométrico anual de crecimiento de la población de Lima durante 5 años que tuvo la siguiente variación: 12 458 358, 12 845 125, 13 345 320, 13 879 208 y 14 527 245. Resp:
13 391 068
8) Hallar el promedio geométrico anual de crecimiento de la población de vicuñas de Ayacucho durante 6 años que tuvo la siguiente variación: 25 458, 26 730, 28 334, 29 184, 30 458 y 31 587. Resp:
28 548,35
3.1.2.2. Media Geométrica para Datos Agrupados Este tipo de promedio se obtiene mediante la raíz enésima del producto de enésimos términos elevados a su correspondiente frecuencia absoluta; también puede ser obtenido mediante el uso de logaritmos. La media geométrica para datos agrupados, se define de la siguiente manera:
Donde: fi = Xi = n = N = Utilizando
Frecuencia absoluta Variable o marca de clase Número de marcas de clase o veces que cambia el valor de la variable Suma de las frecuencias absolutas o total de datos u observaciones logaritmos, la media geométrica se define de la siguiente manera:
Donde: Log Xi = fi = N = n =
Logaritmo de la variable Frecuencia absoluta Número total de datos u observaciones. Número de marcas de clase
Con esta segunda fórmula de la media geométrica, los resultados se obtienen en logaritmos, por ello es necesario que al resultado que se obtenga de ella, se calcule el anti logaritmo para volver la información en su unidad de medida.
z1 1 1 z
E S TA D Í S T I C A I
El lector puede escoger cualquiera de las dos fórmulas para hallar la media geométrica, sin embargo cuando se trata de datos agrupados, es más fácil utilizar la segunda fórmula, con logaritmos, porque al elevar la marca de clase (Xi) a la potencia que es la frecuencia absoluta (fi) puede generar un número excesivamente grande que cualquier calculadora no puede manejar; en cambio con los logaritmos, la operación se hace manejable. Ejercicios resueltos 1) Hallar la media geométrica utilizando los siguientes datos agrupados: Nacimientos
fi
126
134
3
135
143
15
144
152
26
153
161
38
162
170
40
171
179
30
180
188
12
189
197
6
Solución:
Nacimientos
fi
Xi
fi log. Xi
126
134
3
130
6,34183
135
143
15
139
32,14522
144
152
26
148
56,42680
153
161
38
157
83,44419
162
170
40
166
88,80432
171
179
30
175
67,29114
180
188
12
184
27,17781
189
197
6
193
Σ
170
Log Xg = 375,34465 / 170 = 2,20791 Xg = 161,40
z1 1 2 z
13,71334 375,34465
Anti logaritmos de: 2,20791 = 161,40
WA LT E R C É S P E D E S R A M Í R E Z
2) Hallar la media geométrica utilizando los siguientes datos agrupados: Depósitos en Ahorros
fi
1 260
2 280
4
2 280
3 300
15
3 300
4 320
20
4 320
5 340
25
5 340
6 360
12
6 360
7 380
8
7 380
8 400
6
Solución:
Depósitos en Ahorros
fi
Xi
fi log. Xi
1 260
2 280
4
1 770
12,99189
2 280
3 300
15
2 790
51,68406
3 300
4 320
30
3 810
107,42775
4 320
5 340
25
4 830
92,09868
5 340
6 360
12
5 850
45,20587
6 360
7 380
8
6 870
30,69565
7 380
8 400
6
7 890
23,38246
100
Σ Log Xg = 363,48636 / 100 = 3,6348636
363,48636
Anti logaritmos de: 3,6348636 = 4 313,84
Xg = 4 313,84
3) Hallar la media geométrica utilizando los siguientes datos agrupados: Ahorros fi
455 465 35
465 475
475 485
485 495
495 505
505 515
515 525
40
30
18
12
10
5
z1 1 3 z
E S TA D Í S T I C A I
Solución: Ahorros
fi
Xi
fi log. Xi
455
465
35
460
93,19652
465
475
40
470
106,88391
475
485
30
480
80,43724
485
495
18
490
48,42353
495
505
12
500
32,38764
505
515
10
510
27,07570
515
525
5
520
Σ (Total)
150
13,58002 401,98456
Log Xg = 401,98456 / 150 = 2,679897
Anti logaritmos de: 2,679897 = 478,52
Xg = 478,52
Resolver los siguientes ejercicios propuestos, utilizando Media Geométrica para Datos Agrupados:
1) Hallar la media geométrica utilizando los siguientes datos agrupados: Nacimientos
125 135
135 145
145 155
155 165
165 175
175 185
fi 15 18 26 36 20 10 Resp: 153,97
2) Hallar la media geométrica utilizando los siguientes datos agrupados: Ahorros
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 11 25 40 65 37 14 8 Resp: 87,15
3) Hallar la media geométrica utilizando los siguientes datos agrupados: Depósitos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 14 30 48 54 34 20 Resp: 1 396,20 z1 1 4 z
WA LT E R C É S P E D E S R A M Í R E Z
4) Hallar la media geométrica utilizando los siguientes datos agrupados: Préstam.
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 4 16 25 18 12 5 Resp: 3 691,88
5) Hallar la media geométrica utilizando los siguientes datos agrupados: Tasas (%)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 5 25 55 45 38 22 10 Resp: 73,20 6) Hallar la media geométrica utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 14 26 35 28 17 5 Resp: 3 960,36
3.1.3. Media Armónica ( Xh ) La media armónica es un promedio aritmético que se usa exclusivamente para hallar promedios de velocidad, ya sea: de vehículos, de máquinas o de hombres. El uso de esta medida estadística es restringido, porque tiene un solo objetivo. Cuando la variable es un valor compuesto, dada ya sea en velocidad por recorrido o en velocidad por producción, y los recorridos o producciones son los mismos o son variables, la Estadística tiene un procedimiento para hallar los promedios aritméticos a través de la media armónica. La media armónica es una medida de resumen, que se define de dos maneras, dependiendo de la información que se tiene:
z1 1 5 z
E S TA D Í S T I C A I
3.1.3.1. Media Armónica Simple La media armónica simple se utiliza cuando todas las variables compuestas de velocidad por la unidad de tiempo (Xi), tienen la misma importancia, o no tienen ponderación. Cuando a todas las velocidades a analizar, les corresponden una misma distancia o les corresponden una misma cantidad de producción, la media armónica simple se define de la siguiente manera:
Donde: Xi =
Variable de velocidad por la unidad de tiempo
Número total de datos.
N
=
Ejercicios resueltos 1) Hallar la media armónica o promedio de velocidad de un ciclista que recorre tres veces 100 kilómetros a: 60, 70 y 90 km. por hora. Solución:
2) Hallar la media armónica o promedio de velocidad de operación de 5 operarias que realizan la misma producción a: 25, 28, 32, 30 y 20 artículos por día. Solución:
3) Hallar el promedio de velocidad de operación de una operadora de teléfonos que durante 5 días en su jornada de trabajo que atendió la misma cantidad de llamadas, las realizó a: 480, 450, 460, 470 y 490 llamadas por día.
z1 1 6 z
WA LT E R C É S P E D E S R A M Í R E Z
Solución:
Resolver los siguientes ejercicios propuestos, utilizando Media Armónica Simple: 1) Hallar la media armónica o promedios de velocidad de la siguiente producción por hora: 28, 24, 22, 26 y 28. Resp: 25,38 2) Hallar la media armónica o promedios de velocidad de los siguientes km. por hora: 35, 40, 55 y 40. Resp: 41,34 3) Hallar la media armónica o promedios de velocidad de la siguiente producción por día: 298, 284, 282, 265 y 288. Resp: 282,99 4) Hallar la media armónica o promedios de velocidad de la siguiente producción por turno: 18, 14, 16, 18, 18 y 20. Resp: 17,11 5) Hallar la media armónica o promedios de velocidad de los siguientes km. por hora: 150, 125, 120 y 100. Resp: 121,21 6) Hallar la media armónica o promedios de velocidad de la siguiente producción por hora: 8, 9, 7, 10, 8 y 8. Resp: 8,23 7) Hallar la media armónica o promedios de velocidad de la siguiente producción por día: 50, 54, 52, 56 y 46. Resp: 51,36 8) Hallar la media armónica o promedios de velocidad de la siguiente producción por turno: 165, 174, 158, 160 y 158. Resp: 162,78 9) Hallar la media armónica o promedios de velocidad de la siguiente producción por semana: 2 820, 2 814, 2 822, 2 826 y 2 810. Resp: 2 818,39
z1 1 7 z
E S TA D Í S T I C A I
3.1.3.2. Media Armónica para Datos Agrupados La media armónica para datos agrupados, se utiliza cuando las variables compuestas de velocidad por la unidad de tiempo (Xi), tienen diferente importancia o ponderación. Cuando todas las velocidades corresponden a distancias o a cantidades de producción diferentes, o al menos una de ellas, la media armónica para datos agrupados se define de la siguiente manera:
Donde: Xi = Variable de velocidad por la unidad de tiempo fi = Distancia recorrida o producción realizada N = Número total de datos. n = Número de veces que cambia el valor de la variable Ejercicios resueltos 1) Hallar la media armónica o promedio de velocidad de un ciclista que recorre: 100 kilómetros a 60 km. por hora, 150 km. a 70 km. por hora y 90 km. a 90 km. por hora. Solución:
2) Hallar la media armónica o promedio de velocidad de operación de 5 operarias que producen: 450 artículos a 25 artículos por día, 340 artículos a 28 artículos por día, 500 artículos a 32 artículos por día, 420 artículos 30 artículos por día y 360 artículos a 20 artículos por día. Solución:
3) Hallar el promedio de velocidad de operación de una operadora de teléfonos, que durante 5 días, en su jornada de trabajo, en las mañanas atendió: 220 llamadas a 480
z1 1 8 z
WA LT E R C É S P E D E S R A M Í R E Z
llamadas por día, 250 llamadas a 450 llamadas por día, 240 llamadas a 460 llamadas por día, 220 llamadas a 470 llamadas por día y 220 llamadas a 490 llamadas por día. Solución:
4) Hallar la media armónica de la siguiente distribución de frecuencias referida a las unidades producidas por días: Unidades
fi
455
465
30
465
475
40
475
485
30
485
495
18
495
505
12
505
515
10
515
525
5
525
535
5
Solución:
Unidades
fi
Xi
fi / Xi
455
465
30
460
0,065217
465
475
40
470
0,085106
475
485
30
480
0,062500
485
495
18
490
0,036735
495
505
12
500
0,024000
505
515
10
510
0,019608
515
525
5
520
0,009615
525
535
5
530
0,009434
Σ
150
150 / 0,312215 = 480,44 unidades / día
z1 1 9 z
0,312215
E S TA D Í S T I C A I
Resolver los siguientes ejercicios propuestos, utilizando Media Armónica para Datos Agrupados: 1) Hallar la media armónica utilizando los siguientes datos agrupados: Unidades
225 235
235 245
245 255
255 265
265 275
275 285
fi 15 18 26 36 20 10 Resp: 253,82 2) Hallar la media armónica utilizando los siguientes datos agrupados: Kilómetros
155 165
165 175
175 185
185 195
195 205
205 215
215 225
fi 11 25 40 65 37 14 8 Resp: 187,24 3) Hallar la media armónica utilizando los siguientes datos agrupados: Unidades
800 820
820 840
840 860
860 880
880 900
900 920
fi 14 30 48 54 34 20 Resp: 861,52 4) Hallar la media armónica utilizando los siguientes datos agrupados: Pedidos
100 120
120 140
140 160
160 180
180 200
200 220
fi 4 16 25 18 12 5 Resp: 154,16 5) Hallar la media armónica utilizando los siguientes datos agrupados: Kilogramos
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 5 25 55 45 38 22 10 Resp: 71,80 6) Hallar la media armónica utilizando los siguientes datos agrupados: Compras
150 250
250 350
350 450
450 550
550 650
650 750
fi 14 26 35 28 17 5 Resp: 372,42 z1 2 0 z
L e c c i ó n
2
3.2. OTRAS MEDIDAS DE POSICIÓN CENTRAL Entre los estadígrafos de posición, además de los promedios que tienden hacia el centro de todos los datos, existen otras medidas de resumen con las mismas tendencias, que son: la mediana y la moda. Mientras que la mediana se posiciona en el centro de los datos, la moda representa al o los datos de mayor frecuencia que en la práctica son datos centrales o tiene esa tendencia. La Estadística utiliza estas medidas, para resolver algunas dificultades que los promedios pueden ocasionar, sobre todo cuando la influencia de valores extremos es muy fuerte, generando distorsión en la media aritmética.
3.2.1. Mediana (Me) En el ámbito de la Estadística, la mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición, el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra o de la población. La mediana es una medida de localización o posición central y es igual a algunos cuantiles, porque coincide con ellos, tales como: el percentil 50, el cuartil 2 y el decil 5, entre los cuantiles más importantes. La mediana es considerada estadísticamente como una medida no matemática, porque una vez que los datos han sido ordenados, se puede observar que el valor o dato que se ubica en el centro es la mediana, y si hay dos valores en el centro, la mediana es el promedio de ambos, porque la mediana es única dentro de un conjunto de datos. z1 2 1 z
E S TA D Í S T I C A I
Esta medida recobra importancia, cuando dentro de un conjunto de datos, existen valores muy extremos que hacen que la media aritmética pierda credibilidad, porque como el promedio es una medida de tendencia central, se aleja de esa posición siendo atraído hacia el lado del valor extremo.
3.2.1.1. Mediana para Datos no Agrupados Para ubicar el valor de la mediana, considerando los datos u observaciones en forma individual, sin ser agrupados, primero se ordenan los datos en forma creciente o decreciente, luego se suma uno al total de datos para dividirlo entre dos, determinando que dato u observación tiene la posición central, y el dato que quede en esa posición es la mediana. Cuando la cantidad de datos es impar, (N + 1) / 2, la mediana es exactamente el dato del centro; en cambio, cuando la cantidad de datos es par, (N + 1) / 2, es un valor intermedio entre dos valores centrales; es este caso, la mediana es el promedio de los dos valores del centro, por que como ya se ha mencionado, todo conjunto de datos: muestra o población, solo tienen una mediana y una media aritmética. Cuando los datos son individuales o no han sido agrupados, para hallar el valor mediana, solo basta saber cuál es su posición, además como la mediana no es un promedio, no importa si los datos tienen variación aritmética o variación geométrica, por lo tanto no necesita de una fórmula para ser hallada.
Ejercicios resueltos 1) Hallar la mediana de: 158, 264, 78, 99, 157, 216 y 88. Solución: Ordenando los datos en forma creciente donde N = 7: Posición Dato
1
2
3
4
5
6
7
78
88
99
157
158
216
264
Ubicación de la mediana = (N + 1) / 2 = (7 + 1) / 2 = 4 Me = es el dato de la posición 4 = 157
z1 2 2 z
WA LT E R C É S P E D E S R A M Í R E Z
2) Hallar la mediana de:
1 508, 2 642, 978, 919, 1 058, 821, 625 y 1 000.
Solución: Ordenando los datos en forma creciente donde N = 8: Posición Dato
1
2
3
4
5
6
7
8
625
821
919
978
1 000
1 058
1 508
2 642
Ubicación de la mediana = (N + 1) / 2 = (8 + 1) / 2 = 4,5 El dato de la posición 4,5, es el promedio entre el dato 4 y el dato 5 Me = (978 + 1 000) / 2 = 989 3) Hallar la mediana de:
508, 647, 982, 969, 105, 828, 647, 325, 455 y 780.
Solución: Ordenando los datos en forma creciente donde N = 10: Posición Dato
1
2
3
4
5
6
7
8
9
10
105
325
455
508
647
647
780
828
969
982
Ubicación de la mediana = (N + 1) / 2 = (10 + 1) / 2 = 5,5 El dato de la posición 5,5, es el promedio entre el dato 5 y el dato 6 Me = (647 + 647) / 2 = 647 En los casos de que los dos valores del centro sean iguales, ya no es necesario hallar el promedio entre ambos, por solo basta con tomar uno de ellos.
Resolver los siguientes ejercicios propuestos, utilizando Mediana para Datos no Agrupados: 1) Hallar la mediana de: 45, 58, 45, 22 y 36.
Resp:
45
2) Hallar la mediana de: 156, 158, 98, 44, 365 y 452.
Resp:
157
3) Hallar la mediana de: 17, 56, 12, 65, 37,82 y 44.
Resp:
44
Resp:
45
Resp:
415
4) Hallar la mediana de: 148, 30, 66, 45, 58, 45, 22 y 36. 5) Hallar la mediana de: 415, 518, 475, 282 y 326.
z1 2 3 z
E S TA D Í S T I C A I
6) Hallar la mediana de: 3 456, 1 231, 4 567, 5 345 y 2 457
Resp:
3 456
7) Hallar la mediana de: 15, 9, 25, 8, 7, 11, 17, 4, 5, 5, 8 y 6
Resp:
8
8) Hallar la mediana de: 14, 15, 19, 12, 14, 19, 15, 18 y 14
Resp:
15
9) Hallar la mediana de: 34 567 y 22 161
Resp:
10) Hallar la mediana de: 196, 458, 785, 518, 789, 215 y 775
Resp:
28 364 518
3.2.1.2. Mediana para Datos Agrupados Para ubicar el valor de la mediana entre los datos agrupados en distribuciones de frecuencias, se divide el total de datos entre dos para encontrar la posición central que es donde se encuentra el valor de la mediana, en los casos de datos agrupados, no es necesario ordenar la información u observaciones, porque ya lo están. Cuando los datos han sido agrupados, para hallar el valor mediana, no solo basta saber cuál es su posición, sino que además como la mediana se encuentra dentro de una clase o grupo de datos, para hallarla es necesario utilizar un proceso de interpolación, sin importar si los datos tienen variación aritmética o variación geométrica, la fórmula para la interpolación se define de la siguiente manera: ESQUEMA DE INTERPOLACIÓN DE LA MEDIANA
z1 2 4 z
WA LT E R C É S P E D E S R A M Í R E Z
Donde:
Li
=
Límite inferior de la clase donde está la mediana
Ls
=
Límite superior de la clase donde está la mediana
N
=
Número total de datos
fi
=
Frecuencia absoluta de la clase donde está la mediana
Fi – 1 e
= Frecuencia acumulada de la clase anterior a la posición de la mediana.
=
Amplitud o tamaño de la clase donde está la mediana (e = Ls – Li)
Ejercicios resueltos 1) Hallar la mediana utilizando los siguientes datos agrupados: Rem.
600 1000
1000 1400
1400 1800
1800 2200
21
58
65
28
fi
2200 2600 2600 3000 16
Solución: Remuneraciones
fi
Fi
600
1 000
21
21
1 000
1 400
58
79
1 400
1 800
65
144
1 800
2 200
28
172
2 200
2 600
16
188
2 600
3 000
12
200
Σ
200
Posición de la mediana: N / 2 = 200 / 2 = 100
z1 2 5 z
(Tercera clase)
12
E S TA D Í S T I C A I
2) Hallar la mediana utilizando los siguientes datos agrupados: Ventas (en millones)
2
fi
6
6 10
10 14
14 18
18 22
22 26
22
62
40
36
24
16
Solución: Ventas fi
en millones
Fi
2
6
16
16
6
10
22
38
10
14
62
100
14
18
40
140
18
22
36
176
22
26
24
200
Σ
200
Posición de la mediana: N / 2 = 200 / 2 = 100
(Tercera clase)
3) Hallar la mediana utilizando los siguientes datos agrupados: Alumnos fi
20 40
40 60
60 80
80 100
100 120
120 140
140 160
160 180
4
16
36
40
26
19
5
4
Solución: Alumnos
fi
Fi
20
40
4
4
40
60
16
20
60
80
36
56
80
100
40
96
100
120
26
122
120
140
19
141
140
160
5
146
160
180
4
150
Σ
150
z1 2 6 z
WA LT E R C Ă&#x2030; S P E D E S R A M Ă? R E Z
PosiciĂłn de la mediana: N / 2 = 150 / 2 = 75
(Cuarta clase)
Resolver los siguientes ejercicios propuestos, utilizando Mediana para Datos Agrupados:
1) Hallar la mediana utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 10 18 26 36 20 15 Resp: 157,36
2) Hallar la mediana utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 8 25 40 65 37 14 11 Resp: 89,15
3) Hallar la mediana utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 30 48 54 34 14 Resp: 1 407,41
4) Hallar la mediana utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 16 25 18 10 5 Resp: 3 720
z1 2 7 z
E S TA D Í S T I C A I
5) Hallar la mediana utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 10 25 55 45 38 22 5 Resp: 72,22 6) Hallar la mediana utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 10 26 35 28 17 9 Resp: 4 257,14
3.2.2. Moda (Mo) La moda es aquel valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, porque es la única medida estadística que se aplica a variable cualitativa, además no precisa la realización de ningún cálculo. El valor de moda en distribuciones discretas o cualitativas, no requiere de una explicación mayor; sin embargo, cuando se trata de distribuciones continuas, se precisa de todo un proceso interpolatorio. Como medida de resumen, la moda es también la única que puede o no existir dentro de un conjunto de datos, y si existe, pueden observarse uno o más valores de moda, ya que como representa la mayor frecuencia, varios valores pueden tener la misma mayor frecuencia dentro del conjunto de datos. Si tienen los datos un valor de moda, es monomodal; si tienen dos, entonces será bimodal; si tienen tres, se dice que es trimodal y así sucesivamente.
3.2.2.1. Moda para Datos no Agrupados La principal ventaja de esta medida de posición, es la simplicidad con que se obtiene, ya que representa a la observación de mayor frecuencia. Por definición, la moda no es una medida matemática, porque cuando los datos no han sido agrupados, basta con ver que dato u observación se repite con más frecuencia, aunque se recomienda primero ordenarlos para verlos juntos y así determinar el o los valores de moda con más precisión.
z1 2 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios esueltos 1) Hallar la moda de los siguientes datos: 34, 26, 32, 26 y 20. Mo = 26
Ordenando: 20, 26, 26, 32, 34
2) Hallar la moda de los siguientes datos: 32, 34, 26, 32, 26 y 20. Mo = 26 y 32
Ordenando: 20, 26, 26, 32, 32, 34
3) Hallar la moda de los siguientes datos: 32, 34, 26, 32, 26, 34 y 20. Ordenando: 20, 26, 26, 32, 32, 34, 34
Mo = 26, 32 y 34
4) Hallar la moda de los siguientes datos: 20, 32, 34, 26, 32, 26, 34 y 20. Ordenando: 20, 20, 26, 26, 32, 32, 34, 34
Mo = No hay moda
El hecho de haber datos repetidos, no implica que necesariamente haya moda, en este último ejercicio, hay elementos repetidos pero no hay moda, debido a que todos se repiten exactamente en la misma cantidad, y para que haya moda, al menos una de las repeticiones debe ser distinta (Con los datos ordenados es más fácil identificar la moda).
Resolver los siguientes ejercicios propuestos, utilizando la Moda para Datos no Agrupados:
1) Hallar la moda de los siguientes datos: 1 458, 1 589, 1 251, 1651, 1452, 1 458, 1 251, 1 589, 1 458, 1 651, 1 920 y 1 325. Resp: 1 458. 2) Hallar la moda de los siguientes datos: 6, 12, 10, 6, 3, 4, 5, 5, 5, 7, 6, 9, 6, 7 Resp:
6.
3) Hallar la moda de los siguientes datos: 1 852, 1 857, 2 187, 1 587, 1 528, 1 678, 1 897 Resp: Sin Mo. 4) Hallar la moda de los siguientes datos: 76, 79, 75, 79, 88, 87, 88, 79, 88 Resp: 79 y 88.
z1 2 9 z
E S TA D Í S T I C A I
3.2.2.2. Moda para Datos Agrupados Cuando los datos están agrupados en intervalos, antes de determinar la moda habrá que localizar el intervalo que lo contiene o sea el intervalo modal. En los casos de que los intervalos sean de igual amplitud, el intervalo modal es donde se da la mayor frecuencia. En casos de distinta amplitud es donde se da la mayor función de densidad; en este texto solo se trabajará con intervalos de igual tamaño o amplitud. La principal desventaja que tiene la moda, es que solo considera el valor que más se repite, sin considerar la incidencia de los restantes.
Donde: Li
=
Límite inferior de la clase donde está la moda
Ls
=
Límite superior de la clase donde está la moda
N
=
Número total de datos
fi
=
Frecuencia absoluta de la clase donde está la moda
fi – 1
=
Frecuencia absoluta de la clase anterior a la posición de la moda.
fi + 1
=
Frecuencia absoluta de la clase posterior a la posición de la moda.
e
= Amplitud o tamaño de la clase donde está la moda (e = Ls – Li)
z1 3 0 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos 1) Hallar la moda utilizando los siguientes datos agrupados: Remuneraciones
fi
600
1 000
21
1 000
1 400
58
1 400
1 800
65
1 800
2 200
28
2 200
2 600
16
2 600
3 000
10
3 000
3 400
2
Σ
200
Posición de la moda está en la tercera clase porque tiene la mayor frecuencia absoluta.
2) Hallar la moda utilizando los siguientes datos agrupados: Ventas fi
en millones 2
6
16
6
10
24
10
14
50
14
18
50
18
22
36
22
26
24
Σ
200
z1 3 1 z
E S TA D Í S T I C A I
Hay dos modas que se posicionan en la tercera y en la cuarta clase. Mo1 =
?
Li = 10;
∆1 = 50 – 24 = 26
Mo2 =
?
Li = 14;
∆1 = 50 – 50 = 0
fi = 50;
fi – 1 = 24;
fi + 1 = 50;
e = 10 – 14 = 4
∆2 = 50 – 50 = 0
fi = 50;
fi – 1 = 50;
fi + 1 = 36;
e = 14 – 18 = 4
∆2 = 50 – 36 = 14
Observe que no hay dos modas, solo hay una; esto sucede siempre cuando los valores de moda están juntos, por la interpolación ve las dos clases iguales y juntas como una sola. 3) Hallar la moda utilizando los siguientes datos agrupados: Alumnos
fi
20
40
4
40
60
15
60
80
20
80
100
38
100
120
26
120
140
38
140
160
5
160
180
4
Σ
150
Como la máxima frecuencia es 38 que se repite en la cuarta y sexta clase, hay dos modas que se posicionan en dichas clases. Mo1 = ?
Li = 80;
fi = 38;
fi – 1 = 20;
∆1 = 38 – 20 = 18
∆2 = 38 – 26 = 12
Mo2 = ?
fi = 38;
Li = 120;
fi – 1 = 26; z1 3 2 z
fi + 1 = 26;
fi + 1 = 5;
e = 100 – 80 = 20
e = 140 – 120 = 20
WA LT E R C É S P E D E S R A M Í R E Z
∆1 = 38 – 26 = 12
∆2 = 38 – 5 = 33
Ahora al encontrase las dos modas separadas, el proceso interpolatorio puede distinguir realmente que hay dos valores de modas.
4) Hallar la moda utilizando los siguientes datos agrupados: Producción
fi
2 000
6 000
6
6 000
10 000
14
10 000
14 000
20
14 000
18 000
30
18 000
22 000
16
22 000
26 000
14
Σ
100
Posición de la moda está en la cuarta clase porque tiene la mayor frecuencia absoluta. Mo = ?
Li = 14 000;
fi = 30;
fi – 1 = 20;
e = 18 000 – 14 000 = 4 000 ∆1 = 30 – 20 = 10
∆2 = 30 – 16 = 14
⎡ 10 ⎤ = 14 000 ⎢ ⎥ 4 000 = 15 666,67 ⎢⎣ 10 +14 ⎥⎦
z1 3 3 z
fi + 1 = 16;
E S TA D Ă? S T I C A I
Resolver los siguientes ejercicios propuestos, utilizando Moda para Datos Agrupados:
1) Hallar la moda utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 10 18 26 36 20 15 Resp: 158,85
2) Hallar la moda utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 8 25 40 65 37 14 11 Resp: 89,72
3) Hallar la moda utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 30 48 54 34 14 Resp: 1 446,15
4) Hallar la moda utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 16 25 18 10 5 Resp: 3 562,5
5) Hallar la moda utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 10 25 55 30 55 22 5 Resp: 65,45 y 84,31
z1 3 4 z
WA LT E R C Ă&#x2030; S P E D E S R A M Ă? R E Z
6) Hallar la moda utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 10 26 35 35 10 9 Resp: 4 500,00
7) Hallar la moda utilizando los siguientes datos agrupados: Ventas
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 54 48 34 30 14 Resp: 1 170,00
8) Hallar la moda utilizando los siguientes datos agrupados: Utilidades
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 10 16 23 30 15 Resp: 5 318,18
z1 3 5 z
L e c c i ó n
3
3.3. CUANTILES Son un grupo de medidas estadísticas de posición o de localización, que no tienen una tendencia hacia el centro, con excepción de: el cuartil 2, el decil 5 y el percentil 50; porque son iguales a la mediana, por lo tanto son medidas que se localizan en el centro. El cuantil es un valor o dato que se encuentra en una posición definida, por lo tanto, para hallar un cuantil, primero se ve en qué posición se localiza y luego se toma el valor localizado. Si la posición del cuantil no es exacta, es necesaria una interpolación para determinar su valor, en caso contrario se toma el valor de la posición. Existe una gran variedad de cuantiles, pero los mayormente usados por Estadística, son:
3.3.1. Cuartiles (Qi) Representan la cuarta parte de los datos, producto de dividir la totalidad de los datos en 4 partes iguales. Los cuartiles son tres, que a partir del primer dato ordenado, se ubican: al 25% (Cuartil1), al 50% (Cuartil 2) y al 75% (Cuartil 3). Los cuartiles pueden ser hallados, tanto de datos no agrupados, como de datos agrupados.
3.3.1.1. Cuartiles para Datos no Agrupados Cuando la información o conjunto de datos no se encuentran agrupados, la posición o localización de los tres cuartiles, es: Q1 = 1(N+1) / 4;
Q2 = 2(N+1) / 4 z1 3 7 z
y
Q3 = 3(N+1) / 4
E S TA D Í S T I C A I
Si la posición es exacta, se toma el valor o dato de la posición; en caso contrario, el cuartil es hallado mediante la siguiente interpolación: Se toma el dato de la posición considerando solo la parte entera, más el producto de la parte decimal por la diferencia del dato tomado con el dato siguiente.
En todos los casos de interpolación para datos no agrupados, si la posición buscada es inferior a 1, se toma el primer dato; y, si la posición buscada es superior a la posición del último dato, se toma este último.
Ejercicios resueltos 1) Hallar todos los cuartiles con los siguientes datos: 125, 536, 485, 789, 584, 725 y 649. Solución: Ordenando los datos en forma creciente donde N = 7:
Posición Dato
1
2
3
4
5
6
7
125
485
536
584
649
725
789
Ubicación del cuartil 1:
Q1 = 1(N + 1) / 4 = 1(7 + 1) / 4 = 2
Q1 = es el dato de la posición 2 = 485 Ubicación del cuartil 2:
Q2 = 2(N + 1) / 4 = 2(7 + 1) / 4 = 4
Q2 = es el dato de la posición 4 = 584 Ubicación del cuartil 3:
Q3 = 3(N + 1) / 4 = 3(7 + 1) / 4 = 6
Q3 = es el dato de la posición 6 = 725
2) Hallar el cuartil 3 con los siguientes datos : 25, 36, 37, 52, 67, 19, 33, 50, 62, 44, 58 y 61. Ordenando los datos en forma creciente donde N = 12: Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
19
25
33
36
37
44
50
52
58
61
62
67
Ubicación del cuartil 3:
Q3 = 3(N + 1) / 4 = 3(12 + 1) / 4 = 9,75
Interpolación del Q3 = 58 + 0,75(61 – 58) = 60,25 z1 3 8 z
WA LT E R C É S P E D E S R A M Í R E Z
En la interpolación de la posición 9,75, se ha tomado el dato 9 (58), más 0,75 de la diferencia del dato 10 (61) menos el dato 9 (58). 3) Hallar el cuartil 1 utilizando los siguientes datos no agrupados: 71, 59, 33, 58, 63, 44, 38, 51, 68 y 61
56, 62, 74, 22,
Ordenando los datos en forma creciente donde N = 14:
Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
13
14
22
33
38
44
51
56
58
59
61
62
63
68
71
74
Ubicación del cuartil 1:
Q1 = 1(N + 1) / 4 = 1(14 + 1) / 4 = 3,75
Interpolación del Q1 = 38 + 0,75(44 – 38) = 42,5.
Resolver los siguientes ejercicios propuestos, utilizando Cuartiles para Datos no Agrupados: 1) Hallar el cuartil 3 utilizando los siguientes datos: 96, 105, 116, 88, 75, 110 y 127. Resp: 116 2) Hallar el cuartil 1 utilizando los siguientes datos: 24, 26, 28, 31, 33, 24, 28, 27 y 22. Resp: 24 3) Hallar el cuartil 2 utilizando los siguientes datos: 85, 74, 76, 58, 54, 62, 45, 77, 87. Resp: 74
4) Hallar el cuartil 3 utilizando los siguientes datos: 252, 264, 287, 264, 268, 278, 281, 276 y 295. Resp: 284 5) Hallar el cuartil 2 utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 571 y 1 562. Resp:
1 564
6) Hallar el cuartil 1 utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457. Resp:
24 178 z1 3 9 z
E S TA D Í S T I C A I
3.3.1.2. Cuartiles para Datos Agrupados Cuando la información o conjunto de datos se encuentran agrupados, la posición o localización de los tres cuartiles, es: Q1 = 1N / 4;
Q2 = 2N / 4
y
Q3 = 3N / 4
Una vez localizada la posición del cuartil, se procede a utilizar el mismo procedimiento interpolatorio de la mediana para datos agrupados, pero esta vez se realizará con la posición del cuartil.
Donde: Posición= Número del cuartil por “N” entre 4 Li
=
Límite inferior de la clase donde está el cuartil
Ls
=
Límite superior de la clase donde está el cuartil
N
=
Número total de datos
fi
=
Frecuencia absoluta de la clase donde está el cuartil
=
Frecuencia acumulada de la clase anterior a la posición del cuartil.
=
Amplitud o tamaño de la clase donde está el cuartil (e = Ls – Li)
Fi – 1 e
Ejercicios resueltos
1) Hallar los cuartiles: 1, 2 y 3; utilizando los siguientes datos agrupados:
Remuneraciones
fi
Fi
600
1 000
21
21
1 000
1 400
58
79
1 400
1 800
65
144
1 800
2 200
28
172
2 200
2 600
16
188
2 600
3 000
10
198
3 000
3 400
2
200
Σ
200 z1 4 0 z
WA LT E R C É S P E D E S R A M Í R E Z
Posición del cuartil 1: 1N / 4 = 1(200) / 4 = 50 Li = 1 000;
N = 200;
fi = 58;
Fi – 1 = 21;
e = 1 400 – 1 000 = 400
Posición del cuartil 2: 2N / 4 = 2(200) / 4 = 100 Li = 1 400;
N = 200;
fi = 65;
Fi – 1 = 79;
e = 1 800 – 1 400 = 400
Posición del cuartil 3: 3N / 4 = 3(200) / 4 = 150 Li = 1 800;
N = 200;
fi = 28;
Fi – 1 = 144;
e = 2 200 – 1 800 = 400
2) Hallar el cuartil 3 utilizando los siguientes datos no agrupados:
Dividendos
fi
Fi
1 600
2 000
21
2 000
2 400
78
99
2 400
2 800
85
184
2 800
3 200
48
232
3 200
3 600
36
268
3 600
4 000
20
288
4 000
4 400
12
300
Σ
21
300
Posición del cuartil 3: 3N / 4 = 3(300) / 4 = 225 Li = 2 800;
N = 300;
fi = 48;
Fi – 1 = 184;
z1 4 1 z
e = 3 200 – 2 800 = 400
E S TA D Ă? S T I C A I
Resolver los siguientes ejercicios propuestos, utilizando Cuartiles para Datos Agrupados:
1) Hallar el cuartil 1 utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 10 18 26 36 20 15 Resp: 146,25
2) Hallar el cuartil 2 utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 8 25 40 65 37 14 11 Resp: 89,15
3) Hallar el cuartil 3 utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 30 48 54 34 14 Resp: 1 592,59
4) Hallar el cuartil 1 utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 16 25 18 10 5 Resp: 2 875,00
5) Hallar el cuartil 2 utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 10 25 55 30 55 20 5 Resp: 73,33
z1 4 2 z
WA LT E R C É S P E D E S R A M Í R E Z
6) Hallar el cuartil 3 utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 10 26 35 35 10 9 Resp: 5 150,00
7) Hallar el cuartil 1 utilizando los siguientes datos agrupados: Ventas
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 54 48 34 30 14 Resp: 1 111,11
8) Hallar el cuartil 3 utilizando los siguientes datos agrupados: Utilidades
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 10 16 23 30 15 Resp: 5 666,67
3.3.2. Deciles (Di) Representan la décima parte de los datos, producto de dividir la totalidad de los datos en 10 partes iguales. Los deciles son nueve, que a partir del primer dato ordenado, se ubican: al 10% (decil1), al 20% (decil 2) y así sucesivamente hasta el último, al 90% (decil 9). Los deciles pueden ser hallados, tanto de datos no agrupados, como de datos agrupados.
3.3.2.1. Deciles para Datos no Agrupados Cuando la información o conjunto de datos no se encuentran agrupados, la posición o localización de los nueve deciles, es: D1 = 1(N+1) / 10; D2 = 2(N+1) / 10;
D3 = 3(N+1) / 10 ... D9 = 9(N+1) / 10
Si la posición es exacta, se toma el valor o dato de la posición; en caso contrario, el decil es hallado mediante la misma interpolación del cuartil para datos no agrupados. z1 4 3 z
E S TA D Í S T I C A I
Ejercicios resueltos 1) Hallar los deciles 4 y 7 utilizando los siguientes datos no agrupados: 156, 122, 159, 133, 158, 144, 138, 151, y 161 Ordenando los datos en forma creciente donde N = 9: Posición Dato
1
2
3
4
5
6
7
8
122
133
138
144
151
156
158
159
Ubicación del decil 4:
9 161
D4 = 4(N + 1) / 10 = 4(9 + 1) / 10 = 4
D4 = es el dato de la posición 4 = 144 Ubicación del decil 7:
D7 = 7(N + 1) / 10 = 7(9 + 1) / 10 = 7
D7 = es el dato de la posición 7 = 158 2) Hallar el decil 6 utilizando los siguientes datos no agrupados: 58, 62, 77, 28, 71, 59, 35, 58, 63, 44, 38, 51, 68 y 61 Ordenando los datos en forma creciente donde N = 14: Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
13
14
28
35
38
44
51
58
58
59
61
62
63
68
71
77
Ubicación del decil 6:
D6 = 6(N + 1) / 10 = 6(14 + 1) / 10 = 9
D6 = es el dato de la posición 9 = 61 3) Hallar el decil 8 utilizando los siguientes datos no agrupados: 38, 16, 27, 28, 21, 21, 31, 19, 13, 24, 28, 15, 18, 27, 26 y 31 Ordenando los datos en forma creciente donde N = 16: Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13
15
16
18
19
21
21
24
26
27
27
28
28
31
31
38
Ubicación del decil 8:
D8 = 8(N + 1) / 10 = 8(16 + 1) / 10 = 13,6
Interpolación del D8 = 28 + 0,6(31 – 28) = 29,8 4) Hallar el decil 3 utilizando los siguientes datos no agrupados: 564, 572, 545, 459, 468, 497, 485, 651, 612 y 542. Ordenando los datos en forma creciente donde N = 10: Posición Dato
1
2
3
4
5
6
7
8
9
10
459
468
485
497
542
545
564
572
612
651
Ubicación del decil 3:
D3 = 3(N + 1) / 10 = 3(10 + 1) / 10 = 3,3
Interpolación del D3 = 485 + 0,3(497 – 485) = 488,6 z1 4 4 z
WA LT E R C É S P E D E S R A M Í R E Z
Resolver los siguientes ejercicios propuestos, utilizando Deciles para Datos no Agrupados:
1) Hallar el decil 3 utilizando los siguientes datos: 196, 105, 116, 188, 175, 110 y 127.
Resp:
112,4
2) Hallar el decil 7 utilizando los siguientes datos: 34, 46, 38, 41, 33, 44, 38, 47 y 32.
Resp:
44
3) Hallar el decil 9 utilizando los siguientes datos: 85, 74, 76, 58, 54, 62, 45, 77, 87, 67.
Resp:
86,8
4) Hallar el decil 2 utilizando los siguientes datos: 276 y 295, 274 y 269.
Resp:
252, 264, 287, 264, 268, 278, 281,
264
5) Hallar el decil 6 utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 573 y 1 562.
Resp:
1 569
6) Hallar el decil 8 utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457.
Resp:
24 783,6
3.3.2.2. Deciles para Datos Agrupados Cuando la información o conjunto de datos se encuentran agrupados, la posición o localización de los nueve deciles, es: D1 = 1N / 10;
D2 = 2N / 10;
D3 = 3N / 10
.
.
.
D9 = 9N / 10
Una vez localizada la posición del decil, se procede a utilizar el mismo procedimiento interpolatorio de la mediana para datos agrupados, pero esta vez se realizará con la posición del decil.
z1 4 5 z
E S TA D Í S T I C A I
Donde: Posición= Número del decil por “N” entre 10 Li
=
Límite inferior de la clase donde está el decil
Ls
=
Límite superior de la clase donde está el decil
fi
=
Frecuencia absoluta de la clase donde está el decil
=
Frecuencia acumulada de la clase anterior a la posición del decil.
e
=
Amplitud o tamaño de la clase donde está el decil (e = Ls – Li)
Fi – 1
Ejercicios resueltos
1) Hallar los deciles: 1, 5 y 8; utilizando los siguientes datos agrupados:
Ventas (en Miles)
fi
Fi
5 600
6 000
121
121
6 000
6 400
158
279
6 400
6 800
265
544
6 800
7 200
128
672
7 200
7 600
116
788
7 600
8 000
110
898
8 000
8 400
102
1 000
Σ
1 000
Posición del decil 1: 1N / 10 = 1(1 000) / 10 = 100 Li = 5 600;
N = 1 000;
fi = 121;
Fi – 1 = 0;
e = 6 000 – 5 600 = 400
Posición del decil 5: 5N / 10 = 5(1 000) / 10 = 500 Li = 6 400;
N = 1 000;
fi = 265;
z1 4 6 z
Fi – 1 = 279;
e = 6 800 – 6 400 = 400
WA LT E R C É S P E D E S R A M Í R E Z
Posición del decil 8: 8N / 10 = 8(1 000) / 10 = 800 Li = 7 600;
N = 1 000;
fi = 110;
Fi – 1 = 788;
e = 8 000 – 7 600 = 400
2) Hallar el decil 7 utilizando los siguientes datos no agrupados:
Consumos
fi
Fi
1 600
1 900
21
1 900
2 200
78
99
2 200
2 500
85
184
2 500
2 800
48
232
2 800
3 100
36
268
3 100
3 400
20
288
3 400
3 700
12
300
Σ
21
300
Posición del decil 7: 7N / 10 = 7(300) / 10 = 210 Li = 2 500;
N = 300;
fi = 48;
Fi – 1 = 184;
e = 2 800 – 2 500 = 300
⎡ Posición − fi−1 ⎤ ⎡ 210 −184 ⎤ ⎥ e = 2500 + ⎢ D7 = Li + ⎢ ⎥ 300 = 2662,50 ⎢⎣ ⎥ ⎥⎦ ⎢⎣ fi 48 ⎦
z1 4 7 z
E S TA D Ă? S T I C A I
Resolver los siguientes ejercicios propuestos, utilizando Deciles para Datos Agrupados:
1) Hallar el decil 1 utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 10 18 26 36 20 15 Resp: 136,39
2) Hallar el decil 2 utilizando los siguientes datos agrupados: Toneladas
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 8 25 40 65 37 14 11 Resp: 76,75
3) Hallar el decil 3 utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 30 48 54 34 14 Resp: 1 241,67
4) Hallar el decil 4 utilizando los siguientes datos agrupados: Produc.
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 16 25 18 10 5 Resp: 3 400,00
5) Hallar el decil 6 utilizando los siguientes datos agrupados: Evaluaciones
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 10 25 55 30 55 20 5 Resp: 80,00
z1 4 8 z
WA LT E R C É S P E D E S R A M Í R E Z
6) Hallar el decil 7 utilizando los siguientes datos agrupados: Compras
500 1500
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
fi 10 26 35 35 10 9 Resp: 3 971,43
7) Hallar el decil 8 utilizando los siguientes datos agrupados: Ventas
80 100
100 120
120 140
140 160
160 180
180 200
fi 6 44 32 24 10 4 Resp: 151,67
8) Hallar el decil 9 utilizando los siguientes datos agrupados: Utilidades
3000 4000
4000 5000
5000 6000
6000 7000
7000 8000
8000 9000
fi 16 30 46 43 40 25 Resp: 8 200,00
3.3.3. Percentiles (Pi) Representan la centésima parte de los datos, producto de dividir la totalidad de los datos en 100 partes iguales. Los percentiles son noventainueve, que a partir del primer dato ordenado, se ubican: al 1% (percentil1), al 2% (percentil 2) y así sucesivamente hasta el último, al 99% (percentil 99). Los percentiles pueden ser hallados, tanto de datos no agrupados, como de datos agrupados.
3.3.3.1. Percentiles para Datos no Agrupados Cuando la información o conjunto de datos no se encuentran agrupados, la posición o localización de los noventainueve percentiles, es: P1 = 1(N+1) / 100;
P2 = 2(N+1) / 100;
P3 = 3(N+1) / 100
P99 = 99(N+1) / 100 z1 4 9 z
. . .
E S TA D Í S T I C A I
Si la posición es exacta, se toma el valor o dato de la posición; en caso contrario, el percentil es hallado mediante la misma interpolación del cuartil o decil para datos no agrupados. Ejercicios resueltos 1) Hallar los percentiles 19 y 67 utilizando los siguientes datos no agrupados: 15, 6, 1, 22, 15, 9, 13, 3, 15, 8, 14, 4, 13, 8, 15, 1, 16, 10 y 19 Ordenando los datos en forma creciente donde N = 19:
Posición
1 2 3 4 5 6
7
8
9
10
11
12 13 14 15 16
Dato
1 1
8
9
10
13
13
14
3 4 6 8
Ubicación del percentil 19:
15 15 15
17
18
19
15 16
19
22
P19 = 19(N + 1) / 100 = 19(19 + 1) / 100 = 3,8
Interpolación del P19 = 3 + 0,8(4 – 3) = 3,8 Ubicación del percentil 67:
P67 = 67(N + 1) / 100 = 67(19 + 1) / 100 = 13,4
Interpolación del P67 = 15 + 0,4(15 – 15) = 15 2) Hallar los percentiles 52 y 91utilizando los siguientes datos no agrupados: 58, 62, 77, 28, 71, 59, 35, 58, 63, 44, 38, 51, 68 y 61
Ordenando los datos en forma creciente donde N = 14:
Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
13
14
28
35
38
44
51
58
58
59
61
62
63
68
71
77
Ubicación del percentil 52:
P52 = 52(N + 1) / 100 = 52(14 + 1) / 100 = 7,8
Interpolación del P52 = 58 + 0,8(59 – 58) = 58,8 Ubicación del percentil 91:
P91 = 91(N + 1) / 100 = 91(14 + 1) / 100 = 13,65
Interpolación del P91 = 71 + 0,65(77 – 71) = 74,9
z1 5 0 z
WA LT E R C É S P E D E S R A M Í R E Z
3) Hallar los percentiles 85 y 48 utilizando los siguientes datos no agrupados: 27, 28, 21, 21, 31, 19, 13, 24, 28, 15, 18, 27, 26 y 31
38, 16,
Ordenando los datos en forma creciente donde N = 16:
Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12 13
14
15
16
13
15
16
18
19
21
21
24
26
27
27
28
31
31
38
Ubicación del percentil 85:
28
P85 = 85(N + 1) / 100 = 85(16 + 1) / 100 = 14,45
Interpolación del P85 = 31 + 0,45(31 – 31) = 31 Ubicación del percentil 48:
P48 = 48(N + 1) / 100 = 48(16 + 1) / 100 = 8,16
Interpolación del P48 = 24 + 0,16(26 – 24) = 24,32
Resolver los siguientes ejercicios propuestos, utilizando Percentiles para Datos no Agrupados: 1) Hallar el percentil 23 utilizando los siguientes datos: 158, 162, 196, 105, 116, 188, 175, 110 y 127. Resp: 111,8 2) Hallar el percentil 37 utilizando los siguientes datos: 34, 46, 38, 41, 33, 44, 38, 47 y 32.
Resp: 36,8
3) Hallar el percentil 59 utilizando los siguientes datos: 85, 74, 76, 58, 54, 62, 45, 77, 87, 67.
Resp: 74,98
4) Hallar el percentil 78 utilizando los siguientes datos: 152, 164, 187, 164, 168, 178, 181, 276, 295, 274 y 269.
Resp:
274,72
5) Hallar el percentil 82 utilizando los siguientes datos: 252, 264, 287, 264, 268, 278, 281, 361, 355, 349 y 367.
Resp:
360,04
6) Hallar el percentil 66 utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 573 y 1 562. Resp: 1 572,6 7) Hallar el percentil 18 utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457.
Resp:
24 168,76 z1 5 1 z
E S TA D Í S T I C A I
3.3.3.2. Percentiles para Datos Agrupados Cuando la información o conjunto de datos se encuentran agrupados, la posición o localización de los noventainueve percentiles, es: P1 = 1N / 100;
P2 = 2N / 100;
P3 = 3N / 100
.
.
.
P99 = 99N / 100
Una vez localizada la posición del percentil, se procede a utilizar el mismo procedimiento interpolatorio de la mediana para datos agrupados, pero esta vez se realizará con la posición del percentil.
Donde:
Posición = Número del percentil por “N” entre 100 Li
=
Límite inferior de la clase donde está el percentil
Ls
=
Límite superior de la clase donde está el percentil
N
=
Número total de datos
fi
=
Frecuencia absoluta de la clase donde está el percentil
e
Fi – 1
= Frecuencia acumulada de la clase anterior a la posición del percentil. =
Amplitud o tamaño de la clase donde está el percentil (e = Ls – Li)
Ejercicios resueltos
1) Hallar los percentiles: 21, 62 y 93; utilizando los siguientes datos agrupados:
Remuneraciones
fi
Fi
600
1 000
21
21
1 000
1 400
58
79
1 400
1 800
65
144
1 800
2 200
28
172
2 200
2 600
16
188
2 600
3 000
10
198
3 000
3 400
2
200
Σ
200
z1 5 2 z
WA LT E R C É S P E D E S R A M Í R E Z
Posición del percentil 21: 21N / 100 = 21(200) / 100 = 42
Li = 1 000;
N = 200;
fi = 58;
Fi – 1 = 21;
e = 1 400 – 1 000 = 400
Posición del percentil 62: 62N / 100 = 62(200) / 100 = 124 Li = 1 400;
N = 200;
fi = 65;
Fi – 1 = 79;
e = 1 800 – 1 400 = 400
Posición del percentil 93: 93N / 100 = 93(200) / 100 = 186 Li = 2 200;
N = 200;
fi = 16;
Fi – 1 = 172;
e = 2 600 – 2 200 = 400
2) Hallar el percentil 33 utilizando los siguientes datos no agrupados:
Dividendos
fi
Fi
1 600
2 000
21
2 000
2 400
78
99
2 400
2 800
85
184
2 800
3 200
48
232
3 200
3 600
36
268
3 600
4 000
20
288
4 000
4 400
12
300
Σ
21
300
Posición del percentil 33: 33N / 100 = 33(300) / 100 = 99 Li = 2 000;
N = 300;
fi = 78;
z1 5 3 z
Fi – 1 = 21;
e = 2 400 – 2 000 = 400
E S TA D Ă? S T I C A I
Resolver los siguientes ejercicios propuestos, utilizando Percentiles para Datos Agrupados:
1) Hallar el percentil 95 utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 10 18 26 36 20 15 Resp: 180,83
2) Hallar el percentil 82 utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 8 25 40 65 37 14 11 Resp: 102,03
3) Hallar el percentil 73 utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 30 48 54 34 14 Resp: 1 577,78
4) Hallar el percentil 61 utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 16 25 18 10 5 Resp: 4 100,00
5) Hallar el percentil 42 utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 10 25 55 30 55 20 5 Resp: 68,91
z1 5 4 z
WA LT E R C Ă&#x2030; S P E D E S R A M Ă? R E Z
6) Hallar el percentil 37 utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 10 26 35 35 10 9 Resp: 3 792,86
7) Hallar el percentil 21 utilizando los siguientes datos agrupados: Ventas
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 54 48 34 30 14 Resp: 1 081,48
8) Hallar el percentil 16 utilizando los siguientes datos agrupados: Utilidades
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 10 16 23 30 15 Resp: 3 000,00
z1 5 5 z
L e c c i ó n
4
3.4. Propiedades de las medidas de posición Las medidas de posición que son medidas de resumen, porque representan generalmente de alguna manera a todos los datos, tienen un comportamiento distinto ante los cambios de origen y ante los cambios de escala.
3.4.1. Cambio de origen Si a los valores que toma una variable X (recorrido de la variable) se le suma o se le resta un determinado número, se produce un cambio de origen en la variable original. Las medidas de posición de la variable X sufren modificaciones por ese cambio de origen, aunque no todas. Si a la Variable Xa se le resta o adiciona “k”, resulta: Xb = Xa ± k. Entonces:
(Xb)
=
(Xa)
± k
Me (Xb) = Me (Xa) ± k Mo (Xb) = Mo (Xa) ± k
z1 5 7 z
E S TA D Í S T I C A I
3.4.2. Cambio de escala Si a los valores que toma una variable X (recorrido de la variable) se le multiplica o divide por un determinado número, se produce un cambio de escala en la variable original. Las medidas de posición central de la variable X sufren modificaciones por ese cambio de escala, salvo el coeficiente de variación.
Si a la Variable Xa se le multiplica “k”, resulta: Entonces:
(Xb) = k
Xb = Xa (a). (Xa)
Me (Xb) = k Me (Xa) Mo (Xb) = k Mo (Xa)
También, Si a la Variable Xa se le divide entre “k”, resulta: Xb = Xa / k. Entonces:
(Xb)
=
(Xa)
/k
Me (Xb) = Me (Xa) / k Mo (Xb) = Mo (Xa) / k
La comprobación de estas propiedades quedan para el lector, quién propondrá los ejercicios y cambios que crea conveniente.
z1 5 8 z
WA LT E R C É S P E D E S R A M Í R E Z
AUTOEVALUACIÓN Nº 3 1) ¿Cuál es el promedio de edad de una familia de 5 miembros, cuyas edades son: 3, 12, 17, 39 y 44 años? A) 24
B) 30
C) 29
D) 23
E) 26
2) Un alumno ha sido evaluado con los siguientes calificativos: 10, 16, 18, 11, 12 y 13. Si las cuatro primeras evaluaciones corresponden a notas de prácticas, la quinta es un examen que vale el doble que una práctica y la última es otro examen que vale el doble que el examen anterior. ¿Cuál es el promedio final del alumno? A) 12,22
B) 12,94
C) 13,10
D) 14,15
E) 13,85
3) Hallar la media aritmética utilizando los siguientes datos agrupados: Utilidades fi A) 2 220
1000 1500
1500 2000
2000 2500
2500 3000
3000 3500
3500 4000
15
30
23
16
10
6
B) 3 025
C) 2 918
D) 2 233
E) 3 251
4) Si las entradas para el futbol cuestan: 40 soles para adultos y 5 soles para niños, ¿cuál es la proporción de adultos pagantes para ver el fútbol si el promedio fue de 12 soles? A) 29,44%
B) 20.00%
C) 21,22%
D) 28,36%
E) 26,16%
5) ¿Cuál es el promedio geométrico de las variaciones anuales de una cuenta de ahorros sujeta a interés compuesto, si las variaciones son: 2 458, 2615,22, 2 815,45, 3014,17 y 3 312,26? A) 2 944,46
B) 2 827,39
C) 2 719,92
D) 2 189,96
E) 2 616,17
6) Hallar la media geométrica utilizando los siguientes datos agrupados: Depósitos
1000 1500
1500 2000
2000 2500
2500 3000
3000 3500
3500 4000
fi
18
45
88
36
20
13
A) 2 243,16
B) 2 150,25
C) 2 718,56
D) 3 012,15
E) 3 123,22
7) Un ciclista realiza tres veces el mismo recorrido ¿Cuál es el promedio de velocidad, si va a: 85, 90 y 60 Km por hora? A) 76,22 km/h
B) 80,12 km/h
C) 79,94 km/h z1 5 9 z
D) 81,15 km/h
E) 75,87 km/h
E S TA D Í S T I C A I
8) Hallar la media armónica o promedio de velocidad de operación de 5 operarias que producen: 350 artículos a 25 artículos por día, 320 artículos a 28 artículos por día, 320 artículos a 32 artículos por día, 380 artículos 30 artículos por día y 360 artículos a 20 artículos por día. A) 29,28 art/día
B) 20,18 art/día
C) 19,81 art/día
D) 20,16 art/día E) 26,17 art/día.
9) Hallar la mediana utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 573 1 587 y 1 562. A) 1 566
B) 1 573
C) 1 564
D) 1 568
E) 1 562
10) Hallar la mediana utilizando los siguientes datos agrupados: Azúcar (Kg)
140 145
145 150
150 155
155 160
160 165
165 170
fi 10 18 28 40 34 20 A) 149,254
B) 147,253
C) 157,375
D) 148,125
E) 152,150
11) Hallar la moda utilizando los siguientes datos agrupados: Avena (Kg)
140 145
145 150
150 155
155 160
160 165
165 170
fi 8 20 28 40 32 22 A) 157
B) 158
C) 155
D) 159
E) 156
12) Hallar el cuartil 3 utilizando los siguientes datos agrupados: Producción
1800 2000
2000 2200
2200 2400
2400 2600
2600 2800
fi 25 40 80 45 10 A) 2 541,45
B) 2 425,30
C) 2 395,58
D) 2 422,22
E) 2 512,15
13) Hallar el decil 7 utilizando los siguientes datos agrupados: Compras
80 100
100 120
120 140
140 160
160 180
180 200
200 220
fi 15 36 62 41 30 14 12 A) 154,54
B) 147,25
C) 149,45 z1 6 0 z
D) 151,12
E) 156,59
WA LT E R C Ă&#x2030; S P E D E S R A M Ă? R E Z
14) Hallar el percentil 65 utilizando los siguientes datos: 748, 758, 723, 756, 718, 719, 722, 735, 734, 782, 756, 727, 741, 745, 766, 771, 763, 790 y 756, A) 748
B) 756
C) 758
D) 763
E) 766
15) Hallar el percentil 34 utilizando los siguientes datos agrupados: Ventas
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 54 48 34 30 14 A) 1 049,54
B) 1 407,25
C) 1 125,17
D) 1 074,07
E) 1152,15
Respuestas de control 1. D, 2. C, 3. A, 4. B, 5. B, 6. A, 7. E, 8. E, 9. A, 10. C, 11. B, 12. D, 13. E, 14. B, 15. D
z1 6 1 z
E S TA D Í S T I C A I
GLOSARIO
Antilogaritmo.
Es la inversa del logaritmo, porque es la base que tiene como potencia el logaritmo.
Cálculo algebraico.
Se refiere a las operaciones matemáticas.
Datos Agrupados.
Es un conjunto de datos que ha sido ordenado en tablas de distribución de frecuencias.
Logaritmo.
Es el exponente al cual hay que elevar la base para obtener dicho número. Todo logaritmo tiene como base a un número mayor de 1, y el logaritmo mayormente utilizado es el logaritmo vulgar cuya base es 10.
Observación.
En sstadística, observación es sinónimo de dato.
Sumando.
Es un valor que se habrá de agregar, aunque algunas veces también puede disminuir.
Teoría de los Sondeos.
Es una medición tomada a partir de encuestas destinadas a conocer la opinión pública. Estas mediciones se realizan por medio de muestreos que, usualmente, están diseñados para representar las opiniones de una población llevando a cabo una serie de preguntas. Es un sondeo de opinión.
EXPLORACIÓN ON LINE http://www.tuveras.com/estadistica/estadistica02.htm http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml http://es.wikipedia.org/wiki/Mediana_(estad%C3%ADstica) http://es.wikipedia.org/wiki/Media_aritm%C3%A9tica
z1 6 2 z
c u a r t a
UNIDAD Medidas de Dispersión o de Variabilidad
Dispersión con relación a una medida de posición centarl: Desviación Media, Desviación Mediana, Varianza, Desviación Estándar Dispersióne entre medidas o entre datos de posición no central: Rango o recorrido de la variable, Variación Cuartílica, Variación Percentílica Dispersión relativa: Coeficiente de Variación, Variable Estándar, Otras medidas de dispersión relativa
OBJETIVO (S) GENERAL Aprender que las medidas de dispersión también son medidas de resumen que se caracterizan por determinar si los datos u observaciones, se encuentran concentrados o dispersos, ya que no es suficiente conocer la posición, sino que además es necesario conocerlos en conjunto como son. Las medidas de variabilidad, son de tres tipos: unas son determinadas con relación a una medida de tendencia central, otras son determinadas con relación a medidas o datos de tendencia no central, y finalmente existen medidas de variabilidad de carácter relativo. De los tipo de medidas de variabilidad mencionados, los dos primeros son de tipo absoluto, que permiten comparar variaciones entre unidades de la misma especie, por ello son utilizadas dentro de un conjunto de datos; mientras que las de carácter relativos, permiten comparar las variaciones entre dos o más conjuntos de datos aún con unidades de medidas diferentes. ESPECÍFICOS • Conocer el uso de las medidas de variabilidad con relación a las medidas de tendencia central, en donde se emplearán tanto los datos no agrupados como los agrupados, a través de la varianza y de la desviación estándar. • Saber cómo utilizar la variabilidad de los datos con relación a otras medidas de tendencia no central, también para datos agrupados, como no agrupados, a través de los diferentes rangos. • Determinar cómo se utiliza la dispersión relativa y cuál es su importancia al ser comparada con otros datos de otra magnitud.
L e c c i ó n
1
4.1. DISPERSIÓN CON RELACIÓN A UNA MEDIDA DE POSICIÓN CENTRAL
Mientras las medidas de posición indican los valores centrales hacia los cuales tienden los valores de las variables, las medidas de dispersión se pueden determinar con relación a una medida de tendencia central, que se encargan de definir el grado de variación o de desviación que existen entre ellos. Los valores centrales pierden significación cuando la dispersión es alta, razón por la cual estas medidas complementan las anteriores; además, la importancia de estas medidas de variabilidad, radica en que permite conocer como son los datos u observaciones en su conjunto, nos dice en qué medida si son más homogéneos o menos homogéneos.
4.1.1. Desviación Media (D X ) Es una medida de dispersión o de variabilidad de tipo absoluta, que se da en valores igualmente absolutos o sea sin signos. Se obtiene mediante la diferencia absoluta de cada una de las observaciones o datos con la media aritmética, divididos entre el número de datos; por ello, esta medida es conocida como un promedio de variaciones respecto a la media. Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión. Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha
z1 6 5 z
E S TA D Í S T I C A I
función al no ser derivable; es decir, que la medida independientemente de la variable no tiene un tratamiento de una función matemática continua, sino discreta. Conforme se presentan las observaciones dentro de una muestra o de una población, donde los datos pueden o no estar agrupados, la desviación media se define de la siguiente manera:
4.1.1.1. Desviación Media para Datos no Agrupados Cuando los datos u observaciones que se estudian o se investigan, no están agrupados en tablas de distribución de frecuencias, la deviación media se define de la siguiente manera:
Donde: Xi
=
Variable
=
Número total de datos o número de observaciones
=
Media Aritmética
N
Ejercicios resueltos 1) Hallar la desviación media utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución:
z1 6 6 z
WA LT E R C É S P E D E S R A M Í R E Z
2) Hallar la desviación media utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44. Solución:
3) Hallar la desviación media utilizando los siguientes datos: 1546, 4852, 5782, 3238,5258 y 6456. Solución:
z1 6 7 z
E S TA D Í S T I C A I
Resolver los siguientes ejercicios propuestos, utilizando Desviación Media para Datos no Agrupados:
1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar la desviación media por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.
Resp:
0,31
2) Hallar la desviación media de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55.
Resp:
7,75
3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue la desviación media de remuneraciones?
Resp:
748,80
4) Hallar la desviación media de los consumos de energía eléctrica mensual en Kw de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322.
Resp:
15,33
5) Hallar la desviación media de asistencia de: 118, 107, 115, 110 y 120.
Resp:
4,40
6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la desviación media.
Resp:
84,00
7) Hallar la desviación media de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.
Resp:
22,17
8) Hallar la desviación media de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302.
Resp:
26,33
4.1.1.2. Desviación Media para Datos Agrupados Cuando los datos u observaciones que se estudian o se investigan, se encuentran agrupados en tablas de distribución de frecuencias, la deviación media se define de la siguiente manera:
z1 6 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Donde: fi
= Frecuencia absoluta
n
= Número de marcas de clase o veces que cambia el valor de la variable
Xi = Variable o marca de clase
N = Suma de las frecuencias absolutas o total de datos u observaciones.
X
= Media Aritmética
Ejercicios resueltos
1) Hallar la desviación media utilizando los siguientes datos agrupados: Compras fi
25 35
35 45
45 55
55 65
65 75
75 85
85 95
95 105
16
24
25
40
35
30
20
10
Solución:
z1 6 9 z
E S TA D ร S T I C A I
2) Hallar la desviaciรณn media utilizando los siguientes datos agrupados: Consultas
251 259
260 268
2
12
fi
269
277
278 286
287 295
296 304
305 313
10
6
6
4
10
Soluciรณn:
3) Hallar la desviaciรณn media utilizando los siguientes datos agrupados:
Invitaciones fi
30 36 37 43 44 50 51 57 58 64 65 71 72 78 79 85 4
6
20
25
Soluciรณn:
z1 7 0 z
20
15
6
4
WA LT E R C É S P E D E S R A M Í R E Z
Resolver los siguientes ejercicios propuestos, utilizando Desviación Media para Datos Agrupados:
1) Hallar la desviación media utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 15 18 26 36 20 10 Resp: 12,06
2) Hallar la desviación media utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 11 25 40 65 37 14 8 Resp: 11,01
3) Hallar la desviación media utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 14 30 48 54 34 20 Resp: 230,08
4) Hallar la desviación media utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 4 16 25 18 12 5 Resp: 1064,06
z1 7 1 z
E S TA D Í S T I C A I
5) Hallar la desviación media utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 5 25 55 45 38 22 10 Resp: 11,66 6) Hallar la desviación media utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 14 26 35 28 17 5 Resp: 1 084,80
4.1.2. Desviación Mediana (DM) Es una medida de dispersión o de variabilidad de tipo absoluta, que se da en valores absolutos (sin signos), entre cada una de las observaciones o datos con la mediana, divididos entre el número de datos; por ello, esta medida es conocida como un promedio de variaciones respecto a la mediana. La desviación mediana debería también llamarse desviación absoluta respecto a la mediana. Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función ya que tampoco es derivable; es decir, que la medida independientemente de la variable no tiene un tratamiento de una función continua, sino un tratamiento discreto. Además como ya es conocido, si la medina es utilizada cuando los datos no tienen una media representativa, esta medida solo tiene real importancia solo en estos casos. Conforme se presentan las observaciones dentro de una muestra o de una población, donde los datos pueden o no estar agrupados, la desviación mediana que es utilizable cuando la media aritmética pierde credibilidad, sobre todo por la gran influencia de valores extremos, se define esta medida de dispersión de la siguiente manera:
4.1.2.1. Desviación Mediana para Datos no Agrupados Cuando los datos u observaciones que se estudian o se investigan, no están agrupados en tablas de distribución de frecuencias, la deviación mediana se define de la siguiente manera:
z1 7 2 z
WA LT E R C É S P E D E S R A M Í R E Z
Donde: Xi
=
Variable
=
Número total de datos o número de observaciones
Me
=
Mediana
N
Ejercicios resueltos
1) Hallar la desviación mediana utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424.
Solución: Ordenando los datos en forma creciente, se tiene:
Posición de la Me = (N+1) / 2 = (11+1) / 2 = 6
Me = 424
2) Hallar la desviación mediana utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44.
Solución: Ordenando los datos en forma creciente, se tiene:
Posición de la Me = (N+1) / 2 = (10+1) / 2 = 5,5
z1 7 3 z
Me = (47 + 48) / 2 = 47,5
E S TA D Í S T I C A I
3) Hallar la desviación mediana utilizando los siguientes datos: 1546, 4852, 5782, 3238,5258 y 6456. Solución: Ordenando los datos en forma creciente, se tiene:
Posición de la Me = (N+1) / 2 = (6+1) / 2 = 3,5
Me = (4 852 + 5 258) / 2 = 5 055
Resolver los siguientes ejercicios propuestos, utilizando Desviación Mediana para Datos no Agrupados:
1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar la desviación mediana por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.
Resp:
0,31
2) Hallar la desviación mediana de los siguientes jornales: 65, 58, 67, 72, 75, 85, 60 y 55.
Resp:
7,63
3) Si un trabajador durante 5 años obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue la desviación mediana de remuneraciones?
Resp:
710,00
4) Hallar la desviación mediana de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 323.
Resp:
14,92
5) Hallar la desviación mediana de asistencia de: 118, 107, 115, 110 y 120.
Resp:
4,20
6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la desviación mediana.
Resp:
82,86 z1 7 4 z
WA LT E R C É S P E D E S R A M Í R E Z
7) Hallar la desviación mediana de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.
Resp:
21,33
8) Hallar la desviación mediana de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302. Resp:
26,17
4.1.2.2. Desviación Mediana para Datos Agrupados Cuando los datos u observaciones que se investigan o se analizan, se encuentran agrupados en tablas de distribución de frecuencias, la deviación mediana se define de la siguiente manera:
Donde: fi Xi
=
Frecuencia absoluta
=
Variable o marca de clase
n
=
Número de marcas de clase o veces que cambia el valor de la variable
N
=
Suma de las frecuencias absolutas o total de datos u observaciones.
Me =
Mediana
Ejercicios resueltos 1) Hallar la desviación mediana utilizando los siguientes datos agrupados:
Rem. fi
600 1000 21
1000 1400 1400 1800 58
65
z1 7 5 z
1800 2200
2200 2600
2600 3000
28
16
12
E S TA D Í S T I C A I
Solución:
Posición de la mediana: N / 2 = 200 / 2 = 100 Li = 1 400;
N = 200;
fi = 65;
Fi – 1 = 79;
e = 1 800 – 1 400 = 400
⎡ 100 − 79 ⎤ Me = 1400 + ⎢ ⎥ 400 = 1529, 23 ⎥⎦ ⎢⎣ 65
2) Hallar la desviación mediana utilizando los siguientes datos agrupados:
Ventas (en millones)
2
fi
6 16
6 10
10 14
14 18
18 22
22 26
22
62
40
36
24
Solución:
Posición de la mediana: N / 2 = 200 / 2 = 100 Li = 10;
N = 200;
fi = 62;
z1 7 6 z
Fi – 1 = 38;
e = 14 – 10 = 4
WA LT E R C É S P E D E S R A M Í R E Z
3) Hallar la desviación mediana utilizando los siguientes datos agrupados:
Alumnos fi
20 40 4
40 60 16
60 80
80 100
36
40
100 120 120 140 26
19
140 160 160 180 5
4
Solución:
Posición de la mediana: N / 2 = 150 / 2 = 75 Li = 80;
N = 150;
fi = 40;
z1 7 7 z
Fi – 1 = 56;
e = 100 – 80 = 20
E S TA D Í S T I C A I
Resolver los siguientes ejercicios propuestos, utilizando Desviación Mediana para Datos Agrupados:
1) Hallar la desviación mediana utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 10 18 26 36 20 15 Resp: 11,72 2) Hallar la desviación mediana utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 8 25 40 65 37 14 11 Resp: 10,83 3) Hallar la desviación mediana utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 20 30 48 54 34 14 Resp: 231,85 4) Hallar la desviación mediana utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 6 16 25 18 10 5 Resp: 1 051,00 5) Hallar la desviación mediana utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 10 25 55 45 38 22 5 Resp: 11,88 6) Hallar la desviación mediana utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 10 26 35 28 17 9 Resp: 1 114,97
z1 7 8 z
WA LT E R C É S P E D E S R A M Í R E Z
4.1.3. Varianza (S2) Es la medida estadística de dispersión de tipo absoluta que mide el grado de variabilidad que sintetiza el grado de homogeneidad o heterogeneidad de las diferencias individuales entre los casos de una muestra o de una población respecto de una variable numérica. En Estadística se acostumbra para diferenciar una varianza de una muestra, con la varianza de una población, simbolizando a la muestra como S2 y a la población como σ2. La varianza es el promedio de las diferencias o desviaciones al cuadrado de cada una de las observaciones respecto a la media aritmética. Existe un método abreviado que es la diferencia entre el momento de orden 2 con relación al origen (definido en la siguiente unidad), con la media aritmética al cuadrado; la varianza es de mucha utilidad en Estadística debido a que es una función derivable; es decir, que la medida independientemente de la variable tiene un tratamiento de una función matemática continua. En teoría de Probabilidad y Estadística la varianza es un estimador de la divergencia de una variable aleatoria X2 de su valor esperado E[x]2; esta definición de la varianza, es la misma que se definió como método abreviado; donde, la variable aleatoria al cuadrado es el momento del orden 2, y el valor esperado al cuadrado es la media aritmética al cuadrado. La varianza se da en unidades al cuadrado, por lo que se recomienda al calcular esta medida de dispersión, adicionar al resultado obtenido u2. Conforme se presentan las observaciones dentro de un conjunto de datos, donde los datos pueden o no estar agrupados, la varianza se define de la siguiente manera:
4.1.3.1. Varianza para Datos no Agrupados Cuando los datos u observaciones que se estudian o se investigan, no están agrupados en tablas de distribución de frecuencias, la varianza se define de la siguiente manera:
Donde: Xi
N
X
=
Variable
=
Número total de datos o número de observaciones
=
Media Aritmética z1 7 9 z
E S TA D Í S T I C A I
Ejercicios resueltos
1) Hallar la varianza utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424.
Solución:
Si usted utiliza la segunda fórmula (denominada abreviada, porque la desviación o diferencia, se realiza al final), se obtiene el mismo resultado que obtuvo con la primera fórmula. 2) Hallar la varianza utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44. Solución:
z1 8 0 z
WA LT E R C É S P E D E S R A M Í R E Z
3) Hallar la varianza utilizando los siguientes datos: 1546, 4852, 5782, 3238, 5258 y 6456. Solución:
Resolver los siguientes ejercicios propuestos, utilizando Varianza para Datos no Agrupados:
1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar la varianza por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.
Resp:
0,17 u2
2) Hallar la varianza de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55. Resp:
86,5 u2
3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue la varianza de remuneraciones?
Resp:
769 784 u2
z1 8 1 z
E S TA D Í S T I C A I
4) Hallar la varianza de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322. Resp: 361,17 u2 5) Hallar la varianza de asistencia de: 118, 107, 115, 110 y 120.
Resp:
23,60 u2
6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la varianza.
Resp:
9 435,43 u2
7) Hallar la varianza de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.
Resp:
728 u2
8) Hallar la varianza de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302.
Resp:
1 261,17 u2
4.1.3.2. Varianza para Datos Agrupados Cuando los datos u observaciones que se estudian o se investigan, se encuentran agrupados en tablas de distribución de frecuencias, la varianza se define de la siguiente manera:
Donde: fi
=
Frecuencia absoluta
Xi
=
Variable o marca de clase
n
= Número de marcas de clase o veces que cambia el valor de la variable
N
=
Suma de las frecuencias absolutas o total de datos u observaciones.
X
=
Media Aritmética
Utilizando la segunda fórmula que es denominada abreviada, se obtiene el mismo resultado que obtuvo con la primera, como se sabe, lo mismo ocurre con los datos no agrupados.
z1 8 2 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos 1) Hallar la varianza utilizando los siguientes datos agrupados:
Compras fi
25 35
35 45
45 55
55 65
65 75
75 85
85 95
95 105
16
24
25
40
35
30
20
10
Solución:
2) Hallar la varianza utilizando los siguientes datos agrupados:
Consultas fi
251 259
260 268
2
12
269
277
278 286
287 295
296 304
305 313
10
6
6
4
10
Solución:
z1 8 3 z
E S TA D Ă? S T I C A I
3) Hallar la varianza utilizando los siguientes datos agrupados:
Invitaciones fi
30 36 37 43 44 50 51 57 58 64 65 71 72 78 79 85 4
6
20
25
20
15
6
4
SoluciĂłn:
Resolver los siguientes ejercicios propuestos, utilizando Varianza para Datos Agrupados:
1) Hallar la varianza utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 15 18 26 36 20 10 Resp: 205,67 u2 z1 8 4 z
WA LT E R C É S P E D E S R A M Í R E Z
2) Hallar la varianza utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 11 25 40 65 37 14 8 Resp: 199,11 u2 3) Hallar la varianza utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
fi 14 30 48 54 34 20 Resp: 75 824 u2 4) Hallar la varianza utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
fi 4 16 25 18 12 5 Resp: 1 617 343,75 u2 5) Hallar la varianza utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 5 25 55 45 38 22 10 Resp: 207,84 u2 6) Hallar la varianza utilizando los siguientes datos agrupados: Compras
1500 2500
2500 3500
3500 4500
4500 5500
5500 6500
6500 7500
fi 14 26 35 28 17 5 Resp: 1 750 144 u2
4.1.4. Desviación Estándar (S) Es la medida estadística de dispersión de tipo absoluta que mide el grado de variabilidad en la misma unidad de origen. En Estadística se acostumbra para diferenciar una desviación estándar de una muestra, con la desviación estándar de una población, simbolizando a la muestra como S y a la población como σ.
z1 8 5 z
E S TA D Í S T I C A I
La desviación estándar o desviación típica es la raíz cuadrada de la varianza, es de mucha utilidad en estadística debido a que conserva las bondades de la varianza y además se expresa en la misma unidad de las observaciones que se investiga. Conforme se presentan las observaciones dentro de un conjunto de datos, donde los datos pueden o no estar agrupados, la desviación estándar se define de la siguiente manera:
4.1.4.1. Desviación Estándar para Datos no Agrupados Cuando los datos u observaciones que se estudian o se investigan, no están agrupados en tablas de distribución de frecuencias, la desviación estándar se define de la siguiente manera:
Donde: Xi
= Variable
N
= Número total de datos o número de observaciones
X
= Media Aritmética
Usted puede utilizar cualquiera de las fórmulas arriba indicadas, porque con ambas se obtiene el mismo resultado. Comparando las medidas de dispersión con relación a una medida central, se tiene: DM ≤ D ≤ S
z1 8 6 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos
1) Hallar la desviación estándar utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424.
Solución:
2) Hallar la desviación estándar utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44. Solución:
z1 8 7 z
E S TA D Í S T I C A I
3) Hallar la desviación estándar utilizando los siguientes datos: 1546, 4852, 5782, 3238, 5258 y 6456. Solución:
Resolver los siguientes ejercicios propuestos, utilizando Desviación Estándar para Datos no Agrupados:
1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar la desviación estándar por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.
Resp:
0,41
2) Hallar la desviación estándar de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55.
Resp:
9,30
3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue la desviación estándar de remuneraciones?
Resp:
877,37
4) Hallar la desviación estándar de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322.
Resp:
19,00
5) Hallar la desviación estándar de asistencia de: 118, 107, 115, 110 y 120
Resp:
4,86 z1 8 8 z
WA LT E R C É S P E D E S R A M Í R E Z
6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar la desviación estándar.
Resp:
97,14
7) Hallar la desviación estándar de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.
Resp:
26,98
8) Hallar la desviación estándar de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302.
Resp:
35,51.
4.1.4.2. Desviación Estándar para Datos Agrupados Cuando los datos u observaciones que se estudian o se investigan, se encuentran agrupados en tablas de distribución de frecuencias, la desviación estándar se define de la siguiente manera:
Donde: fi
= Frecuencia absoluta
Xi
=
Variable o marca de clase
n
=
Número de marcas de clase o veces que cambia el valor de la variable
N
=
Suma de las frecuencias absolutas o total de datos u observaciones.
X = Media Aritmética Usted puede utilizar cualquiera de las fórmulas arriba indicadas, porque con ambas se obtiene el mismo resultado.
Ejercicios resueltos 1) Hallar la desviación estándar utilizando los siguientes datos agrupados:
Compras fi
25 35
35 45
45 55
55 65
65 75
75 85
85 95
95 105
16
24
25
40
35
30
20
10
z1 8 9 z
E S TA D ร S T I C A I
Soluciรณn:
2) Hallar la desviaciรณn estรกndar utilizando los siguientes datos agrupados:
Consultas fi
251 259
260 268
2
12
269
277
10
Soluciรณn:
z1 9 0 z
278 286
287 295
296 304
305 313
10
6
6
4
WA LT E R C É S P E D E S R A M Í R E Z
3) Hallar la desviación estándar utilizando los siguientes datos agrupados:
Invitaciones fi
30 36 37 43 44 50 51 57 58 64 65 71 72 78 79 85 4
6
20
25
20
15
6
4
Solución:
Resolver los siguientes ejercicios propuestos, utilizando Desviación Estándar para Datos Agrupados:
1) Hallar la desviación estándar utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 15 18 26 36 20 10 Resp: 14,34
2) Hallar la desviación estándar utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 11 25 40 65 37 14 8 Resp: 14,11
z1 9 1 z
E S TA D Í S T I C A I
3) Hallar la desviación estándar utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
14 30 48 54 34 20 fi Resp: 275,36
4) Hallar la desviación estándar utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
4 16 25 18 12 5 fi Resp: 1 271,75
5) Hallar la desviación estándar utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
5 25 55 45 38 22 10 fi Resp: 14,42
6) Hallar la desviación estándar utilizando los siguientes datos agrupados: Compras
1500
2500
3500
4500
5500
6500
2500
3500
4500
5500
6500
7500
14 26 35 28 17 5 fi Resp: 1 322,93
z1 9 2 z
L e c c i ó n
2
4.2. DISPERSIÓN ENTRE MEDIDAS O ENTRE DATOS DE POSICIÓN NO CENTRAL
Otra manera de medir la variabilidad que presentan las observaciones o datos, es haciendo comparaciones entre valores que se encuentren por arriba y por debajo de un valor central; esta forma de dispersión, se denomina rango y se da en forma absoluta. Si la dispersión se realiza entre dos cuantiles, se dice que es una variación o rango entre medidas. Cuando la dispersión se realiza entre dos valores extremos, el rango resultante, se denomina recorrido de la variable que es una variación entre datos. El rango carece de significado, si es que los valores que lo determinan, no tiene una posición conocida. Existen varios tipos de rangos, pero los más importantes por el uso que le da la Estadística, son los siguientes:
4.2.1. Rango Simple (R) Es una variación entre datos, porque es la diferencia entre el mayor y el menor valor observado entre todos los datos, por ello representa el recorrido de toda la variable. Posee limitaciones similares a la de la moda, porque en el rango no intervienen los demás datos, solo intervienen los valores extremos. z1 9 3 z
E S TA D Í S T I C A I
Estadística utiliza este tipo de rango en la construcción de las tablas de distribución de frecuencias por intervalos o clase, como el rango es una diferencia numérica entre dos valores, solo se aplica a variables cuantitativas. La relación del rango con la desviación media, es la siguiente: 0 ≤ D ≤ ½R
4.2.1.1. Rango Simple de Variable Discreta El recorrido de la variable para variables discretas, se define de la siguiente manera: R = Dato máximo – Dato mínimo + 1
Ejercicios resueltos 1) Hallar el rango simple del número de asistente a un ciclo de conferencias: 648, 628, 625, 649, 712, 572, 549 y 616. Solución: Dato máximo =
712
Dato mínimo = 549
R = 712 – 549 + 1 = 164
2) Hallar el rango simple del número de matrículas por ciclo académico: 129, 96, 225, 64, 71, 172, 59, 110, 124 y 116. Solución: Dato máximo =
225
Dato mínimo = 59
R = 225 – 59 + 1 = 167
3) Hallar el rango simple del número de consultas diarias en una semana a una página web: 3 547, 2 879, 5 916, 10 453, 1 567, 5 789 y 8 543. Solución: Dato máximo =
10 453
Dato mínimo = 1 567
R = 10 453 – 1 567 + 1 = 8 887
z1 9 4 z
WA LT E R C É S P E D E S R A M Í R E Z
Resolver los siguientes ejercicios propuestos, utilizando Rango Simple de Variable Discreta: 1) Si 7 tiendas venden el mismo producto en las siguientes cantidades, hallar el rango simple: 15, 20, 13, 50, 17, 80 y 50.
Resp:
66
2) Hallar el rango simple de las siguientes compras en unidades: 65, 58, 66, 72, 75, 85, 60 y 55. Resp: 31 3) Si un anualmente una página web es visitada por: 27 900, 26 450, 29 450 30 820 y 30 450 personas. ¿Cuál fue el rango simple del número de visitas a la página web? Resp: 4 371 4) Hallar el rango simple del número de quejas anuales de clientes: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322.
Resp: 66
5) Hallar el rango simple de asistencia de: 118, 107, 115, 110 y 120.
Resp:
14
6) Las visitas anuales durante 7 años a un museo son: 1 785, 1 489, 1 758, 1 648, 1 797, 1 596 y 1 619 unidades, hallar el rango simple.
Resp:
309
7) Hallar el rango simple de las siguientes reclamos anuales a Indecopi: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162.
Resp:
83
8) Hallar el rango simple del número de consumos con error de facturación: 328, 381, 250, 350, 273, 255, 298, 312, 305, 201, 317 y 302.
Resp: 181
4.2.1.2. Rango Simple de Variable Continua El recorrido de la variable para variables continuas, se define de la siguiente manera: R = Dato máximo – Dato mínimo
z1 9 5 z
E S TA D Í S T I C A I
Ejercicios resueltos 1) Hallar el rango simple del número de las ventas diarias de una tienda: 64,80; 62,80; 62,50; 64,90; 71,20; 57,20; 54,90 y 61,60 soles. Solución: Dato máximo =
71,20
Dato mínimo = 54,90
R = 71,20 – 54,90 = 16,30 soles
2) Hallar el rango simple de las edades de un grupo de escolares: 12, 10, 9, 13, 14, 16, 17, 7, 8, 9, 11, 13, 15, 17, 15 y 10 años. Solución: Dato máximo =
17
Dato mínimo = 7
R = 17 – 7 = 10 años
3) Si la producción anual de una empresa es la siguiente: 104,80; 162,80; 162,50; 164,90; 101,20; 357,20; 154,90 y 261,60 toneladas, hallar el rango simple. Solución: Dato máximo =
357,20
Dato mínimo = 101,20
R = 357,20 – 101,20 = 256,00 toneladas.
Resolver los siguientes ejercicios propuestos, utilizando Rango Simple de Variable Continua:
1) Si 7 tiendas venden el mismo producto a los siguientes precios: 12,20; 12,80; 13,00; 12,90; 13,50 y 13,10, hallar el rango simple.
Resp:
13,50;
1,30
2) Hallar el rango simple de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55.
Resp: 30
3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el rango simple de remuneraciones? Resp: 2 550
z1 9 6 z
WA LT E R C É S P E D E S R A M Í R E Z
4) Hallar el rango simple de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322. Resp:
65
5) Hallar el rango simple de compras de: 118, 107, 115, 110 y 120. Resp:
13
6) Las ventas anuales durante 7 años son: 1 785, 1 489, 1 758, 1 648, 1 597, 1 596 y 1 719 unidades, hallar el rango simple. Resp:
296
7) Hallar el rango simple de las siguientes estaturas en centímetros: 128, 182, 135, 205, 203, 175, 196, 123, 175, 169, 187 y 162. Resp:
82
8) Hallar el rango simple de los consumos de agua por m3 de un usuario durante 1 año: 328, 381, 250, 350, 273, 255, 298, 312, 305, 301, 317 y 302. Resp:
131
4.2.2. Variación Cuartílica (Q) Se denomina también rango entre cuartiles o recorrido Inter cuartil, es una variación entre medidas porque es la diferencia entre los valores del tercer cuartil menos el valor del primer cuartil. Es una medida suplementaria de la mediana, abarcando un 50% de la distribución, dejando un 25 % para cada lado, esta medida de dispersión tiene las mismas limitaciones que la mediana y es utilizada mayormente en el cálculo de asimetría, que es una medida de forma que se verá en la siguiente unidad. La variación o desviación cuartílica se define de la siguiente manera: Q = Q3 – Q1 A pesar de tener una sola definición la variación cuartílica, en adelante se verá por separado este tipo de variación, porque los cuartiles tienen cálculo distinto, dependiendo como se presenten las observaciones.
z1 9 7 z
E S TA D Í S T I C A I
En algunas ocasiones, Estadística utiliza la variación cuartílica como Rango-semi-inter-cuartílico en el cálculo de kurtosis, que es otra medida de forma que se verá en la siguiente unidad. El Rango-semi-inter-cuartílico, se define de la siguiente manera: RQ = (Q3 – Q1) / 2
4.2.2.1. Variación Cuartílica para Datos no Agrupados Conociendo que tanto la ubicación como el valor del cuartil, se determinan de manera diferente dependiendo de cómo se presentan los datos, en esta sección solo se verán ejercicios para datos no agrupados.
Ejercicios resueltos
1) Hallar la variación cuartílica utilizando los siguientes datos no agrupados: 125, 536, 485, 789, 584, 725 y 649. Solución: Ordenando los datos en forma creciente donde N = 7: Posición Dato
1
2
3
4
5
6
7
125
485
536
584
649
725
789
Ubicación del cuartil 1:
Q1 = 1(N + 1) / 4 = 1(7 + 1) / 4 = 2
Q1 = es el dato de la posición 2 = 485 Ubicación del cuartil 3:
Q3 = 3(N + 1) / 4 = 3(7 + 1) / 4 = 6
Q3 = es el dato de la posición 6 = 725 Q = 725 – 485 = 240
2) Hallar la variación cuartílica utilizando los siguientes datos no agrupados: 37, 52, 67, 19, 33, 50, 62, 44, 58 y 61 Solución: Ordenando los datos en forma creciente donde N = 12:
Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
19
25
33
36
37
44
50
52
58
61
62
67
z1 9 8 z
25, 36,
WA LT E R C É S P E D E S R A M Í R E Z
Ubicación del cuartil 1:
Q1 = 1(N + 1) / 4 = 1(12 + 1) / 4 = 3,25
Interpolación del Q1 = 33 + 0,25(36 – 33) = 33,75 Ubicación del cuartil 3:
Q3 = 3(N + 1) / 4 = 3(12 + 1) / 4 = 9,75
Interpolación del Q3 = 58 + 0,75(61 – 58) = 60,25 Q = 60,25 – 33,75 = 26,5 3) Hallar la variación cuartílica utilizando los siguientes datos no agrupados: 56, 62, 74, 22, 71, 59, 33, 58, 63, 44, 38, 51, 68 y 61
Solución: Ordenando los datos en forma creciente donde N = 14: Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
13
14
22
33
38
44
51
56
58
59
61
62
63
68
71
74
Ubicación del cuartil 1:
Q1 = 1(N + 1) / 4 = 1(14 + 1) / 4 = 3,75
Interpolación del Q1 = 38 + 0,75(44 – 38) = 42,5 Ubicación del cuartil 3:
Q3 = 3(N + 1) / 4 = 3(14 + 1) / 4 = 11,25
Interpolación del Q3 = 63 + 0,25(68 – 63) = 64,25 Q = 64,25 – 42,5 = 21,75
Resolver los siguientes ejercicios propuestos, utilizando Variación Cuartílica para Datos no Agrupados:
1) Hallar la variación cuartílica utilizando los siguientes datos: 96, 105, 116, 88, 75, 110 y 127.
Resp:
28
2) Hallar la variación cuartílica utilizando los siguientes datos: 24, 26, 28, 31, 33, 24, 28, 27 y 22.
Resp:
5,5
3) Hallar la variación cuartílica utilizando los siguientes datos: 45, 77, 87.
Resp:
85, 74, 76, 58, 54, 62,
25
4) Hallar la variación cuartílica utilizando los siguientes datos: 287, 264, 168, 278, 218, 267 y 290.
Resp:
69
z1 9 9 z
E S TA D Í S T I C A I
5) Hallar la variación cuartílica utilizando los siguientes datos: 252, 264, 287, 264, 268, 278, 281, 276 y 295.
Resp:
20
6) Hallar la variación cuartílica utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 571 y 1 562.
Resp:
29
7) Hallar la variación cuartílica utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457.
Resp:
500
8) Hallar la variación cuartílica utilizando los siguientes datos: 30 522, 30 264, 30 870, 30 229, 30 618, 30 527, 30 281, 30 760 y 30 955.
Resp:
542,5
4.2.2.2. Variación Cuartílica para Datos Agrupados Conociendo que tanto la ubicación como el valor del cuartil, se determinan de manera diferente dependiendo de cómo se presentan los datos, en esta sección solo se verán ejercicios para datos agrupados.
Ejercicios resueltos
1) Hallar la variación cuartílica de la siguiente distribución de jornales por semana en soles: Jornales
455 465
465 475
475 485
485 495
495 505
505 515
515 525
35
40
30
18
12
10
5
455 465
465 475
475 485
485 495
495 505
505 515
515 525
fi
35
40
30
18
12
10
5
Fi
35
75
105
123
135
145
150
fi Solución: Jornales
Q1 = 465 + [(37,5 – 35) / 40] 10 = 465,63 Q3 = 485 + [(112,5 – 105) / 18] 10 = 489,17 Q
= 489,17 – 465,63 = 23,54 soles
z2 0 0 z
WA LT E R C É S P E D E S R A M Í R E Z
2) Hallar la variación cuartílica utilizando la siguiente distribución de estaturas en centímetros: Estat. 135 145 145 155 fi
15
155 165
165 175
45
65
25
175 185 185 195 195 205 25
20
5
Solución: Estat. 135 145 145 155 155 165 165 175 175 185
185 195 195 205
fi
15
25
45
65
25
20
5
Fi
15
40
85
150
175
195
200
Q1 = 155 + [(50 – 40) / 45] 10 = 157,22 Q3 = 165 + [(150 – 85) / 65] 10 = 175 Q
= 175 – 157,22 = 17,78 centímetros
Resolver los siguientes ejercicios propuestos utilizando Variación cuartílica:
1) Hallar la variación cuartílica utilizando las siguientes calificaciones: Calificación
02
fi
Resp:
05
05
6
08
08
12
11
11
32
14
14
30
17
17
16
20 4
4,84
2) Hallar la variación cuartílica utilizando las siguientes remuneraciones: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp:
685,71
3) Hallar la variación cuartílica utilizando las siguientes ventas: Ventas (miles) fi
Resp:
02
06 16
06
10
10
22
8,34
z2 0 1 z
14 62
14
18 40
18
22 36
22
26 24
E S TA D Í S T I C A I
4) Hallar la variación cuartílica utilizando las tallas de las siguientes personas: Personas fi
Resp:
55
65
75
85
95
105
115
125
24
26
28
28
26
30
26
12
36
5) Hallar la variación cuartílica utilizando las siguientes evaluaciones: Evaluación
02
fi
Resp:
05
05
16
08
08
18
11
11
32
14
14
36
17
17
12
20 6
5,67
6) Hallar la variación cuartílica utilizando los siguientes sueldos: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
715,35
7) Hallar la variación cuartílica utilizando las siguientes ventas: Ventas (miles)
12
fi
Resp:
16
16
20
20
20
24
24
24
26
28
28 32
20
16
32
36 14
10,33
8) Hallar la variación cuartílica utilizando las evaluaciones de los siguientes alumnos: Alumnos fi
Resp:
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
42,97
9) Hallar la variación cuartílica utilizando las siguientes pensiones: Pensiones
800
fi 4 Resp: 107,42
850
900
950
1000
1050
1100
1150
16
36
40
26
19
5
4
z2 0 2 z
WA LT E R C É S P E D E S R A M Í R E Z
4.2.3. Variación Percentílica (P) Se denomina también rango entre percentiles o recorrido Inter percentil, es un tipo de variación o rango entre medidas, porque se obtiene mediante la diferencia entre el valor del percentil noventa menos el valor del percentil diez. Es una medida suplementaria de la mediana, abarcando un 80% de la distribución, dejando un 10 % para cada lado, esta medida de dispersión tiene las mismas limitaciones que la mediana y es utilizada mayormente en el cálculo de asimetría y kurtosist, que son medidas de forma que se verán en la siguiente unidad. La variación o desviación percentílica se define de la siguiente manera:
P = P90 – P10 A pesar de tener una sola definición la variación percentílica, en adelante se verá por separado este tipo de variación, porque los percentiles tienen cálculo distinto, dependiendo como se presenten las observaciones.
4.2.3.1. Variación Percentílica para Datos no Agrupados Conociendo que tanto la ubicación como el valor del percentil, se determinan de manera diferente dependiendo de cómo se presentan los datos, en esta sección solo se verán ejercicios para datos no agrupados.
Ejercicios resueltos 1) Hallar la variación percentílica utilizando los siguientes datos no agrupados: 1, 22, 15, 9, 13, 3, 15, 8, 14, 4, 13, 8, 15, 1, 16, 10 y 19
15, 6,
Ordenando los datos en forma creciente donde N = 19: Posición 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Dato
1
3
4
6
8
8
9
10
13
13
14
15
15
15
15
16
19
22
1
Ubicación del percentil 10:
P10 = 10(N + 1) / 100 = 10(19 + 1) / 100 = 2
P10 = es el dato de la posición 2 = 1 Ubicación del percentil 90:
P90 = 90(N + 1) / 100 = 90(19 + 1) / 100 = 18
P90 = es el dato de la posición 18 = 19
P = 19 – 1 = 18
z2 0 3 z
E S TA D Í S T I C A I
2) Hallar la variación percentílica utilizando los siguientes datos no agrupados: 77, 28, 71, 59, 35, 58, 63, 44, 38, 51, 68 y 61
58, 62,
Ordenando los datos en forma creciente donde N = 14: Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
13
14
28
35
38
44
51
58
58
59
61
62
63
68
71
77
Ubicación del percentil 10:
P10 = 10(N + 1) / 100 = 10(14 + 1) / 100 = 1,5
Interpolación del P10 = 28 + 0,5(35 – 28) = 31,5
Ubicación del percentil 90:
Interpolación del P90 = 71 + 0,5(77 – 71) = 74
P = 74 – 31,5 = 42,5
P90 = 90(N + 1) / 100 = 90(14 + 1) / 100 = 13,5
3) Hallar la variación percentílica utilizando los siguientes datos no agrupados: 27, 28, 21, 21, 31, 19, 13, 24, 28, 15, 18, 27, 26 y 31
38, 16,
Ordenando los datos en forma creciente donde N = 16: Posición Dato
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13
15
16
18
19
21
21
24
26
27
27
28
28
31
31
38
Ubicación del percentil 10:
P10 = 10(N + 1) / 100 = 10(16 + 1) / 100 = 1,7
Interpolación del P10 = 13 + 0,7 (15 – 13) = 14,4
Ubicación del percentil 90:
Interpolación del P90 = 31 + 0,3(38 – 31) = 33,1
P = 90(N + 1) / 100 = 90(16 + 1) / 100 = 15,3
P = 33,1 – 14,4 = 18,7
Resolver los siguientes ejercicios propuestos, utilizando Variación Percentílica para Datos no Agrupados:
1) Hallar la variación percentílica utilizando los siguientes datos: 158, 162, 196, 105, 116, 188, 175, 110 y 127.
Resp:
91
2) Hallar la variación percentílica utilizando los siguientes datos: 34, 46, 38, 41, 33, 44, 38, 47 y 32.
Resp:
15
3) Hallar la variación percentílica utilizando los siguientes datos: 85, 74, 76, 58, 54, 62, 45, 77, 87, 67.
Resp:
40,9
z2 0 4 z
WA LT E R C É S P E D E S R A M Í R E Z
4) Hallar la variación percentílica utilizando los siguientes datos: 152, 164, 187, 164, 168, 178, 181, 276, 295, 274 y 269.
Resp: 136,8
5) Hallar la variación percentílica utilizando los siguientes datos: 252, 264, 287, 264, 268, 278, 281, 361, 355, 349 y 367.
Resp: 111,4
6) Hallar la variación percentílica utilizando los siguientes datos: 1 568, 1 578, 1 548, 1 548, 1 577, 1 564, 1 255, 1 549, 1 578, 1 573 y 1 562.
Resp: 293,7
7) Hallar la variación percentílica utilizando los siguientes datos: 24 156, 24 564, 24 854, 24 645, 24 178, 24 541, 24 678, 24 857, 24 624, 24 167 y 24 457.
Resp:
699,6
4.2.3.2. Variación Percentílica para Datos Agrupados Conociendo que tanto la ubicación como el valor del percentil, se determinan de manera diferente dependiendo de cómo se presentan los datos, en esta sección solo se verán ejercicios para datos agrupados.
Ejercicios resueltos
1) Hallar la variación percentílica de la siguiente distribución de jornales por semana en soles: Jornales
455 465
465 475
475 485
485 495
495 505
505 515
35
40
30
18
12
10
455 465
465 475
475 485
485 495
495 505
fi
35
40
30
18
12
10
5
Fi
35
75
105
123
135
145
150
fi
515 525 5
Solución: Jornales
P10 = 455 + [(15 – 0) / 35] 10 = 459,29 P90 = 495 + [(135 – 123) / 12] 10 = 505 P = 505 – 459,29 = 45,71 soles. z2 0 5 z
505 515
515 525
E S TA D Í S T I C A I
2) Hallar la variación percentílica utilizando la siguiente distribución de estaturas en centímetros: Estat.
135 145
145 155
155 165
165 175
15
25
45
65
25
165 175
175 185
fi
175 185
185 195
195 205
20
5
Solución: Estat.
135 145
145 155
155 165
185 195
195 205
fi
15
25
45
65
25
20
5
Fi
15
40
85
150
175
195
200
P10 = 145 + [(20 – 15) / 25] 10 = 147 P90 = 185 + [(180 – 175) / 20] 10 = 187,5
P
= 187,5 – 147 = 40,5 centímetros
Resolver los siguientes ejercicios propuestos utilizando Variación Percentílica:
1) Hallar la variación percentílica utilizando las siguientes calificaciones: Calificación
02
fi
Resp:
05
05
6
08
08
12
11
11
32
14
14
30
17
17
16
20 4
9,88
2) Hallar la variación percentílica utilizando las siguientes remuneraciones: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp:
1 419,05
3) Hallar la variación percentílica utilizando las siguientes ventas: Ventas (miles) fi
Resp:
02
06 16
06
10
10
22
15,94
z2 0 6 z
14 62
14
18 40
18
22 36
22
26 24
WA LT E R C É S P E D E S R A M Í R E Z
4) Hallar la variación percentílica utilizando las tallas de las siguientes personas: Personas fi
Resp:
55
65
75
85
95
105
115
125
24
26
28
28
26
30
26
12
58,59
5) Hallar la variación percentílica utilizando las siguientes evaluaciones: Evaluación
02
fi
Resp:
05
05
16
08
08
18
11
11
32
14
14
36
17
17
12
20 6
11,25
6) Hallar la variación percentílica utilizando los siguientes sueldos: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
1 400
7) Hallar la variación percentílica utilizando las siguientes ventas: Ventas (miles)
12
fi
Resp:
16
16
20
20
20
24
24
24
26
28 20
28 32 16
32
36 14
18,17
8) Hallar la variación percentílica utilizando las evaluaciones de los siguientes alumnos: Alumnos fi
Resp:
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
79,93
9) Hallar la variación percentílica utilizando las siguientes pensiones: Pensiones
800
850
900
950
1000
1050
fi 4 16 36 40 26 19 Resp: 199,83
z2 0 7 z
1100
1150
5
4
L e c c i ó n
3
4.3. MEDIDAS DE DISPERSIÓN RELATIVAS
Son parámetros que miden la dispersión en términos relativos, un porcentaje o una proporción, de modo que permiten una sencilla comparación entre la dispersión de distintas distribuciones. Dependiendo que se desee comparar en términos relativos la variabilidad de un conjunto de observaciones o datos, existen diferentes tipos de dispersión relativa, algunos comparan una medida de dispersión absoluta con una medida de posición, otras comparan el rango entre dos mediada de dispersión, finalmente otras comparan simplemente la relatividad entre dos observaciones, que generalmente son extremas. Entre las medidas de dispersión relativa, se presentan a continuación las mayormente utilizadas en estadística, que son:
4.3.1. Coeficiente de Variación (C.V.) Karl Pearson (1857-1936) desarrolló una medida relativa denominada coeficiente de variación que es útil cuando: 1º Los datos o distribuciones a comprar, están en unidades diferentes. 2º Los datos o distribuciones a comprar, están en la mismas unidades, pero las medias aritméticas muy distantes.
z2 0 9 z
E S TA D Í S T I C A I
Su principal inconveniente es que en el caso de distribuciones cuya media se acerca a cero, su valor tiende a infinito e incluso resulta imposible de calcular cuando la media es cero. Por ello no puede usarse, para variables tipificadas El coeficiente de variación, representa el número de veces que la desviación típica contiene a la media aritmética, y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media. Como la desviación estándar o típica es inferior a la media, suele expresarse este coeficiente en tanto por ciento, para facilitar su comprensión. Realmente el coeficiente de variación es la desviación estándar expresada como porcentaje de la media aritmética. El coeficiente de variación, se define de la siguiente manera:
Donde: S = Desviación estándar o típica
X =
Media aritmética
Ejercicios resueltos 1) Hallar el coeficiente de variación utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución:
z2 1 0 z
WA LT E R C É S P E D E S R A M Í R E Z
2) Hallar el coeficiente de variación utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44.
Solución:
C. V. = (7,43 / 50) 100 = 14,86% 3) Hallar el coeficiente de variación utilizando los siguientes datos agrupados:
Compras fi
25 35
35 45
45 55
55 65
65 75
75 85
85 95
95 105
16
24
25
40
35
30
20
10
Solución:
C. V. = (19,14 / 63,70) 100 = 30,05%
z2 1 1 z
E S TA D Í S T I C A I
4) Hallar el coeficiente de variación utilizando los siguientes datos agrupados:
Consultas
251 259
260 268
2
12
fi
269
277
10
278 286
287 295
296 304
305 313
10
6
6
4
Solución:
Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de variación para Datos no Agrupados:
1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar el coeficiente de variación: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.}
Resp:
3,15%
2) Hallar el coeficiente de variación de los siguientes jornales: 65, 58, 66, 72, 75, 85, 60 y 55.
Resp:
13,88%
3) Si un trabajador obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el coeficiente de variación de las remuneraciones?
Resp:
3,02%
z2 1 2 z
WA LT E R C É S P E D E S R A M Í R E Z
4) Hallar el coeficiente de variación de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 322.
Resp:
5,94%
Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de Variación para Datos Agrupados:
1) Hallar el coeficiente de variación utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 15 18 26 36 20 10 Resp: 9,27%
2) Hallar el coeficiente de variación utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 11 25 40 65 37 14 8 Resp: 15,98%
3) Hallar el coeficiente de variación utilizando los siguientes datos agrupados: Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
14 30 48 54 34 20 fi Resp: 19,34%
4) Hallar el coeficiente de variación utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
4 16 25 18 12 5 fi Resp: 32,50%
z2 1 3 z
E S TA D Í S T I C A I
4.3.2. Variable Estándar (Z) La variable estándar es conocida también como variable tipificada o estandarizada, es una medida estadística de dispersión relativa, que se utiliza para comparar la posición de una variable de un conjunto de datos, con otra variable de otro conjunto de datos; la variable que tenga mayor posición estándar, será mejor que la otra. La variable estándar determina dentro de los límites de cada conjunto de datos, que variable es mejor al ser comparadas. Su mayor importancia está cuando por ejemplo se compara el sueldo de dos trabajadores de ciudades distintas. La variable estándar o típica, se define de la siguiente manera:
Donde:
S
X
X1
= Desviación estándar o típica.
= Media aritmética. = Variable
Ejercicios resueltos
1) En la ciudad de Iquitos, el promedio de remuneraciones es de 1 054 soles con una desviación estándar de 132; en cambio en la ciudad de Lima, el promedio es de 1 196 soles con una desviación estándar de 145. Si un trabajador de Iquitos gana 1 200 soles y otro trabajador de Lima gana 1 300 soles, ¿quién vive mejor en cada una de sus ciudades? Solución: Iquitos
:
Xi = 1 200
= 1 054
S = 132
ZIquitos =
?
Lima
:
Xi = 1 300
= 1 196
S = 145
ZLima
?
ZIquitos = (1 200 – 1 054) / 132 = 1,11 Respuesta:
=
ZLima = (1 300 – 1 196) / 1145 = 0,72
Vive mejor el trabajador de Iquitos
z2 1 4 z
WA LT E R C É S P E D E S R A M Í R E Z
2) Compare a los trabajadores de ambas fábricas y determine quién tiene mejor posición: Fábrica
Sueldo de un trabajador
Promedio
Desviación estándar
A
960,50
920,40
105,15
B
960,50
920,40
102,82
Solución: A :
Xi
=
960,50
= 920,40
S = 105,15
ZA =
B :
Xi
=
960,50
= 920,40
S = 103,82
ZB
ZA = (960,50 – 920,40) / 105,15 = 0,38 Respuesta: presa.
=
? ?
ZB = (960,50 – 920,40) / 103,82 = 0,39
el trabajador de B está ligeramente mejor que el A, dentro de su em-
4.3.3. Coeficiente de Desviación Mediana (C.D.Me.) El coeficiente de desviación mediana, representa el número de veces que la desviación mediana contiene a la mediana, y por lo tanto cuanto mayor es coeficiente de desviación mediana, mayor es la dispersión y menor la representatividad de la mediana. Como la desviación mediana es inferior a la mediana, suele expresarse este coeficiente en tanto por ciento, para facilitar su comprensión. Realmente el coeficiente de desviación mediana, es la desviación mediana expresada como porcentaje de la mediana, y es útil en los casos en que la mediana tiene mayor representatividad que la media aritmética. El coeficiente de desviación mediana, se define de la siguiente manera:
Donde:
DM
= Desviación mediana.
Me
= Mediana.
z2 1 5 z
E S TA D Í S T I C A I
Ejercicios resueltos
1) Hallar el coeficiente de desviación mediana utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424.
Solución: Ordenando los datos en forma creciente, se tiene:
Posición
1
2
3
4
5
6
7
8
9
10
11
257
264
319
347
388
424
425
485
496
528
533
167
160
105
77
36
0
1
61
72
104
109
Total (Σ) 892
Posición de la Me = (N + 1 ) / 2 = (11+1) / 2 = 6 Me, es el dato de la posición 6: 424
C.D.Me = (81,09 / 424) 100 = 19,13%
2) Hallar el coeficiente de desviación mediana utilizando los siguientes datos: 46, 48, 57, 38, 58, 64, 47, 45, 53, y 44.
Solución: Ordenando los datos en forma creciente, se tiene:
Posición
1
2
3
4
5
6
7
8
9
10
Total
38
44
45
46
47
48
53
57
58
64
(Σ)
9,5
3,5
2,5
1,5
0,5
0,5
5,5
9,5
10,5
16,5
60
Posición de la Me = (N + 1 ) / 2 = (10+1) / 2 = 5,5
z2 1 6 z
WA LT E R C É S P E D E S R A M Í R E Z
Me = 47 + 0,5(48 – 47) = 47,5
C.D.Me = (6 / 47,5) 100 = 12,63%
3) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados:
Rem.
600 1000 1000 1400 1400 1800 1800 2200
fi
21
58
65
28
2200 2600
2600 3000
16
12
Solución:
Remuneraciones
fi
Fi
Xi
f
600
1 000
21
21
800
729,23
15 313,83
1 000
1 400
58
79
1 200
329,23
19 095,34
1 400
1 800
65
144
1 600
70,77
4 600,05
1 800
2 200
28
172
2 000
470,77
13 181,56
2 200
2 600
16
188
2 400
870,77
13 932,32
2 600
3 000
12
200
2 800
1 270,77
15 249,24
Σ
200
81 372,34
Posición de la mediana: N / 2 = 200 / 2 = 100 Li = 1 400;
N = 200;
fi = 65;
Fi – 1 = 79;
C.D.Me = (406,86 / 1529,23) 100 = 26,61%
z2 1 7 z
e = 1 800 – 1 400 = 400
E S TA D Í S T I C A I
Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de Desviación Mediana para Datos no Agrupados:
1) Si 7 tiendas venden el mismo producto a los siguientes precios, hallar el coeficiente de desviación mediana por producto: 12,20; 13,50; 12,80; 13,00; 12,90; 13,50 y 13,10.
Resp:
2,38%
2) Hallar el coeficiente de desviación mediana de los siguientes jornales: 65, 58, 67, 72, 75, 85, 60 y 55.
Resp:
11,56%
3) Si un trabajador durante 5 años obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el coeficiente de desviación mediana?
Resp:
2,46%
4) Hallar el coeficiente de desviación mediana de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 323.
Resp:
4,60%
5) Hallar el coeficiente de desviación mediana de las siguientes compras: 118, 107, 115, 110 y 120.
Resp:
3,65%.
Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de Desviación Mediana para Datos Agrupados:
1) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 10 18 26 36 20 15 Resp: 7,45% 2) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 8 25 40 65 37 14 11 Resp: 12,15% 3) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: z2 1 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Sueldos
800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
20
30
48
54
34
14
fi
Resp: 16,47% 4) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Pedidos
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
6000 7000
6
16
25
18
10
5
fi
Resp: 28,25% 5) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Pesos (Kg)
40 50
50 60
60 70
70 80
80 90
90 100
100 110
fi 10 25 55 45 38 22 5 Resp: 16,45%
4.3.4. Coeficiente de Apertura (C.A.) Es el cociente entre los valores extremos de la distribución de datos o conjunto de dato, se usa para comparar el número de veces que el valor máximo contiene al valor mínimo. Realmente el coeficiente de apertura, es el máximo valor expresado en términos del mínimo valor, y es útil en los casos en los que se comparen por ejemplo sueldos. El coeficiente de apertura, se define de la siguiente manera:
C. A. = Dato máximo / Dato mínimo
Ejercicios resueltos
1) Hallar el coeficiente de apertura utilizando los siguientes datos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución: Dato máximo = 533
Dato mínimo = 257
C. A. = 533 / 257 = 2,07 veces.
z2 1 9 z
E S TA D Í S T I C A I
2) Hallar el coeficiente de apertura utilizando los siguientes datos agrupados: Pesos (Kg) fi
40 50
50 60
60 70
70 80
80 90
90 100
100 110
10
25
55
45
38
22
5
Solución: Dato máximo = 110
Dato mínimo = 40
C. A. = 110 / 40 = 2,75 veces. Resolver los siguientes ejercicios propuestos, utilizando el Coeficiente de Apertura:
1) Hallar el coeficiente de desviación mediana de los siguientes jornales: 65, 58, 67, 72, 75, 85, 60 y 55.
Resp:
1,55 veces
2) Si un trabajador durante 5 años obtuvo los sueldos anuales de: 27 900, 28 450, 29 450 28 820 y 30 450. ¿Cuál fue el coeficiente de desviación mediana?
Resp:
1,09 veces
3) Hallar el coeficiente de desviación mediana de los consumos de energía eléctrica mensual en Kw. de un usuario durante 1 año: 325, 358, 350, 325, 293, 305, 298, 302, 325, 310, 327 y 323.
Resp:
1,22 veces
4) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Estaturas
125 135
135 145
145 155
155 165
165 175
175 185
fi 10 18 26 36 20 15 Resp: 1,48 veces 5) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Jornales
55 65
65 75
75 85
85 95
95 105
105 115
115 125
fi 8 25 40 65 37 14 11 Resp: 2,27 veces 6) Hallar el coeficiente de desviación mediana utilizando los siguientes datos agrupados: Sueldos 800 1000
1000 1200
1200 1400
1400 1600
1600 1800
1800 2000
20 30 48 54 34 14 fi Resp: 2,50 veces. z2 2 0 z
WA LT E R C É S P E D E S R A M Í R E Z
4.3.5. Recorrido Relativo (R.R.) El recorrido relativo, representa el número de veces que el recorrido de la variable o rango contiene a la media aritmética, y por lo tanto cuanto mayor es R. R. mayor es la dispersión y menor la representatividad de la media. Generalmente como el recorrido de la variable es inferior a la media, suele expresarse este coeficiente en porcentaje, para facilitar su comprensión. El recorrido relativo, se define de la siguiente manera:
Donde:
R = Rango simple o recorrido de la variable
X=
Media aritmética
Ejercicios resueltos 1) Hallar el recorrido relativo utilizando los siguientes datos discretos: 496, 485, 257, 388, 528, 264, 347, 425, 533, 319 y 424. Solución:
R = 533 – 257 + 1 = 277 R. R. = (277 / 406) = 68,23% 2) Hallar el recorrido relativo utilizando las siguientes calificaciones:
Calif. fi
260 280 280 300 300 320 3
15
320 340 340 360 360 380 380 400
20
25
z2 2 1 z
12
8
7
E S TA D Í S T I C A I
Solución: Calificaciones
fi
Xi
fi Xi
260
280
3
270
810
280
300
15
290
4 350
300
320
30
310
9 300
320
340
25
330
8 250
340
360
12
350
4 200
360
380
8
370
2 960
380
400
7
390
2 730
Σ
100
32 600
R = 400 – 260 = 140 R. R. = (140 / 326) = 42,94%
4.3.6. Recorrido Inter-Cuartílico Relativo (RQ.R.) Representa el número de veces que la desviación cuartílica contiene a la mediana o cuartil 2, el recorrido inter-cuartílico relativo, es la desviación cuartílica expresada como porcentaje de la mediana, y es útil solo en los casos en que la mediana tiene mayor representatividad que la media aritmética. El RQ.R se define de la siguiente manera:
Donde: Q3 – Q1 = Desviación cuartílica
Me
= Mediana = Q2
z2 2 2 z
WA LT E R C É S P E D E S R A M Í R E Z
4.3.7. Recorrido Semi-Inter-Cuartílico Relativo (RS.I.R.) Representa el número de veces que la desviación cuartílica contiene a la suma entre cuartiles 1 y 3, el recorrido semi-inter-cuartílico relativo, es prácticamente medio recorrido inter-cuartílico relativo. Este coeficiente tiene poco uso. El RS.I.R se define de la siguiente manera:
Donde: Q3 – Q1 = Desviación cuartílica. Q3 + Q1 = Equivale a 2 Q2.
Estas medidas por ser poco usadas, solo se presentan para el conocimiento del alumno.
z2 2 3 z
L e c c i ó n
4
4.4. PROPIEDADES DE LAS MEDIDAS DE DISPERSIÓN Las medidas de dispersión llamadas también medidas de variabilidad, son medidas de resumen por que representan generalmente de alguna manera la variación de todos los datos, tienen un comportamiento distinto ante los cambios de origen y ante los cambios de escala.
4.4.1 Cambio de origen Si a los valores que toma una variable X (recorrido de la variable) se le suma o se le resta un determinado número, la variable original no cambia de origen, esto acurre solo con las medidas de dispersión de tipo absoluta, pero las medidas relativas si se ven afectadas, por que utilizan como valor relativo o como denominador una medida de posición. Si a la Variable Xa se le resta o adiciona “k”, resulta: Xb = Xa ± k Entonces:
D (Xb)
=
D (Xa)
DM (Xb)
=
Me (Xa)
S2
(Xb)
=
S2 (Xa)
S
(Xb)
=
S
(Xa)
R
(Xb)
=
R
(Xa)
C.V. (Sa / a)
=
C.V. [Sb / (b ± k)]
z2 2 5 z
E S TA D Í S T I C A I
Ejercicio de comprobación:
4.4.2. Cambio de escala Si a los valores que toma una variable X (recorrido de la variable) se le multiplica o divide por un determinado número, se produce un cambio de escala en la variable original, esto acurre solo con las medidas de dispersión de tipo absoluta, en cambio las medidas de dispersión relativas no se ven afectadas, por que utilizan como valor relativo o como denominador una medida de posición afectada por el mismo valor. Si a la Variable Xa se le multiplica “k”, resulta: Xb = k Xa. Entonces:
D (Xb)
=
k D (Xa)
DM (Xb)
=
k Me (Xa)
S2
(Xb)
=
k2 S2 (Xa)
S
(Xb)
=
k S
(Xa)
R
(Xb)
=
k R
(Xa)
C.V. (Sb / b)
=
C.V. (Sa / a)
También, Si a la Variable Xa se le divide entre “k”, resulta: Xb = Xa / k.
z2 2 6 z
Entonces:
D (Xb)
=
D (Xa) / k
DM (Xb)
=
Me (Xa) / k
S2
(Xb)
=
S2 (Xa) / k2
S
(Xb)
=
S
(Xa) / k
R
(Xb)
=
R
(Xa) / k
C.V. (Sb / b) =
C.V. (Sa / a)
Ejercicio de comprobaciรณn
La diferencia entre los coeficientes de variaciรณn, se deben solo al redondeo de datos.
z2 2 7 z
E S TA D Í S T I C A I
AUTOEVALUACIÓN Nº 4 1) Hallar la desviación media de las siguientes inasistencias: 13, 12, 15, 9, 15, 6, y 14. A) 2,57
B) 3,08
C) 2,92
D) 2,73
E) 2,16
2) Hallar la desviación media de las siguientes remuneraciones: Remun.
600 700 700 800 800 900 900 1000
fi
13
A) 154,22
15
B) 129,49
20
25
C) 133,33
1000 1100
1100 1200
15
12
D) 141,50
E) 130,00
3) Hallar la desviación mediana de las siguientes edades: 22, 19, 17, 19, 25, 36, y 34.
A) 7,16
B) 6,21
C) 4,59
D) 5,71
E) 8,27
4) Hallar la desviación mediana utilizando los siguientes datos agrupados: Util.
1000 1500
1500 2000
2000 2500
2500 3000
3000 3500
3500 4000
15
30
55
55
30
15
fi A) 420
B) 550
C) 945
D) 725
E) 651
5) Hallar la varianza de las siguientes remuneraciones: Remun. 600 700 700 800 800 900 fi A) 25 418 u2
13
15 B) 30 084 u2
900 1000
1000 1100
1100 1200
25
15
12
20 C) 23 500 u2
D) 22 731 u2
E) 21 647 u2
6) Hallar la varianza de las siguientes calificaciones: 785, 569, 784, 650, 488, 695, 567 y 782 A) 9 627,50 u2
B) 10 583,37 u2
C) 11 690,50 u2
z2 2 8 z
D) 7 258,54 u2
E) 15 124,00 u2
WA LT E R C É S P E D E S R A M Í R E Z
7) Hallar la desviación estándar de las siguientes remuneraciones: Remun.
600 700 700 800 800 900 900 1000 1000 1100
fi
8
A) 146,54
20
30
B) 125,84
15
15
C) 112,85
D) 202,02
1100 1200 12 E) 164,74
8) Hallar la desviación estándar de las siguientes ventas en miles: 28,5; 16,9; 28,4; 15,0; 18,8; 19,5; 16,7 y 18,2 A) 6,27
B) 3,36
C) 5,87
D) 7,54
E) 4,91
9) Hallar el rango simple de las siguientes intervenciones en clase: 8, 2, 9, 4, 2, 7, 6, 10, 11, 6, 5, 4, 14, 6 y 8 A) 9
B) 13
C) 11
D) 10
E) 12
10) Hallar el coeficiente de variación de las siguientes remuneraciones: Remun. 900 fi A) 25,18%
10
1 200
1 500
1 800
2 100
2 400
2 700
22
40
45
15
10
8
B) 22,15%
C) 24,58%
D) 26,12%
E) 21,47%
11) Determine la variable estándar de ambos trabajadores, con los siguientes datos: Fábrica
Sueldo de un trabajador
Promedio
Desviación estándar
A
1 325,50
1 020,20
205,18
B
1 421,00
1 325,40
202,24
A) ZA 1,19 y ZB 0,47 D) ZA 1,49 y ZB 0,47
B) ZA 1,49 y ZB 1,47
E) ZA 1,49 y ZB 2,47
z2 2 9 z
C) ZA 1,42 y ZB 0,44
E S TA D Ă? S T I C A I
12) Hallar el coeficiente de desviaciĂłn mediana utilizando los siguientes datos agrupados: Ventas (en millones)
2
fi
6 16
A) 42,05%
6 10
10 14
14 18
18 22
22 26
22
62
40
36
24
B) 34,00%
C) 19,45%
D) 37,25%
E) 46,51%
13) Hallar el coeficiente de apertura utilizando los siguientes datos: 96, 48, 57, 88, 52, 26, 47, 42, 33, 19 y 42. A) 5,05 veces
B) 7,22 veces
C) 9,45 veces
D) 5,87 veces
E) 6,33 veces
14) Hallar el recorrido relativo utilizando las siguientes calificaciones: Remun. 600 700 700 800 800 900 900 1000 fi
13
A) 54,18%
15
20
B) 84,65%
1000 1100
1100 1200
15
12
25 C) 48,47%
D) 66,67%
E) 61,64%
15) Hallar el recorrido inter-cuartĂlico relativo de las siguientes ventas en miles: Ventas (miles) fi
02
06
06
16
A) 52,37%
B) 44,19%
10 22
10
14
14
62 C) 59,57%
18 40
18
22 36
D) 52,33%
22
26 24 E) 21,32%
Respuestas de control 1. A, 2. E, 3.D, 4. B, 5. C, 6. C, 7. A, 8. E, 9. B, 10. D, 11. D, 12. B, 13. A, 14. D, 15. C
z2 3 0 z
WA LT E R C É S P E D E S R A M Í R E Z
GLOSARIO
Función Derivable.
Es una función matemática que utiliza derivadas para darle un tratamiento de una función continua (variable continua).
Función no Derivable.
Es una función matemática a la cual se le da un tratamiento discreto, no utiliza derivadas.
Homogeneidad.
Se refiere a los datos u observaciones en su conjunto, que son iguales o bastante similares entre sí.
Heterogeneidad.
Se refiere a los datos u observaciones en su conjunto, que son muy diferentes o bastante dispersos entre sí.
Medida Absoluta.
Es el valor obtenido por el uso de una fórmula o definición de una medida estadística.
Medida Relativa.
Es el valor obtenido al comparar por cociente dos valores absolutos o dos medidas absolutas.
Valor Absoluto.
Es el valor resultante de una operación matemática al cual no se le considera signo.
Valor Representativo.
Es el valor que expresa el contenido todo un conjunto de datos. Ejemplo, el promedio de notas de un conjunto homogéneo.
Variable Tipificada.
Es la conversión de una variable es términos estandarizados; es decir, convertir un valor “X” en una Variable Típica o Estándar (Z).
EXPLORACIÓN ON LINE http://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n http://www.vitutor.net/2/11/medidas_dispersion.html http://html.rincondelvago.com/medidas-de-dispersion.html http://www.tuveras.com/estadistica/estadistica02.htm z2 3 1 z
q u i n t a
UNIDAD Medidas de Concentración
Momentos: Momentos con relación al origen, Momentos con relación a la media aritmética Asimetría: Tipos de Asimetría, Cálculo según definición Curtosis: Tipos de Curtosis, Cálculo según definición Desigualdad: Índice de Gini: definición y cálculo, Curva de Lorenz: definición y gráfico
OBJETIVO (S) GENERAL Aprender que además de las medidas de tendencia central y las medidas de dispersión, en la Estadística se utilizan también las medidas de concentración tanto de forma como de desigualdad. Las medidas de forma llamadas asimetría, que sirven para determinar la forma cómo se presentan los datos hacia los lados; es decir, para saber si la concentración de los datos están: hacia la derecha, hacia el centro o hacia la izquierda; de la media aritmética. También existe otra medida de forma hacia arriba llamada curtosis, que nos dice con qué intensidad los datos se encuentran repetidos en su conjunto; de manera: alta, media o baja. Encontrar con el índice de Gini y con la curva de Lorenz, la manera en que se encuentran repartidos los datos y con qué frecuencia, la relación variable y frecuencia pone de relieve el mayor o menor grado de desigualdad en el reparto de la variable en cada clase, son por tanto indicadores del grado de distribución de la variable; estos indicadores son las medidas de desigualdad . ESPECÍFICOS • Conocer mediante los momentos cuáles son sus aplicaciones dentro de las medidas de forma, además de saber identificarlos y utilizarlos. • Saber cómo son los datos en su conjunto, conocer si tienen forma simétrica o asimétrica. • Saber cómo son los datos en su conjunto, conocer si tienen forma de gran apuntamiento o no. • Determinar cómo se distribuyen los datos con relación a la variable que se investiga, saber si es equitativa o no.
L e c c i ó n
1
5.1. MOMENTOS Entre los parámetros o medidas estadísticas más utilizadas en una investigación, están la media aritmética y la varianza, por que expresan un promedio y una variabilidad estandarizada; por ello, los momentos han sido definidos considerando estas dos importantes medidas. Existen dos tipos de momentos, unos basados en la definición de la media, por ello se dice son momentos con relación al origen; otros momentos se basan en la definición de la varianza, por ello se dice que son momentos con relación a la media aritmética. La característica principal de todo momento, es que se encuentran definidos en grado “r”, donde dicho grado puede tomar cualquier valor entero, aunque los grados que se pueden utilizar en la Estadística Descriptiva, son de 1 al 4: r: 1, 2, 3
y4
Por ser obtenidas estas medidas estadísticas de un conjunto de datos, es necesario definir un procedimiento apropiado para obtenerlas, según como se encuentren dichos dato; por lo tanto, se definirá un procedimiento de cálculo cuando los datos están dispersos o no agrupados, y otro procedimiento para las distribuciones de frecuencias o simplemente datos agrupados.
5.1.1. Momentos con relación al origen (Mr) La definición de tales momentos basados en la definición de la media aritmética, como ya se ha mencionado va a depender del estado en que se encuentran los datos, que son dispersos o no agrupados, y las distribuciones de frecuencias o simplemente datos agrupados. z2 3 5 z
E S TA D Í S T I C A I
5.1.1.1. Momentos para Datos No Agrupados Cuando la información está desordenada o simplemente hay un grupo de datos (Xi) representados uno por uno que pueden o no estar repetidos, el momento de orden “r” con relación al origen de N datos se define de la siguiente manera:
Considerando que los valores de “r” dentro de esta definición, van del 1 al 4, los momentos para cada orden son:
Ejercicios resueltos 1) Hallar los momentos del 1 al 4, con relación al origen de: Solución: Variable
X1
X2
X3
X1
14
196
2 744
38 416
X2
18
324
5 832
104 976
X3
20
400
8 000
160 000
X4
13
169
2 197
28 561
X5
11
121
1 331
14 641
X6
14
196
2 744
38 416
Σ (Total)
90
1 406
22 848 z2 3 6 z
X4
385 010
14, 18, 20, 13, 11 y 14
WA LT E R C É S P E D E S R A M Í R E Z
M1 = 90 / 6 = 15 u
M2 = 1 406 / 6 = 234,33 u2
M3 = 22 848 / 6 = 3 808 u3
M4 = 385 010 / 6 = 64 168,33 u4
2) Hallar los momentos, con relación al origen de: 560, 660, 900, 930, 810, 880, 760 y 900 Solución: Soles
X1
X2
X3
X1
560
313 600
175 616 000
9,834496x1010
X2
660
435 600
287 496 000
18,974736x1010
X3
900
810 000
729 000 000
65,610000x1010
X4
930
864 900
804 357 000
74,805201x1010
X5
810
656 100
531 441 000
43,046721x1010
X6
880
774 400
681 472 000
59,969536x1010
X7
760
577 600
438 976 000
33,362176x1010
X8
900
810 000
729 000 000
65,610000x1010
Σ (Total)
6400
5 242 200
X4
4 377 358 000
371,212866 x1010
Cuando los números son muy grandes es preferible expresarlos en forma científica (x10k). M1 = 6400 / 8 = 800 u M2 = 5 242 200 / 8 = 655 275 u2 M3 = 4 377 358 000 / 8 = 547 169 750 u3 M4 = 371,212866x1010 / 8 = 46,40160825x1010 u4 Donde “u” representa la unidad de la variable (Soles). Resolver los siguientes ejercicios propuestos con datos no agrupados, utilizando Momentos con relación al origen: 1) Hallar los momentos del 1 al 4, con relación al origen de: 458, y 500 toneladas. Resp:
87 340 044,86 u3,
4,454336 x1010 u4.
2) Hallar los momentos del 1 al 4, con relación al origen de: 38, 55, 65 y 41 asistentes.
45, 81, 72, 56, 53, 54,
Resp:
408 u,
56 u,
181 806,86 u2,
425, 625, 253, 280, 315,
3 300,6 u2,
204 256,4 u3, z2 3 7 z
13 216 138,2 u4.
E S TA D Í S T I C A I
3) Hallar los momentos del 1 al 4, con relación al origen de: 157, 185, 164, 155, 187, 154, 188, 124, 152 y 144 soles. Resp:
161 u,
26 304 u2,
4 357 689,2 u3,
731 419 510,8 u4.
4) Hallar los momentos del 1 al 4, con relación al origen de: 1 485, 1 457, 1 288, 1 557 y 1 243 participantes Resp:
1 406 u,
1 991 263,2 u2,
2 839 904 318 u3,
407,7152 x1010 u4.
5) Hallar los momentos del 1 al 4, con relación al origen de: 56, 64, 72, 53, 45, 38, 44 y 52 empresas. Resp:
53 u,
2 916,75 u2,
166 459,25 u3,
9 827 690,25 u4.
6) Hallar los momentos del 1 al 4, con relación al origen de: 85, 88, 86, 87, 89, 88, 83, 87 y 90 universitarios. Resp:
87 u,
7 573 u2,
659 543 u3,
57 470 066,33 u4.
7) Hallar los momentos del 1 al 4, con relación al origen de: 250, 257, 250, 255 y 254 soles. Resp:
258 u,
66 617,6 u2,
252, 257, 265, 268, 272,
17 215 273,8 u3,
4 452 463 355,6 u4.
8) Hallar los momentos del 1 al 4, con relación al origen de: 13, 18 y 16 puntos. Resp:
13 u,
180 u2,
2 614 u3,
15, 16, 9, 14, 10, 12, 7, 39 334,8 u4.
9) Hallar los momentos del 1 al 4, con relación al origen de: 880, 760 y 800 litros. Resp:
790 u,
627 625 u2,
501 410 500 u3,
10) Hallar los momentos del 1 al 4, con relación al origen de: 860 y 2 900 unidades. Resp:
2800 u,
7 851 520 u2,
760, 860, 700, 830, 730, 40,277658 x1010 u4. 2 680, 2 660, 2 900, 2
2,204832 x 1010 u3,
6,200261 x1010 u4
5.1.1.2. Momentos para Distribuciones de Frecuencias Cuando la información está ordenada en tablas de distribución de frecuencias, donde la frecuencia absoluta (fi) representa la repetición de la marca de clase (Xi), el momento de orden “r” con relación al origen de N datos se define de la siguiente manera:
z2 3 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Considerando que los valores de “r” van del 1 al 4, los momentos para cada orden son:
A pesar de que el momento del orden 2 con relación al origen no tiene uso en el presente texto, es posible darle uso a este momento, si en el cálculo de la Varianza, se utiliza la fórmula desarrollada del binomio al cuadrado, que concluye de la siguiente manera:
Como habrá observado, la primera parte de la fórmula de la Varianza, es el momento del orden 2 y la segunda parte es el momento del orden 1 al cuadrado, ambos con relación al origen.
Ejercicios resueltos
1) Hallar los momentos del 1 al 4, con relación al origen utilizando la siguiente distribución de jornales por semana en soles: Jornales fi
455 465 465 475 475 485 485 495 495 505 505 515 515 525 35
40
30
18
z2 3 9 z
12
10
5
E S TA D Í S T I C A I
Solución: Jornales
fi
455
465
35
465
475
475
Xi
fi Xi2
fi Xi3
fi Xi4
460 16 100
7 406 000
3 406 760 000
15,6710960 x 1011
40
470 18 800
8 836 000
4 152 920 000
19,5187240 x 1011
485
30
480 14 400
6 912 000
3 317 760 000
15,9252480 x 1011
485
495
18
490
8 820
4 321 800
2 117 682 000
10,3766418 x 1011
495
505
12
500
6 000
3 000 000
1 500 000 000
7,5000000 x 1011
505
515
10
510
5 100
2 601 000
1 326 510 000
6,7652010 x 1011
515
525
5 520
2 600
1 352 000
703 040 000
3,6558080 x 1011
71 820 34 428 800
16 524 672 000
79,4127188 x 1011
150
Σ (Total)
fi Xi
M1 = 71 820 / 150 = 478,8 u M2 = 34 428 800 / 150 = 229 525,33 u2 M3 = 16 524 672 000 / 150 = 110 154 480 u3 M4 = 79,4127188 x1011 / 150 = 5,29418125 x 1010 u4
2) Hallar los momentos del 1 al 4, con relación al origen de las siguientes estaturas en metros: Estat. 1,35 1,45 1,45 1,55 fi
16
25
1,55 1,65
1,65 1,75 1,75 1,85 1,85 1,95 1,95 2,05
45
65
24
20
Solución:
Estaturas
fi
Xi
fi Xi
fi Xi2
fi Xi3
fi Xi4
1,35
1,45
16
1,4
22,40
31,36
43,904
61,4656
1,45
1,55
25
1,5
37,50
56,25
84,375
126,5625
1,55
1,65
45
1,6
72,00
115,20
184,320
294,9120
1,65
1,75
65
1,7
110,50
187,85
319,345
542,8865
1,75
1,85
24
1,8
43,20
77,76
139,968
251,9424
1,85
1,95
20
1,9
38,00
72,20
137,180
260,6420
1,95
2,05
5
2,0
Σ (Total)
200
10,00
20,00
40,000
80,0000
333,60
560,62
949,092
1 618,4110
z2 4 0 z
5
WA LT E R C É S P E D E S R A M Í R E Z
M1 = 333,6 / 200 = 1,668 u
M2 = 560,62 / 200 = 2,8031 u2
M3 = 949,092 / 200 = 4,745 u3 M4 = 1 618,411 / 200 = 8,0921 u4 Resolver los siguientes ejercicios propuestos con datos agrupados o distribuciones de frecuencias, utilizando Momentos con relación al origen: 1) Hallar los momentos del 1 al 4, con relación al origen de: Calificación
02
fi Resp:
05
05
6 11 u
08
08
12
11
11
32
133,69 u2
14
14
30
17
17
16
1 744,91 u3
20 4
24 074,46 u4
2) Hallar los momentos del 1 al 4, con relación al origen de: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi Resp : 1596 u
2 832 000 u2
5,53728 x 109 u3
117,90336 x 1011 u4
3) Hallar los momentos del 1 al 4, con relación al origen de: Ventas (miles)
02
fi
06
06
16
Resp: 14,6 u
10
10
22
14
14
62
245,28 u2
18
18
40
22
22
36
4 515,2 u3
24
88 619,52 u4
4) Hallar los momentos del 1 al 4, con relación al origen de: Personas
55
65
75
85
95
105
115
125
fi
24
26
28
28
26
30
26
12
Resp:
88 u
8 195 u2
800 710 u3
81 363 125 u4
5) Hallar los momentos del 1 al 4, con relación al origen de: Evaluación fi Resp:
02
05 16
10,2 u
05
08 18
120,05 u2
08
11 32
11
14 36
1 550,45 u3
z2 4 1 z
26
14
17 12
17
20 6
21 412,76 u4
E S TA D Í S T I C A I
6) Hallar los momentos del 1 al 4, con relación al origen de: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi Resp: 1616 u
2 886 400 u2
5,63456 x 109 u3
11,889664 x 1012 u4
7) Hallar los momentos del 1 al 4, con relación al origen de: Ventas (miles)
12
fi Resp:
16
16
20 22,77u
20
20
24
24
24
26
554,47 u2
28
28 32
20
16
14 283,067 u3
32
36 14
384 649,8667 u4
8) Hallar los momentos del 1 al 4, con relación al origen de: Alumnos fi Resp:
92 u
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
9 385,33 u2
1 043 280 u3
124 648 933,33 u4
9) Hallar los momentos del 1 al 4, con relación al origen de: Pensiones fi Resp:
955 u
800
850
900
950
1000
1050
1100
1150
4
16
36
40
26
19
5
4
917 783,33 u2
887 642 500 u3
864 009 958 333,33 u4
5.1.2. Momentos con relación a la Media Aritmética (Mr) La definición de tales momentos basados en la definición de la varianza, como ya se sabe va a depender del estado en que se encuentran los datos, que son no agrupados o dispersos, y las distribuciones de frecuencias o simplemente datos agrupados.
5.1.2.1. Momentos para Datos no Agrupados Cuando la información está desordenada o simplemente hay un grupo de datos (Xi) representados uno por uno que pueden o no estar repetidos, el momento de orden “r” con relación a la media aritmética de N datos se define de la siguiente manera:
z2 4 2 z
WA LT E R C É S P E D E S R A M Í R E Z
Considerando que los valores de “r” van del 1 al 4, los momentos para cada orden son:
Ejercicios resueltos 1) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 14, 18, 20, 13, 11 y 14 Solución:
X = 90 / 6 = 15 M1 = 0 / 6 = 0 u
M2 = 56 / 6 = 9,33 u2
M3 = 82 / 6 = 13,67 u3 M4 = 980 / 6 = 163,33 u4
z2 4 3 z
E S TA D Í S T I C A I
2) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 83, 84, 85, 88, 90, 92 y 95
80, 81, 82,
Solución:
X = 860 / 40 = 86 M1 = 0 / 10 = 0 u
M2 = 228 / 10 = 22,8 u2
M3 = 576 / 10 = 57,6 u3 M4 = 10 404 / 10 = 1 040,4 u4
Resolver los siguientes ejercicios propuestos con datos no agrupados, utilizando Momentos con relación a la media aritmética: 1) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 425, 625, 253, 280, 315, 458, y 500 toneladas. Resp:
0 u,
15 342,86 u2,
643 075,74 u3,
459 398 288,57 u4
2) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 56, 53, 54, 38, 55, 65 y 41 asistentes. Resp:
0 u,
164,6 u2,
987,6 u3,
45, 81, 72,
63 306,2 u4
3) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 157, 185, 164, 155, 187, 154, 188, 124, 152 y 144 soles. Resp:
0 u,
383 u2,
– 580,8 u3,
328 847 u4.
4) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 1 485, 1 457, 1 288, 1 557 y 1 243 participantes Resp:
0 u,
14 427,2 u2,
– 381 027,6 u3,
z2 4 4 z
293 078 084 u4
WA LT E R C É S P E D E S R A M Í R E Z
5) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 53, 45, 38, 44 y 52 empresas. Resp:
0 u,
107,75 u2,
450 u3,
25 790,75 u4
6) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 87, 89, 88, 83, 87 y 90 universitarios. Resp:
0 u,
4 u2,
56, 64, 72,
– 4 u3,
85, 88, 86,
41,33 u4
7) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 252, 257, 265, 268, 272, 250, 257, 250, 255 y 254 soles. Resp:
0 u,
53,6 u2,
275,4 u3,
6 064,4 u4
8) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 15, 16, 9, 14, 10, 12, 7, 13, 18 y 16 puntos. Resp:
0 u,
11 u2,
– 12 u3,
243,8 u4
9) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 760, 860, 700, 830, 730, 880, 760 y 800 litros. Resp:
0 u,
3 525 u2,
17 250 u3,
21 547 500 u4
10) Hallar los momentos del 1 al 4, con relación a la media aritmética de: 2 680, 2 660, 2 900, 2 860 y 2 900 unidades. Resp:
0 u,
11 520 u2,
– 451 200 u3,
160 896 000 u4
5.1.2.2. Momentos para Distribuciones de Frecuencias Cuando la información está ordenada en tablas de distribución de frecuencias, donde la frecuencia absoluta (fi) representa la repetición de la marca de clase (Xi), el momento de orden “r” con relación a la media aritmética de N datos se define de la siguiente manera:
Considerando que los valores de “r” dentro de esta definición, van del 1 al 4, los momentos para cada orden son:
z2 4 5 z
E S TA D Í S T I C A I
Ejercicios resueltos
1) Hallar los momentos del 1 al 4, con relación a la media aritmética utilizando la siguiente distribución de jornales por semana en soles:
Jornales 455 465 465 475 475 485 fi
35
40
485 495 495 505 505 515 515 525
30
18
12
10
5
Solución:
Jornales
fi
Xi
fi Xi
455
465
465
475
35
460
40
470
475 485
485
30
480
14 400
36,00
43,20
51,840
62,2080
495
18
490
8 820
201,60
2 257,92
25 288,704
283 233,4848
495
505
12
500
6 000
254,40
5 393,28
114 337,536
2 423 955,7632
505
515
10
510
5 100
312,00
9 734,40
303 713,280
9 475 854,3360
515
525
5 520
2 600
206,00
8 487,20
349 672,640
14 406 512,7680
71 820
0,00
41 384,00
533 241,600
31 201 690,8800
Σ (Total)
150
fi (Xi – X )
fi (Xi – X )2
16 100
– 658,00
12 370,40
18 800
– 352,00
3 097,60
X = 71 820 / 150 = 478,8 u
z2 4 6 z
fi (Xi – X )3
fi (Xi – X )4
– 232 563,520
4 372 194,1760
–
27 258,880
239 878,1440
WA LT E R C É S P E D E S R A M Í R E Z
M1 = 0 / 150 = 0 u
M2 = 41 384 / 150 = 275,89 u2
M3 = 533 241,6 / 150 = 3 554,94 u3
M4 = 31 201 690,88 / 150 = 208 011,27 u4
2) Hallar los momentos del 1 al 4, con relación a la media aritmética de las siguientes estaturas en centímetros:
Estaturas
135 145 145 155 155 165 165 175 175 185 185 195
fi
15
25
45
65
25
20
195 205 5
Solución:
Estaturas
fi
Xi
fi Xi
fi (Xi – X )
135
145
15
140
2 100
– 405
10 935
– 295 245
7 971 615
145
155
25
150
3 750
– 425
7 225
– 122 825
2 088 025
155
165
45
160
7 200
– 315
2 205
–
165
175
65
170 11 050
195
585
175
185
25
180
4 500
325
4 225
54 925
714 025
185
195
20
190
3 800
460
10 580
243 340
5 596 820
195
205
5 200
1 000
165
5 445
179 685
5 929 605
33 400
0
41 200
46 200
22 413 400
Σ (Total)
200
fi (Xi – X )2
fi (Xi – X )3
fi (Xi – X )4
15 435
108 045
1 755
5 265
X = 33 400 / 200 = 167
M1 = 0 / 200 = 0 u
M2 = 41 200 / 200 = 206 u2
M3 = 46 200 / 200 = 231 u3 M4 = 22 413 400 / 200 = 112 067 u4 Resolver los siguientes ejercicios propuestos con datos agrupados o distribuciones de frecuencias, utilizando Momentos con relación a la media aritmética: 1) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Calificación fi Resp:
02
05
05
6 0u
12,69 u2
08 12
08
11 32
– 4,86 u3
z2 4 7 z
11
14 30
14
17
17
16 434,36 u4
20 4
E S TA D Í S T I C A I
2) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp :
0u
284 784 u2
108 377 472 u3
25,77067 x 1010 u4
3) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Ventas (miles)
02
fi
Resp:
06
06
16 0u
10
10
22
32,12 u2
14
14
62
18
18
40
– 3,792 u3
22
22
36
26 24
2 323,592 u4
4) Hallar los momentos del 1 al 4, con relación a la media aritmética de:
Personas
55
65
75
85
95
105
115
125
fi
24
26
28
28
26
30
26
12
Resp:
0u
451 u2
174 u3
377 077 u4
5) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Evaluación
02
fi
Resp:
05
05
16 0u
08
08
18
16,01 u2
11
11
32
14
14
36
– 0,664 u3
17
17
12
20 6
621,4497 u4
6) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
0u
274 944 u2
81 518 592 u3
23,500043 x 1010 u4
7) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Ventas (miles) fi
Resp:
12
16 20
0u
16
20 24
40,87 u2
20
24 26
58,8 u3
z2 4 8 z
24
28 20
28 32
32
16 3 260,4667 u4
36 14
WA LT E R C É S P E D E S R A M Í R E Z
8) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Alumnos fi
Resp:
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
0u
921,33 u2
10 304 u3
2 428 773,3333 u4
9) Hallar los momentos del 1 al 4, con relación a la media aritmética de: Pensiones fi
Resp:
0u
800
850
900
950
1000
1050
1100
1150
4
16
36
40
26
19
5
4
5 758,33 u2
161 000 u3
z2 4 9 z
94 873 958,33 u4
L e c c i ó n
2
5.2. ASIMETRÍA
Es una de las medidas de concentración estadística llamada también medida de forma hacia los lados (horizontal), porque cuando los datos son representados gráficamente, nos permite observar si existe o no simetría entre ellos. Si se traza una perpendicular al eje X a la altura de la media, se dice que tiene forma simétrica si tiene las mismas frecuencias equidistantes a ambos lados de la media; en caso contrario será de forma asimétrica. Una mayor concentración de datos hacia un lado del gráfico, deforma la figura, por ello se denomina asimétrica. Se denomina asimetría positiva si la mayoría de los datos se encuentran en el lado izquierdo de la media, en caso de concentrarse mayormente los datos en el lado derecho, la distribución tendrá asimétrica negativa. Los indicadores de asimetría, tanto positivo como negativo, determinan el grado de desequilibrio que tienen los datos en su conjunto, a ello se le denomina sesgo. Cuando el sesgo de un conjunto de datos es cero, se dice que la distribución es simétrica y se encuentra en equilibrio. La asimetría resulta útil en muchos campos, muchos modelos simplistas asumen una distribución normal, es decir simétrica en torno a la media. La distribución normal tiene una asimetría igual a cero; pero en realidad, no todos los valores no son perfectamente simétricos y la asimetría de la distribución, nos proporciona una idea sobre si las desviaciones sobre la media son positivas o negativas.
z2 5 1 z
E S TA D Í S T I C A I
5.2.1. Tipos de Asimetría Existen tres tipos de asimetría que son:
5.2.1.1. Asimetría negativa Se dice que una asimetría es negativa, porque el indicador tiene signo negativo; también porque la forma de distribución de sus datos, en todas las asimetrías negativas hay mayor concentración en el lado derecho del eje de simetría, que es una perpendicular trazada sobre la media aritmética, dejando al lado izquierdo menos datos; por ello, en el gráfico se observa que en la izquierda hay una cola más grande que la de la derecha, precisamente esa cola grande representa el sesgo o desequilibrio entre los datos.
5.2.1.2. Simetría Cuando el indicador de asimetría es cero, se dice que la distribución de datos es simétrica. También porque la forma de distribución de los datos, tiene la mayor concentración en el centro del eje de simetría, que es una perpendicular trazada sobre la media aritmética, dejando al lado derecho pocos datos en la misma magnitud de manera equidistante al lado izquierdo, por ello se observa en el gráfico un equilibrio entre los datos, porque ambas colas son iguales.
z2 5 2 z
WA LT E R C É S P E D E S R A M Í R E Z
5.2.1.3. Asimetría Positiva Se dice que una asimetría es positiva, porque el indicador tiene signo positivo; también porque la forma de distribución de sus datos, en todas las asimetrías positivas hay mayor concentración en el lado izquierdo del eje de simetría, que es una perpendicular trazada sobre la media aritmética, dejando al lado derecho menos datos; por ello, en el gráfico se observa que en la derecha hay una cola más grande que la de la izquierda, precisamente esa cola grande representa el sesgo o desequilibrio entre los datos.
5.2.2. Definición de Asimetría Existen diferentes maneras de medir el grado de asimetría que pueda o no existir dentro de un conjunto de datos; este indicador generalmente se multiplica por cien (100) para ser expresado en tanto por ciento (%). Como esta medida de forma de concentración se refiere al desequilibrio que pueda o no existir entre los datos y una medida de carácter central, solo se van a proponer ejercicios para distribuciones de frecuencias, porque ellas albergan una cantidad considerable de datos expresando claramente su forma. Existe una variedad de coeficientes de asimetría, en esta lección se proponen los que mayormente se utilizan y para que usted pueda compararlos, se van a utilizar los mismos ejercicios para cada modelo:
z2 5 3 z
E S TA D Í S T I C A I
5.2.2.1. Asimetría según Pearson Karl Pearson (Londres 27 de marzo de 1857- Londres, 27 de abril de 1936) fue un prominente científico, matemático y pensador británico, que estableció la disciplina de la estadística matemática. Desarrolló una intensa investigación sobre la aplicación de los métodos estadísticos en la biología y fue el fundador de la bioestadística. El coeficiente de asimetría de Pearson, sólo se puede utilizar en distribuciones con: una sola moda, campaniformes y moderadamente asimétricas. Pearson la define utilizando la relación empírica entre: media, mediana y moda; de tal relación, se obtienen dos coeficientes llamados primer y segundo coeficiente de asimetría. Pearson se basa en que todas las distribuciones simétricas, tienen: la media, la moda y la mediana iguales; por ello, cualquier diferencia de estas medidas con la media aritmética, representa un sesgo o simplemente asimetría, que representa una proporción o porcentaje de desviación con relación a la desviación estándar. Los coeficientes de asimetría de Pearson (AP), se definen como:
AP1 =
Primer coeficiente de Pearson
[( X – Mo) / S] 100
AP2 = [3( X – Me) / S] 100
Segundo coeficiente de Pearson
Donde: X
= Media Aritmética
Mo = Moda o Modo Me = Mediana S
= Desviación Estándar
Ejercicios resueltos
1) Hallar el primer y segundo coeficiente de asimetría de Pearson utilizando la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 fi
35
40
485 495 495 505 505 515 515 525
30
18
z2 5 4 z
12
10
5
WA LT E R C É S P E D E S R A M Í R E Z
Solución: Jornales
fi
Xi
455
465
35
460
16 100
– 18,80
465
475
40
470
18 800
–
475
485
30
480
485
495
18
495
505
505
515
515
525
(Xi – X )
fi (Xi – X )
Fi
2
12 370,40
35
8,80
3 097,60
75
14 400
1,20
43,20
105
490
8 820
11,20
2 257,92
123
12
500
6 000
21,20
5 393,28
135
10
510
5 100
31,20
9 734,40
145
5
520
2 600
41,20
8 487,20
150
150
Σ (Total)
fi Xi
71 820
41 384,00
X = 71 820 / 150 = 478,8 u
S2 = 41 384 / 150 = 275,89 u2
S =
Me = 465 + [(75 – 35) / 40] 10 = 475
275.89
= 16,61
Mo = 465 + [5 / (5 +10)] 10 = 468,33
Primer coeficiente de Pearson
AP1 = [(478,8 – 468,33) / 16,61] 100 = 63,03%
Segundo coeficiente de Pearson
AP2 = [3(478,8 – 475) / 16,61] 100 = 68,63%
2) Hallar el primer y segundo coeficiente de asimetría de Pearson con la siguiente distribución de estaturas en centímetros: Estat.
135 145 145 155 155 165 165 175 175 185 185 195 195 205
fi
15
25
45
65
25
20
Solución: Estaturas
fi
Xi
fi Xi
135
145
15
140
2100
– 27
10935
15
145
155
25
150
3750
– 17
7225
40
155
165
45
160
7200
–7
2205
85
165
175
65
170
11050
3
585
150
175
185
25
180
4500
13
4225
175
185
195
20
190
3800
23
10580
195
195
205
5
200
1000
33
5445
200
Σ (Total)
200
(Xi – X )
33400
fi (Xi – X )2
41200
z2 5 5 z
Fi
5
E S TA D Í S T I C A I
X = 33400 / 200 = 167
S2 = 41200 / 200 = 206 u2
206 = 13,35
S =
Me = 165 + [(100 – 85) / 65] 10 = 167,31 Mo = 165 + [20 / (20 +40)] 10 = 168,33 Primer coeficiente de Pearson
AP1 = [(167 – 168,33) / 13,35] 100 = – 9,96%
Segundo coeficiente de Pearson
AP2 = [3(167 – 167,31) / 13,35] 100 = – 6,97%
Resolver los siguientes ejercicios propuestos utilizando las asimetrías de Pearson:
1) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Calificación
02
fi
Resp:
05
05
6
08
08
12
AP1 = 7,58%
11
11
32
14
14
30
17
17
16
20 4
AP2 = 0,00%
2) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp:
AP1 = 24,80%
AP2 = 37,54%
3) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Ventas (miles)
02
fi
Resp:
06
06
16 AP1 = 35,63%
10
10
22
14 62
14
18 40
18
22 36
AP2 = 31,75%
4) Hallar el primer y segundo coeficiente de asimetría de Pearson con:
Personas
55
65
75
85
95
105
115
125
fi
24
26
28
28
26
30
26
12
Resp:
AP1 = – 80,04%
AP2 = 1,98%
z2 5 6 z
22
26 24
WA LT E R C É S P E D E S R A M Í R E Z
5) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Evaluación
02
fi
Resp:
05
05
16
08
08
18
AP1 = – 30,75%
11
11
32
14
14
36
17
17
12
20 6
AP2 = – 18,00%
6) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
AP1 = 17,10%
AP2 = 27,46%
7) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Ventas (miles)
12
fi
Resp:
16
16
20 AP1 = – 31,30%
20
20
24
24
24
26
28 20
28 32 16
32
36 14
AP2 = 25,35%
8) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Alumnos fi
Resp:
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
AP1 = 24,77%
AP2 = 24,57%
9) Hallar el primer y segundo coeficiente de asimetría de Pearson con: Pensiones fi
Resp:
800
850
900
950
1000
1050
1100
1150
4
16
36
40
26
19
5
4
AP1 = 24,89%
AP2 = 24,71%
5.2.2.2. Asimetría según Fisher Ronald Aylmer Fisher, (n. 17 de febrero de 1890 – m. 29 de julio de 1962) científico, matemático, estadístico, biólogo evolutivo y genetista inglés. Fisher realizó muchos avances en la estadística, siendo una de sus más importantes contribuciones, la inferencia estadística creada por él en 1920. Con relación a la asimetría, este tipo de asimetría Fisher la mide con relación a la media aritmética. z2 5 7 z
E S TA D Í S T I C A I
Cuando la distribución es simétrica, existe el mismo número de valores a la derecha que a la izquierda de la media aritmética, y por tanto el mismo número de desviaciones con signo positivo que con signo negativo, siendo la suma de desviaciones positivas igual a la suma de las negativas. Se puede decir entonces que a partir de las desviaciones (Xi – X ) elevadas a una potencia impar para no perder los signos de las desviaciones; lo más sencillo sería tomar más simple (que es tres), es decir, que Fisher toma como medida de asimetría el momento de orden tres centrado en la media. Pero, de hacer esto, esta medida vendría expresada en las mismas unidades que las de la variable, pero elevadas al cubo, por lo que no es invariante ante un cambio de escala. Para conseguir un indicador unidimensional, se debe dividir la expresión anterior por una cantidad que venga en sus mismas unidades de medida, que es la desviación típica al cubo. En estadística, la medida de asimetría más utilizada parte del uso del tercer momento estándar, por que como ya se ha mencionado, interesa mantener el signo de las desviaciones con respecto a la media, para determinar si dichas desviaciones son mayores en el lado derecho de la media o en el lado izquierdo. El coeficiente de asimetría de Fisher, mide la desviación de los datos conforme a la media con relación a la desviación estándar. El coeficiente de asimetría de Fisher (AF), se define como: AF = [M3 / M23 / 2] 100
o también;
AF = [M3 / S3] 100
Donde: M3 = Momento del orden 3 con relación a la media aritmética M2 = Momento del orden 2 con relación a la media aritmética S = Desviación estándar
Coeficiente de asimetría de Fisher estandarizado Este coeficiente estandarizado, se aplica al modelo de distribución normal (Estadística II) y se puede realizar cuando N >150, donde la varianza es 6/N. El coeficiente de asimetría es asintóticamente normal con media igual a cero (0) y varianza igual a uno (1) en términos del coeficiente, que se define de la siguiente manera:
Esta definición solo es para conocimiento, porque su uso corresponde a Estadística II. z2 5 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos:
1) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de jornales por semana en soles: Jornales
455 465 465 475 475 485
fi
35
40
485 495 495 505 505 515 515 525
30
18
12
10
5
Solución:
Jornales
fi
Xi
455
465
35
460
16 100
– 18,80
465
475
40
470
18 800
–
475
485
30
480
14 400
1,20
43,20
51,840
485
495
18
490
8 820
11,20
2 257,92
25 288,704
495
505
12
500
6 000
21,20
5 393,28
114 337,536
505
515
10
510
5 100
31,20
9 734,40
303 713,280
515
525
5
520
2 600
41,20
8 487,20
349 672,640
Σ (Total)
150
fi Xi
(Xi – X )
12 370,40
8,80
71 820
X = 71 820 / 150 = 478,8 u
fi (Xi – X )2 3 097,60
41 384,00
fi (Xi – X )3 – 232 563,520 –
27 258,880
533 241,600
M3 = 533 241,6 / 150 = 3 554,94 u3
S2 = 41 384 / 150 = 275,89 u2
S =
275.89 = 16,61
AF = [3 554,94 / 16,613] 100 = 77,58% 2) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de estaturas en centímetros: Estaturas 135 145 fi
15
145 155 155 165 165 175 175 185 185 195 195 205 25
45
65
z2 5 9 z
25
20
5
E S TA D Í S T I C A I
Solución: Estaturas
fi
Xi
fi Xi
(Xi – X )
fi (Xi – X )2
fi (Xi – X )3
135
145
15
140
2100
– 27
10935
– 295245
145
155
25
150
3750
– 17
7225
– 122825
155
165
45
160
7200
– 7
2205
–
165
175
65
170
11050
585
1755
175
185
25
180
4500
13
4225
54925
185
195
20
190
3800
23
10580
243340
195
205
5
200
1000
33
5445
179685
41200
46200
Σ (Total)
X
200
3
33400
= 33 400 / 200 = 167
S2 = 41 200 / 200 = 206 u2
15435
M3 = 46 200 / 200 = 231 u3
206
S =
= 13,35
AF = [231 / 13,353] 100 = 9,71%
Resolver los siguientes ejercicios propuestos utilizando la asimetría de Fisher: 1) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Calificación
02
fi
Resp:
05
05
6
08
08
12
11
11
32
14
14
30
17
17
16
20 4
– 10,75%
2) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp :
71,31%
3) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Ventas (miles) fi
Resp:
02
06 16
06
10
10
22
– 2,08% z2 6 0 z
14 62
14
18 40
18
22 36
22
26 24
WA LT E R C É S P E D E S R A M Í R E Z
4) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Personas fi
Resp:
55
65
75
85
95
105
115
125
24
26
28
28
26
30
26
12
1,82%
5) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Evaluación
02
fi
Resp:
05
05
16
08
08
18
11
11
32
14
14
36
17
17
12
20 6
– 1,04%
6) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
56,54%
7) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Ventas (miles)
12
fi
Resp:
16
16
20
20
20
24
24
24
26
28 20
28 32 16
32
36 14
22,50%
8) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Alumnos fi
Resp:
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
36,85%
9) Hallar el coeficiente de asimetría de Fisher utilizando la siguiente distribución de datos: Pensiones
800
850
900
950
1000
1050
1100
1150
fi 4 16 36 40 26 19 5 4 Resp: 36,85% z2 6 1 z
E S TA D Í S T I C A I
5.2.2.3. Asimetría según Bowley Arturo Lyon Bowley (Bristol, Inglaterra 6 de noviembre, 1869 - 21 de enero, 1957) era un inglés estadístico y economista quién trabajó en estadística económica e inició el uso de las técnicas de muestreo en exámenes sociales. Este tipo de asimetría, Bowley la mide con relación a la desviación o rango que hay entre el cuartil 3 (Q3) y el cuartil 1 (Q1). El coeficiente de asimetría de Bowley, se basa en que si la posición central de una distribución de datos que es la mediana (Me) o el segundo cuartil (Q2), tiene la misma desviación con el primer cuartil (Q1) que con el tercer cuartil (Q3), se dice que la distribución es simétricas. Cualquier diferencia entre estas desviaciones, representa un sesgo o simplemente asimetría. El coeficiente de asimetría de Bowley (ABQ), que representa una proporción o porcentaje de las desviaciones con respecto a la mediana entre la desviación del Q3 menos el Q1. Dicho coeficiente se definen como: ABQ = {[(Q3 – Me) – (Me – Q1)] / [Q3 – Q1]} 100
o
también
ABQ = [(Q3 – 2Q2 + Q1) / (Q3 – Q1)] 100 Donde: Q3 = Cuartil 3 Q1 = Cuartil 1 Me = Mediana = Cuartil 2 (Q2) Algunos investigadores estadísticos han observado que entre los Q1 y Q3, solo existe el 50% de los datos, por lo que piensan que el coeficiente de Bowley elimina el otro 50% repartidos entre el 25% inicial y el 25% final que representan a los extremos de un conjunto ordenado de datos. Esta iniciativa de Bowley que restringe el rango al 50%, también puede ser utilizada en Percentiles que permite ampliar más el rango del 50% al 80%, de la siguiente manera:
ABP = {[(P90 – Me) – (Me – P10)] / [P90 – P10]} 100 ABP = [(P90 – 2P50 + P10) / (P90 – P10)] 100 Donde: P90 = Percentil 90 P10 = Percentil 10 Me = Mediana = Percentil 50 (P50) z2 6 2 z
o
también
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos 1) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 fi
35
40
30
18
505 515 515 525
12
10
5
Solución: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi
35
40
30
18
12
10
5
Fi
35
75
105
123
135
145
150
Q1 = 465 + [(37,5 – 35) / 40] 10 = 465,63 Q2 = 465 + [(75 – 35) / 40] 10 = 475
P10 = 455 + [(15 – 0) / 35] 10 = 459,29
P50 = Me = Q2 = 475
Q3 = 485 + [(112,5 – 105) / 18] 10 = 489,17
P90 = 495 + [(135 – 123) / 12] 10 = 505
Coeficiente de Bowley con cuartiles:
ABQ = [(489,17 – 2(475) + 465,63) / (489,17 – 465,63)] 100 = 20,39%
Coeficiente ampliado con percentiles: ABP = [(505 – 2(475) + 459,29) / (505 – 459,29)] 100 = 31,26%
2) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles utilizando la siguiente distribución de estaturas en centímetros: Estat.
135 145 145 155 155 165
fi
15
25
165 175 175 185 185 195 195 205
45
65
25
20
5
Solución: Estat. 135 145 145 155 155 165 165 175 175 185 185 195 195 205 fi
15
25
45
65
25
20
5
Fi
15
40
85
150
175
195
200
Q1 = 155 + [(50 – 40) / 45] 10 = 157,22
P10 = 145 + [(20 – 15) / 25] 10 = 147
Q2 = 165 + [(100 – 85) / 65] 10 = 167,31 Q3 = 165 + [(150 – 85) / 65] 10 = 175
P50 = Me = Q2 = 167,31
P90 = 185 + [(180 – 175) / 20] 10 = 187,5
z2 6 3 z
E S TA D Í S T I C A I
Coeficiente de Bowley con cuartiles:
ABQ = [(175 – 2(167,31) + 157,22) / (175 – 157,22)] 100 = – 13,50% Coeficiente ampliado con percentiles: ABP = [(187,5 – 2(167,31) + 147) / (187,5 – 147)] 100 = – 0,30%
Resolver los siguientes ejercicios propuestos utilizando las asimetrías de Bowley:
1) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Calificación
02
fi
Resp:
05
05
6 ABQ =
08
08
12
11
11
32
14
14
30
17
17
16
20 4
ABP = – 1,21%
3,31%
2) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp:
ABQ =
3,97%
ABP = 22,73%
3) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Ventas (miles)
02
fi
Resp:
06
06
16 ABQ = 22,54%
10
10
22
14 62
14
18 40
18
22 36
22
26 24
ABP = 8,78%
4) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Personas fi
Resp:
ABQ =
55
65
75
85
95
105
115
125
24
26
28
28
26
30
26
12
0,78%
ABP = – 0,80% z2 6 4 z
WA LT E R C É S P E D E S R A M Í R E Z
5) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Evaluación
02
fi
Resp:
05
05
16
08
08
18
ABQ = – 9,70%
11
11
32
14
14
36
17
17
12
20 6
ABP = – 10,04%
6) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
ABQ =
4,47%
ABP = 15,29%
7) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Ventas (miles)
12
fi
Resp:
16
16
20 ABQ =
7,26%
20
20
24
24
24
26
28 20
28 32 16
32
36 14
ABP = 11,28%
8) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Alumnos fi
Resp:
ABQ =
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
7,94%
ABP = 10,55%
9) Hallar el coeficiente de asimetría de Bowley con cuartiles y el ampliado con percentiles de: Pensiones
fi Resp:
ABQ =
800
850
900
950
1000
1050
1100
1150
4
16
36
40
26
19
5
4
7,95%
ABP = 10,55%
5.2.2.4. Asimetría según Yule George Udny Yule (Colina de la haya cerca Haddington, Escocia 18 de febrero, 1871 – Cambridge, Inglaterra 26 de junio, 1951) era conocido generalmente como Udny Yule z2 6 5 z
E S TA D Í S T I C A I
que vino de una familia escocesa establecida integrada por oficiales de ejército, funcionarios, eruditos, y administradores. A la edad de 16, Udny comenzó a estudiar ingeniería en Universidad de Londres y más adelante se trasladó a Bonn, Alemania, donde él estudió debajo del científico famoso Heinrich Herz. Una gran influencia en su vida académica era el estadístico Karl Pearson, quien lo persuadió para que vuelva de nuevo a Londres. Yule era escritor prolífico, el toque de luz de sus publicaciones que eran quizás libro de textos Introducción a la teoría de la estadística, que pasó a través de catorce ediciones. Él era activo en Sociedad estadística real, al que le concedieron la Medalla del individuo en oro en 1911, fue posteriormente su presidente entre 1924-26. Yule no desarrolló completamente ninguna ramas de la teoría estadística, él tomó las primeras medidas en muchas direcciones que eran más adelante probar las líneas fructuosas para el progreso adicional, fue uno de los pioneros de la estadística moderna por que hizo contribuciones importantes a la teoría y a la práctica de: correlación, regresión, y asociación, así como el análisis de la serie de tiempo. Este tipo de simetría, Yule la mide con relación al centro de la distribución (Mediana). El coeficiente de asimetría de Yule (AYQ), que representa una proporción o porcentaje de las desviaciones con respecto a la mediana entre 2 veces la mediana que se define como: AYQ = {[(Q3 – Me) – (Me – Q1)] / 2 Me} 100
o
también
AYQ = [(Q3 – 2Q2 + Q1) / 2Q2] 100 Donde: Q3 = Cuartil 3 Q1 = Cuartil 1 Me = Mediana = Cuartil 2 (Q2) Algunos investigadores estadísticos han observado que entre los Q1 y Q3, solo existe el 50% de los datos, por lo que piensan que el coeficiente de Yule elimina el otro 50% repartidos entre el 25% inicial y el 25% final que representan a los extremos de un conjunto ordenado de datos. Esta iniciativa de Yule utilizada también por Bowley que restringe el rango al 50%, se utiliza también en Percentiles, para ampliar el rango del 50% al 80% de la siguiente manera: AYP = {[(P90 – Me) – (Me – P10)] / 2 Me} 100 AYP = [(P90 – 2P50 + P10) / 2P50] 100
Donde: P90 = Percentil 90 P10 = Percentil 10 Me = Mediana = Percentil 50 (P50) z2 6 6 z
o
también
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos
1) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 fi
35
40
30
18
12
10
515 525 5
Solución: Jornales
455 465 465 475 475 485 485 495 495 505 505 515 515 525
fi
35
40
30
18
12
10
5
Fi
35
75
105
123
135
145
150
Q1 = 465 + [(37,5 – 35) / 40] 10 = 465,63
P10 = 455 + [(15 – 0) / 35] 10 = 459,29
Q2 = 465 + [(75 – 35) / 40] 10 = 475
P50 = Me = Q2 = 475
Q3 = 485 + [(112,5 – 105) / 18] 10 = 489,17
P90 = 495 + [(135 – 123) / 12] 10 = 505
Coeficiente de Yule con cuartiles: AYQ = [(489,17 – 2(475) + 465,63) / 2(475)] 100 = 0,51% Coeficiente ampliado con percentiles: AYP = [(505 – 2(475) + 459,29) / 2(475)] 100 = 1,50%
2) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles utilizando la siguiente distribución de estaturas en centímetros: Estat. 135 145 145 155 155 165 165 175 175 185 185 195 195 205 fi
15
25
45
65
25
20
5
Solución: Estat. 135 145 145 155 155 165 165 175 175 185 185 195
195 205
fi
15
25
45
65
25
20
5
Fi
15
40
85
150
175
195
200
Q1 = 155 + [(50 – 40) / 45] 10 = 157,22
P10 = 145 + [(20 – 15) / 25] 10 = 147
Q2 = 165 + [(100 – 85) / 65] 10 = 167,31
P50 = Me = Q2 = 167,31
Q3 = 165 + [(150 – 85) / 65] 10 = 175
P90 = 185 + [(180 – 175) / 20] 10 = 187,5 z2 6 7 z
E S TA D Í S T I C A I
Coeficiente de Yule con cuartiles: AYQ = [(175 – 2(167,31) + 157,22) / 2(167,31)] 100 = – 0,72% Coeficiente ampliado con percentiles: AYP = [(187,5 – 2(167,31) + 147) / 2(167,31)] 100 = – 0,04%
Resolver los siguientes ejercicios propuestos utilizando las asimetrías de Yule:
1) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Calificación
02
fi
Resp:
05
05
6 AYQ =
08
08
12
11
11
32
14
14
30
17
17
16
20 4
AYP = – 0,55%
0,73%
2) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp:
AYQ =
0,89%
AYP = 10,54%
3) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Ventas (miles)
02
fi
Resp:
06
06
16 AYQ = 6,71%
10
10
22
14 62
14
18 40
18
22 36
22
26 24
AYP = 5,00%
4) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Personas fi
Resp:
AYQ =
55
65
75
85
95
105
115
125
24
26
28
28
26
30
26
12
0,16%
AYP = – 0,27% z2 6 8 z
WA LT E R C É S P E D E S R A M Í R E Z
5) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Evaluación
02
fi
Resp:
05
05
16
08
08
18
AYQ = – 2,63%
11
11
32
14
14
36
17
17
12
20 6
AYP = – 5,41%
6) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
AYQ =
1,02%
AYP = 6,82%
7) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Ventas (miles)
12
fi
Resp:
16
16
20 AYQ =
1,67%
20
20
24
24
24
26
28 20
28 32 16
32
36 14
AYP = 4,56%
8) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Alumnos fi
Resp:
AYQ =
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
1,91%
AYP = 4,71%
9) Hallar el coeficiente de asimetría de Yule con cuartiles y el ampliado con percentiles de: Pensiones
fi Resp:
AYQ =
800
850
900
950
1000
1050
1100
1150
4
16
36
40
26
19
5
4
0,45%
AYP = 1,11%
z2 6 9 z
E S TA D Í S T I C A I
5.2.2.5. Asimetría según Kelly El coeficiente de asimetría de Kelly (AK), representa la asimetría o sesgo existente en una de las colas. Para Kelly la asimetría debe ser medida por la posición central que es la mediana menos la mitad de las desviaciones entre el percentil 90 (P90) menos el percentil 10 (P10). Kelly fue el primero en utilizar percentiles en el cálculo de la asimetría, por esta razón con este aporte, los investigadores con posterioridad utilizaron estos percentiles en las asimetrías de Bowley y de Yule. Este tipo de asimetría tiene poco uso, debido a que se encuentra medida en unidades de información; es decir que si se utilizan soles, la asimetría esta en soles, La asimetría en las mismas unidades de la información, se define como:
AK =
Me – [(P90 + P10) / 2]
Donde: P90 = Percentil 90 P10 = Percentil 10 Me = Mediana = Percentil 50 (P50) Ejercicio resuelto Hallar el coeficiente de asimetría de Kelly con la siguiente distribución de frecuencias con los jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi
35
40
30
18
12
10
5
Solución: Jornales 455 465 465 475
475 485 485 495 495 505 505 515 515 525
fi
35
40
30
18
12
10
5
Fi
35
75
105
123
135
145
150
P10 = 455 + [(15 – 0) / 35] 10 = 459,29 Me = 465 + [(75 – 35) / 40] 10 = 475
P90 = 495 + [(135 – 123) / 12] 10 = 505 AK = 475 – [(505 + 459,29) / 2] = – 7,15 soles Por tener poco uso este coeficiente de asimetría, se ha creído conveniente hacer un solo ejercicio aplicativo, para conocimiento del lector. z2 7 0 z
L e c c i ó n
3
5.3. CURTOSIS Es una medida de forma hacia arriba (perpendicular), que en una distribución de frecuencias señala el grado de presencia de observaciones muy alejadas de la media, tomando como medida la desviación típica; por consiguiente, una distribución de frecuencias con gran curtosis, será aquella en que hay observaciones situadas a una distancia de la media igual a varias veces la desviación típica. Cuantas más observaciones alejadas de esa forma existan dentro de un conjunto de datos, habrá mayor curtosis, por el contrario si una variable no tiene observaciones cuya distancia a la media sea de varias veces la desviación típica, o las haya en grado mínimo, tendrá una curtosis pequeña. A menudo, en una variable con alta curtosis, al haber una cierta cantidad de observaciones muy alejadas de la media, en relación a su propia desviación típica, debe tener el resto de sus observaciones muy cercanas a la media, en comparación a su desviación típica. Esto hace que una curtosis elevada suela acompañarse de frecuencias relativamente muy grandes entorno a la media, dando lugar a un diagrama de frecuencias con forma “puntiaguda” en la media, de ahí el nombre alternativo de apuntamiento para la curtosis. Para entender correctamente el concepto de curtosis, es importante no confundir “curtosis alta” con “dispersión alta”. Una distribución de frecuencias con una cantidad importante de valores muy alejados de la media puede tener, por eso mismo, una dispersión elevada, pero no necesariamente una curtosis alta. Para que se dé una curtosis elevada tiene que ocurrir que esas grandes desviaciones respecto a la media, sean grandes en comparación a la desviación típica. De esa manera, puede verse que la cantidad de curtosis no está relacionada en absoluto con la dispersión de la distribución, sino con la forma de distribuirse esta dispersión.
z2 7 1 z
E S TA D Í S T I C A I
Se dice que una distribución tiene un apuntamiento o no, siempre en función de la distribución normal, que es representada gráficamente por la campana de Gauss a través de una función matemática llamada ley normal o función de densidad de la distribución, tal campana se define de la siguiente manera:
En esta función de densidad normal se produce una inflexión a la altura de la ordenada cuando la abscisa es igual a ( X + S) y también se produce otra cuando es igual a ( X – S). Como se sabe, una inflexión es el cambio de dirección de una curva porque siendo cóncava se vuelve convexa o viceversa.
El nombre de esta medida de concentración, proviene del griego “kyrtos o kurtos” que significa convexo, y de Kurtosis o Cyrtosis que significa curva convexa. Normalmente la palabra curtosis se escriba con “C”, mientras que para el coeficiente se reserva la letra “K”. En teoría de la probabilidad y estadística, la curtosis es una medida de altura de la distribución de probabilidad de una variable aleatoria de número real, que a pesar de encontrarse dividida por la varianza al cuadrado, no necesariamente una mayor varianza da un menor coeficiente de curtosis.
z2 7 2 z
5.3.1. Tipos de Curtosis Curtosis se presenta de tres maneras que son:
5.3.1.1. Platicúrtica El término platicúrtica proviene del griego “plato” que significa chato; se dice que un conjunto de datos tiene forma platicúrtica, cuando la altura de la concentración de datos, es menor a la altura que tendría una distribución de las características del modelo de probabilidad Normal.
5.3.1.2. Mesocúrtica El término mesocúrtica proviene del griego “meso” que significa medio; se dice que un conjunto de datos tiene forma mesocúrtica, cuando la altura de la concentración de datos, es igual a la altura que tendría una distribución de las características del modelo de probabilidad Normal.
z2 7 3 z
E S TA D Í S T I C A I
5.3.1.3. Leptocúrtica El término leptocúrtica proviene del griego “lepto” que significa alto; se dice que un conjunto de datos tiene forma leptocúrtica, cuando la altura de la concentración de datos, es mayor a la altura que tendría una distribución de las características del modelo de probabilidad Normal.
5.3.2. Utilidad del Coeficiente de Curtosis La curtosis nos informa sobre la existencia (o no) de observaciones mucho más alejadas a la media que la mayoría de ellas. En una distribución de frecuencias con curtosis alta (leptocúrtica), pueden encontrarse valores “excepcionalmente” alejados de la media; en una con curtosis baja, es imposible o muy infrecuente que eso se dé. Una curtosis elevada va, en cierta forma, asociada al concepto de “riesgo”: podrían registrarse valores de la variable muy diferentes a los habituales, y, por tanto, se haría difícil una predicción segura. z2 7 4 z
WA LT E R C É S P E D E S R A M Í R E Z
Algunos ejemplos serían los siguientes: 1. Si sabemos que un determinado producto ofrece unos beneficios mensuales con una media de 15 millones de soles y una desviación típica de 5 millones, nos podríamos hacer una idea del rango aproximado del beneficio mensual usando el Teorema de Tchebycheff: en una gran mayoría de los meses los beneficios estarían entre 5 y 25 millones. Sin embargo, el conocimiento de la curtosis nos ayudaría a matizar esta información: si los beneficios tienen poca curtosis, no habrá (apenas) valores excepcionalmente alejados de la media y, por ello, en el intervalo (5, 25) estarán prácticamente el 100% de los valores mensuales de beneficios; si la curtosis fuese alta habría algunos meses en donde el beneficio sería considerablemente menor o considerablemente mayor que lo indicado en ese intervalo. En el caso primero sería casi imposible encontrar un mes con pérdidas, en el segundo caso sería posible observar esa circunstancia: el “riesgo” sería mayor. 2. Si en una localidad “A” la lluvia anual es una distribución de frecuencias con moderada dispersión y mucha curtosis, ocurrirá que el comportamiento pluvial será relativamente estable año tras año, sin grandes altibajos, pero, excepcionalmente, se producirán años con una precipitación muy diferente de las habituales: o bien años muy secos, o bien años extremadamente lluviosos. Si en otra localidad “B” la lluvia anual es una distribución de frecuencias con gran dispersión pero con curtosis moderada, habrá constantemente una gran variabilidad interanual en la precipitación, y por tanto los años muy secos o extremadamente lluviosos no serán vistos como “excepcionales” o “imprevistos”, sino que ocurrirán con cierta frecuencia. La dificultad en la “predicción” de valores futuros de una distribución de frecuencias de elevada curtosis reside en que es difícil saber hasta dónde pueden darse sus valores, por muchas observaciones que se tengan recogidas hasta el presente. De nuevo aparece el concepto de “riesgo” relacionado con la curtosis.
5.3.3. Definición de Curtosis Existen diferentes maneras de medir el grado de apuntamiento o altura de un conjunto de datos. Como esta medida de forma de concentración se refiere a la altura o elevación que pueda existir entre los datos con relación al modelo normal, solo se van a proponer ejercicios para distribuciones de frecuencias, porque ellas albergan una cantidad considerable de datos expresando claramente su forma de altura. Existe una variedad de coeficientes de curtosis, en esta lección se proponen dos que mayormente se utilizan:
5.3.3.1. Curtosis según Fisher Ronald Fisher toma como medida de apuntamiento o curtosis el momento de orden cuatro centrado en la media, pero como esta medida esta expresada a la cuarta, para conseguir un indicador unidimensional, se debe dividir la expresión anterior por una z2 7 5 z
E S TA D Í S T I C A I
cantidad que venga en sus mismas unidades de medida, que es la varianza al cuadrado (M22 = S4). La medida de curtosis más utilizada en estadística es el coeficiente de Fisher (KF), que cuando es igual a tres (3), se dice que la distribución de datos tiene características de una distribución de probabilidad normal. El coeficiente de Fisher se basa en la definición de curtosis hecha por primera vez en 1905 por Pearson, quien afirmó que: K = ∑(X – μ)4 / [∑(X – μ)2]2. En esta definición de curtosis hecha para la Estadística Inferencial, se dice que si K es igual a 3, la distribución de probabilidad es normal o sea mesocúrtica; en cambio si es menor de 3, la distribución es platicúrtica, mientras que se es mayor de 3, la distribución es leptocúrtica. Esta misma definición de Pearson, Fisher la utiliza en la Estadística Descriptiva utilizando momentos, tal como se muestra a continuación:
KF = M4 / M22
o también;
KF = M4 / S4
Donde: M4 = Momento del orden 4 con relación a la media aritmética M2 = Momento del orden 2 con relación a la media aritmética o Varianza
S
= Desviación estándar.
Según este coeficiente, los tres tipos de curtosis se dan, cuando:
KF = M4 / S4 < 3 (Se dice que la distribución es Platicúrtica) KF = M4 / S4 = 3 (Se dice que la distribución es Mesocúrtica) KF = M4 / S4 > 3 (Se dice que la distribución es Leptocúrtica). También se presenta el coeficiente de Fisher restándole tres (3), para hacer que la distribución normal sea cero (0), de la siguiente manera:
KF = [M4 / S4] – 3 < 0
(Tiene menos punta que la distribución normal, Platicúrtica)
KF = [M4 / S ] – 3 = 0
(Tiene igual punta que la distribución normal, Mesocúrtica)
KF = [M4 / S ] – 3 > 0
(Tiene más punta que la distribución normal, Leptocúrtica)
4
4
Ejercicios resueltos
1) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 fi
35
40
30
18
z2 7 6 z
12
10
515 525 5
WA LT E R C É S P E D E S R A M Í R E Z
Solución: Jornales
fi
Xi
fi Xi
455
465
35
460
16 100
– 18,80
465
475
40
470
18 800
–
475
485
30
480
485
495
18
495
505
505
515
515
525
Σ (Total)
(Xi – X )
fi (Xi – X )2
fi (Xi – X )4
12 370,40
4 372 194,1760
8,80
3 097,60
239 878,1440
14 400
1,20
43,20
62,2080
490
8 820
11,20
2 257,92
283 233,4848
12
500
6 000
21,20
5 393,28
2 423 955,7632
10
510
5 100
31,20
9 734,40
9 475 854,3360
5
520
2 600
41,20
8 487,20
14 406 512,7680
41 384,00
31 201 690,8800
150
71 820
X = 71 820 / 150 = 478,8 u
M2 = 41 384 / 150 = 275,89 u2 M4 = 31 201 690,88 / 150 = 208 011,27 u4 KF = 208 011,27 / 275,892 = 2,73 (Platicúrtica)
2) Hallar el coeficiente de curtosis de Fisher utilizando las siguientes estaturas en centímetros:
Estaturas 135 145 145 155 fi
15
155 165 165 175
25
45
65
175 185 185 195 195 205 25
20
5
Solución:
Estaturas
fi
Xi
fi Xi
135
145
15
140
2 100
– 27
10 935
7 971 615
145
155
25
150
3 750
– 17
7 225
2 088 025
155
165
45
160
7 200
– 7
2 205
108 045
165
175
65
170
11 050
3
585
5 265
175
185
25
180
4 500
13
4 225
714 025
185
195
20
190
3 800
23
10 580
5 596 820
195
205
5
200
1 000
33
5 445
5 929 605
41 200
22 413 400
Σ (Total)
200
(Xi – X )
33 400
z2 7 7 z
fi (Xi – X )
2
fi (Xi – X )
4
E S TA D Í S T I C A I
X = 33 400 / 200 = 167
M2 = 41 200 / 200 = 206 u2 M4 = 22 413 400 / 200 = 112 067 u4 KF = 112 067 / 2062 = 2,64 (Platicúrtica) Resolver los siguientes ejercicios propuestos utilizando el coeficiente de curtosis de Fisher: 1) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Calificación
02
fi Resp:
05
05
6
08
08
12
11
11
32
14
14
30
17
17
16
20 4
2,70 (Platicúrtica)
2) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi Resp:
3,18 (Leptocúrtica)
3) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Ventas (miles)
02
fi Resp:
06
06
16
10
10
22
14
14
62
18
18
40
22
22
36
26 24
2,25 (Platicúrtica)
4) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Personas
55
65
75
85
95
105
115
125
fi
24
26
28
28
26
30
26
12
Resp:
1,85 (Platicúrtica)
5) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Evaluación fi Resp:
02
05 16
05
08 18
08
11 32
2,42 (Platicúrtica) z2 7 8 z
11
14 36
14
17 12
17
20 6
WA LT E R C É S P E D E S R A M Í R E Z
6) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi Resp:
3,11 (Leptocúrtica)
7) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Ventas (miles)
12
fi Resp:
16
16
20
20
20
24
24
24
26
28 20
28 32 16
32
36 14
1,95 (Platicúrtica)
8) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Alumnos
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
fi Resp:
2,86 (Platicúrtica)
9) Hallar el coeficiente de curtosis de Fisher utilizando la siguiente distribución de datos: Pensiones
800
850
900
950
1000
1050
1100
1150
fi 4 16 36 40 26 19 5 4 Resp: 2,86 (Platicúrtica)
5.3.3.2. Curtosis según Cuantiles Conociendo la utilidad de los cuantiles para el cálculo de la asimetría, los investigadores estadísticos, han propuesto una fórmula donde se conjugan los cuartiles y percentiles, que ha tenido acogida en el cálculo de curtosis; esta medida de forma de punta, divide media variación cuartílica entre la variación percentílica. El coeficiente de curtosis con cuantiles, se define de la siguiente manera: KC = (Q3 – Q1) / 2 (P90 – P10)
o también;
Donde: Q3 = Cuartil 3 Q1 = Cuartil 1 P90 = Percentil 90 P10 = Percentil 10 z2 7 9 z
KC = 0,5 (Q3 – Q1) / (P90 – P10)
E S TA D Í S T I C A I
Según este coeficiente, los tres tipos de curtosis se dan, cuando:
KC = 0,5 (Q3 – Q1) / (P90 – P10) < 0,263 (Se dice que la distribución es Platicúrtica) KC = 0,5 (Q3 – Q1) / (P90 – P10) = 0,263 (Se dice que la distribución es Mesocúrtica) KC = 0,5 (Q3 – Q1) / (P90 – P10) > 0,263 (Se dice que la distribución es Leptocúrtica) Esta fórmula que emplea cuartiles y percentiles, si es utilizada por los investigadores de Estadística, por lo tanto se desarrollará a continuación ejercicios aplicativos relacionados con esta definición de curtosis.
Ejercicios resueltos 1) Hallar el coeficiente de curtosis con cuantiles utilizando la siguiente distribución de jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi
35
40
30
18
12
10
5
Solución: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi
35
40
30
18
12
10
5
Fi
35
75
105
123
135
145
150
Q3 = 485 + [(112,5 – 105) / 18] 10 = 489,17 Q1 = 465 + [(37,5 – 35) / 40] 10 = 465,63 P90 = 495 + [(135 – 123) / 12] 10 = 505 P10 = 455 + [(15 – 0) / 35] 10 = 459,29 KC = 0.5 (489,17 – 465,63) / (505 – 459,29) = 0,2575 (Platicúrtica) 2) Hallar el coeficiente de curtosis con cuantiles utilizando la siguiente distribución de estaturas en centímetros: Estat. 135 145 145 155 155 165 fi
15
25
165 175 175 185 185 195 195 205
45
65
25
20
5
Solución: Estat.
135 145 145 155 155 165 165 175
175 185 185 195 195 205
fi
15
25
45
65
25
20
5
Fi
15
40
85
150
175
195
200
z2 8 0 z
WA LT E R C É S P E D E S R A M Í R E Z
Q3 = 165 + [(150 – 85) / 65] 10 = 175
Q1 = 155 + [(50 – 40) / 45] 10 = 157,22 P90 = 185 + [(180 – 175) / 20] 10 = 187,5 P10 = 145 + [(20 – 15) / 25] 10 = 147 KC = 0.5 (175 – 157,22) / (187,5 – 147) = 0,2195 (Platicúrtica) Resolver los siguientes ejercicios propuestos utilizando curtosis con cuantiles: 1) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Calificación
02
fi
Resp:
05
05
6
08
08
12
11
11
32
14
14
30
17
17
16
20 4
0,2449 (Platicúrtica)
2) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp:
0,2416 (Platicúrtica)
3) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Ventas (miles)
02
fi
Resp:
06
06
16
10
10
22
14
14
62
18
18
40
22
22
36
26 24
0,2616 (Platicúrtica)
4) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos:
Personas
55
65
75
85
95
105
115
125
fi
24
26
28
28
26
30
26
12
Resp:
0,3072 (Leptocúrtica)
5) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Evaluación fi
Resp:
02
05
05
16
08 18
08
11 32
0,2520 (Platicúrtica) z2 8 1 z
11
14 36
14
17 12
17
20 6
E S TA D Í S T I C A I
6) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
0,2555 (Platicúrtica)
7) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Ventas (miles)
12
fi
16
16
20
Resp:
20
20
24
24
24
26
28 20
28 32 16
32
36 14
0,2843 (Leptocúrtica)
8) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Alumnos fi
Resp:
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
0,2688 (Leptocúrtica)
9) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Pensiones
800
850
900
950
1000
1050
1100
1150
fi 4 16 36 40 26 19 5 4
Resp:
0,2688 (Leptocúrtica)
5.3.3.3. Curtosis según Moors En 1988, Moors define un coeficiente de curtosis basado en octiles; es decir, cuantiles dividido en 8 partes iguales que los utiliza en la fórmula siguiente:
K = (O7 – O5) + (O3 – O1) / (O6 – O2)
Donde: O1 O2 O3 O4 O5 O6 O7
= = = = = = =
Octil Octil Octil Octil Octil Octil Octil
1 2 3 4 5 6 7
(Ubicado (Ubicado (Ubicado (Ubicado (Ubicado (Ubicado (Ubicado
al al al al al al al
12,5 25,0 37,5 50,0 62,5 75,0 87,5
% % % % % % %
de de de de de de de
los los los los los los los
datos datos datos datos datos datos datos z2 8 2 z
ordenados) ordenados) ordenados) ordenados) ordenados) ordenados) ordenados)
WA LT E R C É S P E D E S R A M Í R E Z
Según este coeficiente, los tres tipos de curtosis se dan, cuando:
K = (O7 – O5) + (O3 – O1) / (O6 – O2) < 1,237 (Se dice que la distribución es Platicúrtica) K = (O7 – O5) + (O3 – O1) / (O6 – O2) = 1,237 (Se dice que la distribución es Mesocúrtica) K = (O7 – O5) + (O3 – O1) / (O6 – O2) > 1,237 (Se dice que la distribución es Leptocúrtica)
En esta definición de curtosis, se dice que la distribución es normal si K = 1,237. Como los octiles (12,5%) representan la mitad de los cuartiles (25%), éstos no han tenido mucho uso en la estadística, por ello la fórmula es poco conocida. Se deja a criterio del lector el utilizar o no esta definición de curtosis, porque solo se ha propuesto para conocimiento del lector.
z2 8 3 z
L e c c i ó n
4
5.4. DESIGUALDAD Es una medida estadística de concentración, que mide el desequilibrio o desigualdad que pueda existir al relacionar la cantidad de datos o frecuencias que le corresponden a cada valor de la variable. Se denomina concentración de desigualdad a la mayor o menor equidad en el reparto de la suma total de los valores de la variable. Generalmente este tipo de medida, considera que su aplicación tiene utilidad, cuando la variable representa valores monetarios; por ejemplo: renta, salarios, inversiones, etc. Aunque el índice de concentración de desigualdad se utiliza sobre todo para medir la desigualdad en los ingresos, también puede utilizarse para medir la desigualdad en la riqueza suponiendo que nadie disponga de una riqueza neta negativa.
5.4.1. Formas de Concentración de Datos En la medición del grado de desigualdad, los valores extremos que se pueden dar dentro de una distribución de frecuencias sobre riquezas o sobre ingresos, son las concentraciones mínimas y las concentraciones máximas: Como se sabe, cuanto más se acerca a 1 el coeficiente de desigualdad, peor es la distribución del ingreso, en tanto que cuanto más se acerca a 0, es mejor. Así, un coeficiente igual a 1 sería sinónimo de la peor distribución posible, al significar que una sola persona se apropia de todo el ingreso, en tanto que uno igual a 0 reflejaría una perfecta distribución, pues indicaría que todos reciben una cantidad exactamente igual.
z2 8 5 z
E S TA D Í S T I C A I
Lógicamente, ambas situaciones extremas son utópicas, pues ninguna sociedad toleraría la primera, en tanto que dadas las diferentes: capacidades, habilidades, disposiciones y conductas humanas, resulta difícil aspirar a la segunda. Lo que se pretende es que el índice, dentro de los términos de la racionalidad, sea el más bajo posible. Según el Informe de Desarrollo Humano del año 2012, el Coeficiente de desigualdad medido con el coeficiente de Gini, Namibia tiene 0,707 (situación de máxima desigualdad), mientras que Dinamarca tiene 0,281 (situación de máximo reparto igualitario. De acuerdo a este informe, el Coeficiente de Gini de Brasil es 0,547; Chile 0,503; México 0,476; Argentina 0,411; Perú 0,481; Venezuela 0,390; China 0,474, Estados Unidos 0,469; Rusia 0,417; Portugal 0,345; Italia 0,319; Francia 0,305; España 0,340; Alemania 0,283; Suecia 0,244; Japón 0,321.
5.4.1.1. Concentración mínima Este caso extremo se da, cuando el conjunto total de valores de la variable, se encuentran repartidos por igual a cada uno de los valores; es decir, existe un reparto equitativo entre los datos siendo el coeficiente de desigualdad cero (0). Lo expresado se define de la siguiente manera: Sea la variable Xi con sus valores: X 1, X 2, X 3, X 4, ………. X n - 1 y X n. Se dice que existe concentración mínima, cuando lo valores: X 1 = X 2 = X 3 = X 4 = ………. = X n - 1 = X n = (Total ingresos / n)
5.4.1.2. Concentración máxima Este otro caso extremo se da, cuando el conjunto total de valores de la variable, no se encuentran repartidos, sino asignados al valor más alto; es decir, no existe un reparto equitativo entre los datos, porque no lo hay siendo el coeficiente de desigualdad uno (1). Lo expresado se define de la siguiente manera: Sea la variable Xi con sus valores: X 1, X 2, X 3, X 4, ………. X n - 1 y X n. Se dice que existe concentración mínima, cuando lo valores son: X 1 = X 2 = X 3 = X 4 = ………. = X n - 1 =
z2 8 6 z
0;
X n = Total ingresos
WA LT E R C É S P E D E S R A M Í R E Z
5.4.2. Definición de la Desigualdad Para medir el grado de desigualdad en la distribución de ingresos o de riquezas, existen una serie de índices disponibles, con propiedades distintas entre sí, tales como: los indicadores basados en función de la utilidad de Dalton y de Atkinson (1970), los indicadores basados en la entropía de Theil (1966), y los indicadores mayormente utilizados que miden la desigualdad de los ingresos de Gini y la curva de Lorenz. En principio ninguno de ellos es mejor que el otro; la utilidad de cada uno depende del uso que tenga para satisfacer las propiedades deseables en los indicadores de desigualdad que son: 1º Independencia de escala, porque el indicador no debe variar ante transformaciones proporcionales de los ingresos 2º Independencia de tamaño de la población, si se agrega un número proporcional de individuos a todos los niveles de ingreso, el índice no debe variar. 3º Independencia ante el cambio de posición, porque si los individuos intercambian posición, esto no debe afectar al indicador. 4º Principio de transferencia el indicador debe variar ante el cambio de individuos de una escala a otra y debe ser más fuerte si son extremas. 5º Descomposición aditiva, porque la concentración de ingresos para una población debe ser igual a la suma de la desigualdad inter-grupal e intra-grupal para los sub-grupos que la conforman. 6º Rango del índice, es deseable que éstos tengan como mínimo valor cero (0) y como máximo uno (1).
5.4.2.1. Índice de Gini Corrado Gini (Motta de Livenza, Treviso, Italia, 23 de Mayo de 1884, Roma, 13 de Marzo de 1965), fue desde joven un ejemplo de múltiples disciplinas. Estudió Matemáticas y Derecho en la Universidad de Bolonia y fue profesor de materias tan diversas como Estadística, Economía, Derecho, Biometría, Demografía y Sociología en las universidades de Cagliari, Luigi Boconi (Milán), Padua, Roma y Minnesota. Fue también responsable del departamento de estadística del Ministerio de la Guerra italiano durante la primera guerra mundial, miembro de la “Comisión para los problemas de la Postguerra”, director del Instituto Central de Estadística (1926.1932), colaborador de la Sociedad de Naciones y participó en varias expediciones de investigación antropológica-demográfica a diversas zonas del globo. Sus principales aportaciones científicas pertenecen al campo de la estadística: en la teoría de las distribuciones, en la estimación de parámetros en la medida del valor y márgenes de error de variables, medidas de variabilidad, etc. En el campo de la demografía prestó una atención especial a los fenómenos migratorios. Gini fue también un influyente teórico fascista e ideólogo que escribió Las bases científicas del fascismo en 1927. z2 8 7 z
E S TA D Í S T I C A I
El coeficiente de Gini es un número entre 0 y 1, en donde 0 se corresponde con la perfecta igualdad (todos tienen los mismos ingresos) y 1 se corresponde con la perfecta desigualdad (una persona tiene todos los ingresos y los demás ninguno). El índice de Gini, es el coeficiente de Gini multiplicado por 100 para expresarlo en porcentaje, que es más fácil de comprender. El coeficiente de Gini se calcula como una razón de las áreas en el diagrama de la curva de Lorenz. Si el área entre la línea de perfecta igualdad y la curva de Lorenz es a, y el área por debajo de la curva de Lorenz es b, entonces el coeficiente de Gini es a / (a + b).
Este coeficiente es universalmente más utilizado por ser fácilmente comprensible, pese a no que tiene todas la propiedades deseables en un indicador de desigualdad; por ejemplo: no varía fuertemente en una fuerte transferencia de datos de una clase a otra, no responde a una descomposición aditiva, no es claro cuando al comparar dos indicadores las curvas de Lorenz se cruzan, y el peso de las transferencias es mayor en torno al centro de distribución. Según lo expresado, el coeficiente de Gini, se puede definir de la siguiente manera:
Donde: pi = fi / n
(Valor relativo (hi), frecuencia absoluta entre el número total de datos) .
qi = fi Xi / Σ fi Xi (Valor relativo del ingreso por clase o por individuo entre el ingreso total) Pi = Σ p i
(Valor relativo agregado o acumulado de pi).
Qi = Σ qi
(Valor relativo agregado o acumulado de qi).
Recuerde que los valores agregados son acumulaciones sucesivas que se van totalizando a partir de la primera clase, a medida pasa de una clase a otra; es decir, el valor acumulado a la segunda clase, será la suma de las dos primeras clase, el valor acumulado a la tercera clase, será la suma de las tres primeras clase, así sucesivamente
z2 8 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos 1) Hallar el coeficiente y el índice de Gini utilizando los jornales por semana en soles: Jornales 455 465 fi
465 475
475 485
485 495
495 505
40
30
18
12
35
505 515 515 525 10
5
Solución: Jornales
fi
Xi
455
465
35
460
16 100
0,2333
0,2242
0,2333
0,2242
465
475
40
470
18 800
0,2667
0,2618
0,5000
0,4860
475
485
30
480
14 400
0,2000
0,2005
0,7000
0,6865
485
495
18
490
8 820
0,1200
0,1228
0,8200
0,8093
495
505
12
500
6 000
0,0800
0,0835
0,9000
0,8928
505
515
10
510
5 100
0,0667
0,0710
0,9667
0,9638
515
525
5
520
2 600
0,0333
0,0362
1,0000
1,0000
71 820
1,0000
1,0000
5,1200
5,0626
Σ (Total)
150
fi Xi
pi
qi
Pi
Qi
Coeficiente G = (5,12 – 5,0626) / (5,12 – 1) = 0,0139 Índice G = 0,0139 (100) = 1,39%
2) Hallar el coeficiente y el índice de Gini utilizando las siguientes estaturas en centímetros: Estaturas fi
135 145
145 155
155 165
15
25
45
165 175 175 185 65
25
185 195
195 205
20
5
Solución: Estaturas
fi
Xi
fi Xi
pi
135
145
15
140
2 100
0,075
145
155
25
150
3 750
0,125
155
165
45
160
7 200
165
175
65
170
11 050
175
185
25
180
185
195
20
190
195
205
5
200
Σ (Total)
200
qi
Pi
Qi
0,075
0,0629
0,1123
0,200
0,1752
0,225
0,2156
0,425
0,3908
0,325
0,3308
0,750
0,7216
4 500
0,125
0,1347
0,875
0,8563
3 800
0,100
0,1138
0,975
0,9701
0,0629
1 000
0,025
0,0299
1,000
1,0000
33 400
1,000
1,0000
4,300
4,1769
z2 8 9 z
E S TA D Í S T I C A I
Coeficiente G = (4,3 – 4,1769) / (4,3 – 1) = 0,0373 Índice G = 0,0373 (100) = 3,73%
3) Hallar el coeficiente y el índice de Gini utilizando los jornales por semana en soles: Jornales 455 465 465 475 475 485 485 495 495 505 505 515 515 525 fi
35
40
30
18
12
10
5
Solución: Jornales
fi
Xi
fi Xi
pi
qi
Pi
Qi
455
465
22
460
10 120
0,1467
0,1378
0,1467
0,1378
465
475
22
470
10 340
0,1467
0,1408
0,2904
0,2786
475
485
22
480
10 560
0,1466
0,1438
0,4400
0,4224
485
495
21
490
10 290
0,1400
0,1401
0,5800
0,5625
495
505
21
500
10 500
0,1400
0,1430
0,7200
0,7055
505
515
21
510
10 710
0,1400
0,1458
0,8600
0,8513
515
525
21
520
10 920
0,1400
0,1487
1,0000
1,0000
73 440
1,0000
1,0000
4,0371
3,9581
Σ (Total)
150
Coeficiente G = (4,0371 – 3,9581) / (4,0371 – 1) = 0,0260 Índice G = 0,0260 (100) = 2,60% En este ejercicio como usted habrá notado, las veces que se repiten los valores de la variable jornal, a pesar de que prácticamente iguales, el índice de Gini no es cero, es de 2,6%. Esto quiere decir que dentro de una distribución de datos, no es suficiente que a cada valor de la variable se reparta la misma cantidad de datos, sino que la proporción de los valores repartidos en su conjunto, sean los mismos en cada clase.
Resolver los siguientes ejercicios propuestos utilizando el Índice de Gini: 1) Hallar el índice de Gini de la siguiente distribución de datos: Calificación fi
Resp:
02
05 6
05
08 12
08
11 32
15,38%
z2 9 0 z
11
14 30
14
17 16
17
20 4
WA LT E R C É S P E D E S R A M Í R E Z
2) Hallar el índice de Gini de la siguiente distribución de datos: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
21
58
65
28
16
10
2
fi
Resp:
11,13%
3) Hallar el índice de Gini de la siguiente distribución de datos: Ventas (miles)
02
fi
Resp:
06
06
16
10
10
22
14
14
62
18
18
40
22
22
36
26 24
23,40%
4) Hallar el índice de Gini de la siguiente distribución de datos:
Personas
55
65
75
85
95
105
115
125
fi
24
26
28
28
26
30
26
12
Resp:
13,85%
5) Hallar el índice de Gini de la siguiente distribución de datos: Evaluación
02
fi
Resp:
05
05
16
08
08
18
11
11
32
14
14
36
17
17
12
20 6
18,90%
6) Hallar el índice de Gini de la siguiente distribución de datos: Sueldos
800
1 200
1 600
2 000
2 400
2 800
3 200
16
38
50
24
16
4
2
fi
Resp:
10,74%
7) Hallar el índice de Gini de la siguiente distribución de datos: Ventas (miles) fi
Resp:
12
16 20
16
20
20
24
16,17%
z2 9 1 z
24 26
24
28 20
28 32 16
32
36 14
E S TA D Í S T I C A I
8) Hallar el índice de Gini de la siguiente distribución de datos: Alumnos fi
Resp:
30
50
70
90
110
130
150
170
4
16
36
40
26
19
5
4
12,84%
9) Hallar el índice de Gini de la siguiente distribución de datos: Pensiones fi
800
850
900
950
1000
1050
1100
1150
4
16
36
40
26
19
5
4
Resp: 3,10%
5.4.2.2. Curva de Lorenz Max Otto Lorenz (1880 – 1962) economista estadounidense que desarrolló la curva de Lorenz en 1905 para describir las desigualdades del ingreso. Él publicó su estudio como estudiante del doctorado en la Universidad de Wisconsin en Madison, recibiendo el grado de doctor en 1906. La curva de Lorenz es una forma gráfica de mostrar la distribución de la renta en una población. En ella se relacionan los porcentajes acumulados de población con porcentajes acumulados de la renta que esta población recibe. En el eje de abscisas se representa la población “ordenada” de forma que los percentiles de renta más baja quedan a la izquierda y los de renta más alta quedan a la derecha. El eje de ordenadas representa las rentas. La línea negra representaría una distribución igualitaria de la renta.
En la gráfica se muestran como ejemplo la representación de dos países imaginarios, uno en azul y otro en rojo. La distribución de la renta en el país azul es más desigual que en el país rojo. En el caso del país azul, el cuarenta por ciento más pobre de la población recibe una renta inferior al veinte por ciento del total del país. En cambio, en el z2 9 2 z
WA LT E R C É S P E D E S R A M Í R E Z
país rojo, el cuarenta por ciento más pobre recibe más del veinte por ciento de la renta. La línea diagonal negra muestra la situación de un país en el que todos y cada uno de los individuos obtuviese exactamente la misma renta; sería la equidad absoluta. Cuanto más próxima esté la curva de Lorenz de la diagonal, más equitativa será la distribución de la renta de ese país. En la práctica si se grafican los valores de “P” en la abscisa y de “Q” en la ordenada, tomados del ´cálculo del coeficiente de Gini, se puede obtener la curva de Lorenz, por ello el lector si desea ver la variación de la desigualdad, puede graficarlos.
z2 9 3 z
E S TA D Í S T I C A I
AUTOEVALUACIÓN Nº 5 1) Hallar el cuarto momento con relación al origen de: 65 y 41 asistentes. A) 14 564 232,8
B) 17 937 669,2
C) 22 457 124,6
68, 81, 72, 56, 60, 54, 78, 55, D) 12 258 235,4
E) 10 158 247,5
2) Hallar el primer momento con relación al origen de: Remuneraciones
800
1 200
1 600
2 000
2 400
2 800
3 200
7
18
22
24
15
8
6
fi
A) 2 325
B) 1 762
C) 2 045
D) 1 880
E) 1 798
3) Hallar el tercer momento con relación a la media aritmética de: 458, 425, 462, 435, 452, 470, 482 y 484 participantes. A) – 2 465,625
B) – 3 145,200
C) 2 575,645
D) – 1 958,425
E) 2 470,500
4) Hallar el segundo momento con relación a la media aritmética de: Remuneraciones fi
A) 464 232
800
1 200
1 600
2 000
2 400
2 800
3 200
7
18
22
24
15
8
6
B) 456 789
C) 398 400
D) 388 354
E) 412 686
5) Hallar el primer coeficiente de asimetría de Pearson de la siguiente distribución de datos: Personas fi
A) – 14,25%
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) – 16,63%
C) – 10,11%
D) – 3,88%
E) – 4,86%
6) Hallar el segundo coeficiente de asimetría de Pearson de la siguiente distribución de datos: Personas fi
A) – 17,24%
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) – 28,73%
C) – 15,84%
z2 9 4 z
D) – 13,20%
E) – 14,24%
WA LT E R C É S P E D E S R A M Í R E Z
7) Hallar el coeficiente de asimetría de Fisher de la siguiente distribución de datos: Personas fi
A) 31,34%
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) – 5,56%
C) 18,32%
D) – 33,25%
E) 26,58%
8) Hallar el coeficiente de asimetría de Bowley con cuartiles utilizando los siguientes datos: Personas fi
A) – 11,68%
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) 1,26%
C) – 10,05%
D) – 7,85%
E) – 9,45%
9) Hallar el coeficiente de asimetría ampliado de Bowley con percentiles utilizando los siguientes datos: Personas fi
A) 8,20%
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) 5,64%
C) – 4,24%
D) – 1,82%
E) 6,00%
10) Hallar el coeficiente de asimetría de Yule con cuartiles utilizando los siguientes datos: Personas fi
A) – 0,85%
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) – 2,60%
C) 0,76%
D) – 1,08%
E) – 3,88%
11) Hallar el coeficiente de asimetría ampliado de Yule con percentiles utilizando los siguientes datos: Personas fi
A) – 3,22%
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) 12,16%
C) – 1,09% z2 9 5 z
D) 1,42%
E) – 3,33%
E S TA D Í S T I C A I
12) Hallar el coeficiente de curtosis de Fisher de la siguiente distribución de datos: Personas fi
A) 2,96
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) 3,64
C) 2,69
D) 3,56
E) 2,80
13) Hallar el coeficiente de curtosis con cuantiles de la siguiente distribución de datos: Personas fi
A) 0,236
50 60
60 70
70 80
80 90
90 100
100 110
110 120
6
20
24
30
10
8
2
B) 3,045
C) 0,382
D) 0,333
E) 0,285
14) Hallar el índice de Gini de la siguiente distribución de datos: Sueldos en miles
8
fi
25
A) 12,57%
12
B) 15,52%
15) ¿Qué medida estadística horizontal? A) Asimetría
B) Curtosis
12 45
16 16 20 20 62 C) 23,56%
88
24 24
28 28
60
44
D) 7,18%
32 32 36 26
E) 16,22%
de concentración es conocida como medida de forma C) Momentos
D) Curva de Lorenz
E) Índice de Gini
Respuestas de control 1. B, 2. D, 3.A, 4. C, 5. B, 6. B, 7. A, 8. E, 9. E, 10. D, 11. D, 12. C, 13. A, 14. E, 15. A
z2 9 6 z
WA LT E R C É S P E D E S R A M Í R E Z
GLOSARIO Apuntamiento.
Se denomina así al nivel de punta que se puede observar en la altura de la mayor concentración de datos.
Asintóticamente normal.
Es el valor de “Y” infinitamente pequeño para cualquier valor de “X” pero nunca es cero. El modelo de probabilidad normal está contenido en la función de densidad de Gauss Y = f (X), que por tener su exponente con signo negativo, el valor de Y es asintóticamente normal.
Cola.
Son los pocos datos que quedan a los extremos a ambos lados de un conjunto ordenado de datos. Una de las colas puede ser más grande que la otra.
Demografía.
Ciencia encargada del estudio de poblaciones humanas.
Desviación.
Es la diferencia entre dos valores. En estadística es sinónimo de rango o de variación.
Entropía.
Indicador unidimensional. Perpendicular.
Es el desorden o la peculiaridad de ciertas combinaciones, es también considerada como una medida de la incertidumbre. La palabra entropía procede del griego “ἐντροπία” que significa “evolución o transformación”. Son indicadores cuya unidad de potencia es uno. Entiéndase como una línea imaginaria vertical trazada en forma paralela a la ordenada (Eje Y).
EXPLORACIÓN ON LINE http://books.google.com.pe/books?id=RbaC-wPWqjsC&pg=PA124&lpg=PA124&dq=estadistico+yule&source=bl&ots=WN9t5MG9s-&sig=y4u9XfGsLf8JuEFu2sH1KFCVsSI&hl=es#v=onepage&q&f=false http://www.unavarra.es/estadistica/I.T.A./Curso%202005-06/APUNTES/temas%201%20y%202.pdf http://es.wikipedia.org/wiki/Asimetr%C3%ADa http://www.spssfree.com/spss/analisis3.html http://nutriserver.com/Cursos/Bioestadistica/Asimetria_Curtosis.htm http://www.bioestadistica.uma.es/libro/node25.htm z2 9 7 z
s e x t a
UNIDAD Teoría de las Probabilidades
Teoría de conjuntos: operaciones, aplicaciones Teoría combinatoria: factorial,permutaciones, combinaciones Definición de las probabilidades: numérica, por axiomas, teoremas
OBJETIVO (S) GENERAL Aprender que a través de las técnicas para contar ya sea con permutaciones o con combinaciones, hallará el número de repeticiones posibles o espacio muestral y también las repeticiones favorables de un experimento aleatorio, que son utilizadas por las probabilidades, para conocer en qué medida se puede lograr lo esperado al relacionar lo favorable con el espacio muestral. Encontrar la utilidad de las probabilidades, ya que al ser aplicadas a una determinada variable, se puede determinar la certeza o incertidumbre de hallarla. Las probabilidades adquieren real importancia en la Estadística Inferencial por que la utiliza como base. ESPECÍFICOS • Conocer mediante los conjuntos las tres operaciones base, que son aplicadas directamente a las probabilidades. • Saber que con las técnicas para contar, se puede encontrar el número de variaciones posibles de “n” datos tomados en grupos definidos. • Puede definir el espacio muestral y calcular las probabilidades respectiva del suceso de una variable, a través de sus teoremas.
L e c c i ó n
1
6.1. TEORÍA DE CONJUNTOS
La teoría de Conjuntos es una herramienta importante para entender el comportamiento de las operaciones probabilísticas; por ejemplo el lector muchas veces tiene dificultad para entender cuando se tienen que sumar, restar o multiplicar las probabilidades cuando se asocian dos o más sucesos. Entre los conjuntos existen tres operaciones básicas relacionadas estrictamente con las probabilidades, tales operaciones son:
6.1.1. Operación de Unión ( ∪ )
z3 0 1 z
E S TA D Í S T I C A I
6.1.2. Operación de Intercepción ( ∩ )
6.1.3. Operación de Complemento ( ):
Ahora bien, considerando que las operaciones de conjuntos, son operaciones “o” (unión), operaciones “y” (intercepción) y operaciones “no” (complemento).
En probabilidades, también se consideran esas mismas opciones, que son:
a) Probabilidad de A unión B: P(AUB) Se lee como la probabilidad de A o B, y por lo tanto la operación a realizar será, la suma de la probabilidad de A más la probabilidad de B, menos la probabilidad de la intercepción de ambos sucesos (véase más adelante, 1,3,3. Teorema de la adición). b) Probabilidad de A intercepción B: P(A∩B) Se lee como la probabilidad de A y B, y por lo tanto la operación a realizar será la multiplicar la probabilidad de A por la probabilidad de B (véase más adelante, 1,3,4. Teorema de la multiplicación). c) Probabilidad del complemento de A: P(Ā) Se lee como la probabilidad de no A, y por lo tanto la operación a realizar será 1 menos la probabilidad de A (véase más adelante, 1,3,2. Teorema del complemento).
z3 0 2 z
WA LT E R C É S P E D E S R A M Í R E Z
El lector debe haber notado que las tres operaciones base de conjuntos, se aplican directamente a las probabilidades ya que en estas últimas solo caben las preguntas: ¿cuál es la probabilidad de A o B?, ¿cuál es la probabilidad de A y B?, y también la pregunta ¿cuál es la probabilidad de no A? Considerando la relación que existe entre Teoría de Conjuntos con Probabilidades, el lector sabrá que operaciones de aritmética realizar en el cálculo de probabilidades; ante las interrogantes ya expuestas, tal relación se resume de la siguiente manera: Relación entre la Teoría de Conjuntos con las Probabilidades Operación de Teoría de Conjuntos
Operación de Probabilidad
o
Suma
(∩)
y
Multiplicación
(Ā)
no
Unión
(U)
Intercepción Complemento
Lectura
z3 0 3 z
Resta de 1
L e c c i ó n
2
6.2. TEORÍA COMBINATORIA
Son procedimientos que se utilizan para determinar las veces que se puede presentar un grupo de elementos al ser seleccionados entre otros con determinadas características. Es un método práctico que se utiliza para conocer el número de resultados posibles de un experimento que puede ser aleatorio o al azar; es decir que esta teoría, es también aplicable a las probabilidades ya que con la teoría combinatoria se puede determinar las veces que se pude presentar un suceso al relacionarlo con su universo. Por ejemplo una gran empresa desea codificar a sus trabajadores para darles una identificación propia de acuerdo a la fecha de ingreso, para ello desea utilizar 2 letras y 2 dígitos. ¿Cuántos trabajadores pueden ser contratados, con reemplazo de la letra o del dígito ya seleccionado?
En el primer y segundo casillero pueden entrar desde la letra A hasta la Z (26); En el tercer y cuarto casillero pueden entrar desde el número 0 hasta el 9 (10). En caso de que la empresa no desee contar con el primer código AA00, entonces restaremos 1 a 67 600 y nos quedan 67 599 códigos posibles. También si las combinaciones de las dos letras, no deben estar acompañadas por dos ceros, entonces habrá que restar 676 (262) al total 67 600 y nos quedan 66 924 códigos disponibles. z3 0 5 z
E S TA D Í S T I C A I
¿Cuántos trabajadores pueden ser contratados, sin reemplazo de la letra o del dígito ya seleccionado?
En En En En
el el el el
primer casillero pueden entrar desde la letra A hasta la Z (26). segundo casillero pueden entrar solo las letras que quedan (25). tercer casillero pueden entrar los números desde el 0 hasta el 9 (10). cuarto casillero pueden entrar solo los números que quedan (9).
Tal como se ha observado, esta técnica para contar es bastante práctica además de los procedimientos formales que pueden ser utilizados para contar; tales procedimientos son:
6.2.1. Factorial (!) Es el producto de todos los números consecutivos que comienzan desde la unidad hasta el mismo número inclusive o viceversa, todo número factorial se escribe y se lee de la siguiente manera: (n !) Se lee factorial de n
n ! = n (n – 1) (n – 2) (n – 3)
… 2x1
Por excepción, el factorial de cero (0) es igual a 1, porque el valor mínimo del factorial de un número es siempre uno (1); no se considera el cero, ya que todo producto que considere al menos un cero, toda la respuesta es cero (0). Sepa que no existe factorial de un número negativo. Ejercicios resueltos 1) Hallar:
15!
Solución: 15! = 15 x 14 x 13 x 12 x 11 x 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 1 307 674 368 000 También se puede expresar: 15! = 15 x 14 x 13 x 12! 2) Hallar:
= 1, 307674368 x 1012
9!
z3 0 6 z
WA LT E R C É S P E D E S R A M Í R E Z
Solución: 9! = 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 362 880 También se puede expresar: 9! = 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 = 362 880 3) Hallar:
25!
Solución: 25! = 25 x 24 x 23 x 22 x 21 x 20 x 19 x 18 x 17! = 1,551121004x1025 La respuesta completa solo se puede expresar en forma científica, por el número resultante está compuesto por 26 cifras enteras.
Resolver los siguientes ejercicios propuestos sobre Factorial: 1) 5! + 4! - 1! Resp: 143 2) 10! - [9! + (7! X 3!)] Resp: 3 235 680 3) (3! + 5! + 6!) – (5! X 0!) Resp: 726 4) 4(2! + 8!) Resp: 161 288 5) 3(0! + 1!) - 3! Resp: 0 6) 10(8! + 4! – 6!) Resp: 396 240 7) 10[(8! – 5!) – (2! x 3! x 4! x 5!)] Resp: 56 400 8) 7! – (6! + 5!) Resp: 4 200 9) 8! / 8 x 7 Resp: 6! = 720 10) 12! / 10! Resp: 12 x 11 = 132
z3 0 7 z
E S TA D Í S T I C A I
6.2.2. Permutaciones (nPk) Es una técnica de conteo que se caracteriza por considerar siempre el orden en que se presentan los elementos o datos. Existe una variedad de permutaciones, por que acepta elementos que se encuentran repetidos y también elementos que una vez elegidos, pueden volver a ser utilizados en una nueva elección, reelegir un mismo objeto, se denomina con reemplazo. Entre las permutaciones más importantes, se pueden considerar:
6.2.2.1. Permutaciones sin elementos repetidos y sin reemplazo Se define de la siguiente manera: (nPk) = n! / (n – k)!
Ejercicios resueltos 1) ¿Cuántas permutaciones se pueden lograr si se desea premiar con: primer, segundo y tercer puesto a elección entre 10 vendedores? Solución: (10P3) = 10! / (10 – 3)! = 720 2) ¿Cuántas permutaciones se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 6 si se toman 4 dígitos con exclusión o sin reemplazo? Solución: (6P4) = 6! / (6 – 4)! = 360
6.2.2.2. Permutaciones sin elementos repetidos y con reemplazo Se define de la siguiente manera: (nPk) = nk
z3 0 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos 1) ¿Cuántas permutaciones se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 6 si se toman 4 dígitos con reemplazo? Solución: (6P4) = 64 = 1296 2) ¿Cuántas permutaciones se pueden lograr con las letras: a, b, c, d, e, f, g, h, i; si se toman 3 letras con reemplazo? Solución: (9P3) = 93 = 729
6.2.2.3. Permutaciones sin elementos repetidos, sin reemplazo, tomando todos a la vez para ser ubicados en línea Se define de la siguiente manera: (nPn) = n!
Ejercicios resueltos 1) ¿Cuántas permutaciones se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 6 sin reemplazo? Solución: (6P6) = 6! = 720 2) ¿Cuántas permutaciones se pueden lograr con las letras: a, b, c, d, e, f, g, h, i; sin reemplazo? Solución: (9P9) = 9! = 362 880
z3 0 9 z
E S TA D Í S T I C A I
6.2.2.4. Permutaciones sin elementos repetidos, sin reemplazo, tomando todos a la vez para ubicarlos en círculo: Se define de la siguiente manera: (nPn) =
(n – 1)!
Ejercicios resueltos
1) ¿Cuántas permutaciones se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 6 sin reemplazo para ubicarlos en círculo? Solución: (6P6) = (6 – 1)! = 120 2) ¿Cuántas permutaciones se pueden lograr con las letras: a, b, c, d, e, f, g, h, i; sin reemplazo para ubicarlas en círculo? Solución: (9P9) = (9 – 1)! = 40 320
6.2.2.5. Permutaciones con elementos repetidos sin reemplazo tomando todos a la vez: Se define de la siguiente manera: (PR) = n! / (n1! n2! n3! …)
Ejercicios resueltos
1) ¿Cuántas permutaciones se pueden lograr con la palabra PAPA? Solución: P : n1 = 2 A : n2 = 2
n
(PR) = 4! / (2! x 2!) = 6
= 4 z3 1 0 z
WA LT E R C É S P E D E S R A M Í R E Z
2) Hallar las permutaciones que se pueden lograr con la palabra ESTADÍSTICAS Solución: E: S: T: A: D: I : C:
n1 n2 n3 n4 n5 n6 n7 n
= 1 = 3 = 2 = 2 = 1 = 2 = 1 = 12
(PR) = 12! / (1! x 3! x 2! x 2! x 1! x 2! x 1!) = 9 979 200
3) Hallar las permutaciones que se pueden lograr con el número 515 517 Solución: 1 : n1 5 : n2 7 : n3 n
= = = =
2 3 1 6
(PR) = 6! / (2! x 3! x 1!) = 60
6.2.2.6. Permutaciones con restricciones Estas permutaciones pueden ser aplicadas a cualquiera de los casos vistos en la presente unidad y no se permite el uso de fórmulas, por que la solución depende de la restricción. En esta ocasión, solo se tratarán los casos de mayor uso, que son: 1ª CASO: Permutaciones con restricción sin elementos repetidos y sin reemplazo Ejercicios resueltos
1) ¿Cuántas permutaciones se pueden lograr si se desea premiar con: primer, segundo y tercer puesto a elección entre 4 vendedores mujeres y 6 hombres, si el primer premio le corresponde a una mujer?
Solución: Observe que la restricción está en el primer casillero y solo pueden participar cualquiera de las 4 vendedoras, pero se elige a una; para el segundo premio o casillero ya no hay restricción, por lo tanto pueden participar todos los que quedan entre hombres y mujeres (9); para la tercera y última elección, solo quedan 8 vendedores. z3 1 1 z
E S TA D Í S T I C A I
2) ¿Cuántos números pares de tres cifras se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 7 si se toma cada dígito sin reemplazo?
Solución: Observe que la restricción está en el último casillero, porque para que el conjunto sea par, solo basta que termine en cifra par, que son dos opciones (2 o 4); luego para la segunda elección ya no hay restricción y pueden participar cualquiera de los 5 dígitos restantes, finalmente el tercer dígito se elegirá entre los 4 que quedan. 2ª CASO: Permutaciones con restricción sin elementos repetidos y con reemplazo.
Ejercicios resueltos
1) ¿Cuántos números pares de tres cifras se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 7 si se toma cada dígito con reemplazo? Solución: Observe que la restricción está en el último casillero, y hay 2 opciones o 2 dígitos pares. 2) ¿Cuántos números de tres cifras menores de 500 se pueden lograr con los dígitos: 1, 2, 3, 4, 5 y 7 si se toma cada dígito con reemplazo? Solución:
Observe que la restricción está ahora en el primer casillero, y hay 4 opciones o 4 dígitos menores de 5 (1, 2, 3, 4); en las siguientes elecciones al no haber restricción y no se excluyen los dígitos elegidos, participan todos nuevamente (6).
Resolver los siguientes ejercicios propuestos sobre Permutaciones: 1) Hallar el número de permutaciones que se pueden logra con las letras a, b, c, d; si se toma 2 sin reemplazo. Resp: 12 2) Determine el número de formas en las cuales se pueden asignar 9 asistentes de docencia, a 9 secciones de un curso. Resp: 362 880 z3 1 2 z
WA LT E R C É S P E D E S R A M Í R E Z
3) Determine el número de formas en que se pueden clasificar 7 diseños de paquetes distintos de un nuevo producto, en orden de preferencia. Resp: 5 040 4) ¿De cuántas formas pueden 5 hombres y 4 mujeres pueden sentarse alrededor de una mesa circular, si no se impone ninguna restricción? Resp: 40 320 5) Desarrollar: Resp: 6 300
P2 x
6
P3
7
6) ¿De cuántas formas pueden sentarse 6 personas en un sofá, si tiene solamente tres asientos? Resp: 120 7) ¿De cuántas formas pueden ordenarse un estante 8 libros? si: (a) Es posible cualquier ordenación. (b) 3 libros determinados deben estar juntos. (c) 2 libros determinados deben ocupar los extremos.
Resp: 40 320 Resp: 4 320 Resp: 720
8) ¿Cuántos números diferentes se pueden lograr con: 3 veces 4, 4 veces 2 y 2 veces 3? Resp: 1 260 9) ¿Cuántos números de 3 cifras pueden formarse con los dígitos 1, 2, 3, 4 y 5 con reemplazo? Resp: 125 10) ¿De cuántas maneras pueden 8 personas sentarse en una mesa?: a) Si sabemos que solo alcanzan 5 personas en línea. Resp: 6 720 b) Si sabemos que solo alcanzan 5 personas en círculo* Resp: 1 344 (*) Este ejercicio sobre permutaciones, requiere de la ayuda de las combinaciones.
6.2.3. Combinaciones (nCk) Es una técnica para contar, que se caracteriza por no interesarse por el orden en que aparezcan lo objetos, demás en el proceso de elección debe hacerse sin reemplazo y los datos o elementos no deben estar repetidos. Las combinaciones se definen de la siguiente manera: (nCk) = n! / [ (n – k)! k! ]
z3 1 3 z
E S TA D Í S T I C A I
Ejercicios resueltos 1) Supóngase que un comité compuesto por 8 personas debe ser seleccionado entre un grupo de 20. ¿Por cuántos grupos distintos de personas puede constituirse el comité? Solución: C8 = 20! / [ (20 – 8)! x 8! ] = 125 970
20
2) En una realización de una conocida casa comercial, se ofertan 8 productos al mismo precio. A una persona le agradan todos los productos ofertados por igual y solo tiene dinero para 4 productos, ¿de cuántas maneras puede seleccionarlos? Solución: C4 = 8! / [ (8 – 4)! x 4! ] = 70
8
3) Si usted forma parte de un jurado calificador de un concurso de canto donde participan 10 concursantes con las mismas opciones de ganar, pero las normas del concurso puede aceptar hasta triple empate, porque solo puede otorgar 3 premios ¿de cuántas maneras puede seleccionar a 3 ganadores? Solución: C = 10! / [ (10 – 3)! x 3! ] = 120 10 3 Resolver los siguientes ejercicios propuestos sobre Combinaciones: 1) ¿Cuál de los números siguientes es mayor?: Resp: b
a)
C30
93
b)
C31
93
2) ¿De cuántas formas pueden seleccionarse 6 preguntas de un total de 10 para una evaluación? Resp: 210 3) Con 5 economistas y 6 administradores se quiere formar un directorio compuesto por 2 economistas y 3 administradores ¿Cuántos directorios diferentes pueden formarse si: a) No se impone ninguna restricción. Resp: 200 b) 2 administradores determinados deben estar en el directorio. Resp: 40 c) Uno de los administradores no debe estar en el directorio. Resp. 100 4) En cuántas formas se puede elegir un decano, si previamente se eligen de 2 de los 10 candidatos de la facultad de Administración de la UIGV. Resp: 90 5) ¿En cuántas formas pueden escogerse 4 interruptores buenos y 2 defectuosos de un lote que contiene 20 interruptores buenos y 5 defectuosos, si se sabe que todos los interruptores están codificados? Resp: 48 450 z3 1 4 z
WA LT E R C É S P E D E S R A M Í R E Z
6) Entre 8 hombres y 6 mujeres una profesora debe nombrar un comité compuesto por 4 alumnos. ¿Cuántos comités diferentes se pueden nombrar? Resp: 1 001 7) Un estudiante tiene que contestar 8 de 10 preguntas. Si las 2 primeras son obligatorias ¿de cuántas maneras podrá contestar? Resp: 28 8) Diez invitados a una cena se han dividido en 2 grupos de 5 porque hay 2 mesas con capacidad para 5. ¿De cuántas maneras diferentes se pueden agrupar los invitados? Resp: 252 9) ¿De cuántas formas puede un grupo de 10 personas dividirse en 2 grupos de 7 y 3 personas? Resp: 120 10) ¿De cuántas formas puede un grupo de 10 personas dividirse en 3 grupos de 4, 3 y 2 personas? Resp: 12 600
z3 1 5 z
L e c c i ó n
3
6.3. PROBABILIDADES
Toda probabilidad es un valor relativo o una proporción de sucesos llamados favorables, dentro de todos los sucesos posibles llamado espacio muestral. Tal valor relativo es el resultado de un experimento al azar o aleatorio, que se ocasiona cuando se relacionan todos los sucesos favorables de un experimento aleatorio o al azar, con todos los sucesos posibles del mismo experimento.
6.3.1. Definición numérica Numéricamente el valor de una probabilidad se obtiene al dividir el número de sucesos favorables, entre el espacio muestral (Ω) o número total de sucesos posibles. En muchos casos para determinar tanto el número de sucesos favorables como el posible, se recurre a la teoría combinatoria. P(A)
=
n (A) / n (Ω)
Ejercicios resueltos 1) ¿Cuál es la probabilidad de obtener 5 en el lanzamiento de un dado equilibrado? Solución: Ω = {1, 2, 3, 4, 5, 6}
n = 6
P(5) = 1 / 6 = 0,1667 (Porque hay un 5 entre 6 sucesos)
z3 1 7 z
E S TA D Í S T I C A I
2) ¿Cuál es la probabilidad de obtener un número menor de 3 en el lanzamiento de un dado equilibrado? Solución: Ω = {1, 2, 3, 4, 5, 6}
n = 6
P(<3) = 2 / 6 = 0,3333
(Porque hay 2 números menores de 3 entre 6 sucesos)
3) De un lote que contiene interruptores codificados, hay 20 buenos y 5 defectuosos ¿cuál es la probabilidad de que al elegir 6 interruptores, 4 sean buenos?
Solución: n = 20 + 5 = 25
k = 6
P(4 buenos y 2 defectuosos) =
20
C4 x 5C2 /
Ω =
C6 = 177100
25
C6 = 48450 / 177 100 = 0,2736
25
4) Con 9 consonantes y 6 vocales diferentes, ¿cuál es la probabilidad formar palabras de 5 letras que contengan cada una 3 consonantes y 2 vocales en un proceso sin reemplazo? Solución: n = 9 + 6 = 15
k = 5
P(3 consonantes y 2 vocales) =
C3 x 6C2 /
9
Ω =
C5 = 3003
15
C5 = 1260 / 3003 = 0,4196
15
Un problema de probabilidad sobre permutaciones se puede resolver por combinaciones.
Resolver los siguientes ejercicios propuestos considerando la Definición Numérica de Probabilidades: 1) Si se lanza una moneda 3 veces. Calcular la probabilidad de: a) Obtener un solo sello. Resp: b) No obtener sello. Resp:
0,3750 0,1250
2) Si se lanza un par de dados, ¿cuál es la probabilidad de obtener 2 números que sean consecutivos y ascendentes? Resp: 0,1389 3) Entre 8 hombres y 5 mujeres una profesora debe nombrar un comité compuesto por 4 alumnos. ¿Cuál es la probabilidad de que dicho comité quede integrado por? a) Un hombre. Resp: 0,1119 b) Al menos un hombre. Resp: 0,9930
z3 1 8 z
WA LT E R C É S P E D E S R A M Í R E Z
4) En un examen de Estadística un estudiante tiene que contestar 5 de 10 preguntas. ¿Cuál es la probabilidad de que un estudiante pueda contestar 5 preguntas, si las dos primeras son obligatorias? Resp: 0,2222 5) Diez invitados a una cena se han dividido en 2 grupos de 5 porque hay 2 mesas con capacidad para 5. ¿Cuál es la probabilidad de que dos invitados determinados, formen parte de la primera mesa? Resp: 0,2222
6.3.2. Definición por Teoremas Fácilmente se puede determinar que toda probabilidad por ser un valor relativo, el máximo valor posible es uno (1); es decir, espacio muestral (favorable) entre espacio muestral (posible). También se puede determinar que el mínimo es cero (0), cuando no hay sucesos favorables. Considerando lo visto, a continuación se definirán los siguientes teoremas relacionados con las probabilidades.
6.3.2.1. Teorema del conjunto vacío Cuando no existen sucesos favorables, la probabilidad de ocurrencia de dicho suceso es cero. P(ø) = 0
Ejercicios resueltos
1) Calcular la probabilidad de obtener 7 en el lanzamiento de un dado equilibrado. Solución: Ω = {1, 2, 3, 4, 5, 6} P(7) = 0 / 6 = 0
n = 6 (porque un dado no tiene 7)
2) ¿Cuál es la probabilidad de obtener 9 dentro de un conjunto de dígitos pares incluyendo al cero? Solución: Ω = {0, 2, 4, 6, 8}
n = 5
P(9) = 0 / 5 = 0
(por que el 9 es impar).
z3 1 9 z
E S TA D Í S T I C A I
Conociendo que todos los casos relacionados con este tipo de teorema la respuesta es cero, no se proponen más ejercicios sobre el conjunto vacío porque ya se sabe cuál es la respuesta.
6.3.2.2. Teorema del complemento La probabilidad de ocurrencia del complemento de un suceso cualquiera es igual a 1 menos la probabilidad de ocurrencia del propio suceso. P(Ā) = 1 – P(A)
Ejercicios resueltos
1) ¿Cuál es la probabilidad de no obtener As (A) al extraer una carta de una baraja de 52 cartas? Solución: Ω = {2♠, 2♣, 2♥, 2♦, 3♠, 3♣, 3♥, 3♦ …. K♠, K♣, K♥, K♦, A♠, A♣, A♥, A♦}
n = 52
P(A) = 4 / 52 = 0,0769 P(Ā) = 1 – P(A) = 1 – 0,0769 = 0,9231
2) Al ordenar sobre un estante 8 libros ¿cuál es la probabilidad de que 3 libros determinados no estén juntos? Solución: n=8
Ω = 8! = 40 320
P(3 libros juntos) = 6! x 3! / 8! = 4 320 / 40 320 = 0,1071 P
= 1 – 0,1071 = 0,8929
Resolver los siguientes ejercicios sobre el teorema del complemento de la Probabilidad 1) Si se lanza una moneda 3 veces, ¿cuál es la probabilidad de no obtener un solo sello? Resp: 0,6250
z3 2 0 z
WA LT E R C É S P E D E S R A M Í R E Z
2) Si se lanza un par de dados, ¿cuál es la probabilidad de no obtener 7 si se suman los resultados de ambos dados? Resp: 0,8333 3) Si se tienen 5 cubos identificados con las letras: A, B, C, D y E; si se ordenan dichos cubos sobre un estante, ¿cuál es la probabilidad de que la “B” no concluya el ordenamiento?
Resp:
0,8000
4) ¿Cuál es la probabilidad de que al ordenar las letras de la palabra PAPA, la “A” no esté al principio y la “P” no esté al final? Resp: 0,6666 5) En un internado con capacidad para 5 personas, hay igual número de camas ¿Cuál es la probabilidad de que al repartir las camas al azar, no ocupen los internos las camas alfabéticamente? Resp: 0,9917 6) Si en un estante hay 8 libros, ¿Cuál es la probabilidad de que 2 libros determinados no ocupen los extremos? Resp: 0,9821 7) Entre 10 hombres y 12 mujeres una profesora debe nombrar un comité compuesto por 5 alumnos. ¿Cuál es la probabilidad de que dicho comité no quede integrado solo por hombres? Resp: 0,9904 8) Doce invitados a una cena se han dividido en 2 grupos de 6 porque hay 2 mesas con capacidad para 6. ¿Cuál es la probabilidad de que dos invitados determinados, no formen parte de la primera mesa? Resp: 0,7727
6.3.2.3. Teorema de la adición Este teorema considera dos tipos de sucesos, que son: a) Eventos excluyentes
z3 2 1 z
E S TA D Í S T I C A I
Ejercicios resueltos
1) ¿Cuál es la probabilidad de obtener 2 o 5 en el lanzamiento de un dado equilibrado? Solución: Ω = {1, 2, 3, 4, 5, 6} P(2 o 5)
n = 6
= 1/6+1/6
= 2 / 6 = 0,3333
2) ¿Cuál es la probabilidad de obtener bola roja o bola blanca, al extraer una bola de una urna que contiene: 5 bolas rojas, 7 blancas y 8 azules? Solución: Ω = {R, R, R, R, R, B, B, B, B, B, B, B, A, A, A, A, A, A, A, A} P(2 o 5)
= 5 / 20 + 7 / 20
n = 20
= 0,25 + 0,35 = 0,6
b) Eventos no excluyentes o regla aditiva
Ejercicios resueltos
1) Calcular la probabilidad de obtener As (A) o corazón (♥) al extraer una carta de una baraja de 52 cartas. Solución: P
(A U B)
= P(A) + P(♥) - P(A ∩ ♥) ; P(A) = 4 / 52 ; P(♥) = 13 / 52 ; P(A ∩ ♥) = 1 / 52
P(As o corazón)
= 4 / 52 + 13 / 52 – 1 / 52 = 16 / 52 = 0,3077
z3 2 2 z
WA LT E R C É S P E D E S R A M Í R E Z
2) La probabilidad de que un hombre y una mujer pasen a semifinales en un concurso de matemáticas, es 0,4672. ¿Cuál es la probabilidad de que uno de los dos pase a semifinales, si las probabilidades individuales del hombre es de 0,6301 y la de la mujer es 0,7527? Solución: P
(H U M)
= P(H) + P(M) - P(H ∩ M) ; P(H) = 0,6301 ; P(M) = 0,7527 ; P(H ∩ M) = 0,4672
P(Hombre o Mujer)
= 0,6301 + 0,7527 – 0,4672 =
0,9156
Resolver los siguientes ejercicios propuestos sobre el Teorema de la adición de la Probabilidad: 1) Si se lanza una moneda 3 veces, ¿cuál es la probabilidad de obtener un solo sello o una sola cara? Resp: 0,7500 2) Para obtener una licencia de conducir es necesario aprobar el examen teórico como el práctico. Se sabe que la probabilidad de aprobar la teoría es 0.86, la parte práctica 0.72 y que se apruebe las 2 partes es de 0.78. Si se elige un alumno al azar. ¿Cuál es la probabilidad de que haya aprobado cualquiera de los exámenes para obtener licencia? Resp: 0,8000 3) Se tienen 5 cubos identificados con las letras: A, B, C, D y E; si se ordenan dichos cubos sobre un estante, ¿cuál es la probabilidad de que la letra “D” inicie el ordenamiento y la “B” lo concluya o viceversa? Resp: 0,1000 4) ¿Cuál es la probabilidad de obtener número par o mayor de 3 en el lanzamiento de un dado equilibrado? Resp: 0,6667 5) Si en un estante hay 8 libros, ¿Cuál es la probabilidad de que 2 o 3 libros cualesquiera estén juntos? Resp: 0,1429 6) Entre 8 hombres y 5 mujeres una profesora debe nombrar un comité compuesto por 4 alumnos. ¿Cuál es la probabilidad de que dicho comité quede integrado por dos hombres o por tres mujeres? Resp: 0,5035 7) Entre las escuelas de la facultad de administración, se conoce que el 53,25% desean graduarse recursos humanos, el 38,37% en Administración Logística y el 17,63% en ambas escuelas. Si se elige a un estudiante al azar de esta facultad, ¿cuál es la probabilidad de que desee graduarse en cualquiera de las escuelas mencionadas? Resp: 0,7399 z3 2 3 z
E S TA D Í S T I C A I
8) La probabilidad de que un estudiante universitario apruebe Estadística es de 12/15, de que apruebe Costos es de 6/8 y la probabilidad de que apruebe ambas asignaturas es de 0,6345. ¿Cuál es la probabilidad de que el alumno en mención apruebe Estadística o Costos? Resp: 0,9155
6.3.2.4. Teorema de la multiplicación Este teorema considera lo siguiente: a) Sucesos independientes Son aquellos por el cual la ocurrencia de uno de los sucesos, no va a afectar la ocurrencia de los demás sucesos. P(A ∩ B) = P(A) x P(B)
Ejercicios resueltos
1) Calcular la probabilidad de obtener bola roja y luego bola blanca con reemplazo de una urna que contiene 4 bolas rojas y 6 bolas blancas. Solución: Ω = {R, R, R, R, B, B, B, B, B, B} P(R ∩ B)
n = 10 bolas
P(R) = 4 / 10
P(B) = 6 / 10
= 4 / 10 x 6 / 10 = 24 / 100 = 0,24
2) La probabilidad de que un deportista especializado en tiro, de en el blanco es de 0,83. Si hace tres disparos. ¿Cuál es la probabilidad de dar en el blanco las tres veces? Solución: P(B ∩ B ∩ B)
= 0,83 x 0,83 x 0,83 = 0,5718
b) Sucesos dependientes Son aquellos por el cual la ocurrencia de uno de los sucesos, va a afectar la ocurrencia de los demás sucesos. P(A ∩ B) = P(A) x P(B/A) z3 2 4 z
WA LT E R C É S P E D E S R A M Í R E Z
Ejercicios resueltos
1) Calcular la probabilidad de obtener bola roja y luego bola blanca sin reemplazo de una urna que contiene 4 bolas rojas y 6 bolas blancas. Solución: n = 10 bolas
Ω = {R, R, R, R, B, B, B, B, B, B} P(R ∩ B)
P(R) = 4 / 10
P(B) = 6 / 10
= 4 / 10 x 6 / 9 = 24 / 90 = 0,2667
(Observe que la probabilidad de obtener bola blanca en segundo suceso ha cambiado, porque el espacio muestral también ha cambiado al retirar una bola sin reemplazo)
2) Se tienen 5 pilas de la misma marca de las cuales se conoce que 3 de ellas tienen carga eléctrica, si se eligen al azar 2 pilas consecutivamente (sin reemplazo). ¿Cuál es la probabilidad de que ambas pilas están cargadas? Solución: Ω = {P, P, P, , } P(P ∩ P)
n = 5
P(P) = 3 / 5
= 3 / 5 x 2 / 4 = 6 / 20 = 0,3
c) Probabilidad condicional Es cuando se espera la ocurrencia de un suceso conociendo el resultado de otro suceso que viene a ser el nuevo espacio muestral. P(B/A)
=
P(A ∩ B) / P(A)
Ejercicios resueltos
1) Calcular la probabilidad de obtener 3, en el lanzamiento de un dado equilibrado, si se sabe que el resultado fue impar. Solución: Ω = (Impar)
= {1, 3, 5}
n = 3
;
(Impar ∩ 3) = {3}
n = 1
P(3 / Impar) = 1 / 3 = 0,3333 (por que la condición impar es el nuevo espacio muestral)
z3 2 5 z
E S TA D Í S T I C A I
2) En una competencia de tiro, las probabilidades de dar en el blanco del deportista “A” es de 0,82 y la del deportista “B” es 0,76. Si cada uno decide hacer un solo disparo y uno de ellos ha dado en el blanco. ¿Cuál es la probabilidad de que haya sido el deportista “B”? Solución: P(A) = 0,82
P() = 1 – 0,82 = 0,18
P(B) = 0,76
P() = 1 – 0,76 = 0,24
P(Uno en Blanco) = P(A∩) o P(∩B) = (0,82 x 0,24) + 0,18 x 0,76) = 0,,3336 P(B ( Uno en Blanco)
= 0,18 x 0,76 / 0,3336 = 0,4101
Resolver los siguientes ejercicios propuestos sobre el Teorema de la multiplicación de la Probabilidad: 1) Una caja tiene 8 bolas rojas, 3 blancas y 9 azules. Hallar la probabilidad de que se extraiga una de cada color, en un proceso: a) Con reemplazo Resp: 0,1620 b) Sin reemplazo Resp: 0,1895 2) Un lote de 12 artículos tiene 4 defectuosos. Si se toman 3 artículos al azar uno tras otro. ¿Cuál es la probabilidad de que los 3 estén buenos? Resp: 0,2545 3) Un aula está compuesta por 15 alumnos jóvenes y por 20 adultos, si solo van a aprobar 18 alumnos, ¿cuál es la probabilidad de que entre los aprobados hayan 8 jóvenes y 10 adultos? Resp: 0,2620 4) Con 7 consonantes y 4 vocales diferentes, ¿cuál es la probabilidad formar palabras de 5 letras que contengan cada una 3 consonantes y dos vocales?, en un proceso de elección: a) Sin reemplazo Resp: 0,4545 b) Con reemplazo Resp. 0,3408 5) En una competencia de tiro dos competidores tiene las probabilidades de dar en el blanco de 0,8 y 0,75; si cada uno hace un solo disparo, ¿cuál es la probabilidad de que ambos disparos den en el blanco? Resp: 0,6000 6) En una competencia de tiro dos competidores tiene las probabilidades de dar en el blanco de 0,8 y 0,75; si cada uno hace un solo disparo, ¿cuál es la probabilidad de que uno solo de los competidores de en el blanco? Resp: 0,3500 7) En una competencia de tiro dos competidores tiene las probabilidades de dar en el blanco de 0,8 y 0,75; si cada uno hace un solo disparo y solo uno de ellos da en el blanco, ¿cuál es la probabilidad de que haya sido el primero? Resp: 0,5714. z3 2 6 z
WA LT E R C É S P E D E S R A M Í R E Z
8) Se tienen 5 pilas de la misma marca de las cuales se conoce que 3 de ellas tienen carga eléctrica, si se eligen al azar 3 pilas consecutivamente (sin reemplazo) y resulta que una no tiene carga eléctrica. ¿Cuál es la probabilidad de que la última pila extraída no tenga carga? Resp: 0,3333.
6.3.2.5. Teorema de la probabilidad total o de las particiones
Este teorema considera que si un suceso “A” se subdividiera en: A1, A2, A3, … An y posteriormente este mismo suceso fuera interceptado por otro suceso “B”; entonces cada subdivisión de “A” interceptada con “B”, quedaría de la siguiente manera: A1 ∩ B, A2 ∩ B, A3 ∩ B, …. An ∩ B. por consiguiente la probabilidad total de “B” es: P(B) = P(A1 ∩ B) + P(A2 ∩ B) + P(A3 ∩ B) + … + P(An ∩ B) P(B) = P(A1) P(B / A1) + P(A2) P(B / A2) + P(A3) P(B / A3) + … + P(An) P(B / An)
Ejercicios resueltos
1) La producción de una empresa procede de tres plantas de la siguiente manera: el 38% procede de la planta “A”, el 26% de la planta “B” y los restantes 36% proceden de la planta “C”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 5% y 8%; respectivamente. ¿Cuál es la probabilidad de que al elegir un producto al azar, éste sea defectuoso?
z3 2 7 z
E S TA D Í S T I C A I
Solución
P(D) = P(A ∩ D) + P(B ∩ d) + P(C ∩ D)
= P(A) P(D / A) + P(B) P(D / B) + P(C) P(D / C) =
P(D) = (0,38 x 0,03) + (0,26 x 0,05) + (0,36 x 0,08) = P(D) = 0,0114 + 0,0130 + 0,0288
= 0,0532
2) En una reunión de directorio se ha incluido en agenda incrementar las remuneraciones en general al 12%. La probabilidad de que asista el gerente general a la reunión de directorio quién sustentará dicho incremento, es de 0,92; si asiste el gerente general a dicha reunión, la probabilidad de que se apruebe el incremento, es de 0,84; en caso contrario, la aprobación del incremento será solo de 0,38. ¿Cuál es la probabilidad de que al término de la reunión del directorio la compañía apruebe incrementar las remuneraciones en 12%? Solución
P(A) = P(G ∩ A) + P( ∩A)
= P(G) P(A / G) + P() P(A /B)
P(A) = (0,92 x 0,84) + (0,08 x 0,38)
=
=
0,7728 + 0,0304 = 0,8032
3) Según su habilidad y experiencia en la producción, los trabajadores de una compañía para mejorar sus remuneraciones han sido clasificados como: máster, sénior y junior. El grupo máster está compuesto por el 26% de los trabajadores, el grupo sénior lo integran el 32% y el grupo junior los restantes 42%. Se sabe que el 35%, 48% y 42% de los integrantes del de cada grupo respectivamente, son mujeres. ¿Cuál es la probabilidad de que al elegir a un trabajador al azar, resulte ser mujer? z3 2 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Solución:
P(F) = P(M ∩ F) + P(S ∩ F) + P(J ∩ F)
= P(M) P(F / M) + P(S) P(F / S) + P(J) P(F / J) =
P(F) = (0,26 x 0,35) + (0,32 x 0,48) + (0,42 x 0,42) = P(F) = 0,0910 + 0,1536 + 0,1764
= 0,4210
En el ejercicio se ha identificado con una “F” a las mujeres por que la letra “M” ha sido reservada para el grupo máster.
4) Según su habilidad y experiencia en la producción, los trabajadores de una compañía para mejorar sus remuneraciones han sido clasificados como: máster, sénior y junior. El grupo máster está compuesto por el 26% de los trabajadores, el grupo sénior lo integran el 32% y el grupo junior los restantes 42%. Se sabe que el 35%, 48% y 42% de los integrantes del de cada grupo respectivamente, son mujeres. ¿Cuál es la probabilidad de que al elegir a un trabajador al azar, resulte ser hombre? Solución
P(H) = P(M ∩ H) + P(S ∩ H) + P(J ∩ H)
= P(M) P(H / M) + P(S) P(H / S) + P(J) P(H / J) =
P(H) = (0,26 x 0,65) + (0,32 x 0,52) + (0,42 x 0,58) = P(H) = 0,1690 + 0,1664 + 0,2436
= 0,5790
Conociendo que el grupo máster está compuesto por mujeres en 35%, se asume que los restantes trabajadores de ese grupo son hombres (65%). Lo mismo se ha hecho para determinar la proporción de hombres en los otros grupos. z3 2 9 z
E S TA D Í S T I C A I
Resolver los siguientes ejercicios propuestos sobre el Teorema de la probabilidad total: 1) Cuatro unidades realizan servicio de taxi en la ciudad de Lima a razón de: 15%, 28%, 34% y 23% al mes. Las probabilidades de que un usuario utilice este servicio por la cercanía a su domicilio, son: 0,18%, 0,13%, 0,20 y 0,14% respectivamente a cada unidad. ¿Cuál es la probabilidad de un día cualquiera este usuario tome una de estas unidades de taxi?
Resp:
0,1636
2) Según su edad los socios inscritos en un club han sido clasificados como: adultos, jóvenes y niños. El grupo de adultos está compuesto por el 65% de los socios, el grupo de jóvenes lo integran el 15% y el grupo de niños los restantes 20%. Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. ¿Cuál es la probabilidad de que al elegir a un socio al azar, resulte ser hombre? Resp:
0,5610
3) La producción de una empresa procede de 4 plantas de la siguiente manera: el 26% procede de la planta “A”, el 24% de la planta “B”, el 22% de la planta “C” y los restantes 28% proceden de la planta “D”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 1,4% 2,5% y 1,8%; respectivamente. ¿Cuál es la probabilidad de que al elegir un producto al azar, éste sea defectuoso? Resp: 0,0217 4) Según su edad los socios inscritos en un club han sido clasificados como: adultos, jóvenes y niños. El grupo de adultos está compuesto por el 65% de los socios, el grupo de jóvenes lo integran el 15% y el grupo de niños los restantes 20%. Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. ¿Cuál es la probabilidad de que al elegir a un socio al azar, resulte ser mujer?
Resp:
0,4390
5) La producción de una empresa procede de 5 plantas en proporciones iguales. Se sabe que la producción clase “A” de las 5 plantas, son: 73%, 85% 77%, 95% y 82%; respectivamente. ¿Cuál es la probabilidad de que al elegir un producto al azar, éste sea de clase “A”? Resp: 0,8240 6) En una reunión de consejo se ha incluido en agenda incrementar la remuneración mínima en 20%. La probabilidad de que el ministro de economía exponga claramente este incremento, es de 0,78; si su exposición es clara, la probabilidad de que se apruebe el incremento, es de 0,88; en caso contrario, la aprobación del incremento será solo de 0,22. ¿Cuál es la probabilidad de que al término del consejo de ministros se apruebe incrementar la remuneración mínima en 20%?
Resp:
0,7348
z3 3 0 z
WA LT E R C É S P E D E S R A M Í R E Z
7) Se lanza una moneda insesgada tres veces, cada vez que resulte cara se coloca en una urna una bola roja y se sale sello, se coloca una bola blanca. ¿Cuál es la probabilidad de extraer bola blanca si se saca una bola de la urna?
Resp:
0,5000
8) El servicio de transporte público de Lima está compuesto por: ómnibus (15%), microbús (32%), colectivo (8%) y taxi (45%). Los accidentes que ocasionan estas unidades de transporte son a razón de: 4%, 6%, 1% y 12% respectivamente. ¿Cuál es la probabilidad de en la ciudad de Lima se produzca un accidente ocasionado por el transporte público?
Resp:
0,0800
6.3.2.6. Teorema de la Bayes Este teorema considera una probabilidad condicional, desarrollada en el ambiente de la probabilidad total; por ello:
En donde las particiones al ser condición, se convierten en nuevo espacio muestral; por consiguiente, se busca hallar la probabilidad de una o más particiones que son consideradas como sucesos. Porque este teorema de la probabilidad se desarrolla en el ambiente de la probabilidad total, se utilizarán los mismos ejercicios anteriores sobre el teorema de las particiones, para ver cómo se aplica el teorema de Bayes. Ejercicios resueltos 1) La producción de una empresa procede de tres plantas de la siguiente manera: el 38% procede de la planta “A”, el 26% de la planta “B” y los restantes 36% proceden de la planta “C”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 5% y 8%; respectivamente. Si se elige un producto al azar y resulta defectuoso ¿cuál es la probabilidad de que provenga de la planta “A”? Solución:
z3 3 1 z
E S TA D Í S T I C A I
P(D) = P(A ∩ D) + P(B ∩ d) + P(C ∩ D)
= P(A) P(D / A) + P(B) P(D / B) + P(C) P(D / C) =
P(D) = (0,38 x 0,03) + (0,26 x 0,05) + (0,36 x 0,08) = 0,0114 + 0,0130 + 0,0288 = 0,0532 P(A / D) = P(A ∩ D) / P(D)
= 0,0114 / 0,0532 = 0,2143
2) En una reunión de directorio, se ha incluido en agenda incrementar las remuneraciones en general al 12%. La probabilidad de que asista el gerente general a la reunión para sustentar dicho incremento, es de 0,92; si asiste el gerente general, la probabilidad de que se apruebe el incremento, es de 0,84; en caso contrario, la aprobación del incremento será solo de 0,38. Al término de la reunión la compañía aprueba incrementar las remuneraciones en 12%, ¿cuál es la probabilidad de que el gerente haya asistido? Solución:
P(A) = P(G ∩ A) + P( ∩A)
= P(G) P(A / G) + P() P(A /B)
P(A) = (0,92 x 0,84) + (0,08 x 0,38) P(G / A) = P(G ∩ A) / P(A)
=
=
0,7728 + 0,0304 = 0,8032
= 0,7728 / 0,8032 = 0,9622
3) Según su habilidad y experiencia en la producción, los trabajadores de una compañía para mejorar sus remuneraciones han sido clasificados como: máster (26%), sénior (32%) y junior (42%). Se sabe que el 35%, 48% y 42% de los integrantes del de cada grupo respectivamente, son mujeres. Si elige a un trabajador al azar, resulta ser mujer, ¿cuál es la probabilidad de que sea máster o junior? Solución:
z3 3 2 z
WA LT E R C É S P E D E S R A M Í R E Z
P(F) = P(M ∩ F) + P(S ∩ F) + P(J ∩ F)
= P(M) P(F / M) + P(S) P(F / S) + P(J) P(F / J) =
P(F) = (0,26 x 0,35) + (0,32 x 0,48) + (0,42 x 0,42) = 0,0910 + 0,1536 + 0,1764 = 0,4210 P(M / F) = P(M ∩ F) / P(F) = 0,0910 / 0,4210 = 0,2162 P(J / F)
= P(J ∩ F) / P(F) = 0,1764 / 0,4210 = 0,4190
P(M ö J) = 0,2162 + 0,419 = 0,6352
4) Según su habilidad y experiencia en la producción, los trabajadores de una compañía para mejorar sus remuneraciones han sido clasificados como: máster (26%), sénior (32%) y junior (42%). Se sabe que el 35%, 48% y 42% de los integrantes del de cada grupo respectivamente, son mujeres. Si elige a un trabajador al azar, resulta ser hombre, ¿cuál es la probabilidad de que sea sénior? Solución:
P(H) = P(M ∩ H) + P(S ∩ H) + P(J ∩ H)
= P(M) P(H / M) + P(S) P(H / S) + P(J) P(H / J) =
P(H) = (0,26 x 0,65) + (0,32 x 0,52) + (0,42 x 0,58) = 0,1690 + 0,1664 + 0,2436
= 0,5790 P(S / H) =
P(S ∩ H) / P(H) = 0,1664 / 0,5790 = 0,2874
5) La producción de una empresa procede de cuatro plantas de la siguiente manera: el 28% procede de la planta “A”, el 26% de la planta “B”, el 22% procede de la planta “C” y los restantes 24% proceden de la planta “D”. Se sabe que la producción con fallas provenientes de las cuatro plantas, son: 0,8%, 0,5%, 1% y 0,4%; respectivamente. Si se elige un producto al azar y resulta tener fallas. Determine las probabilidades de que la falla provenga de cada planta.
z3 3 3 z
E S TA D Í S T I C A I
Solución:
P(F) = P(A ∩ F) + P(B ∩ F) + P(C ∩ F) + P(D ∩ F)
=
P(A) P(F / A) + P(B) P(F / B) + P(C) P(F / C) + P(D) P(F / D) = P(F) = (0,28 x 0,008) + (0,26 x 0,005) + (0,22 x 0,01) + (0,24 x 0,004) = P(F) =
0,00224 + 0,00130 + 0,00220 + 0,00096 = 0,0067
P(A / F) = P(A ∩ F) / P(F)
= 0,00224 / 0,0067 = 0,3343
P(B / F) = P(B ∩ F) / P(F)
= 0,00130 / 0,0067 = 0,1940
P(C / F) = P(C ∩ F) / P(F)
= 0,00220 / 0,0067 = 0,3284
P(D / F) = P(D ∩ F) / P(F)
= 0,00096 / 0,0067 = 0,1433
Resolver los siguientes ejercicios propuestos sobre el Teorema de Bayes: 1) Cuatro unidades realizan servicio de taxi en la ciudad de Lima a razón de: 15%, 28%, 34% y 23% al mes. Las probabilidades de que un usuario utilice este servicio por la cercanía a su domicilio, son: 0,18%, 0,13%, 0,20 y 0,14% respectivamente a cada unidad. Si un día cualquiera este usuario toma una de estas unidades de taxi, ¿cuál es la probabilidad de que sea la tercera? Resp: 0,4156 2) Según su edad los socios inscritos en un club han sido clasificados como: adultos, jóvenes y niños. El grupo de adultos está compuesto por el 65% de los socios, el grupo de jóvenes lo integran el 15% y el grupo de niños los restantes 20%. Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. Si se elige a un socio al azar y resulta ser hombre, ¿cuál es la probabilidad de que sea niño? Resp: 0,2282 3) La producción de una empresa procede de 4 plantas de la siguiente manera: el 26% procede de la planta “A”, el 24% de la planta “B”, el 22% de la planta “C” y los restantes 28% proceden de la planta “D”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 1,4% 2,5% y 1,8%; respectivamente. Si se elige un producto al azar y es defectuoso, ¿cuál es la probabilidad de que provenga de la planta “B”? Resp: 0,1548 z3 3 4 z
WA LT E R C É S P E D E S R A M Í R E Z
4) El servicio de transporte público de Lima está compuesto por: ómnibus (15%), microbús (32%), colectivo (8%) y taxi (45%). Los accidentes que ocasionan estas unidades de transporte son a razón de: 4%, 6%, 1% y 12% respectivamente. Si en la ciudad de Lima se produce un accidente ocasionado por el transporte público, ¿cuál es la probabilidad de que dicho accidente lo causara un microbús? Resp: 0,2400 5) En una reunión de consejo se ha incluido en agenda incrementar la remuneración mínima en 20%. La probabilidad de que el ministro de economía exponga claramente este incremento, es de 0,78; si su exposición es clara, la probabilidad de que se apruebe el incremento, es de 0,88; en caso contrario, la aprobación del incremento será solo de 0,22. Al término del consejo de ministros se aprueba el incremento de la remuneración mínima en 20%, ¿cuál es la probabilidad de que la exposición del ministro no haya sido clara? Resp: 0,0659 6) Según su edad los socios inscritos en un club han sido clasificados como: adultos, jóvenes y niños. El grupo de adultos está compuesto por el 65% de los socios, el grupo de jóvenes lo integran el 15% y el grupo de niños los restantes 20%. Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. Si se elige a un socio al azar y resulta ser mujer, ¿cuál es la probabilidad de que sea joven o niña? Resp: 0,3485 7) La producción de una empresa procede de 5 plantas en proporciones iguales. Se sabe que la producción clase “A” de las 5 plantas, son: 73%, 85% 77%, 95% y 82%; respectivamente. Si se elige un producto al azar y es de clase “A”, ¿cuál es la probabilidad de que provenga de la primera o segunda planta? Resp: 0,3835
z3 3 5 z
E S TA D Í S T I C A I
AUTOEVALUACIÓN Nº 6 1) Hallar las permutaciones que se pueden lograr con el número 1 515 517. A) 5 040 2) Resolver:
B) 210 P6 x
12
A) 139 708 800
C) 140
D) 180
E) 1800
P3.
7
B) 210 152 000
C) 665 280
D) 180 750
E) 25 180
3) ¿De cuántas maneras pueden 10 personas sentarse alrededor de una mesa con capacidad para 8 personas? A) 5 040
B) 1 814 400
C) 120
D) 180
E) 226 800
4) Un estudiante tiene que contestar 6 de 10 preguntas. Si la última pregunta es obligatoria, ¿de cuántas maneras podrá contestar? A) 210
B) 126
C) 151 200
D) 180
E) 800
5) Doce invitados a una cena va a ocupar 2 mesas, una con capacidad para 5 y la otra con capacidad para 7. ¿Cuántas maneras diferentes podrán agruparse en las mesas? A) 5 040
B) 792
C) 120
D) 180
E) 226
6) Un lote de 12 artículos tiene 3 defectuosos. Si se toman 3 artículos al azar uno tras otro. ¿Cuál es la probabilidad de que 2 estén buenos? A) 0,3818
B) 0,1406
C) 0,1846
D) 0,4909
E) 0,2524
7) Un aula está compuesta por: 20 jóvenes y 12 adultos, todos ellos con opciones iguales de aprobar una asignatura. Si solo van a aprobar 18 alumnos, ¿cuál es la probabilidad de que entre los aprobados haya 8 jóvenes y 10 adultos? A) 0,0176 B) 0,1006 C) 0,0816 D) 0,0009 E) 0,0522 8) Con 8 consonantes y 4 vocales diferentes, ¿cuál es la probabilidad formar palabras de 5 letras que contengan cada una 3 consonantes y 2 vocales en un proceso sin reemplazo? A) 0,0818 B) 0,0146 C) 0,1144 D) 0,0909 E) 0,4242 9) Si se lanza un par de dados, ¿cuál es la probabilidad de obtener 2 números que sean iguales o sean consecutivos ascendentes? A) 0,1666 B) 0,3333 C) 0,1846 D) 0,3056 E) 0,1388
z3 3 6 z
WA LT E R C É S P E D E S R A M Í R E Z
10) En una competencia de tiro dos participantes tiene las probabilidades de dar en el blanco de 0,68 y 0,75; si cada uno hace un solo disparo, ¿cuál es la probabilidad de que al menos, uno de los participantes den en el blanco? A) 0,51
B) 0,17
C) 0,92
D) 0,07
E) 0,02
11) La promoción de una escuela secundaria compuesta por 70 alumnos, entre las profesiones que escogieron en su mayoría de los egresados, fue: medicina y administración. Del total, 42 deseaban ser médicos, 37 deseaban ser administradores y 17 decían que querían ser médicos y administradores. Si al azar a un estudiante, ¿cuál es la probabilidad de que prefiera medicina o administración? A) 0,7858
B) 0,8857
C) 0,6846
D) 0,7588
E) 0,5788
12) La producción de una empresa procede de 4 plantas en proporciones iguales. Se sabe que la producción clase “A” de las 4 plantas, son: 93%, 88%, 95% y 90%; respectivamente. Si se elige un producto al azar, ¿cuál es la probabilidad de que no sea de clase A? A) 0,9150
B) 0,0850
C) 0,0949
D) 0,0758
E) 0,0570
13) El servicio de transporte público de Lima está compuesto por: ómnibus (15%), microbús (32%), colectivo (8%) y taxi (45%). Los accidentes que ocasionan estas unidades de transporte son a razón de: 4%, 6%, 1% y 12% respectivamente. Si en la ciudad de Lima se produce un accidente ocasionado por el transporte público, ¿cuál es la probabilidad de que dicho accidente lo causara un taxi? A) 0,7150
B) 0,5660
C) 0,6750
D) 0,7580
E) 0,7570
14) La producción de una empresa procede de 4 plantas de la siguiente manera: el 26% procede de la planta “A”, el 24% de la planta “B”, el 22% de la planta “C” y los restantes 28% proceden de la planta “D”. Se sabe que la producción defectuosa de las tres plantas, son: 3%, 1,4% 2,5% y 1,8%; respectivamente. Si se elige un producto al azar y no es defectuoso, ¿cuál es la probabilidad de que provenga de la planta “C”? A) 0,2193
B) 0,1879
C) 0,1949
D) 0,2298
E) 0,1577
15) Según su edad los socios inscritos en el club Regatas Lima, han sido clasificados como: adultos (58,5%), jóvenes (18,6%) y adolescentes (22,9%). Se sabe que el 56%, 46% y 64% de los integrantes del de cada grupo respectivamente, son hombres. Si se elige a un socio al azar y resulta ser mujer, ¿cuál es la probabilidad de que no sea joven? A) 0,6667
B) 0,2774
C) 0,4402
D) 0,7719
E) 0,8786
Respuestas de control 1. C, 2. A, 3.E, 4. B, 5. B, 6. D, 7. A, 8. E, 9. D, 10. C, 11. B, 12. B, 13. C, 14. A, 15. D
z3 3 7 z
E S TA D Í S T I C A I
GLOSARIO Con Reemplazo.
La acción de devolver el elemento o dato elegido dentro de un todo, con el objeto de que vuelva a participar en la siguiente elección.
Se utiliza en los casos de que se requiera de la participación de un mismo dato varias veces.
Elementos Repetidos.
Existencia de datos u objetos dos o más veces con las mismas características.
Se utiliza en la permutación o ubicación de objetos en donde sobresalen aquellos que no están repetidos, ya que la variación de estos objetos repetidos no se aprecia.
Espacio Muestral.
Conjunto de todas las posibles ocurrencias contempladas en un Experimento Aleatorio.
Se utiliza como divisor en el cálculo de las probabilidades.
Experimento Aleatorio.
Proceso o acción que se encuentra sujeto al azar o a la suerte.
Se utiliza para conocer cuáles son las ocurrencias o sucesos posibles de alcanzar.
Probabilidad.
La división de un conjunto de observaciones llamadas favorables para una determinada acción, entre el número total de observaciones posibles para la misma acción. Se relaciona generalmente con procesos aleatorios de algún experimento.
Se utiliza para saber qué tan cerca o tan lejos se está de alcanzar lo que se busca ante una determinada acción, que puede estructurarse de la siguiente manera:
- 0,000
- 0,001 – 0,100: Incertidumbre sobre lo que se desea alcanzar
- 0,101 – 0,500:
Valor probable poco cierto
- 0,501 – 0,900:
Valor probable cierto
- 0,901 – 0,999:
Certeza sobre lo que se desea alcanzar
- 1,000
Certeza absoluta
:
:
Suceso imposible de alcanzar
Restricción.
Limitaciones para una acción o proceso.
Se utiliza para seleccionar objetos que tienen únicamente las características señaladas como restricción.
Sin Reemplazo.
La acción de no devolver el objeto elegido dentro de un todo, con el objeto de que no vuelva a participar en la siguiente elección. z3 3 8 z
WA LT E R C É S P E D E S R A M Í R E Z
Se utiliza solo en los casos de que se requiera de la participación de los datos que se tienen unas sola vez.
Suceso.
Cualquiera de las posibles ocurrencias en un experimento aleatorio, se le conoce también como evento.
Se utiliza como referencia para nombrar la ocurrencia de una determinada probabilidad que se espera alcanzar.
Sumatoria.
La suma de un conjunto de valores constantes y/o variables. Su símbolo es la letra griega mayúscula llamada sigma (Σ).
Se utiliza para agregar datos con el propósito de obtener cifras acumuladas, así como para establecer promedios al dividir lo acumulado entre el número de datos u observaciones.
Valor Aleatorio.
El producto del valor nominal de una variable por su respectiva probabilidad de ocurrencia.
Se utiliza en la Estadística Analítica o Inferencial, para calcular algunas medidas estadísticas, se diferencia de la Estadística Descriptiva, porque se obtiene lo mismo con solo conocer la variable y su probabilidad respectiva.
Valor Nominal.
El valor original de todo dato numérico constante o variable.
Se utiliza en la Estadística Descriptiva; porque al multiplicar el valor nominal por su respectiva frecuencia o veces que se repite el valor, permite calcular algunas medidas estadísticas.
EXPLORACIÓN ON LINE http://es.wikipedia.org/wiki/Estad%C3%ADstica_descriptiva http://www.aulafacil.com/CursoEstadistica/Lecc-16-est.htm http://www.aulafacil.com/CursoEstadistica/Lecc-18-est.htm http://www.aulafacil.com/CursoEstadistica/Lecc-22-est.htm http://www.aulafacil.com/CursoEstadistica/Lecc-25-est.htm http://www.aulafacil.com/CursoEstadistica/Lecc-26-est.htm
z3 3 9 z
E S TA D Í S T I C A I
BIBLIOGRAFÍA BÁSICA Berenson, Mark l. y David M. Levine (2000) Estadística Básica en Administración. Madrid, Prentice Hall Hispanoamérica S. A. Céspedes Ramírez, Walter (2011) Estadística II. Lima, Editorial Universidad Inca Garcilaso de la Vega Freud, E. John y otros (1993) Estadística para la Administración con enfoque Moderno. Madrid, Prentice Hall Hispanoamérica S. A. García Pérez, Alfonso (2008) Estadística Aplicada: Conceptos Básicos. Madrid, Universidad Nacional de Educación a Distancia (UNED). Kasmier, Leonard J. (2006) Estadística Aplicada a la Administración y a Economía. México, Mc Graw-Hill / Interamericana. Levine, Richard I. (2004) Estadística para Administración y Economía. 7ª. Ed. México, Prentice Hall Hispanoamérica S. A. Lind, Douglas y otros (2008) Estadística Aplicada a los Negocios y a la Economía. 13ª. Ed. Buenos Aires, Mc Graw-Hill / México, Interamericana. Martín Pliego, Francisco Javier y otros (2006) Problemas de Probabilidad. 2ª. Ed. Madrid, Thomson Paraninfo S. A. Newbold, Paul y William Carlson L. (2008) Estadística para Administración y Economía. Madrid, Prentice Hall Hispanoamérica S. A. Ricardo Cao, Abad y otros (2001) Introducción a la Estadística y sus Aplicaciones. Madrid, Pirámide. Ropero Morriones, Eva (2008) Manual de Estadística Empresarial (con Ejercicios Resueltos). Madrid, Delta Publicaciones Universitaria S. L. Tijero García, Ignacio. (2009) Estadística Práctica Aplicada a la Calidad: Fundamentos de la Calidad. Madrid, CYAN. Vilela Diez, Elizabeth (2001) Estadística Básica para Universitarios. Barañaín, Universidad de Navarra S. A. Webster, Allen L. (2000) Estadística Aplicada a los Negocios y la Economía. Santa Fe de Bogotá, Mc Graw Hill.
z3 4 0 z
WA LT E R C É S P E D E S R A M Í R E Z
BIBLIOGRAFÍA COMPLEMENTARIA Baíllo Moreno, Amparo (2007) 100 Problemas Resueltos de Estadística Multivariante. Madrid, Delta. Bonet Jerez, José Luis (2004) Lecciones de Estadística: Estadística Descriptiva y Probabilidad. Alicante, Club Universitario. Casas Sánchez, José Miguel y Julián Santos Peña (2002) Introducción a la Estadística para Administración y Dirección de Empresas 2ª Ed. Madrid, Universitaria Ramón Areces. Casas Sánchez, José Miguel (1999) Estadística Empresarial. Madrid, Universitaria Ramón Areces. Chao, Lincoln l. (1994) Estadística para Ciencias Administrativas. Santa Fe de Bogotá, Mc Graw Hill. Delgado de la Torre, Rosario (2007) Probabilidad y Estadística Para Ciencias e Ingeniería. Madrid, Delta. Fernández Fernández, Santiago y otros (2002) Estadística Descriptiva 2ª Ed. Madrid, ESIC Editorial. García Ramos González, Carmen y Gabriel Ruiz Garzón (2006) Estadística Administrativa. Cádiz, Universidad de Cádiz. Hernández Bautista, Agustín (2007) Curso Elemental de Estadística Descriptiva. Madrid, Pirámide. Hoel, Paul G. y Raymond J. Jensen (1986) Estadística Básica para los Negocios y para Economía, México D. F. Compañía Editorial Continental S. A. Mason, Robert D. y otros (2000) Estadística para Administradores. Madrid, Alfaomega S. A. Mendenhall, William (1990) Estadística para Administradores. Madrid, Grupo Editorial Iberoamericana. Mode, Elmer B. (2000) Elementos de Probabilidad y Estadística. México D. F., Reverte Mexicana S. A. Serrano Angulo, José (2003) Iniciación a la Estadística Bayesiana. Madrid, La Muralla. Vélez Ibarrola, Ricardo (2004) Cálculo de Probabilidades 2. Madrid, Ediciones Académicas. Zamora Sanz, Ana Isabel y otros (2006) Ejercicios de Estadística Descriptiva y Probabilidad para la Economía y Administración de Empresas. Madrid, Pirámid
z3 4 1 z